viernes, 3 de junio de 2011

Ciencias Forenses y los Principios Fundamentales del Método Científico (Parte Final)

La incertidumbre y el error

Los datos científicos y los procesos están sujetos a una variedad de fuentes de error. Por ejemplo, los resultados de laboratorio y los datos de los cuestionarios están sujetos a errores de medición, y la interpretación de las evidencias por los observadores humanos están sujetos a parcialidades potenciales. Una tarea clave para el investigador científico que diseña y lleva a cabo un estudio científico, así como para el analista que aplica un método científico para llevar a cabo un análisis particular, es identificar muchas fuentes de error posible, para controlar o eliminar el mayor número posible, y estimar la magnitud de los errores restantes para que las conclusiones del estudio sean válidos. Los datos numéricos reportados en un artículo científico no sólo incluyen un solo valor (estimación puntual), sino también un rango de valores posibles (por ejemplo, un intervalo de confianza, o intervalo de incertidumbre).

Error de medición


Como con todas las otras investigaciones científicas, los análisis de laboratorio realizados por los científicos forenses están sujetos a error de medición. Este error refleja las fortalezas intrínsecas y las limitaciones de la técnica científica en particular. Por ejemplo, los métodos para medir el nivel de alcohol en la sangre en un individuo o métodos para medir el contenido de heroína de una muestra, sólo pueden hacerlo dentro de un intervalo de posibles valores. Además de las limitaciones inherentes de la técnica de medición, también pueden estar presentes y afectar la precisión de los análisis de laboratorio, una serie de otros factores. Entre estos factores se incluyen deficiencias en los materiales de referencia utilizados en el análisis, errores de los equipos, condiciones ambientales que se encuentran fuera del intervalo en el que se validó el método, mezcla de la muestra y la contaminación, errores de transcripción, y mucho más.
Consideremos, por ejemplo, un caso en que un instrumento se utiliza para medir el nivel de alcohol en sangre de una persona tres veces, y las tres medidas son 0,08 por ciento, un 0,09 por ciento y 0,10 por ciento. La variabilidad en las tres mediciones pueden derivarse de los componentes internos del instrumento, los diferentes tiempos y formas en que las medidas fueron tomadas, o una variedad de otros factores. Es necesario informar estos resultados de las mediciones, junto con un intervalo de confianza que tiene una alta probabilidad de contener el verdadero nivel de alcohol en sangre. Para esta ilustración, el promedio es de 0,09 por ciento y la desviación estándar es de 0,01 por ciento, por lo tanto, un intervalo de confianza de dos desviaciones estándar (0,07 por ciento, 0,11 por ciento) tiene una alta probabilidad de contener el verdadero nivel de alcohol en sangre. La situación para evaluar el contenido de heroína de una muestra de polvo blanco es similar, aunque la cuantificación y los límites no están tan ampliamente estandarizados. La combinación de cromatografía de gases y espectrometría de masas se utiliza ampliamente en la identificación de sustancias controladas. Esos análisis tienden a ser más cualitativos (por ejemplo, la identificación de los picos en un espectro que aparecen a frecuencias compatibles con la sustancia controlada y que se destacan por sobre el “ruido” de fondo), aunque es posible la cuantificación.
Tasas de error
Los análisis en las disciplinas de ciencias forenses se llevan a cabo para proporcionar información para una variedad de propósitos en el proceso penal. Sin embargo, la mayoría de estos análisis  abordan dos grandes tipos de preguntas: (1) ¿Puede un trozo particular de evidencia estar asociado con una clase particular de fuente? y (2) ¿Puede un trozo particular de evidencia estar asociada con una fuente en particular? El primer tipo de pregunta lleva a las conclusiones de "clasificación". Un ejemplo de tal cuestión sería si las características de un espécimen particular de pelo/cabello comparten características físicas comunes a un grupo étnico en particular. Una respuesta afirmativa a una pregunta de clasificación sólo indica que el tema pertenece a una clase particular de elementos similares. Otro ejemplo podría ser si una marca de pintura dejada en la escena del crimen es consistente (según algunas colecciones de mediciones pertinentes) con una muestra de pintura en particular, de una base de datos, desde donde se pueda inferir la clase de vehículo (por ejemplo, modelo (s) y año (s) de producción que podría haber dejado la marca. El segundo tipo de pregunta lleva a conclusiones de "individualización", por ejemplo, ¿pertenece una muestra particular de ADN a la persona X?.
A pesar de que las preguntas que encaran los análisis forenses no siempre son binarias (sí / no) o tan nítidamente establecidas como en el párrafo anterior, el paradigma de las conclusiones sí / no, es útil para describir y cuantificar la exactitud con que las disciplinas de la ciencia forense puede dar respuestas. 

El marco conceptual y la terminología para evaluar la exactitud de los análisis forenses se ilustra con un hipotético ejemplo de un análisis microscópico del cabello de la cabeza. En esta situación, se evalúan múltiples características, tanto cualitativas como cuantitativas, en cada muestra de cabello. Las características cualitativas incluyen el color (por ejemplo, rubio, marrón, rojo), colorante (natural o tratado), forma (liso, ondulado, curvado, doblado), textura (suave, medio, grueso). Los rasgos cuantitativos incluyen la longitud y el diámetro. Sin lugar a dudas, estas características pueden variar de cabello en cabello, incluso del mismo individuo, pero las características que varían menos para el mismo individo (es decir, dentro de la variabilidad individual) y más para diferentes personas (es decir, entre la variabilidad individual) son necesarios con fines de identificación de clase y discriminación. Estas características también se pueden combinar de alguna manera para dar lugar a cierta puntuación global, o a un conjunto de resultados, para cada muestra, y estos resultados se comparan con los de la muestra objetivo. En el análisis final, sin embargo, se requiere a menudo una conclusión binaria. Por ejemplo, "¿Proviene el cabello de la cabeza de una persona caucásica?
Como en el caso de todos los análisis que llevan a conclusiones de clasificación (por ejemplo, pruebas de diagnóstico en medicina), el proceso de análisis microscópico del cabello debe ser sometido a la realización y estudios de validación en los que las tasas de error apropiados pueden ser definidos y estimados.
La precisión de una prueba (en este caso, el análisis microscópico del cabello) puede evaluarse de diferentes maneras. Tomando prestada terminología de la evaluación de pruebas médicas de diagnóstico, a continuación se indican cuatro de estas caracterizaciones y sus medidas asociadas. Cada una es útil a su manera: las primeras dos destacan la capacidad de detectar una asociación; las dos últimas hacen hincapié en la capacidad de predecir una asociación:
·         Entre las muestras de personas de la clase C, la fracción que está correctamente identificada por la prueba se llama la "sensibilidad" o la "tasa de positivos verdaderos" (TPV) de la prueba. En este cuadro, la sensibilidad se calcula como [95 / (95 +5)] × 100 = 95 por ciento.
. Entre las muestras de personas que no pertenecen a la clase C, la fracción que está correctamente identificada por la prueba se llama “especificidad” o la “tasa negativa verdadera de la prueba”. En este cuadro, la especificidad se estimaría como [98 / (2+98)] × 100 = 98 por ciento.
. Entre las muestras clasificadas por la prueba como que proceden de personas de la clase C, la fracción que en realidad resulta ser de la clase C se denomina el "valor predictivo positivo (VPP)" de la prueba. En esta tabla, el VPP sería estimado como [95 / (95 + 2)] × 100 = 98 por ciento.
·         Entre las muestras clasificadas por la prueba como procedentes de personas no pertenecientes a la clase C, la fracción que en realidad resulta no ser de personas de la clase C, se denomina el "valor predictivo negativo (VPN)" de la prueba. En esta tabla, el valor presente neto se calcularía como [98 / (5+98)] x 100 = 95 por ciento.
Estas cuatro medidas hacen hincapié en la capacidad del análisis para hacer determinaciones correctas. "Las tasas de error" se definen como la proporción de casos en los que el análisis lleva a una conclusión falsa. Por ejemplo, el complemento de la sensibilidad (100 por ciento menos la sensibilidad) es el porcentaje de casos falsos negativos en los que la muestra era de clase C, pero el análisis llegó a la conclusión opuesta. En el cuadro anterior, esto sería estimado como el 5 por ciento. Del mismo modo, el complemento de especificidad (100 por ciento menos la especificidad) es el porcentaje de casos positivos falsos en los que la muestra no era de clase C, pero el análisis concluyó que era. En el cuadro anterior sería estimado como el 2 por ciento. Una tasa de error global podría ser definida como el porcentaje de casos mal identificados entre todos los analizados. En la tabla se estimaría como [(5 +2) / 200] x 100 = 3.5 por ciento.
Es importante destacar que, la respuesta de prueba sea correcta o no depende de que pregunta este siendo abordada por la prueba. En este ejemplo de comparación de cabello, la finalidad es  determinar si el cabello provenía de un individuo de la clase C. Por lo tanto, el análisis debe evaluarse sobre la exactitud de la clasificación. En este ejemplo, si el análisis indica "Clase C", pero el cabello en realidad provenía de un individual de "no-Clase C", el análisis ha devuelto una clasificación incorrecta. Esta evaluación de la exactitud no se aplica a otras tareas que están más allá del objetivo del análisis particular, tales como ubicar la persona de quien se obtuvo la muestra. En el ejemplo de pintura sobre marcas de pintura dejadas por un vehículo, si la pregunta es si un vehículo objeto de investigación fue un modelo A, hecho por un fabricante B en el año 2000, entonces la respuesta correcta se limita a sólo el modelo, fabricante y año.
Aunque solamente ilustrativos, estos ejemplos sirven para demostrar la importancia de:
·         la caracterización cuidadosa y precisa del procedimiento científico, para que otros puedan replicar y validarlo;
·         la identificación de tantas fuentes de error como sea posible, que puedan afectar tanto a la exactitud como a la precisión de la medición;
·         la cuantificación de las medidas;
·         la comunicación de una medición con un intervalo que tiene una alta probabilidad de contener el valor verdadero;
·         la definición precisa de la cuestión abordada por el método (por ejemplo, la clasificación frente a la individualización), y el reconocimiento de sus limitaciones, y,
·         la realización de estudios de validación de los resultados de un procedimiento forense, para evaluar los porcentajes de falsos positivos y falsos negativos.
Claramente, una mejor comprensión de los equipos de medición y el proceso de medición conducen a más mejoras en todos los procesos y en definitiva a menos resultados falsos positivos y falsos negativos. En el caso del análisis microscópico del cabello, el estudio de validación puede confirmar su valor en la identificación de características de clase de un individuo, pero no en la identificación de la persona concreta.
La existencia de varios tipos de tasas de error potencial hace que sea absolutamente crítico para todos los involucrados en el análisis, ser explícitos y precisos en las tasas de referencia en particular o en un entorno específico. La estimación de las tasas de error de este tipo, exige estudios científicos rigurosamente desarrollados y llevados a cabo. Otros factores pueden jugar un papel en los análisis relativos a la interpretación humana, como la experiencia, la formación y la capacidad inherente del intérprete, el protocolo para la realización de la interpretación, y los prejuicios de una variedad de fuentes La evaluación de la exactitud de las conclusiones de los análisis forenses y la estimación de los índices de error pertinentes, constituyen componentes clave de la misión de la ciencia forense.

Fuentes de prejuicios

 

El juicio humano está sujeto a muchos tipos diferentes de prejuicio, ya que inconscientemente percibimos el humor de nuestro medio ambiente y lo canalizamos de forma tácita en nuestro análisis mental. Esos análisis mentales también podrían verse afectados por suposiciones injustificadas y un grado de exceso de confianza que ni siquiera lo reconocemos en nosotros mismos. Estos prejuicios cognitivos no son el resultado de defectos de carácter, sino que son características comunes de toma de decisiones, y no pueden ser alejados. Un ejemplo conocido es como el común deseo de complacer a los demás (o evitar el conflicto) puede sesgar nuestro juicio si los compañeros de trabajo o supervisores sugieren que están esperando, o han llegado a un resultado particular. La ciencia se esfuerza por evitar los prejuicios mediante el uso de protocolos estrictos para minimizar sus efectos.
Un prejuicio cognitivo, en cierto modo evidente, que puede surgir en la ciencia forense es la voluntad de ignorar la información de tipo básico en la evaluación del valor probatorio de la información. Por ejemplo, supongamos que las fibras de la alfombra de la escena del crimen coinciden con fibras de la alfombra de la casa de un sospechoso. El valor probatorio de esta información depende de la proporción en la que estas fibras se encuentran en los hogares, además de la del sospechoso. Si las fibras de alfombras son muy comunes, la presencia de fibras coincidentes en la casa del sospechoso, será de poco valor probatorio.
Un prejuicio cognitivo común es la tendencia de las conclusiones a verse afectadas por la forma en que una pregunta se enmarca o cómo se presentan los datos. En una rueda de identificación, por ejemplo, un testigo ocular que se presenta ante un grupo de caras en un grupo, puede suponer que el sospechoso se encuentra entre ellos, lo cual puede no ser correcto. Una serie de estudios ha demostrado que los jueces pueden estar sujetos a errores de juicio como resultado de prejuicios cognitivos similares. Los científicos forenses pueden también verse afectados por este prejuicio cognitivo si, por ejemplo, se les pide comparar dos pelos en particular, huellas de calzado, huellas digitales -una de la escena del crimen y una de un sospechoso-, en lugar de comparar el ejemplar de la escena del crimen con un grupo de homólogos.
Investigaciones recientes proporcionaron evidencia adicional sobre este tipo de prejuicio a través de un experimento en el que a los examinadores de huellas digitales con experiencia, se les pidió que analizaran las huellas dactilares que, desconocido por ellos, habían sido analizadas con anterioridad en sus carreras. Para la mitad de los exámenes, se introdujo prejuicio contextual. Por ejemplo, las instrucciones que acompañan a la huellas latentes incluyeron información tal como el "sospechoso confesó el crimen" o el sospechoso "fue detenido por la policía en el momento del crimen".  En 6 de los 24 exámenes que incluyeron la manipulación del contexto, los examinadores alcanzaron conclusiones que fueron consistentes con la información de prejuicio y diferente de los resultados a que habían llegado a la hora de examinar las mismas huellas en su trabajo diario.
Otros prejuicios cognitivos pueden atribuirse a las imperfecciones comunes en nuestra capacidad de razonamiento. Uno comúnmente reconocido es la tendencia a evitar la disonancia cognitiva, tal como convencer a uno mismo a través de la argumentación racional de que la compra era a buen precio, una vez completa la transacción. Un científico encuentra este prejuicio inconsciente cuando no llega a estar demasiado aferrado a una conclusión preliminar, por lo que resulta difícil aceptar nueva información de manera justa y excesivamente difícil, como para concluir que las hipótesis iniciales estaban equivocadas. Esto a menudo se manifiesta por lo que se conoce como "anclaje", la tendencia bien conocida de depender demasiado de una sola pieza de información, cuando se toman decisiones. A menudo, la pieza de información que se pondera de manera desproporcionada, es una de las primeras encontradas. Uno tiende a buscar el cierre y ver la parte inicial de una investigación como un "costo hundido", que se perdería si se volcara.
Otro prejuicio cognitivo común es la tendencia a ver los patrones que realmente no existen. Este se relaciona con nuestra tendencia a subestimar la cantidad de complejidad que realmente puede existir en la naturaleza. Ambas tendencias pueden conducir a formular modelos simples de la realidad y por lo tanto a dar demasiada importancia a las coincidencias y las sorpresas. En términos más generales, la intuición humana no es un buen sustituto de un cuidadoso razonamiento cuando se trata de probabilidades. Como ejemplo, consideremos un problema común que se plantea en las estadísticas de comienzo de clases: ¿Cuántas personas deben estar en una habitación antes de que haya una probabilidad del 50 por ciento de que por lo menos dos van a compartir un cumpleaños en común? La intuición puede sugerir un gran número, quizás más de 100, pero la respuesta real es de 23. Esto no es difícil de demostrar mediante la lógica cuidadosa, pero la intuición puede resultar engañosa.
Todas estas fuentes de prejuicio son bien conocidas en la ciencia, y una gran cantidad de esfuerzo se ha dedicado a su comprensión y mitigación. El objetivo es hacer a la investigación científica lo más objetiva posible, de manera que los resultados no dependan del investigador. Algunos campos de la ciencia (en particular, los ensayos clínicos biofarmacéuticos de los protocolos de tratamiento y las drogas) han desarrollado prácticas como exámenes de verificación doblemente ciegos e independientes (ciego) de verificación, para minimizar el impacto de los prejuicios. Además, la ciencia busca la publicación de sus descubrimientos, hallazgos y conclusiones para que sean sometidos a revisión por pares independientes; ello permite a otros estudiar los prejuicios que puedan existir en el método de investigación o intentar replicar resultados inesperados. Para evitar, o para compensar, un prejuicio es una tarea importante. Incluso los campos con protocolos bien establecidos para minimizar los efectos de aquél,  todavía puede tener mejora. La vigilancia continua es necesaria; la investigación ha sido escasa en el importante tema del prejuicio cognitivo en la ciencia forense, tanto respecto a sus efectos como en los métodos para minimizarlo.

La naturaleza de auto-corrección de la ciencia

 

Los métodos y la cultura de la investigación científica le permiten ser una empresa de auto-corrección. Dado que los investigadores son, por definición, la creación de nuevo conocimiento, deben ser lo más prudentes posibles, antes de afirmar una nueva "verdad." Además, porque los investigadores están trabajando en una frontera, algunos otros pueden tener los conocimientos necesarios para detectar y corregir los errores que hacen. Así, la ciencia ha tenido que desarrollar medios de revisar resultados provisionales y revelar los errores antes de que se utilicen ampliamente. Los procesos de revisión inter pares, la publicación, las interacciones colegiales (por ejemplo, el intercambio en congresos), y la participación de estudiantes de posgrado apoyan esta necesidad. La ciencia se caracteriza también por una cultura que fomenta y recompensa la discusión crítica de resultados anteriores y de los colegas. La mayoría de las tecnologías se benefician de una fundación de investigación sólida en el mundo académico. Estos elementos proporcionan un rico conjunto de caminos por los que las nuevas ideas y el escepticismo pueden viajar y dan oportunidades a los científicos para abandonar su trabajo del día a día y tener una visión a más largo plazo. La cultura científica alienta declaraciones prudentes y precisas y desalienta a las declaraciones que van más allá de hechos establecidos; es aceptable para los colegas a desafiarse unos a otros, incluso si el rival es de menor rango. Las disciplinas de las ciencias forenses se beneficiarán enormemente con la adopción plena de esta cultura científica.

Conclusión

La forma en que la ciencia se lleva a cabo es distinta de, y complementaria de, otros modos por los cuales los seres humanos investigan y crean. Los métodos de la ciencia tienen una larga historia de éxito en la creación de conocimientos útiles y dignos de confianza y colmado de lagunas, al mismo tiempo que corrige los errores del pasado. El premio que pone la ciencia en la precisión, la objetividad, el pensamiento crítico, la observación cuidadosa y la práctica, la respetabilidad, la gestión de la incertidumbre, y la revisión paritaria, permite la recogida fiable, y  la medición e interpretación de pistas con el fin de producir conocimiento.

No hay comentarios: