Acerca de la prueba lingüística en atribución de autoría hoy

Autor:Sheila Queralt
Càrrec:Pèrit col·legiada i investigadora al Laboratori de Lingüística Forense (ForensicLab, IULA, UPF)
Pàgines:35-48
RESUMEN

En este artículo se introduce el procedimiento que conviene seguir en la comparación forense de textos con el fin de atribuir la autoría de un texto. A continuación, se presenta el estado de la metodología actual de esta rama de la lingüística forense y, finalmente, se discuten las medidas que deben ser aplicadas para poder comparar el marco metodológico de la atribución de autoría con el de otras ciencias forenses. Palabras clave: lingüística forense; estilo idiolectal; atribución de autoría; marco metodológico; razón de verosimilitud.

 
ÍNDICE
CONTENIDO

Page 37

1 Introducción

Durante los últimos 20 años los tribunales de varios países han solicitado de manera creciente expertos en lingüística forense. En España, afortunadamente, cada vez son más las ocasiones en que se recurre al experto en lingüística, aunque todavía resta una gran labor de difusión de esta disciplina para que tanto los posibles clientes privados como los agentes de la justicia conozcan de su existencia y utilidad.

Los casos en los que los expertos lingüistas ofrecen su testimonio pueden ser diversos. Por ejemplo, pueden actuar en disputas sobre posible plagio entre patentes, casos de identiicación de hablantes, casos de desambiguación de cláusulas de contratos o, en el caso de este artículo, casos de atribución de autoría o también conocidos como de identiicación de autoría (Stamatatos, Fakotakis y Kokkinakis, 2001).

Los casos más frecuentes en lingüística forense implican en algunos casos la realización de un peril lingüístico del texto dubitado (texto anónimo cuya autoría se cuestiona) con un conjunto de textos indubitados (textos cuya autoría no se cuestiona) de un sospechoso o varios sospechosos. En general, el análisis de autoría se ha deinido como aquel proceso mediante el cual se analizan las características lingüísticas de un texto para extraer conclusiones sobre su autoría (Zheng et al., 2003)

2 Protocolo de actuación en un caso de atribución de autoría

¿Cómo empieza un caso en atribución de autoría o, según la terminología actual, en comparación forense de textos escritos? El punto más inicial posible en el que se puede encontrar el lingüista forense es aquel en el que simplemente se dispone de un texto dubitado sin posibles sospechosos y se debe realizar un peril lingüístico con el in de que los cuerpos policiales o el cliente puedan determinar el posible sospechoso de haber producido el texto dubitado.

Bajo esta circunstancia, el lingüista forense debe, primeramente, discernir si hay caso lingüístico o no, es decir, si la muestra:

  1. Es suicientemente larga. Todavía no se ha establecido un mínimo de palabras ni cuántos textos son necesarios (Stamatatos, 2009). Los estudios más cualitativos pueden trabajar con textos más breves con un mínimo de unas 150-200 palabras mientras que los estudios más cuantitativos que emplean programas informáticos necesitan experimentar con textos más largos, por ejemplo, Hirst y Feiguina (2007) trabajaban con escritos de 200, 500 y 1.000 palabras y señalaban que la precisión de sus resultados decrecía signiicativamente cuando la longitud del texto era inferior a las 1.000. A pesar de no existir una longitud mínima probada, resulta evidente que difícilmente se podrán determinar rasgos del autor con un texto anónimo de dos líneas (unas 40 palabras, aproximadamente).

  2. Es de calidad. Es decir, si el texto releja el estilo del autor, aparecen marcas de su dialecto, sexo, nivel de estudios, estatus social, posible contacto con segundas lenguas, etcétera.

Si una de las dos condiciones no se cumple se debe rechazar el caso alegando que no existe caso lingüístico ya que el material es insuiciente. En el caso que ambas condiciones se cumplan, se puede proceder a la realización del peril lingüístico.

3 Periles lingüísticos

La información que se puede proporcionar en un peril lingüístico dependerá en gran medida de la muestra dubitada de la que se dispone. La sociolingüística supone el estudio de la variación lingüística, y eso incluye el análisis correlacional de las características sociales de los escritores y de las variables lingüísticas que usan.

La escritura de un individuo contiene rasgos que pueden revelar el origen geográico de ese individuo. Por ejemplo, en el caso de hablantes bilingües catalán-español, se observa que la frecuencia de uso del pronombre relativo compuesto (el cual) frente a la frecuencia de uso del pronombre relativo simple (que) suele ser mayor que en el caso de hablantes de español no bilingües. Esta variable ha sido de gran utilidad en

Page 38

varios casos forenses, como por ejemplo, en el caso descrito en Turell (2011: 80) en el que se debía atribuir la autoría de unos escritos en formato electrónico a un trabajador de una empresa del sector turístico de Cataluña. Además, en el caso de que un autor sea procedente de algún grupo étnico o sea inmigrante, puede que el autor conserve formas de su lengua nativa, calque una forma o la frecuencia de uso de una variable en la lengua del país receptor. Estudios como Koppel, Schler y Zigdon (2005) indican que los hablantes no nativos realizan variables estilísticas que permiten determinar su lengua nativa.

Otra variable sociolingüística que suele ser relativamente fácil de determinar es el nivel educativo del autor. Este rasgo se observa gracias a que la lengua contiene claves tales como pueden ser el uso de términos especializados, el estilo, la gramática, la puntuación, el uso de iguras metafóricas, entre otras. Además, se debe tener presente que siempre resulta más fácil intentar suplantar un nivel educativo más bajo que uno más alto. No obstante, difícilmente el autor podrá ser consistente en los rasgos estilísticos y se podrá entrever su verdadero nivel educativo así como otras características demográicas.

En algunas ocasiones, aunque suelen ser rasgos más difíciles de perilar en el caso de textos escritos, se puede indicar un rango de edad o el sexo del autor. Las generaciones diferentes de escritores encuentran vías lingüísticas para distanciarse de otros grupos generacionales. Además, con los cambios tecnológicos, se resisten a adoptar nuevas estructuras y nuevos términos, preservando la modalidad de discurso que les relaciona a su grupo generacional. Por ejemplo, se puede pensar en la forma de escribir los mensajes de texto, la población más joven tiende a utilizar más abreviaciones o más emoticonos que las generaciones mayores.

Otra característica que se puede indicar en algunos casos es el sexo del autor, se ha demostrado que hombres y mujeres tienen modalidades de discurso relativamente diferentes. Se ha podido observar en diferentes estudios, como Schler, Koppel, Argamon y Pennebaker (2006), que las mujeres y los hombres hablan de temas distintos y se expresan de forma distinta en las redes sociales. Por ejemplo, los hombres tienden a hablar más sobre política, tecnologías o dinero, mientras que las mujeres suelen hablar más de temas personales. Por lo que respecta a la forma de expresarse, las mujeres tienden a utilizar más emoticonos, realizan más alargamientos vocálicos o tienden a repetir los signos de puntuación con más frecuencia.

4 Atribución de autoría

Una vez se ha realizado el peril lingüístico del texto dubitado, es tarea del cliente o del cuerpo judicial establecer la lista de posibles sospechosos. El lingüista forense solo deberá guiarles en la búsqueda de muestras indubitadas asesorándoles sobre cómo deben ser las muestras: mismo género textual o lo más similar posible, longitud de las muestras, número de muestras, etc.

A continuación, igura 1, se presenta un ejemplo de dos textos dubitados1pertenecientes a un caso de 2014 llevado a cabo por investigadores del Laboratorio de Lingüística Forense (ForensicLab), del Instituto Universitario de Lingüística Aplicada de la Universidad Pompeu Fabra. El corpus del caso consistía en un total de 18 textos indubitados y 15 textos dubitados escritos en inglés con longitudes comprendidas entre las 150 y las 1.290 palabras por documento.

Page 39

D1

Estimado Sr Kxxxx

se acuerda de mi ? Le he enviado varios correos durante los últimos meses sobre el Sr Rxxxx Dxxxx y sobre que es millonario ?! Querías mantenerme informado pero desgraciadamente no he recibido ningún mensaje tuyo hasta hoy. Quizá sea por el correo de Yahoo ?!

De todos modos la compañía del Sr Dxxx en UK MXXXXX CXXXXXXX ha realizado las cuentas anuales y oicialmente está valorado en 2 mil millones de libras, unos USD 3.3 mil millones. En la página 8 de las cuentas se escribe: Control - la compañía Británica está controlada por el director quien tiene en su poder el 100% del capital compartido ! Le envío una captura de pantalla de la compañía.

Saludos cordiales

Bxxx Bxxxx

D2

Estimado Sr Kxxxx,

Gracias por su rápida respuesta. Aquí le reenvío el correo original.

Hace unos años que sigo la columna "gente especial" en su carrera y su éxito para publicar noticias sobre ellos en las revistas Alemanas. Una de estas "personas especiales" que he encontrado por azar.

De todos modos después encontré distintos artículos en grandes revistas sobre el Sr Dxxx y sus bicicletas artesanas. El espectáculo fue en la ciudad de Ostend en la costa Belga del Flandés Occidental. Desafortunadamente no he podido conocer a esta persona pero he intentado conocerla de todos modos. Desafortunadamente, no he tenido suerte hasta ahora ?!.

En todos estos artículos que he encontrado (y otros) se ha escrito el nombre de la compañía MXXXXX CXXXXXXX la cual no ha existido hasta 2008. Puede ser que tantas revistas se hayan equivocado ?!

Saludos cordiales

Bxxx Bxxxx

Figura 1: textos dubitados.

En la igura 1, se pueden observar, a primera vista y sin entrar en análisis más detallados, varios rasgos inusuales y comunes en ambos textos dubitados. Algunos de ellos (destacados en el texto de la igura 1 en negrita) son: coincidencia en las fórmulas de salutación (Sr. Kxxxx) y despedida (Saludos cordiales seguido de Nombre y Apellido); el uso frecuente de la expresión de todos modos; preferencia por el sustantivo compañía en lugar de empresa; el uso de gentilicios en mayúscula; el uso de puntuación no estándar en español (uso de punto en lugar de coma); uso de mayúsculas para escribir el nombre de la empresa; escritura de la abreviatura de señor sin punto (Sr); espacio antes del signo de interrogación o admiración; y la combinación frecuente de interrogante seguido de exclamación.

Además de estas variables, que pueden resultar las más visibles en este caso, en el peritaje lingüístico se tendrían en cuenta otras variables, como por ejemple medidas de complejidad (longitud de frase, longitud de párrafo), variables morfosintácticas (por ejemplo, secuencias de categorías sintácticas más frecuentes, posición preferente de adverbios), variables léxicas y variables pragmáticas, entre otras.

En la comparación forense de textos, como en la comparación forense de habla, el análisis de la evidencia lingüística no consiste únicamente en abordar las características lingüísticas del texto dubitado. También

Page 40

implica cuantiicar el grado de similitud entre las características dependientes del escritor obtenidas de la muestra dubitada, y las características obtenidas de las muestras indubitadas (Gonzalez-Rodriguez, Drygajlo, Ramos-Castro, Garcia-Gomar y Ortega-Garcia, 2006: 332). No obstante, esta comparación «es el paso inal de un largo escrutinio del contenido léxico y sintáctico de los textos en el que se mide, calcula y clasiica cada unidad para encontrar posibles rasgos estilísticos distintivos de autor, es decir, marcas identiicativas» (Spassova, 2009: 32).

En lingüística forense se trabaja bajo la premisa de la existencia de un estilo idiolectal del autor, un estilo propio, único e irrepetible. El estilo idiolectal tiene que ver, principalmente, no con el sistema lingüístico/ dialectal que tiene cada individuo, sino:

  1. Con cómo este sistema, compartido por mucha gente, es utilizado de un modo distintivo por una persona concreta;

  2. Con la producción lingüística de un hablante/escritor, que parece ser ‘individual’ y ‘único’ (Coulthard 2004);

  3. Con la propuesta de Halliday (1989) de ‘opciones’ y ‘selecciones’ de estas opciones.

La hipótesis del ‘estilo idiolectal’ hace posible el establecimiento de una medida de similitud idiolectal para poder airmar si dos muestras lingüísticas han sido producidas por el mismo autor o no. De este modo es posible que los lingüistas forenses puedan aportar pruebas en peritajes lingüísticos ante los tribunales. Esta premisa teórica es ampliamente aceptada por la comunidad de lingüistas forenses de todo el mundo como el principio fundamental para lidiar con el problema de atribución de autoría.

Una vez determinado el sospechoso, la tarea del lingüista forense es determinar la probabilidad de que este haya producido los textos dubitados. En la igura 2 se muestran dos textos indubitados2:

I1

Estimado Sr Bxxxxx

la secretaría de mi compañía me ha enviado sus peticiones sobre la cobertura de MXXXXX CXXXXXXX ?! Me pregunto que resulta tan interesante sobre mí y XXXXX CXXXXXXX que una revista tan famosa como FXXXX quiera comunicarse conmigo ? Y debo decir que esta no es la primera vez ! Otra gente que sale en vuestra revista también es muy rica y algunos incluso más que yo ! Supongo que no soy de tanto interés para sus lectores ? Así que sería tan amable de decirme cuál es el interés ? Gracias de antemano.

Saludos cordiales

Rxxx Dxxxx

I2

Estimado Sr Bxxxxx

Ahora se interesan por MXXXXX CXXXXXXX porque Xxxx dijo que no había ninguna conexión.... ahora debería pensar porque el director de la compañía MXXXXX dice ahora que no hay conexión :-) Si él dice que no hay conexión busque por internet todas las transacciones comerciales (y el valor) realizadas durante 1.5 años a nombre Mxxxxxx Cxxxxxx ! Los medios de comunicación se equivocan ! Quizá se han equivocado en contar los millones ?! De todos modos supongo que interesarse por minerales es mi pasión, pero no solo son los minerales sino también el gas y el petróleo Sudamericanos.

Saludos cordiales

Rxxx Dxxxx

Figura 2: textos indubitados.

Page 41

Sheila Queralt Acerca de la prueba lingüística en atribución de autoría hoy

En los dos textos indubitados de la igura 2 se observan rasgos muy similares que también aparecen en el conjunto de textos dubitados de la igura 1. La tabla 1 ofrece una comparativa entre el conjunto de texto dubitados y el conjunto de textos indubitados.

Tabla 1: Comparativa entre los textos dubitados e indubitados.

[VER PDF ADJUNTO]

Page 42

[VER PDF ADJUNTO]

Pero, ¿pueden considerarse estas similitudes en ambos conjuntos como un indicador de que estos textos han estado producidos por la misma persona? o ¿es posible que esas similitudes se deban a que el autor del texto es una persona que comparte muchos rasgos sociolingüísticos con el autor del texto indubitado?

Por ejemplo, uno se puede plantear si los rasgos ‘uso de gentilicios con mayúscula’ o ‘uso de puntuación no estándar en español’ o ‘preferencia del sustantivo compañía en lugar de empresa’ podrían deberse a un nivel no nativo del español. Si fuera así, estos rasgos también se podrían encontrar en textos producidos por nonativos y no serían una peculiaridad concreta del hablante sino que estarían directamente relacionados con el nivel no-nativo de español del sujeto.

5 Marco metodológico

Hasta el momento esta comparación, tanto por los lingüistas forenses como por los lingüistas computacionales, se ha realizado analizando cuáles son los rasgos comunes o diferentes entre las muestras y las variables han sido, en cierta manera, ‘ad hoc’, es decir, caso a caso. En la búsqueda para cuantiicar el grado de similitud entre las muestras se han un utilizado una gran variedad de variables como por ejemplo la frecuencia relativa de palabras funcionales o gramaticales (ej. Burrows, 1987, 2003), distribuciones de frecuencias de palabras (ej. Holmes, 2003), análisis del vocabulario (ej. Coulthard, 2004; Woolls & Coulthard, 2007), n-gramas de categorías gramaticales (Part of Speech n-grams en inglés) (Bel et al. 2012; Queralt, Spassova y Turell 2011; Queralt y Turell 2012; Spassova y Turell 2007; Turell 2004a, 2004b), entre otras.

A pesar de todos estos estudios, el marco metodológico en la comparación forense de textos se encuentra todavía en desarrollo. En comparación con otras ciencias forenses, la lingüística forense no es una ciencia exacta puesto que trabaja con un objeto de estudio variable como es la lengua y es por este motivo que algunos profesionales ante el presente estado de la cuestión del campo declaran:

Linguistic evidence is currently more appropriate for the defence, where the need is to show ‘reasonable doubt’, than for the prosecution, where the need is to demonstrate ‘beyond reasonable doubt’.

M. Coulthard (1994: 31)

Hasta la actualidad, los peritos lingüistas han basado sus dictámenes en análisis puramente descriptivos (cualitativos) o han intentado con gran esfuerzo realizar una combinación de métodos cuantitativos y

Page 43

cualitativos. Solo unos pocos análisis, aunque cada vez más, se han beneiciado de una combinación de ambos métodos y, por lo tanto, se han podido beneiciar de la naturaleza complementaria de la prueba lingüística.

La importancia que se le daba a cada similitud o diferencia dependía de la valoración que le otorgaba el perito por su experiencia y, por tanto, podía variar de experto a experto. Por este motivo, esta aproximación ha sido considerada subjetiva y se ha dejado de aplicar en otras ciencias forenses como el ADN, las huellas dactilares o el análisis de la escritura. Durante las dos últimas décadas, el volumen de pruebas forenses y métodos forenses soisticados ha aumentado a pasos agigantados. En consecuencia, se han implementado métodos probabilísticos y multivariantes en un intento de poder evaluar la fuerza de la comparación de las propiedades cuantiicables de muestras conocidas (indubitadas) y desconocidas (dubitadas).

De este modo es evidente que evaluar el grado de similitud no es suiciente. Se debe considerar también la rareza o la probabilidad de aparición de esas características en comparación con la población relevante. Coulthard y Johnson en el libro An Introduction of Forensic Linguistics: language in evidence preguntan "cómo puede medir uno la rareza y, por tanto, el valor evidencial de las expresiones individuales?" (2007:

6). Con el in de calcular el grado de similitud entre las muestras escritas y su rareza se debe estimar la distribución de esas variables en una población relevante -Distribución Poblacional o Base Rate Knowledge en inglés. Esta distribución poblacional implica:

The collection of data regarding the general usage of the linguistic parameters being considered by a relevant population, or group of language users from the same linguistic community, with which the speciic behaviour of the speakers or writers under comparison can be compared.

Turell & Gavaldà Ferré (2013: 499 nota 13)

[VER PDF ADJUNTO]

Figura 3: Ejemplo visual de distribución poblacional.

En la igura 3 se puede observar en el eje de abscisas (o eje x) las posibles variables lingüísticas, y en el eje de las ordenadas (o eje y) el valor medio de cada variable en la población. La lecha representaría la distribución poblacional de un grupo de variables, es decir, el valor medio y, por tanto, la tipicidad o expectativa de esas variables en una población concreta. Unos valores superiores o inferiores a los medios indicarían un rasgo idiosincrático del hablante.

Una de las principales razones por las que no se ha materializado un marco común antes en atribución de autoría es, como en otras ciencias como el análisis de ADN, el hecho de que, por ejemplo, el marco de la razón de verosimilitud (§5.1) requiere una distribución poblacional de las variables lingüísticas, para

Page 44

poder ser capaz de proporcionar un valor de la ‘rareza’ o ‘tipicidad’ de ese rasgo lingüístico en ese contexto particular, y así ser capaz de proporcionar la fuerza de la evidencia.

Para obtener una mayor aceptación sobre la práctica de la comparación forense de textos, la comunidad de lingüistas forenses debe establecer con urgencia un marco metodológico común que sea capaz de proporcionar unos resultados iables en atribución de autoría mediante la combinación de los métodos cualitativo y cuantitativo. Este marco metodológico debe deinir el comienzo del proceso, por ejemplo la naturaleza, el número y el tamaño de las muestras, cuáles son las variables más discriminatorias, y las técnicas estadísticas capaces de medir las tasas de error.

5. 1 Marco de la razón de verosimilitud

El marco de la razón de verosimilitud es un nuevo paradigma en las ciencias forenses de comparación que ha sido ampliamente adoptado en las tres últimas décadas y que se inició en los años 90 dentro de la evaluación de la comparación de periles de ADN con ines forenses. La aplicación de este marco implica la sustitución de suposiciones anticuadas sobre la singularidad y la perfección de las pruebas en las ciencias forenses tradicionales por una ciencia más empírica y basada en la probabilística. Esta transición del enfoque anterior al nuevo en las ciencias forenses se ha llamado ‘cambio de paradigma’3en Saks y Koehler (2005).

El marco de la razón de verosimilitud fue introducido después del fallo judicial de 1993, de Daubert v. Merrell Dow Pharmaceuticals, Inc. mediante el cual el Tribunal Supremo de EE.UU. aclaró los estándares que los jueces deben utilizar para determinar si los métodos cientíicos de los peritos son iables y, por tanto, decidir si la prueba pericial es admitida.

En esta sentencia el juez tenía como tarea principal excluir aquellas disciplinas cientíicas que no fueran válidas para presentar pruebas periciales. Dicho tribunal se centró sobre la admisibilidad del testimonio de los peritos y destacó que dicho testimonio es admisible sólo si es relevante y iable. Además, sostuvo que las Reglas Federales de Evidencia4indican que el juez tiene la obligación de garantizar que el testimonio de un experto responde efectivamente a una base iable y relevante para la tarea en cuestión5. Asimismo, el tribunal analizó factores más especíicos, como las pruebas, la revisión por pares, las tasas de error, y la aceptabilidad en la comunidad cientíica pertinente. Todos o algunos de estos hechos podrían ser de gran utilidad para determinar la iabilidad de la teoría o la técnica cientíica. Concretamente, dichos estándares son los siguientes:

  1. La metodología debe haber sido probada y debe ser replicable6. Según el Tribunal, la prueba empírica es el criterio principal de la ciencia.

  2. Debe existir una tasa de error real o probable sobre la técnica aplicada7.

  3. Deben existir y se deben mantener los estándares para el control de la aplicación de la técnica8.

  4. La aceptación general de la metodología aplicada puede tener un papel determinante para el Tribunal. Como el Tribunal señaló "[w]idespread acceptance can be an important factor in ruling particular evidence admissible, and ‘a known technique which has been able to attract only minimal support within the community’ may properly be viewed with skepticism".

  5. La metodología debe haber sido sometida a revisión y publicación9. El Tribunal declaró que "submission to the scrutiny of the scientiic community is a component of ‘good science’ ".

Page 45

A pesar de que estos estándares se aplican solo en EE.UU., su aparición no solo ha tenido implicaciones obvias para la ley, sino que también ha tenido un gran impacto en la comunidad cientíica internacional en general y en la comunidad de lingüistas forenses en particular, ya que establecen un importante cambio conceptual en muchas áreas. Estos estándares determinan cuándo es admisible una evidencia cientíica y, a su vez, diicultan en cierto grado, la admisibilidad de metodologías basadas en la experiencia del experto y no en la objetividad.

No mucho tiempo después los distintos institutos oiciales en ciencias forenses de todo el mundo adoptaron los estándares que emplean el marco de la razón de verosimilitud, por ejemplo, la Asociación de Proveedores en Ciencias Forenses en la República de Irlanda (ASFP, 2009), el Servicio de Ciencias Forenses en Reino Unido (Cook et al., 1998), y el Instituto Forense de Holanda (CEH Berger, 2010).

De este modo, el uso de este nuevo paradigma, es decir, el marco de la razón de verosimilitud, se recomienda ampliamente, por una parte para la evaluación de las pruebas de comparación forense y, por la otra, para evaluar con precisión el valor de las pruebas.

El marco de la razón de verosimilitud parece apropiado en el contexto legal, ya que permite a los expertos evaluar la fuerza de la prueba, sin especiicar cuál es su creencia previa, tanto por parte de la acusación como por parte de la defensa, consideradas en el teorema de Bayes del cual derivan las relaciones de verosimilitudes. Por lo tanto, el papel del cientíico y el del tribunal quedan bien diferenciados. El cientíico exclusivamente analiza e interpreta los datos a in de proporcionar la fuerza de la evidencia mediante el uso de recursos lingüísticos mientras que el tribunal es el que tiene una opinión subjetiva ante la evidencia y actualiza su opinión a la luz de las pruebas y construyen un veredicto inal objetivo.

Actualmente no queda duda de que en los casos de ADN hay una base estadística suiciente para proporcionar resultados con razones de verosimilitudes y, por ese motivo, están presentes en los tribunales de muchos países, como Australia10, Países Bajos, Nueva Zelanda11, Eslovenia, España, Suiza o Reino Unido12. Además, el marco de la razón de verosimilitud no sólo se ha aplicado a los casos de ADN, sino también a otras disciplinas como la comparación de huellas dactilares (por ejemplo, Neumann, Evett, y Skerrett 2012), de huellas (por ejemplo, Skerrett, Neumann y Mateos-Garcia, 2011), de armas de fuego y marcas de herramientas (por ejemplo, Champod et al. 2003), de vidrio (por ejemplo, Curran, Champod y Buckleton, 2000), de pintura (por ejemplo, McDermott, Willis y McCullough 1999), de caligrafía (por ejemplo, Hepler, Saunders, Davis y Buscaglia, 2012) o de comparación forense de la voz (por ejemplo, Morrison, 2009; Delgado, 2001; Gonzalez-Rodriguez et al., 2006).

5. 2 Presentación de resultados

Según este paradigma se llegaría a lo popularmente conocido en los casos de ADN de ‘hay una probabilidad entre 1000 de que sean la misma persona’. En el caso de la comparación forense de textos se llegaría a algo así como: ‘Muestra dubitada vs muestra indubitada: cociente de probabilidad= 0.2653’. Es decir, hay una probabilidad entre 0,2653 de que sea el mismo autor en ambos textos o el resultado especíico obtenido signiica que las diferencias observadas tendrían 3,76 veces más probabilidades de ser observadas asumiendo autores diferentes que el mismo autor.

Estos resultados suelen adaptarse a una descripción verbal para facilitar su comprensión. En la tabla 2 se muestra el método más sencillo de correspondencia entre el valor de la razón de verosimilitud con un descriptor verbal utilizando términos como un apoyo muy sólido, sólido, moderadamente sólido, moderado, limitado a la hipótesis de la iscalía. La escala que igura en la Tabla 2 se aplica a la hipótesis de la iscalía pero se puede realizar una escala análoga para la hipótesis de la defensa. En el caso de asumir la escala verbal mostrada en la tabla 2, el resultado numérico de nuestro ejemplo se podría traducir como una evidencia moderada contra la hipótesis de la Fiscalía -es el mismo autor- o un apoyo moderado a la hipótesis de la Defensa -por tanto, no es el mismo autor.

Page 46

Tabla 2: Equivalencia verbal propuesta por Champod, C. y Evett, I. (2000). Commentary on Broeders (1999), FL 7/2, 238-43.

[VER PDF ADJUNTO]

6 Conclusión

En conclusión, es evidente que la comparación forense de textos escritos no se puede basar únicamente en el análisis de similitudes y diferencias entre las muestras dubitadas e indubitadas. Sino que se deben contrastar dichas similitudes y diferencias con una distribución poblacional para poder determinar la relevancia y signiicancia de los hallazgos. La interpretación de las pruebas y la evaluación de su signiicación se debería llevar a cabo de forma cuantitativa, ya sea a través del cálculo de la razón de verosimilitud, como se ha expuesto en este artículo, o de otro tipo de análisis estadísticos. El resultado del análisis debería, por tanto, apoyar tanto los casos de la iscalía como de la defensa.

Tradicionalmente, la relación entre la ciencia y el derecho en los tribunales se ha percibido como dos entes no relacionados. De este modo, la valoración de la prueba pericial se realiza, por un lado, por la comunidad cientíica quien debe marcar los estándares para la validación de los métodos cientíicos aplicados a la pericial; y, por otro lado, por los agentes judiciales quienes se centran en valorar las cuestiones más de procedimiento y las cualiicaciones de los peritos de la pericial. En ningún momento, los jueces deben valorar la prueba según los estándares exigidos por el método cientíico sino que deben atribuirle un valor jurídico.

Con el planteamiento de la necesidad de nuevos estándares cientíicos en la sentencia del caso Daubert v. Merrell Dow Pharmaceuticals, Inc., 1993 (509 U.S. 579) y la propuesta del paradigma de la razón de verosimilitud, esta relación distante entre la ciencia y el derecho debe necesariamente estrecharse. La valoración de las periciales en un juicio no puede realizarse a partir de la puesta en escena de las partes y de los mismos peritos sino que la decisión judicial debe basarse en unos estándares de metodología cientíica robustos y que sean comprensibles por los jueces. Como se indica en las Reglas Federales el juez tiene la tarea de garantizar que el testimonio del perito se basa en los estándares de validez cientíica acordados y aceptados por la comunidad cientíica.

Bibliografía

BEL, N; QUERALT, S; SPASSOVA, M.S.; TURELL, M.T. «The Use of Sequences of Linguistic Categories in Forensic Written Text Comparison Revisited ». Proceedings of The International Association of Forensic Linguists’ Tenth Biennial Conference, 2012, p. 192-209, http://www.linguisticaforense.ufsc.br/galleries/IAFL2010.pdf

Page 47

BURROWS, J. F. «Questions of Authorship: Attribution and Beyond». Conferencia en ocasión del premio Roberto Busa ACH-ALLC 2001, Nueva York, Computers and the Humanities, 37, 2003, p.5-32.

--. «Word Patterns and Story Shapes: The Statistical Analysis of Narrative Style». Literary and Linguistic Computing, 2, 1987, p. 61-70.

CEH, B. «Criminalistiek Is Terugredeneren [Criminalistics Is Reasoning Backwards] ». Nederlands Juristen Blad, 2010, p.784-789.

CHAMPOD, C.; BALDWIN, D.; TARONI, F.; BUCKLETON, J. S. «Firearm and Tool Marks Identiication: The Bayesian Approach». AFTE JOURNAL, 35, 2003, p.307-316.

CHAMPOD, C.; EVETT, I. «Commentary on Broeders (1999)». FL 7/2, 2000, p. 238-243.

COOK, R.; EVETT, I.W.; JACKSON, G.; JONES, P. J.; LAMBERT, J. A. «A Hierarchy of Propositions: Deciding Which Level to Address in Casework». Science & Justice, 38, 1998, p.231-239.

COULTHARD, M. «Author Identiication, Idiolect, and Linguistic Uniqueness». Applied linguistics, 25, 2004, p.431-47.

--. «On the Use of Corpora in the Analysis of Forensic Texts». Forensic Lingusitics, 1, 1994, p.26-43.

COULTHARD, M.; JOHNSON, A. An Introduction of Forensic Linguistics: Language in Evidence, London and New York: Routledge, 2007.

CURRAN, J. M.; CHAMPOD, T.N.H.; BUCKLETON, J.S. Forensic Interpretation of Glass Evidence, CRC, 2000.

DELGADO, C. «Comentarios Sobre El Contexto Actual de La Identiicación Forense de Locutores», 2001, http://www.policia.es/org_central/cientiica/pdf/ident_locutores.pdf

FARRELL, M. G. «Daubert v. Merrell Dow Pharmaceuticals, Inc.: Epistemilogy and Legal Process». Cardozo L.Rev., 15, 1993, 2183.

GONZALEZ-RODRIGUEZ, J.; DRYGAJLO, A.; RAMOS-CASTRO, D.; GARCIA-GOMAR, M.; ORTEGA-GARCIA, J. «Robust Estimation, Interpretation and Assessment of Likelihood Ratios in Forensic Speaker Recognition». Computer Speech & Language 20,2, 2006, p.331-355.

HEPLER, A. B.; SAUNDERS C. P.; DAVIS, L. J.; BUSCAGLIA, J. «Score-Based Likelihood Ratios for Handwriting Evidence». Forensic science international, 2012.

HIRST, G.; FEIGUINA, O. «Bigrams of Syntactic Labels for Authorship Discrimination of Short Texts». Literary and Linguistic Computing, 22, 2007, p.405-417 , http://llc.oxfordjournals.org/content/22/4/405. full.pdf+html

HOLMES, D. I. «Stylometry and the Civil War: The Case of the Pickett Letters». Chance, 16, 2003, p.18-25.

KOPPEL, M.; SCHLER, J; ZIGDON, K. «Determining an Author’s Native Language by Mining a Text for Errors (short Paper)». Proceedings of KDD, Chicago Il., 2005.

MCDERMOTT, S. D; WILLIS, S.M.; MCCULLOUGH, J.P. «The Evidential Value of Paint. Part II: A Bayesian Approach».Journal of forensic sciences, 44 (1999), p.263-69.

MORRISON, G. S. «Comments on Coulthard & Johnson’s (2007) Portrayal of the Likelihood-Ratio Framework». Australian Journal of Forensic Sciences, 41 (2009), p.155-61.

NEUMANN, C.; EVETT, I.W.; SKERRETT, J. «Quantifying the Weight of Evidence from a Forensic Fingerprint

Comparison: A New Paradigm». Journal of the Royal Statistical Society: Series A (Statistics in Society), 175, 2012, p.371-415.

Page 48

Association of Forensic Science Providers. «Standards for the Formulation of Evaluative Forensic Science Expert Opinion». Science & Justice, 49, 2009, p.161-64, http://dx.doi.org/10.1016/j.scijus.2009.07.004

QUERALT, S.; SPASSOVA, M.S.; TURELL, M. T. «L’ús de Les Combinacions de Seqüències de Categories

Gramaticals Com a Nova Tècnica de Comparació Forense de Textos Escrits». LSC- Llengua, societat i comunicació, 9, 2011, p. 59-67.

QUERALT, S.; TURELL, M.T. «Testing the Discriminatory Potential of Sequences of Linguistic Categories (n-Grams) in Spanish, Catalan and English Corpora». The regional conference of the International Association of Forensic Linguists, 2012.

SAKS, M. J.; KOEHLER, J.J. «The Coming Paradigm Shift in Forensic Identiication Science». Science, 309,2005, p.892-95.

SCHLER, J.; KOPPEL, M.; ARGAMON, S.; PENNEBAKER, J. «Effects of Age and Gender on Blogging». Procedings of AAAI Spring Symposium on Computational Approaches for Analyzing Weblogs, 2006, http://u.cs.biu. ac.il/~koppel/papers/springsymp-blogs-07.10.05-inal.pdf

SKERRETT, J.; NEUMANN, C.; MATEOS-GARCIA, I. «A Bayesian Approach for Interpreting Shoemark Evidence in Forensic Casework: Accounting for Wear Features». Forensic science international, 210, 2011, p.26-30.

SPASSOVA, M. S. «El Potencial Discriminatorio de Las Secuencias de Categorías Gramaticales En La Atribución Forense de Autoría de Textos En Español». Tesis doctoral. 2009.

SPASSOVA, M. S.; TURELL, M.T. «The Use of Morpho-Syntactically Annotated Tag Sequences as Forensic Markers of Authorship Attribution». Proceedings of the Second European IAFL Conference on Forensic Linguistics, Language and the Law, ed. por M T Turell, M S Spassova y J Cicres, Barcelona: Publicacions de l’IULA, 2007, p. 229-237.

STAMATATOS, E. «A Survey of Modern Authorship Attribution Methods». Journal of the American Society for Information Science and Technology, 60, 2009, p.538-556, http://dx.doi.org/10.1002/asi.21001

STAMATATOS, E; FAKOTAKIS, N.; KOKKINAKIS, G. «Computer-Based Authorship Attribution without Lexical Measures». Computers and the Humanities, 35, 2001, p.193-214, http://www.iula.upf.edu/ materials/050401sanchez.pdf

TURELL, M. T. «Textual Kidnapping Revisited: The Case of Plagarism in Literary Translation». International Journal of Speech Language and the Law, 11, 2004, p.1-26.

--, «The Disputed Authorship of Electronic Mail: Linguistic, Stylistic and Pragmatic Markers in Short Texts». First European IAFL Conference on Forensic Linguistics, Language and Law, 2004.

TURELL, M. T.; GAVALDÀ FERRÉ, N. «Towards an Index of Idiolectal Similitude (or Distance) in Forensic Authorship Analysis». Brooklyn Law School’s Journal of Law & Policy, 2013, p.494-514 ,http://www. brooklaw.edu/intellectuallife/centerforlawlanguageandcognition/publications.aspx

TURELL, M. T. «La tasca del lingüísta detectiu en casos de detecció de plagi i determinacio d’autoria de textos escrits». Llengua, societat i comunicació, 9, 2011, p.67-83.

WOOLLS, D.; COULTHARD, M. «Tools for the Trade». International Journal of Speech Language and the Law, 5, 2007, p.33-57.

ZHENG, R.; QIN Y.; HUANG, Z.; CHEN, H. «Authorship Analysis in Cybercrime Investigation». ISI’03 Proceedings of the 1st NSF/NIJ Conference on Intelligence and Security Informatics, 2003, p. 59-73.

[1] Textos traducidos y adaptados por la autora de este artículo.

[2] Textos traducidos y adaptados por la autora de este artículo.

[3] Paradigm shift en inglés.

[4] Las Reglas Federales de Evidencia Se pueden consultar en: http://federalevidence.com/node/638

[5] Op. Cit. 597.

[6] Op. Cit. 593.

[7] Op. Cit. 594.

[8] Op. Cit. 594

[9] Op. Cit. 593.

[10] Véase p.ej. Regina v GK 2001(NSWCCA 413); R v Berry y Wenitong 2007 (VSCA 202).

[11] Véase p.ej. Lapper v R 2005 (NZCA 259).

[12] Véase p.ej. R v Doheny y Adams 1997 (1 Cr App R 369, CA).