La transcripción de registros de audio en el ámbito policial y judicial español: una propuesta de criterios

Transcription of Audio Recordings in Spanish Police and Legal Settings: Suggested Criteria

Elena Garayzábal Heinze

Universidad Autónoma de Madrid, España

elena.garayzabal@uam.es

Sheila Queralt

SQ-Lingüistas Forenses, España

sheila.queralt@upf.edu

Mercedes Reigosa

Policía Nacional Laboratorio de Acústica Forense de la Policía Científica, España

mercereigosa@hotmail.es

Susana Ridao

Universidad de Almería, España

sridao@gmail.com

Resumen: A lo largo de los años, investigadores de numerosos campos han presentado diferentes criterios y convenciones para transcribir muestras orales. Actualmente, los trabajadores que realizan las transcripciones en el sistema judicial español no comparten estándares o criterios generales. De hecho, existe una gran heterogeneidad en los acuerdos seguidos por los profesionales en este contexto. Este artículo destaca los beneficios de adherirse a un conjunto particular de criterios y convenciones que han sido acordados por 115 transcriptores para mejorar la eficiencia del proceso de transcripción, su comprensión y su valor como documentos clave en el sistema judicial, que pueden afectar directamente a los derechos de las partes involucradas en el proceso.

Palabras clave: Lingüística forense - criterios de transcripción - intervención de comunicaciones - calidad de la transcripción

Abstract: Over the years, researchers of numerous fields have suggested different criteria and conventions for the transcription of oral samples. Current practice by workers who carry out transcriptions in the Spanish legal system is not standardized and does not follow any general criteria. Indeed, the standards followed by professionals in this context are characterized by their heterogeneity. This contribution highlights the benefits of adhering to a particular set of criteria and conventions agreed upon by 115 transcribers to make the transcription process more efficient, improve its comprehension and add to the value of transcriptions as key documents within the legal system that may have a direct impact on the right of the parties involved.

Keywords: Forensic linguistics - transcription criteria - communications interception - transcription quality

Abogado: Con la venia, Señoría. Yo no, no consigoo.

Si es posible que se leyera la transcrip-

Juez: Sí, es lo que iba a hacer, porque yo voy en la misma línea

que usted, ¿puede leer la transcripción?

[Declaración de Ricardo Costa el 24 de enero de 2018 en la Audiencia Nacional

(vista oral de la trama valenciana del caso Gürtel)]

1. La transcripción de corpus orales

La labor de transcripción es un proceso complejo que requiere una gran inversión de tiempo y una capacidad de atención sostenida considerable. Una trascripción es una forma de facilitar el análisis de un corpus oral que se analiza y traspasa a la escritura para posibilitar su legibilidad cuando el soporte de audio no está disponible, todo ello con un propósito determinado. La transcripción ha de ser fiel a lo dicho e incluir todas las palabras y en el orden en que han sido pronunciadas. El resultado final de una transcripción debe permitir la fácil interpretación de lo que se dijo con la menor pérdida de datos posible, ajustándose a un sistema de transcripción concreto que pueda resultar comprensible al lector a quien va destinado (ten Have, 1999). La transcripción de textos orales compete tanto a lingüistas como a sociolingüistas, psicolingüistas y etnometodólogos; por tanto, se comparte la transcripción como medio de análisis, si bien el fin de la investigación difiere según los intereses particulares (O’Connell & Kowal, 1994).

Existen distintos tipos de transcripciones dependiendo del análisis que se efectúe sobre los corpus orales; en el ámbito de la filología española se observa una arraigada tradición en la confección de transcripciones fonéticas y fonológicas, y con tal fin se han elaborado manuales consagrados, como el de Navarro Tomás (1946), Quilis (1993), Gil Fernández (2007) o el de la RAE-ASALE (2009), por citar algunos ejemplos.

De igual modo, en el mundo anglosajón se aprecia una gran cantidad de referencias sobre transcripción fonética. Cabe destacar la obra de Heselwood (2013) que ofrece una panorámica muy completa y actualizada, donde se aborda la utilidad de las transcripciones fónicas en diccionarios, aprendizaje de lenguas extranjeras, enseñanza de fonética, terapia y patologías del habla, dialectología, estudios del acento y sociofonética, análisis conversacional y fonética forense.

Sin embargo, a pesar de que tradicionalmente se ha centrado el foco en la transcripción fonética, en el ámbito del análisis del discurso y de la conversación se constata la necesidad de recurrir a la transcripción ortográfica, que suele preservar la identidad léxica y gramatical a través del uso de la ortografía normativa. Los analistas del discurso y la conversación no analizan las estructuras fónicas, sino las sutilezas del comportamiento interaccional que se manifiestan cuando los individuos interactúan (Heselwood, 2013).

La transcripción del discurso puede ser definida como “the process of creating a written representation of a speech event so as to make it accessible to discourse research” (Du Bois, Schuetze-Coburn, Cumming, & Paolino, 1993, p. 45). Para ten Have (2002) la transcripción es parte esencial en el proceso de investigación del análisis conversacional en el que la información auditiva se traslada a una versión escrita comprensible, y donde el experto debe atender a detalles de la interacción que a un oyente común le pasarían inadvertidas, proceso no carente de problemática.

Con el nacimiento de la lingüística de la comunicación, la investigación ha requerido de la recogida y transcripción de corpus orales para la realización de los estudios pertinentes. El hecho de trabajar con producción oral de intercambios comunicativos presenta dificultades en el análisis de los datos: existe una tensión entre fidelidad y legibilidad en el paso de la oralidad a la escritura a la hora de decidir si conservar las condiciones naturales de lo oral o acomodarse a las exigencias de la escritura (Caravedo, 1996). Por este motivo, resulta conveniente aludir al concepto de transliteración, que responde a la mera adaptación ortográfica convencional que representa fenómenos tanto lingüísticos como prosódicos; por ejemplo, la pausa, la entonación y el énfasis e incluso los alargamientos vocálicos.

En español los sistemas de transliteración y codificación de la lengua hablada pueden dividirse en dos grandes grupos. Por un lado, quienes escogen la codificación a través de un sistema de etiquetas con capacidad para cuantificar datos y facilitar una búsqueda informatizada, lo que les otorga cierta universalidad al insertarse en un sistema apto para un marco científico extenso; y, por otro, quienes abogan por la legibilidad, la lectura fluida del texto y el reflejo preciso de ciertos fenómenos (Hidalgo & San Martín, 2005). Moore y Llompart (2017) diferencian también entre transcripción amplia, donde no se incluyen aspectos como prosodia, gestos o pausas, y transcripción fina, que se completa con símbolos que hacen referencia a la entonación, el énfasis, el ritmo, los gestos o la mirada.

Asimismo, Gallardo Paúls (1998) reflexiona sobre los problemas de corregir o adaptar una transcripción, puesto que se pierde información valiosa para el análisis conversacional, como las vacilaciones del hablante reflejadas en reinicios, la alternancia del habla con las risas, los anacolutos y la sintaxis truncada, detalles de la entonación que pueden resultar relevantes y señales de énfasis, entre otros. La necesidad de distinguir entre la transcripción y el acto de transcribir ya había sido señalada por Durante (1997), quien definió la primera como un proceso de socialización en el que se inscribe la acción social, mientras que el acto de transcribir sería el producto final de dicho proceso. La primera propuesta sólida sobre la realización de transcripciones para el análisis conversacional fue creada por Sacks, Schegloff y Jefferson (1974), con un sesgo sociolingüístico muy marcado que ha servido como modelo para muchas propuestas sucesivas con intereses investigadores parcialmente diferentes.

En España, la RAE-ASALE desarrolló unos criterios de transcripción para la creación del subcorpus oral del banco de datos CREA-CORDE, que responden a una serie de orientaciones que pueden consultarse en Pino y Sánchez (1999). Desde otro enfoque, el Grupo Val.Es.Co. diseñó un sistema de transcripción que goza de repercusión internacional, en el cual se combinan aspectos aparentemente tan incompatibles como que el texto transcrito resultante suponga un fiel reflejo de la realidad lingüística viva, y que tal transcripción sea fácilmente legible y comprensible para el investigador interesado en el análisis de los corpus orales (Hildalgo & Grupo Val.Es.Co., 2005). Con esos objetivos, en el sistema de transcripción creado y adaptado a fenómenos conversacionales se incluye una amplia información: alternancia de turnos, sucesión inmediata de emisiones, solapamientos, reinicios y autointerrupciones, escisiones conversacionales, pausas y silencios, entonación, fenómenos de énfasis, emisiones dudosas o indescifrables, fonosintaxis, alargamientos fonéticos, preguntas retóricas, estilo directo o referencias contextuales. Un problema añadido al proceso de la transcripción fue descrito por Llisterri (1999), quien se percató de la fecunda diversidad existente en el desarrollo de sistemas de transcripción, etiquetado y codificación de corpus orales, de manera que la estandarización se perfilaba como un reto difícilmente alcanzable. La disparidad se explica por las necesidades específicas de cada analista y del contexto en el que se inscribe la transcripción; así existen diferentes modelos de sistemas de transcripción como los de Tusón (1997), Hidalgo (2002), Ridao (2010) o Taranilla (2013); estas dos últimas autoras adaptan sus sistemas de transcripción a corpus de investigación enmarcados en el ámbito judicial.

2. La transcripción en el ámbito forense

La transcripción forense no tiene un fin investigador, como los estudios nombrados anteriormente, sino puramente práctico. Una de las condiciones que caracteriza este trabajo es la inmediatez con la que resulta necesario obtener información relevante que aportar tanto a los grupos operativos policiales como al juez a cargo del procedimiento. Las circunstancias en que se desarrolla este tipo de tarea no suelen ser las más idóneas para su desempeño, debido a la restricción en el uso de herramientas adecuadas, la falta de adaptación de los espacios de trabajo, la adecuación a distintos sistemas lingüísticos cuando, además, el transcriptor tiene que traducir de otras lenguas, la carencia de formación especializada o la falta de estándares generales que incluyan unos criterios unificados de transcripción.

Un trabajo aparentemente tan mecanizado y sencillo como es la transcripción presenta limitaciones: problemas de inteligibilidad debido a sonidos, interferencias o solapamientos entre varios hablantes; conveniencia de utilizar un sistema de transcripción generalizado que marque los aspectos relevantes para su posterior análisis, y necesidad de conocer en profundidad tanto la lengua como los dialectos y el argot usado (Cicres, 2011). Resalta también la trascendencia que puede tener cometer errores en la transcripción de grabaciones, como ocurre en los casos de mala atribución (asignar a un locutor un enunciado emitido por otro), de especial gravedad en el ámbito penal. Mientras, Eades (1996) subraya la dificultad de representar los procesos mecánicos, entendiendo por tales las limitaciones de la ortografía y la linealidad de los sonidos del habla, como son los aspectos prosódicos (entonación, volumen, tono o velocidad), aspectos paralingüísticos (voz temblorosa o risas) y aspectos no verbales (afirmar o negar con la cabeza, mirada o movimientos corporales).

En el ámbito forense, la transcripción podría definirse como el conjunto de anotaciones realizadas por un agente de la policía judicial, o un intérprete debidamente autorizado, referidas al contenido material de una comunicación legalmente intervenida mediante mandato judicial o de todas aquellas grabaciones audiovisuales que forman parte de las evidencias obtenidas a lo largo de una investigación policial y presentadas ante la correspondiente autoridad judicial.

La transcripción en los distintos contextos legales ha recibido escasa atención, lo que muestra la poca importancia otorgada tanto a la labor del transcriptor como a la transcripción en sí (Okrent, 2008). Esto queda patente en la revista de referencia de la Lingüística Forense, The International Journal of Speech, Language and the Law, entre cuyos objetivos no se incluyen aspectos relacionados con la transcripción de la lengua oral y tan solo dos artículos publicados por dicha revista, Walsh (1999) y Fraser (2003), tratan expresamente sobre este tema. El primero señala que existe una serie de elementos que obstaculizan la creación de una transcripción fiable en contextos legales, de índole lingüística (comunicación no verbal, confusión fonética, léxico específico, uso de pronombres o quién es el hablante), por una parte, y, por otra, óbices de naturaleza cultural. Reflexiona también sobre la dificultad de efectuar una transcripción correcta por las complicadas circunstancias en que se lleva a cabo y el grado de responsabilidad otorgado al transcriptor. El trabajo de Fraser (2003) ofrece recomendaciones que deberían contemplarse tanto a la hora de realizar una transcripción como de su utilización como prueba en el proceso judicial, entre ellas cabe destacar que las transcripciones no las realice alguien que tenga, o pueda tener, interés en el caso, y sean revisadas por expertos ajenos a la policía; en casos de grabación precaria que pueda ser impugnada, sería aconsejable que un experto fonetista acometiera la transcripción; si el material presentara mala calidad y escasez de discurso, debería rechazarse; o para la interpretación de determinadas palabras o enunciados resultaría conveniente un estudio de datos contextuales. Con posterioridad, advierte que “[…] it is useful to distinguish transcription of what it is said by whom in a speech recording from interpretation of what was meant by the speakers in the original conversation” (Fraser, 2015, p. 5).

En España, la utilización de las transcripciones en el ámbito forense queda enmarcada en la legislación relativa al uso de las comunicaciones telefónicas, así como en una amplia jurisprudencia, no solo en nuestro país sino en diversas sentencias emitidas por el Tribunal Europeo de Derechos Humanos. Hasta el año 2015 no se recogía expresamente la importancia de las transcripciones como parte de las evidencias de un procedimiento judicial. Su relevancia quedaba referida en las sentencias de casos muy específicos asociados siempre a las grabaciones, que conformaban la auténtica prueba en el marco de la investigación. A la transcripción se otorgaba prioridad tan solo en aquellas ocasiones en las que la grabación no estaba disponible en la vista oral por motivos varios, siempre y cuando estas hubieran sido adveradas por el Letrado de la Administración de Justicia.

Con la rectificación de la Ley de Enjuiciamiento Criminal (LO 3/2015, 5 de octubre), en el desarrollo de su artículo 588, se especifican los casos y el modo en que se deben aportar las transcripciones a lo largo del proceso de investigación, así como aquellos casos en los que estas conservan su valor de prueba documental pudiendo sustituir la escucha de las grabaciones durante el juicio oral, lo que le confiere un valor añadido a efectos casacionales, sirviendo, además, de apoyo al juez, dada la duración de los procedimientos y la gran cantidad de material y documentación que se maneja en ellos. El rápido desvanecimiento de la señal sonora o la dificultad de comprensión del discurso conllevan que el proceso de lectura resulte más cómodo que la escucha de los registros de audio. Sirva como ejemplo la petición de lectura de las transcripciones tras la audición de una de las conversaciones intervenidas entre Pérez y Costa en el transcurso de la vista oral de la trama valenciana del caso Gürtel, que realiza el juez y uno de los letrados.

2.1. Dificultades de la transcripción de grabaciones forenses

Una gran parte de las grabaciones utilizadas como evidencia en los procedimientos judiciales de delitos graves, sobre todo en investigación de crimen organizado y terrorismo, se realiza mediante el sistema de intervención telefónica-SITEL, siempre con autorización judicial. Este tipo de intervención da como resultado unas grabaciones que presentan, en general, una buena calidad, supeditada a ciertas circunstancias asociadas al contexto en que se desarrollan, como el lugar donde se ubican los locutores y su contexto acústico. En cambio, estos inconvenientes se ven atenuados por la gran cantidad de conversaciones grabadas, pues la intervención suele alargarse en el tiempo. Existe, además, un gran número de grabaciones relacionadas con la comisión de ciertos delitos (violencia de género, secuestros, acoso o amenazas) realizadas por víctimas, testigos e incluso por el propio autor del delito, que presentan limitaciones importantes debido al tipo de dispositivo de grabación utilizado, a las circunstancias de la grabación y a la calidad de la misma.

Otro aspecto relevante al afrontar la transcripción de las grabaciones en el medio forense es el trabajo contrarreloj que han de realizar los transcriptores, puesto que con frecuencia estas se encuentran inmersas en una investigación en curso y es necesario obtener la información en el mismo instante en que se produce el intercambio comunicativo conforme se van desarrollando las labores de descubrimiento policial. Según los estándares de la industria profesional (Boston, 1998) se tarda cerca de 1 hora en transcribir 15 minutos de grabación limpia, esto es, grabaciones que no presentan dificultad alguna y que se realizan bajo condiciones controladas. Sin embargo, en el ámbito forense, el bajo nivel de calidad de las grabaciones dificulta la percepción y comprensión de las emisiones de habla, por lo que el proceso de transcripción se alarga, viéndose exponencialmente incrementado por otros factores relacionados con el propio transcriptor: experiencia, capacidad de discriminación y concentración o conocimiento de la variedad dialectal utilizada.

La calidad y aspectos técnicos asociados a la misma vienen determinados esencialmente por cuestiones vinculadas con el dispositivo de grabación, el contexto en el que se realiza la grabación y el comportamiento de los locutores intervinientes en el acto de habla objeto de la grabación; la mayoría factores exógenos difícilmente controlables, entre ellos: el modo y lugar en que se ubica el equipo de grabación y su colocación respecto a los hablantes; el tipo de dispositivo utilizado y los actuales formatos, que presentan un alto nivel de compresión (amr, aac, m4a, opus, etc.); el ruido ambiental; las circunstancias que rodean la grabación (voz gritada o susurrada); el nivel de ruido de fondo; los solapamientos o el efecto cocktail party. Con todo, es posible proceder a la optimización de la grabación para que el mensaje resulte inteligible, aunque no en todos los casos este proceso es viable. En aquellos en que se ha podido llevar a cabo este procesado de la señal resulta muy conveniente para el transcriptor, pues le facilita el acceso al contenido literal del mensaje y a la comprensión fónica del acto locutivo.

Asimismo, las circunstancias relacionadas con cuestiones particulares de los hablantes en el instante en que tiene lugar el proceso de grabación afectan al resultado de las muestras de audio obtenidas, casi más que cualquiera de las eventualidades técnicas señaladas, ya que pueden alterar la percepción y comprensión de los intercambios comunicativos o cualquier tipo de alocución del que se haya requerido su transcripción. Las emisiones simultáneas de varios hablantes y la ruptura de turnos dificultan la comprensión del contenido y complican la correcta discriminación que permite asociar cada tramo de habla al locutor que lo produce. La cualidad de voz constituye otro de los factores que determinan la mejor o peor comprensión del mensaje objeto de la transcripción. La velocidad locutiva del habla espontánea en determinados hablantes ralentiza el proceso de transcripción, dado que el mismo tiempo de emisión puede contener mayor cantidad de palabras de lo habitual, y dificulta la compresión del mensaje emitido.

El habla espontánea presenta una serie de características que condicionan la comprensión del mensaje como, por ejemplo, interrupciones, autocorrecciones, repeticiones, muletillas, risas, dudas e incoherencias discursivas. La variedad lingüística y dialectal de los hablantes conforma un factor determinante, al que se añade la variedad idiolectal, i.e., el uso particular que cada hablante tiene de su propia lengua en relación con la zona específica de la que procede, así como el contexto social y grupal en el que se desenvuelve, el léxico, las expresiones hechas e idiosincrásicas de un hablante y su variación dialectal. Todo ello complica la tarea del transcriptor en el caso de que desconozca esas formas específicas de habla. Los problemas y el tiempo para llevar a cabo la tarea de transcripción aumentan cuando se añade la necesidad de proporcionar una traducción o interpretación de otra lengua que no sea la nativa del traductor.

2.2. La figura del transcriptor

Todas las dificultades que rodean el intercambio comunicativo señaladas hasta el momento se registran en una grabación de audio tal y como han sucedido en el momento en el que se produce la señal sonora, y son fácilmente perceptibles durante su reproducción. Estos inconvenientes pueden minimizarse gracias al buen hacer del transcriptor al traspasar el sonido a la escritura, lo que requerirá un menor esfuerzo por parte del receptor de las transcripciones y le posibilitará recurrir a ellas cuantas veces sea necesario, permitiéndole realizar anotaciones o comentarios pertinentes, subrayar información de interés, etc.

Resulta imprescindible que la figura del transcriptor en este ámbito cumpla ciertos requisitos básicos de formación y entrenamiento que le ayuden a adquirir la experiencia necesaria y, sobre todo, un profundo conocimiento del lenguaje usado en la grabación y su normativa, además de un buen nivel de la lengua meta cuando los hablantes utilicen un idioma distinto. Es también necesario un amplio conocimiento del contexto social en el que se desarrollan estas lenguas, así como el manejo de herramientas que faciliten su trabajo, entre las que cabría incluir la utilización de criterios de transcripción unificados concretos para el ámbito forense. La formación específica y la experiencia acumulada por el transcriptor, junto con la capacidad de atención y concentración, acortará el tiempo empleado en su labor gracias a un sólido entrenamiento perceptivo que le permitirá realizar una correcta discriminación e identificación de los locutores intervinientes en la muestra de habla, así como entender el contenido de la interlocución y realizar una transcripción fiable de la grabación.

La tarea de transcribir un registro de audio es un proceso solitario en tanto que el experto se enfrenta de forma individual a cada transcripción y unilateralmente lleva a cabo una continua toma ecléctica de decisiones acerca de qué ha de transcribir y cómo plasmarlo de forma escrita; por este motivo, establecer estándares y criterios de uso común compartidos no solo por la propia comunidad de transcriptores, sino también por los receptores demandantes de la transcripción, resulta necesario.

Los requisitos que cabría exigir a un transcriptor que desarrolle su labor dentro del marco de una investigación policial/judicial deberían ser muy específicos dada la naturaleza y las circunstancias confidenciales de este trabajo. Por ello, es importante prestar atención a una serie de principios básicos:

- Formación. Es conveniente que el transcriptor reciba formación específica en esta área, atendiendo a cuestiones lingüísticas relacionadas con la jerga judicial y policial, y con aspectos normativos de la lengua nativa, así como de la lengua meta en el caso del transcriptor que además realice tareas de traducción e interpretación. Asimismo, el transcriptor deberá poseer un vasto conocimiento del contexto en el que se desarrolla el proceso investigativo, tanto a nivel sociocultural como sociolingüístico, complementado siempre con el conocimiento básico del sistema legal y el funcionamiento del sistema procesal-penal, así como de la labor operativa de los investigadores. Sin olvidar la formación relacionada con las herramientas que facilitan la labor del transcriptor, como los procesadores de textos, el software de edición de audio y los programas de transcripción o el manejo del sistema integrado de telecomunicaciones.

- Metodología. Habrá que ajustarse a una metodología rigurosa que permita organizar, sistematizar y unificar el trabajo de manera que cuando la transcripción sea adverada presente la mayor fiabilidad y validez posible, reforzando el peso de la grabación proporcionada como prueba en el procedimiento judicial.

- Experiencia. Para desarrollar fluidamente la técnica de transcripción es necesario un entrenamiento continuado, en el que se aplique una metodología automatizada que permita reducir el tiempo dedicado a la compleja labor de transcribir, cuya primera fase requiere de un aprendizaje auditivo-perceptivo intensivo que facilite alcanzar óptimos niveles de concentración y una buena capacidad para trabajar bajo presión.

- Control de calidad. El trabajo debe ser revisado por otro transcriptor o por un responsable de la investigación. Este control resulta necesario dado que es muy frecuente que algunos tramos sean dudosos o inconsistentes, y otros oídos ayudan a solventar dudas y dar validez y fiabilidad a la transcripción en una primera instancia. En el caso de la figura del transcriptor-intérprete-traductor, la transcripción debe ser contrastada con un segundo traductor de la misma lengua.

3. Propuesta de criterios de transcripción unificados en el ámbito forense español: criterios Grupo ILFE [Investigación en Lingüística Forense-España].

Como ya se ha mencionado, el transcriptor debe afrontar su tarea partiendo de la audición de un registro oral que en el contexto forense suele presentar deficiencias que dificultan la correcta comprensión de su contenido verbal, objetivo esencial en muchas de las grabaciones que figuran como pruebas procesales en el transcurso de una investigación policial y judicial. La escasez o ausencia de formación especializada, la falta de entrenamiento y la carencia de una metodología unificada en este campo tan específico lleva, en ocasiones, a inexactitudes que pueden provocar interpretaciones erróneas respecto al contenido de las grabaciones, llegando a poner en riesgo la validez de las evidencias sonoras dentro de todo el procedimiento judicial, e incluso a invalidarlo.

La decisión de llevar a cabo este trabajo surge, en primer lugar, a partir de las irregularidades observadas en las transcripciones que acompañaban los registros de audio remitidos a la policía científica para la realización de estudios comparativos de voz, y de las consecuencias procedimentales que los errores plasmados en dicha documentación producían a la hora de dar validez a los estudios periciales solicitados, como ocurre en casos de atribución errónea. Por otro lado, y tras la impartición de unos seminarios de formación en transcripción y traducción forense (Instituto de Ciencias Forenses y de la Seguridad de la Universidad Autónoma de Madrid en 2011 y Máster de Traducción e Interpretación de la Universidad de Alcalá de Henares en 2013), los traductores e intérpretes del Ministerio del Interior que auxilian a las Fuerzas y Cuerpos de Seguridad del Estado (FCSE) en estas tareas expresaron su interés por formarse específicamente en las labores de transcribir los discursos asociados a una investigación criminal en un entorno de trabajo especialmente duro, complejo y exigente, por lo que el propio el propio Ministerio nos solicitó impartir un curso de formación especializada del que se han celebrado tres ediciones (2015, 2017, 2018). En todos estos cursos quedó patente la escasa formación que se ofrece desde las instituciones a aquellas personas que, una vez en su puesto de trabajo, desempeñan la labor de transcribir las grabaciones asociadas a la comisión de un delito, obtenidas en el transcurso de una investigación policial. En el caso de los funcionaros policiales no se incluye en su fase formativa nada relacionado con este tipo de trabajo y son la experiencia y el interés los que marcan la calidad de esas transcripciones, y el aprendizaje acierto-error tras su incorporación a un grupo operativo. Cuando se introduce una lengua distinta del español, se hace necesaria y obligatoria la intervención de personal especializado en dicha lengua, cuyo único requisito exigido es el ‘conocimiento’ de la misma, sin entrar en consideraciones tales como la familiaridad con determinada variedad dialectal o con la lengua meta y su contextualización en un ámbito social, cultural y profesional, y el consiguiente dominio de jerga específica; prueba de ello son aquellos casos en los que la incorporación de transcripciones defectuosas o claramente incompletas han afectado al derecho a un proceso judicial con todas las garantías al no posibilitar la contradicción y la defensa. Lo que estas cuestiones parecen mostrar es, por una parte, la escasa especialización en el ámbito de la transcripción ofrecida a quienes realizan esta tarea de apoyo a la labor policial y, por otra, el escaso interés existente por mejorar esta parte del procedimiento, lo que además de ahorrar tiempo y esfuerzo ofrecería el valor añadido de calidad.

3.1. Proceso de selección de los criterios de transcripción para su aplicación en el ámbito de la transcripción forense

El presente trabajo se centra en el proceso de transcripción llevado a cabo por personal vinculado con las FCSE, y más concretamente con su trabajo como policía judicial, y aquellos registros de audio relacionados con investigaciones en curso y no con grabaciones audiovisuales en vistas, audiencias o comparecencias judiciales. Esta decisión se adopta por una cuestión práctica, ya que una gran parte del trabajo de transcripción de registros de audio en este ámbito durante toda la investigación, y porque resulta fácilmente extrapolable a cualquiera de las otras grabaciones registradas a lo largo del proceso judicial.

A partir de los cursos de formación impartidos y de la experiencia personal en este tipo de trabajo, se han detectado una serie de carencias claramente apreciables en el resultado final de las transcripciones realizadas por los encargados de las tareas de transcripción a nivel policial, tanto en el ámbito nacional como autonómico, y judicial, y de las que los propios transcriptores son conscientes. Estas deficiencias pueden agruparse en cuatro bloques principales:

1. Heterogeneidad: cada especialista transcribe a su manera (modo de presentación, criterios, atribución, etc.), y resulta práctica habitual que sean varios los transcriptores asignados a una misma investigación.

2. Error en las atribuciones, que se produce sobre todo como consecuencia de lo anterior. Debido al seguimiento de una cronología aleatoria de los acontecimientos y a la falta de continuidad de los transcriptores, no se consigue alcanzar el suficiente nivel de familiarización con las voces para poder llevar a cabo una discriminación adecuada de los turnos de palabra de cada uno de los hablantes. Esto, junto con los solapamientos y ruidos que se producen en el desarrollo de una conversación, provoca que se atribuyan tramos de discurso a otro locutor.

3. Falta de contextualización. El hecho de que no se asignen transcriptores fijos y especializados a una investigación supone que se produzcan pérdidas de información relevante al no disponer de una visión de conjunto, lo que puede conducir a la comisión de errores terminológicos, referenciales o deícticos.

4. Falta de control de calidad. Debido a la premura de tiempo con que trabajan los investigadores, en la mayoría de las ocasiones no se realizan detalladas revisiones del trabajo de transcripción, error incluso más evidente en aquellos casos en los que los investigados se comunican en otra lengua.

Esta serie de deficiencias pone manifiesto la escasa rigurosidad con que parece afrontarse una labor tan delicada como es la transcripción, lo que implica la asunción de que este tipo de tarea sigue siendo valorada como un mero trámite administrativo dentro de un amplio procedimiento judicial. A esta consideración han contribuido varios factores, como la argumentación expuesta en las sentencias dictadas por los tribunales, la rutina instalada en el día a día de las investigaciones policiales y judiciales y la posible laxa interpretación que se hace de la definición de transcripción como “medida facilitadora” o “medio contingente”, como simplificadora del proceso de consulta y constatación, y su no consideración como requisito legal y, por tanto, prescindible, a pesar de que se recurra a ella de forma habitual, especialmente en los tramos de interés. Parece obvio que debe producirse un cambio de actitud en todos los actores participantes implicados en las distintas fases de este tipo de procedimientos, asumiendo que la transcripción forense es una tarea que trasciende el mero trabajo administrativo y forma parte de un engranaje complejo cuyos resultados finales pueden revestir serias consecuencias para los investigados.

A pesar de ello, está claro que recurrir o solicitar la lectura de las transcripciones es una práctica habitual, pero para que estas realmente tengan el peso documental que se merecen dentro del proceso en que se inscriben es necesario que sean fiables y para eso es indispensable que exista una metodología específica a la que ajustarse. Una metodología que no tiene sentido sin la formación necesaria que permita aplicar un protocolo y un sistema de criterios comunes que faciliten tanto la realización de una transcripción como su lectura y comprensión por parte de los receptores de la misma.

Otra cuestión metodológica relevante tiene que ver con la toma de decisiones respecto a la consideración de realizar un resumen o una reproducción verbatim del contenido. Mientras las conversaciones personales no son tenidas en cuenta, y algunas se registran como sin interés, otras sí resultan pertinentes para la investigación y su resumen o su literalidad vendrán determinadas por las necesidades de la investigación y estarán marcadas por el responsable de esta y, en última instancia, por el magistrado a cargo del procedimiento. Solo en los casos de grabaciones en las que se detecta indicio del delito se procedería al volcado literal del discurso; es entonces cuando se lleva a cabo la transcripción como tal.

Un aspecto importante del protocolo de actuación es la reducción del tiempo empleado en la transcripción que, además, asegure un buen resultado final. Para lograrlo es aconsejable realizar una primera aproximación perceptiva que permita la captación inicial de información sobre la dificultad del audio, la identificación del número de interlocutores, la captación del contenido global, etc. para, a continuación, dar inicio al proceso de transcribir. Para afrontar tramos de difícil comprensión es conveniente recurrir a una segunda opinión o descansar auditivamente para retomar de nuevo la escucha selectiva. Una vez finalizado, siempre es recomendable revisar el trabajo realizado. Todo ello redunda en una reducción de los tiempos de transcripción, aunque resulte paradójico y, sin duda, en un resultado más fiable y válido.

A la hora de rebajar el tiempo de duración del proceso de transcribir una muestra de audio, es necesario utilizar un sistema de codificación del habla cuyos criterios resulten claros, sean limitados e intuitivos y de acceso rápido en el teclado, y cuyas reglas de aplicación sean de fácil comprensión y de uso homogéneo por parte de la comunidad de transcriptores forenses.

A continuación, se propone un sistema de codificación con una serie de criterios que cumplen estas características, que se circunscriben exclusivamente al campo forense y que constituyen una herramienta de utilidad y de aplicación común por parte de los transcriptores, y que han sido consensuados con los grupos de trabajo mencionados previamente. A partir de la propia experiencia como transcriptoras en casos de relevancia judicial, y del conocimiento de los sistemas de codificación lingüística utilizados en distintos ámbitos en los que se producen intercambios comunicativos, se seleccionaron un total de veinte criterios que fueron presentados, en diferentes foros, a un total de 115 expertos que desarrollaban labores de transcripción forense. Se trataba de criterios de base lingüística, pero acotados a las necesidades específicas del transcriptor inmerso en una investigación en curso.

La propuesta de los criterios no se encuadraba en una investigación académica, sino que surgió de la necesidad de formación que se observaba en todos los actores que debían realizar transcripciones de grabaciones enmarcadas en una investigación policial y judicial. Se producen dos circunstancias propicias: por un lado, el grupo ILFE es solicitado para impartir esos cursos y minimizar los problemas que se observaban en las transcripciones, en parte debido a carencias formativas. Por otro lado, la experiencia del grupo en transcripciones forenses ya había permitido que, de los diferentes criterios de transcripción existentes, se viera cuáles eran aquellos más relevantes y cuáles perfectamente prescindibles a la hora de realizar las transcripciones de audios complejos (por la calidad del sonido, el número de locutores, etc.) en un tiempo breve y que fueran de fácil manejo.

Dentro de los cursos de formación mencionados se incluyeron ejercicios prácticos en los que los transcriptores debían transcribir utilizando sus propios criterios y posteriormente emplear los 20 criterios propuestos. En cada curso se pusieron en común todas aquellas cuestiones que se plantearon en el transcurso de las prácticas. De cada uno de los cursos se extrajeron las mismas conclusiones: la necesidad de establecer un protocolo de actuación, la exigencia de formación y el acopio de experiencia y, por supuesto, el uso de herramientas que faciliten su labor diaria; entre las que se recogió la inclusión de criterios de transcripción, ya que aportan gran claridad en el trasvase del habla espontánea al documento escrito, lo que también simplificará la lectura a sus receptores.

De las cuestiones relacionadas con el establecimiento y uso de criterios de transcripción surgió un consenso, que podría decirse espontáneo, entre los expertos dedicados a la transcripción forense para reducir los veinte criterios a un total de quince, siendo la pauta de esta selección que fueran criterios intuitivos para los transcriptores, no ambiguos y de acceso cómodo, así como de fácil comprensión para los receptores finales del trabajo. La reducción sobre los primeros veinte criterios propuestos constituye un aspecto de gran importancia pues la cantidad de criterios es importante dado que un mayor número dificultaría su memorización, lo que obligaría a realizar reiteradas consultas, ralentizando el trabajo tanto para el emisor como para los destinatarios últimos de las transcripciones.

Esta selección obedece a las necesidades que desde el mundo forense se han venido observando durante estos últimos años. Se pueden encontrar otros sistemas de codificación más numerosos y detallados respecto a cuestiones del habla, pero que no resultan de especial relevancia en este ámbito. Se tiene constancia de que en 2015 el Centro de Lingüística Forense de la Universidad de Aston (Birmingham) presentó a la policía de Manchester el resultado de un proyecto destinado a mejorar la calidad de las transcripciones de los interrogatorios policiales, en el que parte de los criterios de transcripción estaban relacionados con el análisis del discurso (duración de pausas por segundos, entonación o elisión de pausa entre turnos de palabra), lo que evidencia el campo de aplicación tan específico para el que fueron seleccionados estos criterios y su objetivo último.

3.2. Aspectos clave en la selección de criterios de transcripción

La selección final de los quince criterios propuestos viene marcada por aquellos aspectos que resultan reseñables en una transcripción forense, circunscrita como ya se ha mencionado al ámbito judicial y policial español, y que tienen que ver con las cuestiones señaladas a continuación, que marcarán el nivel de calidad del trabajo resultante. En esta selección se tuvieron en cuenta diferentes aspectos, como los que se enumeran seguidamente, teniendo siempre en cuenta la limitación temporal del trabajo de los transcriptores y la cantidad de usuarios finales receptores del mismo:

1. Determinar tramos atribuidos a un locutor (¿quién dice qué?).

2. Indicar solapamientos o superposición de voces, pues es cuando se puede producir una mala atribución.

3. Señalar el énfasis con que se está produciendo la emisión, sin entrar en consideraciones entonativas, marcando solo la voz gritada o susurrada, siempre y cuando resulte relevante en esa emisión.

4. Distinguir emisión interrogativa o exclamativa mediante el uso de los signos ortográficos respectivos siguiendo la normativa de la lengua española.

5. Marcar alargamientos vocálicos y consonánticos.

6. Resaltar autocorrecciones y autointerrupciones, porque pueden aportar información sobre el tipo de relación comunicativa entre los hablantes (de igual a igual o relaciones jerárquicas) y mostrar características idiosincrásicas del hablante, que pueden ser relevantes para la investigación.

7. Respecto a las pausas, cuando estas son normativas, debería recurrirse al uso de la ortografía del español por medio de los signos ortográficos habituales, primando siempre la legibilidad. Sin embargo, cuando las pausas silenciosas exceden tiempos naturales de más de 30” convendría utilizar otro símbolo que marque esta excepcionalidad en el intercambio comunicativo.

8. Indicar formas incompletas del habla, asimilaciones o acortamiento de las palabras que pueden aportar rasgos sociolectales e idiolectales del hablante.

9. Dejar constancia del uso o inclusión de palabras en otra lengua que indican un cambio de código o una alternancia del mismo (code switching).

10. Subrayar la falta de inteligibilidad de un tramo de la grabación. La percepción y discriminación del contenido de un audio en condiciones forenses puede resultar limitada y, en ocasiones, se pierde información, lo que dificulta la comprensión del mensaje emitido.

11. Permitir comentarios al transcriptor, especialmente cuando están implicadas otras lenguas o culturas.

Este sistema de codificación no pretende innovar sino facilitar el trabajo de los transcriptores que realizan su labor en el ámbito policial/judicial, así como simplificar el procesamiento de la lectura de los documentos resultantes a aquellos receptores de los mismos. En este sentido, se ha tomado la decisión de descartar de forma expresa, y desde casi el principio, dos de los criterios más recurridos y utilizados hasta el momento en las transcripciones policiales: (1) un símbolo de uso tan común como ambiguo, los puntos suspensivos, dado que su representación multifuncional puede producir confusión en su interpretación al servir tanto para indicar una pausa larga como la suspensión del discurso o una enumeración interrumpida, además de flujo lento del habla, alargamientos, omisiones, duda o temor; (2) el término “ininteligible”, que además suele escribirse entre paréntesis, supone aumentar el número total de pulsaciones y, por ende, una mayor inversión de tiempo, sin aportar información pertinente, como la cantidad de discurso incomprensible. También se descartaron criterios que atendían a cuestiones que en la práctica general del transcriptor forense no se presentan, pero que se propusieron al ser criterios habituales en la transcripción lingüística, como por ejemplo, para indicar entonación o tono ascendente, o para indicar lo contrario, ambos símbolos de escasa relevancia en el ámbito que nos ocupa y que se pueden resolver mediante el uso de los criterios 2, 4, 5, 13 o 14 que se proponen en este trabajo (véase tabla 1), teniendo en cuenta siempre el contexto en que aparece la emisión.

Respecto a la inclusión de comentarios que el transcriptor considere que son relevantes para la investigación, podrán tenerse en cuenta dos tipos: (a) atendiendo a su extensión o relevancia, se incluirán dentro de la propia transcripción cuando sean breves, como ocurre en el caso de explicaciones terminológicas, o cuando se produzca alguna emisión onomatopéyica o pausas rellenas; (b) se añadirán en forma de nota al pie cuando la explicación requiera de una mayor complejidad y relevancia para la comprensión del contenido dentro del contexto de la investigación.

Tras estas consideraciones, se presenta a continuación la Tabla 1 con los criterios propuestos que recogen todas las indicaciones arriba expuestas, y consensuadas por un amplio número de expertos:

Nº de Criterio

CÓDIGO

SIGNIFICADO

EJEMPLO

1

A:

Turno de palabra/locutor interviniente

María: Ya te dije que no.

Pedro: Bien, conforme.

2

PALABRA

Énfasis/elevación de tono

Me ha dicho que qué pastilla me tomo y ya va la segunda vez que me lo dice, YA VA LA SEGUNDA VEZ QUE ME LO DICE.

3

aa/ss

Alargamiento vocálico/consonántico

Es conocido comoo, bueno ya sabess, Cuquín.

4

¿ ?

Frases interrogativas

¿Es que no piensas devolvérmelo?

5

¡ !

Frases exclamativas

¡Pues nunca lo diría!

6

pal-

Auto-interrupciones/auto-correcciones

Pero tú te-, tú pero es que eres gil- tú eres idiota o qué.

7

[ ]

Solapamiento

J: Por su[puesto

S: Preferi]blemente por las tardes, porque por las mañanas tengo clase.

8

(( ))

Ininteligible

He llegado, estoy en (( ))

9

((duda))

Emisión dudosa

Dijo que se acercaba por el ((barco)) antes de coger el vuelo.

10

pa’

Uso de grafía fonética para acortamiento palabra o supresión fonema

Pues como es cuña’o del jefe, me tocó a mí.

11

//

Pausas del habla no normativa (≥ 30”)

Nunca lo había escuchado // Nunca hasta ahora.

12

cursiva

Locución en otra lengua (code-switching)

Tú escuchas Burguer King y piensas ¡mola!, escuchas O rei da hamburguesa y ya no te fías.

13

* voz susurrada*

Locución susurrada

No voy ni a intentarlo *pero te juro que te vas a acordar*

14

{ }

Explicación breve, onomatopeya

No cuelgues el teléfono, ¿eh? {silbido largo}.

15

Nota al pie

Comentario del transcriptor

N.T. Los adolescentes recurren a este tipo de expresiones para dirigirse a los mayores.

Tabla 1. Criterios de transcripción para el ámbito forense español propuestos por el Grupo ILFE

4. Conclusiones

Como se ha observado, existen varios y variados obstáculos durante el proceso de transcripción en casos judiciales, tanto compartidos con otros tipos de transcripción como específicos de este ámbito. Entre estos últimos, se han destacado la premura a la que están sometidos los profesionales que realizan las transcripciones, y la falta de formación específica y de homogeneidad en las metodologías utilizadas entre transcriptores. En concreto, se ha argumentado que una formación especializada para estos profesionales contribuiría directamente a superar las deficiencias actuales identificadas y clasificadas en cuatro bloques principales (heterogeneidad, error en las atribuciones, falta de contextualización y escaso control de calidad).

Los antecedentes de los criterios de transcripción presentados en este artículo son muy amplios si se tiene en cuenta las propuestas de sistemas de transcripción de muestras orales con distintos fines. Se ha podido constatar que varios autores han desarrollado sistemas que se ajustan a diversos objetivos y ámbitos de actuación como son las transcripciones fonéticas y fonológicas o las usadas en el análisis conversacional. Sin embargo, las características de dichas propuestas no se adecuan a los requisitos específicos observados en las transcripciones utilizadas en procesos judiciales. A diferencia de estas, los quince criterios de transcripción presentados se establecieron estrictamente con el objetivo de reducir el tiempo de trabajo, de que fueran limitados y de fácil acceso en el teclado y de que resultaran claros, intuitivos y de fácil comprensión y memorización. Además, tienen el valor añadido de que han sido consensuados por profesionales que llevan a cabo este tipo de transcripciones y nos consta que se están utilizando de forma de habitual.

En consecuencia, la implantación de estos criterios de transcripción podría comportar una mayor eficiencia y reducción del tiempo empleado, la eliminación de ambigüedades en las transcripciones, una mejor comprensión por parte de sus receptores-lectores y el aumento del consenso y homogeneidad entre profesionales del ámbito forense. Estas contribuciones tendrían un impacto directo en el peso documental que se otorga a las transcripciones como parte de los procesos judiciales. Un cambio en la percepción de estos documentos como una pieza cuyo peso va más allá del mero trámite administrativo es indispensable, ya que pueden afectar a los derechos de las partes implicadas en los procesos. La fiabilidad necesaria que deben presentar las transcripciones adveradas para que dicho cambio pueda darse sería posible mediante la implantación de los criterios propuestos en este trabajo y de una formación especializada dirigida a los profesionales que realizan dichas transcripciones.

Referencias bibliográficas

Boston, I. (1998). IB Transcription Services. Recuperado de http://www.ibtranscriptionservices.co.uk/transtimes.htm

Caravedo, R. (1996). La escritura de la oralidad. Reflexiones críticas y autocríticas sobre la transcripción de un corpus. Lexis XX, 1(2), 221-235.

Cicres, J. (2011). Transcripció i autenticació de gravacions en contextos judicials. Llengua, Societat i Comunicació, 9, 26-32.

Du Bois, J., Schuetze-Coburn, S., Cumming, S., & Paolino, D. (1993). Outline of discourse transcription. En J. Edwards & M. Lampert (Eds.), Talking Data. Transcription and Coding in Discourse Research (pp. 45-89). Hillsdale: Lawrence Erlbaum Associates.

Durante, A. (1997). Linguistic Anthropology. Cambridge: University Cambridge Press.

Eades, D. (1996). Verbatim courtroom transcripts and discourse analysis. En H. Kniffka (Ed.), Recent Developments in Forensic Linguistics (pp. 241-254). Frankfurt: Peter Lang.

Fraser, H. (2003). Issues in Transcription: Factors affecting the reliability of transcripts as evidence in legal cases. The International Journal of Speech, Language and the Law, 10(2), 203-226.

Fraser, H. (2015). Transcription of poor quality covert recordings used as evidence in criminal trials. (Last reviewed August 2017). Recuperado de https://forensictranscription.com.au/wp-content/uploads/HF-Expert-Evidence-Ch100-rev-2017.pdf

Gallardo Paúls, B. (1998). Comentario de textos conversacionales I: de la teoría al comentario. Madrid: Arco Libros.

Gil Fernández, J. (2007). Fonética para profesores de español: de la teoría a la práctica. Madrid: Arco Libros.

Heselwood, B. (2013). Phonetic transcription in theory and practice. Edinburgh: Edinburgh University Press.

Hidalgo Navarro, A. (2002). La transcripción de la lengua hablada: el sistema del grupo VAL.ES.CO. Español Actual, 77.

Hidalgo Navarro, A., & Grupo Val.Es.Co. (2005). La transcripción de un corpus de lengua hablada. El sistema de transcripción del Grupo Val.Es.Co. En J. Murillo (Ed.), Actas del II Coloquio Internacional del Programa EDICE. Actos de habla y cortesía en distintas variedades del español: Perspectivas teóricas y metodológicas (pp. 275-317). Estocolmo/Costa Rica: EDICE.

Hidalgo Navarro, A., & Sanmartín Sáez, J. (2005). Los sistemas de transcripción de la lengua hablada. Oralia, 8, 13-36.

Llisterri Boix, J. (1999). Transcripción, etiquetado y codificación de corpus orales. Revista Española de Lingüística Aplicada, Volumen monográfico, 53-82.

Moore, E., & Llompart, J. (2017). Recoger, transcribir, analizar y presentar datos interaccionales plurilingües. En E. Moore & M. Dooly (Eds.), Enfoques cualitativos para la investigación en educación plurilingüe (pp. 418-433). Dublín/Voillans: Research-publishing.net. doi: 10.14705/rpnet.2017.emmd2016.639

Navarro Tomás, T. (1946). Estudios de fonología española. Nueva York: Las Américas Publishing Company.

O’Connell, D., & Kowal, S. (1994). Some current transcription systems for spoken discourse: A critical analysis. Pragmatics, 4(1), 81-107. doi: 10.1075/prag.4.1.04con

Okrent, C. (2008). Legal Terminology for Transcription and Court Reporting. Nueva York: Delmar Cencage Learning.

Pino Moreno, M., & Sánchez Sánchez, M. (1999). El subcorpus oral del banco de datos CREA-CORDE (RAE): Procedimientos de transcripción y codificación. Oralia, 2, 83-138.

Quilis Morales, A. (1993). Tratado de Fonología y Fonética españolas. Madrid: Gredos.

Real Academia Española (2009). Nueva gramática de la lengua española. Madrid: Espasa Libros.

Ridao Rodrigo, S. (2010). El género judicial. Materiales para su estudio lingüístico. Extremadura: Junta de Extremadura.

Sacks, H.; Schegloff, E., & Jefferson, G. (1974). A simplest systematics for the organization of turn-taking for conversation. Language, 50(4), 696-735.

Taranilla García, R. (2013). Aspectos metodológicos en la confección de un corpus jurídico. Consideraciones a propósito del Corpus de Procesos Penales. Revista de Investigación Lingüística, 16, 311-341.

Ten Have, P. (1999). Doing conversation analysis: A practical guide. Londres: Sage Publications.

Ten Have, P. (2002). Reflections on transcription. Cahiers de praxématique, 39, 21-43.

Tusón Valls, A. (1997). Análisis de la conversación. Barcelona: Ariel.

Walsh, M. (1999). Interpreting for the transcript: Problems in recording Aboriginal land claim proceedings in northern Australia. The International Journal of Speech, Language and the Law, 6(1), 161-195.