Logos: Revista de Lingüística, Filosofía y Literatura
2011, 21 (2) 4-16
DESCRIBING NON-VOLUNTARY REPETITION OF SEGMENTS IN SEMI- SPONTANEOUS SPEECH
___________________________________________________
Domingo Román Montes de Oca1 Valeria Cofré Vergara 2
Camilo Quezada Gaponov 3
José Matas Crespo 4
Jordi Llumà i Fuentes 5
1 Doctor, Pontificia Universidad Católica de Chile. dromanm@uc.cl
2 Magíster, Pontificia Universidad Católica de Chile. 3 Magíster, Pontificia Universidad Católica de Chile. 4 Traductor.
5 Doctor, Dept. de Ciència de Materials i Enginyeria Metal•lúrgica EUETIB - Universitat Politècnica de Catalunya
En esta investigación se analizan casos de repeticiones involuntarias de segmentos en muestras de habla semiespontánea de un hombre y de una mujer de Santiago de Chile. Las muestras fueron sometidas a un análisis acústico de la duración en el oscilograma y el espectrograma correspondiente. Se presentan los datos desde una perspectiva general (tipos de palabras que aparecen más recurrentemente, número de reiteraciones y número de componentes del segmento repetido) y también se exponen los resultados de un análisis más específico de la duración de los segmentos. Estos resultados muestran que las palabras de clase cerrada tienen mayor frecuencia de aparición, que el segmento tiende a repetirse dos veces y que suele estar constituido por un elemento. El análisis temporal revela con mucha consistencia que el primer segmento es más largo que el segundo. A pesar de la escasa información sobre estos temas en lengua española, es sabido que se trata de fenómenos que tienen directa relación con el procesamiento de la información verbal.
Palabras clave: Habla semiespontánea, repetición involuntaria, análisis temporal, errores de habla
This study is focused on describing the non-voluntary repetition of segments by a man and woman, both Chilean. Each sample´s lenght was determined by means of an acoustic analysys in which both the oscillogram chart and the spectrogram chart were inspected for every sample. The data were gathered from two samples of semi-spontaneous speech and they were approached both from a general descriptive point of view -kind of words more frequently used, number of repetitions, how many items were included in the repeated segments- and from a more specific perspective in which the lengths of the analyzed segments were compared statistically. The results of the analysis showed that function words are more frequently repeated, that segments tend to be repeated twice and that the repeated segment is likely to consist of a single item. The statistical test on the segments’ length clearly showed that the first segment is usually longer than second one. Information about Spanish-language oriented studies approaching similar matters is very little, but nevertheless there seems to be little question about the fact that these phenomena are clearly related with the processing of verbal information.
Keywords: Semi-spontaneous speech, non-voluntary repetition, time analysis, speech errors
Hay ciertas agramaticalidades y errores que son característicos del habla espontánea. Su estudio también debe ser parte las investigaciones sobre el lenguaje. En esa línea, desde la psicolingüística, y particularmente en el estudio de la producción, se ha abordado el interesante tema de los errores del habla. Obras que han marcado rumbos teóricos y analíticos en ese tipo de indagaciones son las de Fromkin (1973 y 1980). Hay tipologías de errores y mediciones generales de frecuencia, por ejemplo, en Garman (1995) y en Nooteboom (1973), entre otros. Forman parte de esos errores las sustituciones, las trasposiciones, las vacilaciones y reformulaciones
sintácticas, entre otros.
Uno de estos fenómenos es la reiteración involuntaria de segmentos, como en los casos en que un hablante dice […] viene de… de Valparaíso o como cuando dice […] es un… es un… es un malentendido. Todo investigador reconoce su presencia en el habla cotidiana; sin embargo, en español, al menos, parece faltar una descripción acotada y precisa.
En otras lenguas, sobre todo en inglés, hay abundante información sobre fenómenos relacionados. Las vacilaciones has sido estudiadas en niños y en adultos; para el primer caso, véase, por ejemplo, Levin y Silverman (1965) y también Ragsdale y Sisterhen (1984) y, para el segundo, Shriberg (2001) con análisis acústico. La mayor parte de estos trabajos se concentran en las pausas y en las vacilaciones. En algunos casos, los menos, se ha considerado la repetición involuntaria.
En la presente investigación se aborda este objeto en muestras de habla semiespontáneaparaseñalaralgunasdesuscaracterísticas. Específicamente, se pretende dar cuenta de cómo se producen estas reiteraciones: a qué palabras o tipos de palabras afectan y cómo los segmentos implicados en esta reiteración se pueden describir desde el punto de vista de la duración. Contar con descripciones de fenómenos como el que aquí se aborda, permitirá hacer conexiones con cuestiones de adquisición (tanto de lengua materna como de una segunda lengua), como también con los estudios del habla patológica y con los del habla artificial.
Para todo ello habrá que disponer de la información sobre la medida en que cada uno de estos fenómenos son constituyentes del habla normal y qué características tienen. Por lo mismo, será relevante saber en qué cantidad o proporción un fenómeno como este pasa a ser índice de anormalidad. Evidentemente, la ausencia de la reiteración involuntaria se dará en la lectura y en hablas muy controladas. En el otro extremo se debe situar
el habla en el que la frecuencia del fenómeno afecte la inteligibilidad del mensaje. Por supuesto, habrá que saber también si esos supuestos umbrales son diferentes en cada lengua o si hay tendencias más o menos generales.
2.1. muestras
En esta investigación se estudió el fenómeno mencionado en el habla de una mujer y en la de un hombre; ambos sujetos tienen estudios superiores completos y pertenecen al mismo grupo etario (entre 25 y 35 años).
Se utilizaron las grabaciones del estudio del Proyecto de estudio de la norma lingüística culta del español hablado en Santiago (de Chile) y, como material de apoyo, con el texto editado de esas muestras (Rabanales y Contreras, 1979). Los registros de audio estaban en cintas de casete y fueron digitalizados para ser analizados en un programa de análisis acústico.
En la tabla 1 se presenta la información básica de las muestras con las cuales se trabajó, tomada de la publicación de Rabanales y Contreras (1979).
Muestra |
Sexo |
Edad |
Minutos |
1 |
Mujer |
27 |
45 |
4 |
Hombre |
25 |
39 |
tabla 1. Características de las muestras analizadas. El número de la muestra y los
minutos de registro son datos obtenidos de la publicación.
Las muestras corresponden a la categoría diálogos dirigidos no secretos con un informante. Ambos sujetos corresponden a la primera generación (entre 25 y 35 años), de acuerdo con los criterios de ese proyecto. Se debe tener en cuenta que los minutos de duración de la grabación se refieren a la extensión total de la entrevista e incluyen, por lo mismo, los tiempos de habla tanto del investigador como del informante.
Elprocedimientogeneralconsistióenescucharlaseñaldigitalizadasiguiendo la lectura del texto. Los casos de segmentos repetidos involuntarios encontrados fueron analizados y convertidos en archivos etiquetados y almacenados para su posterior revisión. En el análisis se uniformaron los criterios para los casos que resultaron difíciles o dudosos. Se construyó
una base de datos con toda la información pertinente para proceder posteriormente al análisis cuantitativo de los datos.
Para las mediciones temporales se tuvieron a la vista el oscilograma y un espectrograma de banda ancha de cada señal, tal como los proporciona el programa Praat (Boersma y Weenink, 2008). Se procedió a medir manualmente la duración total del fenómeno, la duración de cada segmento y la del silencio intermedio. Esta tarea no estuvo exenta de dificultades, pues las señales eran portadoras de ruido, dado que las grabaciones originales fueron hechas en cintas de casete y no tenían como objetivo el análisis acústico.
Se consideraron las repeticiones que corresponden al mismo segmento fónico, que se perciben como involuntarias y que no constituyen una reformulación. Por esta razón, se excluyeron los casos en que resultó evidente para los investigadores que se trataba de una reiteración con fines de énfasis estilístico. También fueron excluidos los registros en los que las reiteraciones estaban separadas por un turno del entrevistador.
Así, se consideraron los casos en que los segmentos repetidos son exactamente iguales: […] de… de […], […] de la… de la […], […] es la del… es la del […].
Para el recuento del número de componentes del segmento repetido, se
consideraron las contracciones, como al y del, como un solo elemento.
También se excluyeron aquellos casos en que uno de los segmentos, habitualmente el primero, está incompleto pero todo permite suponer que se trata del mismo elemento, por ejemplo, casos del tipo […] co… como […]. Este caso difiere de lo que es una reformulación, se trata, más bien, del mismo elemento que ha sido emitido de manera incompleta en la primera ocasión y se completa en la segunda. Su estudio requiere un diseño analítico más fino y se hará en otra ocasión. En esta misma categoría de exclusión hay que poner el caso de de… del, a pesar de que el elemento de está completo en ambos segmentos.
Tal como ya se adelantó, casos con reformulaciones como […] malos… malas […] quedaron fuera de esta investigación, a pesar de que se repiten los tres sonidos iniciales.
La misma opción se tomó con aquellas repeticiones en que uno de los segmentos repetidos, habitualmente el primero, es menor que un morfema:
[…] n… no […].
En síntesis, se consideraron como parte del corpus los segmentos que eran exactamente iguales desde el punto de vista lingüístico (incluyeran o no algún elemento incrustado, del tipo eh o mm). Se tuvo la precaución de que además los elementos fueran estrictamente comparables desde el punto de vista fonético.
Algunos pocos casos fueron excluidos del análisis por razones técnicas debido a la calidad de la grabación (por ejemplo, cuando aparecían ruidos ajenos a la conversación que afectaban la precisión del análisis).
Para ordenar la exposición, se presentan, en primer lugar, todos los datos relevantes más generales, tales como: el número de ocurrencias y su proporción en cada muestra; las palabras y las categorías que más frecuentemente aparecen; el número de veces que el segmento se repite y el número de componentes verbales que conforman el segmento repetido. En segundo lugar, se presenta el análisis de las duraciones de cada segmento.
3.1. Resultados generales
El número de ocurrencias de la repetición involuntaria de segmentos, en ambas muestras, se presenta en la tabla 2 acompañado de un cálculo proporcional correspondiente al número de veces que aparece el fenómeno por minuto.
Muestra |
Ocurrencias |
Proporción (fen/min) |
1 |
57 |
1,3 |
4 |
143 |
3,4 |
tabla 2. Número de ocurrencias y proporción de las ocurrencias por minuto.
Se aprecia en esta tabla, que el informante 4 presenta más veces el fenómeno tanto en términos absolutos como en relación con la duración de la muestra. Este número de ocurrencias (y la correspondiente proporción por minuto) representa una cifra disminuida si se consideran las exclusiones mencionadas anteriormente. En otras palabras, hay que pensar que la proporción de este fenómeno es un poco más alta que lo que aquí se señala. Además, recuérdese que la duración total de la entrevista incluye el tiempo en el que el turno lo tiene el entrevistador.
Las palabras que más se repiten aparecen en la tabla 3 ordenadas en forma decreciente en función de la columna que señala el total.
Segmento |
Muestra |
Total |
|
1 |
4 |
||
de + |
13 |
16 |
29 |
que + |
3 |
20 |
23 |
y + |
6 |
17 |
23 |
es + |
6 |
9 |
25 |
en + |
2 |
11 |
13 |
no + |
4 |
9 |
13 |
la |
6 |
2 |
8 |
el |
0 |
6 |
6 |
tabla 3. Palabras del corpus que más se repiten (+ indica que, en algunos casos, el segmento repetido incluye otro elemento).
Agrupados en categorías, son las preposiciones, las conjunciones y la forma verbal es, entre otras, las clases que aparecen con más frecuencia. La mayor parte de estos elementos pertenecen a lo que muchas veces se denomina clases cerradas o, en otra terminología, palabras funcionales (véase Garrett 1990: 339 y 349-350).
El fenómeno en estudio puede afectar a un elemento o a más de uno, por ejemplo, en […] de… de […] se tiene un elemento repetido, en tanto que en […] de la… de la […] se tienen dos. Los resultados de este recuento se presentan en la tabla 4.
Muestra |
Número de elementos que componen el segmento |
|||||||
Uno |
Dos |
Tres |
Cuatro |
|||||
Nº |
% |
Nº |
% |
Nº |
% |
Nº |
% |
|
1 |
52 |
91,2 |
5 |
8,8 |
0 |
0,0 |
0 |
0,0 |
4 |
108 |
75 |
29 |
20,3 |
5 |
3,5 |
1 |
07 |
tabla 4. Ocurrencias y porcentajes según el número de elementos lingüísticos que
conforman el segmento repetido.
Se aprecia que en ambas muestras la repetición de un elemento es la tendencia principal. En uno de los informantes hay también algunos casos de reiteración de dos elementos y, en el otro, los hay de hasta cuatro. En ambas muestras, se produce una relación inversa entre el número de elementos repetidos y el número de ocurrencias.
El segmento repetido (independientemente del número de elementos que lo componen) puede darse dos veces ([…] de… de […]) o más de dos ([…] de… de… de […]). En las muestras estudiadas, el resultado de este cómputo se muestra en la tabla 5.
Muestra |
Número de repeticiones |
||
|
Dos |
Tres |
Cuatro |
1 |
57 |
--- |
--- |
4 |
130 |
12 |
1 |
tabla 5. Resultados según la cantidad de veces que se repite el segmento.
Como se aprecia, en uno de los informantes todos los casos constan de dos repeticiones, del tipo […] de… de […] o […] de la… de la […]. En el otro informante, este número de repeticiones significa el 91 % y aparecen también unos pocos casos de tres repeticiones (8,4 %) y solo uno (0,7%) de cuatro.
3.2. Resultados de la duración
El análisis que parece ser más interesante es el de la duración de los segmentos reiterados.
El primer dato que reflejan los análisis estadísticos es que el primer elemento es sistemáticamente más largo que el segundo, lo que coincide con la impresión auditiva de los investigadores.
La tabla 6 muestra los resultados de la prueba de comparación de medias t-test para datos relacionados.
Muestra 1 |
t(56)=8,55; p=0,000 |
Muestra 4 |
t(142) =7,70; p=0,000 |
tabla 6. Resultados de la prueba t-test de la comparación de las duraciones
En la figura 1 se muestran los gráficos para cada muestra del intervalo de
confianza para la media.
figura 1. Gráficos de intervalo de confianza para ambas muestras.
Como se puede ver en los gráficos de la figura 1, ninguno de los intervalos de confianza de las dos comparaciones efectuadas se intersecta. Además de esto, se observa una clara convergencia en las medias estimadas tanto para el primer segmento como para el segundo, lo que en conjunto permite afirmar que las duraciones del primer y segundo segmento proceden de poblaciones distintas. En otras palabras, la duración del primer segmento es claramente mayor a la duración del segundo y esta diferencia no se debe al azar sino a algún factor de carácter sistemático.
Un cálculo posterior de la potencia estadística implicada en ambas comparaciones, efectuado con GPower3 (Faul, Erdfelder, Lang y Buchner 2007), arrojó una potencia observada de 1,0 en las dos pruebas t de muestras relacionadas efectuadas, lo que quiere decir que la constatación estadística de las diferencias en las longitudes de los segmentos es sumamente sólida (véase Quezada 2007 para una revisión del concepto de potencia estadística y sus aplicaciones).
Una vez establecidas estas diferencias en las duraciones, se procedió a ver si había alguna relación entre las longitudes de ambos segmentos. Así, se comprobó que al comparar el promedio de duración de todos los primeros segmentos con el promedio de duración de todos los segmentos repetidos, se obtenía una diferencia de 0,201 s en el caso de la muestra 1 y 0,171 s en el caso de la muestra 4. En ambos casos, la diferencia favorecía a los primeros segmentos, claramente más largos.
Una revisión un poco más acuciosa de estas diferencias permitió ver que en la gran mayoría de los casos el primer segmento doblaba la duración del segundo. Para comprobar si esto era efectivo, se procedió a generar una nueva variable dividiendo la duración del primer segmento por la duración del segundo. Así, se obtuvo un coeficiente que da cuenta de la relación entre las dos duraciones: si el valor obtenido en la división es mayor a 1, la duración del primer segmento es mayor que la duración del segundo. Inversamente, los valores inferiores a 1 indican que el primer segmento dura menos que el segundo; véase la figura 2.
La distribución de esta nueva variable representada a partir de un histograma de frecuencias muestra cómo se comportan esas proporciones relativas. La función de densidad de probabilidad del coeficiente se ajusta, en ambos casos, a una distribución lognormal:
Muestra 1: (R2=0,970; Z de Kolmogorov-Smirnov=0,874; p=0,43) Media=2,44; Mediana=2,20; Moda=1,80.
Muestra 4: (R2=0,992; Z de Kolmogorov-Smirnov=0,800; p=0,54) Media=2,37; Mediana=1,92; Moda=1,26.
figura 2. Frecuencias de la relación entre el primer y segundo segmento. El eje de abscisas muestra la relación entre los dos segmentos y el eje de ordenadas la frecuencia en la que se da tal relación
Como se aprecia para ambas muestras, en la mayoría de los casos el primer segmento ha sido mayor que el segundo (1º segmento/2º segmento > 1) y la concentración más alta de casos se da entre el doble y el triple (3 > 1º segmento/2º segmento > 1).
En síntesis, en las muestras analizadas, la reiteración involuntaria de segmentos (excluyendo todos los casos de reformulación) resultó ser un fenómeno de aparición relativamente frecuente. Más allá de estos datos, parece ser una marca de espontaneidad en el discurso.
Las palabras que mayormente se ven afectadas por este fenómeno son las llamadas de clase cerrada o también denominadas funcionales (preposiciones, conjunciones, artículos, etc.).
En términos generales, parece ser que la tendencia es que el número de elementos lingüísticos que componen el segmento sea uno y que el número de veces que se repite el segmento sea dos.
También se observa con mucha consistencia que, en cada reiteración, el primer segmento sistemáticamente es más largo que el segundo, lo que se relaciona de una manera muy interesante con los procesos cognitivos de planificación lingüística.
En particular, lo que de esta investigación se destaca es la participación de las palabras de clase cerrada en el fenómeno descrito. Estas palabras ya han sido mencionadas por su comportamiento particular en muchísimos fenómenos visibles en la producción (véase por ejemplo, González, Cervera y Miralles 1996; Garman, 1995: 193-196). En tanto articuladores de la información sintáctica, parecen cumplir algunas funciones especiales en la planificación de las emisiones y, por lo mismo, son puntos críticos del procesamiento verbal.
Lo anterior, sumado a los resultados de la duración que señalan que sistemáticamente el primer elemento es más largo que el segundo, corrobora una supuesta saturación del procesador, la misma explicación que se ha dado para explicar alargamientos finales de palabras y pausas (Garrett, 1990; Butterworthm, 1990).
¿Por qué razón el procesador lingüístico se apoya en las palabras de clase cerrada? Esta pregunta requiere investigaciones con diseños experimentales específicos; aquí solo se ha tenido un primer acercamiento a partir de una muestra, como se ha señalado, de habla semiespontánea. En cualquier caso, las investigaciones, como las reportadas en Garrett (1990), destacan la importancia de estas partículas y mencionan también otros experimentos
relacionados.
Otros estudios que resultarán complementarios son, por ejemplo, los que describan con detalle la función sintáctica que cumplen los elementos en los que se produce este fenómeno. También hay cuestiones de índole discursiva que parecen ser interesantes, como por ejemplo si hay o no tendencias a que se produzcan en ciertos momentos temporales del texto (al inicio, al final); o en ciertos tipos de secuencias (narrativas, descriptivas, etc.); o si aumenta su frecuencia cuando se tratan temas que se ven afectados más fuertemente por actitudes del hablante, como las investigaciones realizadas por Clark y Fox Tree (2002). En cualquier caso, el estudio de esta materia tiene plena vigencia en el panorama lingüístico y psicolingüístico, tal como se demuestra en Carson y Ferreira (2007) y en Santiago (2007).
Desde el punto de vista de las mediciones acústicas, también habrá que complementar este estudio con información sobre la variación de la velocidad del habla cuando este fenómeno se produce; sobre el comportamiento de la frecuencia fundamental (f0) del segmento repetido y de la intensidad de la señal (considerando todas las dificultades metodológicas que tiene un estudio con ese propósito).
También será interesante aumentar la cantidad de información para complementar la que se ha mostrado aquí, pues solo se trabajó con dos informantes. Habrá que ver si las tendencias reflejadas se mantienen o se modifican en la medida en que se dispone de más datos. Por otra parte, en investigaciones de este tipo la calidad señal-ruido es un factor que hay que tener en cuenta y esa es uno de los aspectos que se pueden mejorar muchísimo respecto de la investigación aquí presentada.
______________________________________________
Boersma, P. y Weenink, D. (2008). Praat: doing phonetics by computer (Versión 5.0.16) [Programa computacional][en linea] Obtenido de http:// www.praat.org/
Butterworth, B. (1990). Aportaciones del estudio de las pausas en el habla. Lecturas de Psicolingüística. 1. Comprensión y producción del lenguaje. Vol 1. F. Valle, F. Cuetos, J.M. Igoas, S. del Viso ( Comps.) Madrid: Alianza. 2 Vols. (Pp. 289-309)
Carlson, R., Gustafson, K., Stranger, E. (2006). Modelling Hesitation for
Synthesis of Spontaneous Speech. 3rd international coference on speech prosody, Dresden, Germany.
Carson, T. S. y Ferreira, V. (eds.). (2007). The State of the Art in Speech Error Research, Proceedings of the LSA Institute Workshop. MIT Working Papers in Linguistics, 53.
Clark, H. H. y J. E. Fox Tree. (2002). Using uh and um in spontaneous speaking. Cognition, 84, 73–111.
Faul, F.; E. Erdfelder; Lang, A.-G. y Buchner, A. (2007). G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods, 39 (2), 175-191. [Programa computacional] Obtenido de http://www.psycho.uni- duesseldorf.de/abteilungen/aap/gpower3/
Fromkin, V. (ed.) (1973). Speech errors as linguistic evidence. Mouton: The Hague-Paris
—. (1980). Errors in linguistic performance: Slips of the tongue, ear, pen, and hand. San Francisco: Academic Press.
Garman, M. (1995). Psicolingüística. Madrid: Visor.
Garrett, M. F. (1990). Niveles de procesamiento en la producción de oraciones. Lecturas de Psicolingüística. 1. Comprensión y producción del lenguaje. Vol 1. F. Valle et al (Comps.). Madrid: Alianza. 2 Vols.: 311-352.
González, J.; Cervera, T. y Miralles, J. L. (1996). Características temporales del habla: distribución de las pausas en castellano. Psicológica, 17, 181- 204.
Levin, H.; Silverman, I. (1965). Hesitation phenomena in children’s speech.
Language & speech, 8 (2), 67- 85.
Nooteboom, S. G. (1973). The tongue slips into patterns. Speech errors as linguistic evidence. V. Fromkin (Ed.). Mouton: The Hague-Paris: 144-156.
Quezada, C. (2007). Potencia estadística, sensibilidad y tamaño de efecto:
¿un nuevo canon para la investigación?. Onomázein, 16, 159-170.
Rabanales, A. y Contreras, L. (eds.). (1979). El habla culta de Santiago
de Chile. Materiales para su estudio. Tomo I. Anejo Nº 2 del Boletín de
Filología, Facultad de Filosofía y Letras, Departamento de Lingüística y Filología, Universidad de Chile. 2 Tomos.
Ragsdale, J., Sisterhen, D.(1984), Hesitation phenomena in the spontaneous speech of normal and articulatory-defective children. Languaje & Speech, 27(3). 235-244.
Santiago, J., Pérez, E., Palma, A. y Stemberger, J. (2007). Syllable, word, and phoneme frequency effects in Spanish phonological speech errors: The David effect on the source of the error. The State of the Art in Speech Error Research, Proceedings of the LSA Institute Workshop. T. S. Carson y V. Ferreira (eds.). MIT Working Papers in Linguistics 53: 265-303.
Shriberg, E., (2001) To ‘errrr’ is human: ecology and acoustics of speech disfluencies. Journal of the International Phonetic Association, 31(1), 153- 169.
Zellner, B. (1994). Pauses and the temporal structure of speech. En E. Keller (Ed.) Fundamentals of speech synthesis and speech recognition, (pp. 41-62). Chichester: John Wiley.