Logos: Revista de Lingüística, Filosofía y Literatura

2011, 21 (2) 82-92

 

El rol de la frecuencia en la diferenciación perceptiva entre el fonema

/s/, y la variante fricativa /∫/ del fonema /t∫/ en el español de Chile.

____________________________________________________________

The role of the frequency in the perceptive distinction between the phoneme /s/ and the fricative variant /∫/ of the phoneme /t∫/ in the Chilean Spanish.

_________________________________________________________________

Magdalena Flores Ferrés1

1 Laboratorio de Fonética, Facultad de Letras Pontificia Universidad Católica de Chile. magdflores@gmail.cl

________________________________________


RESUMEN

La presente investigación pretende describir la incidencia de la frecuencia en la distinción entre el fonema /s/ y [∫] (la variante fricativa de /t∫/) en el español de Chile. Se realizó una prueba de percepción a 32 informantes adultos residentes en Santiago de Chile. A partir de los resultados obtenidos, se establece que uno de  los  rasgos que da lugar a la oposición entre ambos sonidos a nivel perceptivo es claramente la distribución de la energía. Si existe energía en las bandas frecuenciales bajo los 4000 o 3000 Hz, los hablantes tenderán a percibir el sonido como la variante fricativa del fonema / t∫/ del español de Chile. En el caso contrario, los hablantes perciben el fonema /s/.

 

 

 

 

 

Palabras clave: rasgos distintivos, fone- mas, fonética perceptiva, frecuencia, fricativas, español de Chile


ABSTRACT

This research aims to describe the incidence of frequency on the distinction between the phoneme /s/ and [∫], (the fricative variant of

/t∫/) in the Chilean Spanish. We conducted a perception test to 32 adult informants living in Santiago de Chile. From the results, it is established that, at a perceptual level, one of the features that gives rise to the opposition between the two sounds is clearly the distribution of the energy. If there is energy in the frequency bands under the 4000 or 3000 Hz, speakers tend to perceive the sound as a fricative variant of the phoneme /t∫/ in the Chilean Spanish. Otherwise, they perceive the phoneme /s/.

 

 

 

 

 

Keywords: distinctive features, pho- nemes, perceptual phonetic, frequency, frica- tives, Chilean Spanish.


Introducción

El  presente  trabajo  corresponde  a un  proyecto  de  investigación  en fonética perceptiva del español de Chile, un campo que ha sido poco estudiado hasta hoy. Después de hacer una revisión bibliográfica, se constata que se carece de un manual básico en el que se expongan estudios y descripciones principales de las características de este dialecto, como lo hay respecto del español estándar. Es por esta razón que tampoco existen estudios acabados sobre el nivel segmental del español de Chile ni tampoco

una visión perceptiva del mismo.

Si consideramos los planteamientos de lingüistas como Jakobson y Halle (1956), Saussure (1916), Trubetzkoy (1972) y Martínez Celdrán (1996), los fonemas son unidades que se definen por la oposición que existe entre sus rasgos distintivos.

 

Llaman la atención como variaciones alofónicas propias del dialecto de nuestro país las articulaciones fricativas de algunas consonantes. Por esta razón y por las anteriormente expuestas, la presente investigación tiene como principal objetivo describir, específicamente, el modo en que incide la frecuencia para distinguir acústicamente dos fonemas del español en Chile,

/s/ y /t∫/, este último solo en su variante fricativa, [∫].

A partir de lo anterior, los objetivos específicos propuestos para esta investigación son, en primer lugar, establecer si el rango de la frecuencia de estos fonemas puede  considerarse  como  un  rasgo  distintivo  para su percepción. En caso de que esto se responda de manera afirmativa, determinar cuál es el rango de frecuencia relevante para la diferenciación entre estas fricativas, desde el punto de vista de la fonética perceptiva.

II.  Metodología

1.  Informantes

Para una investigación de este tipo en primeras instancias parece lógico pensar que los informantes debieran simplemente cumplir el requisito de ser hablantes del dialecto en estudio, que es el español de Chile. Por esta razón los informantes deben ser hombres y mujeres de nacionalidad chilena y residir actualmente en Santiago de Chile. En cuanto a la edad, de acuerdo con Sadowsky (2011):

 

“(…) resulta sensato excluir a los niños que se encuentran en la etapa inicial de la adquisición del lenguaje, pues el sistema fónico no se encuentra plenamente asentado en ellos. También resulta sensato excluir a los hablantes de edad muy


avanzada, debido a su mayor vulnerabilidad a deterioros de las capacidades físicas y cognitivas relacionadas con el lenguaje. Estos criterios etarios corresponden grosso modo a lo recomendado por Samarin (1967).”

 

Debido a lo anteriormente dicho y también por proximidad con la investigadora, se toma como decisión que los 32 informantes que responderán la prueba de percepción tengan entre 18 y 36 años de edad.

2.  La prueba de percepción

En primer lugar se seleccionó un par de palabras, “chorro” y “zorro”, que en el español de Chile cumplen el siguiente requisito: ambas contienen a uno de los dos fonemas en estudio en idéntica posición, de manera que si se intercalan estos fonemas, se intercambia también de palabra. La elección de este par se debió también a otra razón: era fundamental que, dentro de cada palabra, la ubicación de los fonemas en estudio fuera inicial, con el fin de que la posterior manipulación se enfocara solo en los rangos frecuenciales. Esto se hizo porque si los fonemas hubiesen estado en posición media (intervocálica), su manipulación hubiese tenido que considerar más cambios, puesto que la coarticulación de una fricativa con una vocal que la antecede difiere mucho de la coarticulación de una fricativa con una vocal anterior a ella.

 

Luego se seleccionaron cuatro distractores que tuvieran características similares a los estímulos. Para esto, se buscaron palabras que fueran bisílabas, que tuvieran acentuación grave y una consonante intervocálica. Este fonema debía tener un alófono fricativo propio del español de Chile. Además se consideró que los distractores cumplieran el requisito de que solo con cambiarle un fonema, se pudiera generar otra palabra existente y de uso frecuente en el español de Chile. Cumplen con estas características las palabras [carro], [callo], [gorro] y [corro].

 

La grabación de los estímulos se llevó a cabo en la cabina insonorizada del laboratorio de Fonética de la Pontificia Universidad Católica de Chile, y se usó para ello un micrófono AT3035, tarjeta de sonido externa MBox-2 y el programa Pro Tools.

 

Una voz femenina grabó la palabra “chorro” articulando el fonema inicial como el alófono [∫].

 

En el siguiente gráfico se observa el oscilograma y espectrograma (este último en kilohertzios) del estímulo grabado, al que denominaremos “Chorro original”.


 

  

 

Gráfico n°1. Oscilograma y espectrograma de “Chorro original”.

Luego se grabaron los distractores, cada uno de dos maneras distintas: con sus consonantes intervocálicas articuladas de acuerdo con la norma estándar, y luego con las mismas en sus variantes fricativas.

 

Por medio del programa computacional Praat, se subsampleó cada uno de los estímulos a una frecuencia de muestreo de 22.050 y se normalizaron en intensidad.

 

A partir del estímulo “Chorro original” (que en la prueba de percepción cumplió la función de ser el elemento de control) se generaron 8 estímulos más, mediante la manipulación de su consonante inicial con el programa Praat.

 

En primer lugar, “Chorro original” fue copiado 8 veces. A cada uno de estos nuevos archivos de audio se le extrajo la porción de ruido correspondiente a la fricativa en estudio, que fue modificada a través de la función Pass Hann Band, la opción de filtrado del mencionado programa computacional.

 

A la porción de ruido que se extrajo del primer archivo se le filtró la banda frecuencial inferior a los 1000 Hz. Luego esta porción filtrada se volvió a colocar al comienzo del mismo archivo de audio, en el lugar exacto en el que había sido previamente cortado. Como resultado de esta intervención se obtuvo el primer estímulo manipulado, al que denominaremos “Chorro-1000”.

 

Un similar procedimiento se repitió con cada una de las siete copias restantes del estímulo “Chorro original”, con la salvedad de que la banda frecuencial eliminada para cada nueva porción de ruido fue mayor: en la segunda porción de ruido se eliminó la banda frecuencial bajo los 2000 Hz; en la


tercera, bajo los 3000 Hz; en la cuarta, bajo los 4000 Hz; en la quinta, bajo los 5000 Hz; en la sexta, bajo los 6000 Hz; en la séptima, bajo los 7000 Hz y en la octava, bajo los 8000 Hz. Cada uno de estos sonidos se volvió a colocar en los mismos archivos de audio de los que habían sido cortados antes de ser manipulados (las mismas 8 copias del estímulo “Chorro original”), y en la misma ubicación en la que estaban antes. Cada uno de estos nuevos archivos de audio (ahora modificados) recibieron respectivamente, los siguientes nombres: “Chorro-2000”, “Chorro-3000”, “Chorro-4000”, “Chorro-5000”, “Chorro-6000”, “Chorro-7000” y “Chorro-8000”. Sus oscilogramas y espectrogramas se muestran en la tabla que sigue. En cada espectrograma, una flecha indica el resultado evidente de la manipulación:

 

Chorro-1000                                        Chorro-2000

 

 

  

Chorro-3000                                        Chorro-4000

 

  

Chorro-5000                                       Chorro-6000

 

                                                                   

Chorro-7000                                        Chorro-8000

 

   

 

Tabla n°1. Oscilogramas y espectrogramas de los estímulos manipulados.

 

Cuando se grabaron los distractores, con el fin de asemejarlos a los estímulos en estudio (y que así cumplieran de forma eficaz su función de distractores), en muchos casos se manipuló la consonante intervocálica. Esto se realizó aumentando o disminuyendo su duración, o eliminando oclusiones múltiples en el caso de la vibrante múltiple [r]. De esta manera se elaboraron 19 distractores.

De estas elaboraciones resultaron 28 estímulos, dentro de los cuales 9 eran estímulos en estudio. El total de 28 estímulos se organizaron de manera de que en la prueba de percepción de Praat aparecieran siempre en orden aleatorio.

3.  Aplicación de la prueba de percepción de Praat

Para poder llevar a cabo este experimento se utilizó la prueba de percepción del programa de análisis acústico Praat, que permite al informante identificar algún elemento solicitado.


Antes de realizar el experimento, a cada informante se le dieron las instrucciones acerca de la prueba de percepción a la que se iba a someter.

 

En cada caso, después de que el informante dijo haber comprendido lo que debía hacer, se le presentó en la pantalla del computador una ventana de inicio a la prueba de Praat.

 

Luego se le presentó al informante una sucesión de estímulos a través de los audífonos. Para cada estímulo el informante tuvo seis alternativas de respuesta: “corro”, “callo”, “chorro”, “zorro”, “carro” y “gorro”.

Imagen n°1. Ventana principal del experimento de percepción de Praat.

 

  

Cada vez, la prueba se realizó paso a paso: cada informante escuchó primero un estímulo, seleccionó la respuesta y solo después de este paso escuchó el siguiente estímulo. Antes de marcar cada la respuesta, el informante también tuvo la posibilidad de seleccionar un recuadro para repetir el estímulo una vez.

III.     Resultados

Para el análisis de los datos, del total de respuestas dadas por los 32 informantes, se consideraron solamente las 288 respuestas obtenidas a partir de los estímulos en estudio, que tenían un total de 9.

Estas respuestas se tabularon y ordenaron en una matriz de confusión (Tabla n°2), en la que se distribuyeron las respuestas de los informantes con


respecto a cada emisión. En cada columna se indica la cantidad de veces que se seleccionó cada respuesta, ante la presentación de cada estímulo.

 

Además, la matriz señala la cantidad total de respuestas por cada emisión.

 

Estímulo

R e s p u e s t a : chorro

Respuesta: zorro

R e s p u e s t a : distractor

Chorro original

28

4

0

Chorro-1000

25

7

0

Chorro-2000

26

6

0

Chorro-3000

19

12

1

Chorro-4000

3

27

2

Chorro-5000

1

29

2

Chorro-6000

1

30

1

Chorro-7000

2

28

2

Chorro 8000

0

28

4

 

Tabla n° 2

 

Los mismos datos se representan en el gráfico n°2.

 

Gráfico n°2.

 

  

 

Se observa en los datos entregados por los resultados de las pruebas un definido umbral entre los dos fonemas /t∫/ y /s/, en cuanto a las frecuencias:


la tendencia general fue a seleccionar como la palabra “chorro” los estímulos “Chorro-1000” y “Chorro-2000” (78 % y 81% respectivamente) .Se observa un notorio descenso en la selección de esta respuesta ante el estímulo “Chorro 3000” (59 %) y luego, se observa que la mayoría de las respuestas ante los estímulos “Chorro 4000”, “Chorro 5000”, “Chorro 6000”, “Chorro 7000” y “Chorro 8000” corresponden a la palabra “zorro” (84%, 93,7%,

87,5% y 87,5% respectivamente).

Se observa también que ante los estímulos “Chorro original”, “Chorro-1000” y “Chorro-2000” hubo 0 distractores seleccionados como respuesta. Ante “Chorro- 3000” y “Chorro-6000” hubo 1 distractor seleccionado como respuesta(3,2%). AnteChorro-4000,Chorro-5000” yChorro-7000” hubo 2 distractores seleccionados como respuesta (6,25%). Solo ante el estímulo “Chorro-8000” hubo 4 distractores seleccionados como respuesta (12,5%). Esto podría llevar también a plantearse preguntas acerca de la seguridad de las respuestas de cada informante, en relación con la manipulación de cada estímulo.

IV. Conclusión y proyección

En la bibliografía revisada se señala que “la /s/ concentra una gran cantidad de energía entre los 3000 Hz y los 8000 Hz” (Ladefoged, 2005) y que bajo los 3500 Hz tiene baja cantidad de energía”. Martínez y Fernández (2007). Respecto de /t∫/ ,se obtiene que “este sonido tiene una mayor energía que

/s/ en el rango de frecuencia que está por sobre los 3000 Hz. Si se vuelve a los datos entregados en la fricativa alveolar sorda, se podrá apreciar que, al parecer, /t∫/ tiene una mayor distribución de energía en la gama frecuencial que /s/”. (Ladefoged , 2005)

 

Después de los resultados del experimento realizado, se ha podido observar que esta hipótesis es adecuada también para la variante fricativa alvéolo-palatal sorda de /t∫/, es decir, [∫]. Cuando en su fonema inicial los estímulos presentaban distribución de energía desde niveles menores a los 1000 Hz hasta por sobre los 10000 Hz, los informantes en su mayoría los seleccionaron como la palabra “chorro”. Los informantes tendieron a seleccionarlamismarespuestacuandoseeliminaronlasbandasfrecuenciales bajo los 2000 Herzios, y un gran número seleccionó también esta respuesta cuando se eliminaron también las bandas frecuenciales bajo los 3000 Herzios. La selección de esta opción de respuesta disminuye notablemente a partir del estímulo “Chorro-4000” en adelante (o sea, ante “Chorro-4000”, “Chorro-5000”,  “Chorro-6000”,  “Chorro-7000”    “Chorro-8000”).   En la mayoría de los casos en los  que  se  presentaron  estos  estímulos,  los informantes seleccionaron como respuesta la palabra “zorro”.


Por lo tanto, a partir de esta investigación, se puede establecer que uno de los rasgos distintivos que da lugar a la oposición entre el fonema /s/ y la variante fricativa de y la variante fricativa de /t∫/ del español de Chile a nivel perceptivo es claramente la distribución de la energía. Si existe energía en las bandas frecuenciales bajo los 4000 Herzios, o, preferentemente, bajo los 3000, los hablantes tenderán a percibir el sonido como la variante fricativa del fonema / t∫/ del español de Chile. Si, al contrario, la energía se distribuye a partir de los mencionados rangos (3000 o 4000 Herzios), la percepción de los hablantes parece cambiar rotundamente de un fonema a otro, en este caso, /s/.

 

En cuanto a la mínima variación de la cantidad de veces que se seleccionó un distractor como respuesta ante cada uno de los distintos estímulos, podría tal vez llevar a la pregunta acerca de si habrá un mayor grado de inseguridad en la respuesta a medida que se eliminan más bandas frecuenciales. Sin embargo es difícil determinar esto con certeza puesto que la muestra es pequeña y también es poca la variación del número de veces que se seleccionó un distractor como respuesta ante uno de los estímulos en estudio.

Después de llevar a cabo el experimento es posible señalar algunas críticas a su realización, con el fin de que signifiquen un aporte a futuros estudios similares. Según Martínez y Fernández (2007) “los sonidos fricativos pueden ser estudiados en rangos de frecuencia y de intensidad”. Por esta razón, a pesar de que se mantuvo estable el volumen del computador portátil durante todos los experimentos, sería relevante para una prueba, medir o averiguar de alguna manera la capacidad auditiva de los informantes. El experimento realizado para el seminario de tesis de Luna Urria (2010), en lugar de utilizar una prueba de percepción de Praat, usó un cuestionario para los informantes. Dentro de este se incluyó la pregunta: “¿Considera usted que tiene buena audición?”. Puede ser interesante y quedaría abierto a discusión la posibilidad de complementar la prueba de Praat con un cuestionario escrito. En este se podrían incluir algunas preguntas que entregaran información adicional sobre los informantes, como el lugar de origen, el trabajo u ocupación, los años de escolaridad, etc.

 

Un cuestionario cobraría especial importancia para una posible proyección del presente trabajo que surge a partir de un fenómeno inesperado observado en los resultados del experimento: durante la realización de la investigación se constató que en algunos sujetos jóvenes de estrato socioeconómico alto, el fono [∫] puede confundirse con una variante libre de /s/ y no como una variante de /t∫/, como cabría esperarse (por ejemplo, en [sórro] [∫órro]). Este fenómeno, que sólo puede ser percibido de manera intuitiva, podría ser estudiado científicamente si se contara con un cuestionario que entregara


más datos sobre los informantes.

Como otras posibles proyecciones, el presente informe podría aportar a otros estudios del nivel segmental del español de Chile, como la percepción de todas sus consonantes fricativas y los rasgos que las diferencien. También se pueden estudiar los rasgos opositivos entre todos los fonemas de este dialecto.

 

________________________________________________________

Bibliografía

Jakobson, Roman (1971). Fundamentos del lenguaje. Berlin: Mouton de Gruyter .

 

Ladefoged, Peter (2005) Vowels and consonants : an introduction to the sounds of languages. Chicago : University of Chicago Press . CD 414 L154v 2005

 

Ladefoged, Peter (1996). Elements of acoustic phonetics. Chicago: University of Chicago Press

 

Martínez Celdrán, E. y Fernández Planas, Ana María (2007). Manual de fonética española: articulaciones y sonidos del español. Barcelona: Ariel.

 

Martínez Celdrán.(1996). Evaluación de cuadros de fonemas. Revista LEA,

18,2.

Sadowsky, Scott et al. (2011). El inventario fonético del español de Chile: principios orientadores, inventario provisorio de consonantes y sistema de representación (AFI-CL). En Onomazein, 2 (24), 61-84.

 

Trubetskoi, Nikolai Sergeevich (1972) Fonología y morfología. Buenos Aires: Paidos

 

Urria, Luna (2010) La frecuencia en las fricativas sordas del español de Chile: un estudio perceptivo. Pontificia Universidad Católica de Chile. [En línea] Disponible en http://www7.uc.cl/letras/laboratoriodefonetica/html/ investigacion/TesisTrabajosSeminarios/2010/SeminarioLunaUrria.pdf (consultado en mayo de 2011)