Estudio descriptivo y comparativo del comportamiento rítmico del habla en lectura en el español de Chile

Descriptive and Comparative Study of Rhythm in Chilean Spanish Read-Aloud Speech

Francisco Antonio Nocetti

Universidad de Concepción, Chile

fnocetti@udec.cl

Hernán Emilio Pérez

Universidad de Concepción, Chile

heperez@udec.cl

Mauricio A. Figueroa Candia

Universidad de Concepción, Chile

maufigueroa@udec.cl

Resumen: Este artículo presenta un estudio descriptivo, cuyo propósito es determinar si el comportamiento rítmico del habla en lectura en voz alta de personas profesionales de ocho ciudades diferentes de Chile coincide con la clasificación dada históricamente al español como lengua de ritmo silábico, clasificación que además en general se extiende a todas las lenguas romances. Varios estudios tradicionales afirman que el español es una lengua de tendencia hacia el ritmo silábico, no obstante, también existen otros trabajos, antiguos y recientes, que afirman lo contrario, esto es, que el español manifiesta un comportamiento rítmico de tipo acentual. Hasta el momento, no se ha realizado un estudio de este tipo sobre este tema para el español de Chile. En el presente trabajo, se analiza un corpus de lecturas obtenidas de una muestra de 30 informantes de distintas regiones del país. El análisis se realiza con procedimientos de medición instrumental que entregan indicadores cuantitativos que han sido propuestos recientemente en el ámbito de la investigación sobre prosodia y que le otorgan, además, mayor precisión y objetividad a los estudios acerca de este tema. Los resultados muestran que en el español de Chile, en la lectura en voz alta, se manifiesta una tendencia rítmica de tipo silábico, aunque comparativamente tiende a ser más acentual que los valores que se han dado para el español peninsular. En cuanto a la variación del español de Chile por zona geográfica, las diferencias son tan pequeñas que no es posible afirmar que la variable diatópica influye en el comportamiento rítmico del español de Chile, en situación de lectura.

Palabras clave: ritmo lingüístico - isocronía - español de Chile

Abstract: This article presents a descriptive study whose purpose is to determine whether rhythm in read-aloud speech from professionals of eight different Chilean cities matches the traditional classification given to Spanish as a syllable-timed language, grouping which is also normally extended to all Romance languages. Several studies have stated that Spanish is a language whose rhythmic patterns can be characterized as syllable-timed, however, other studies, both old and recent, have stated that Spanish has rhythm patterns closer to stress-timed languages. Up to date, no studies have investigated this aspect of rhythm in Chilean Spanish. In this study, a corpus of read-aloud speech from 30 participants from different geographical areas in Chile is analysed. The analysis was conducted after obtaining quantitative metrics, developed recently in other studies, in order to give more precision and objectivity to the methods. Results show that Chilean Spanish is syllable-timed, although it displays values slightly closer to stress-timed languages than peninsular Spanish. As to the effect of the geographic origin of the subjects, the differences observed were relatively small, which suggests that this type of variation is not of importance in Chilean Spanish rhythm, in read-aloud speech.

Keywords: linguistic rhythm - isochrony - Chilean Spanish

1. Introducción

1.1. El ritmo en las lenguas

El ritmo es un fenómeno que está presente en una gran parte de las actividades humanas, una de ellas es el lenguaje. Desde el punto de vista estrictamente lingüístico, algunas de las definiciones propuestas acerca del fenómeno rítmico lo presentan como la “repetición regular de las unidades prominentes que se perciben en el habla” (Crystal, 2000, p. 497) o como la “percepción ocasionada por la sucesión periódica de los elementos contrastivos (acento, duración) en intervalos regulares” (Luna, Vigueras & Baez, 2005, p. 200) o también como la “sensación perceptiva provocada por la sucesión de determinados elementos en periodos regulares de tiempo” (Gil, 2007, p. 545). Se puede entender entonces que el ritmo es una percepción provocada por la sucesión de ciertos elementos prominentes en la producción del habla, la que debería presentar cierta periodicidad o patrón de repetición y cuyos intervalos deberían tender a ser más o menos regulares.

Por otro lado, y desde una perspectiva más cercana a la fonética acústica, se ha definido el ritmo como una “recurrencia regular de un constituyente prosódico, tal que el patrón debería observarse en la señal acústica y en la percepción” (Toledo, 2010a, p. 72). Toledo agrega además que “el lapso entre los constituyentes prosódicos debería ser isocrónico”. Cuenca (2000) lo define como “la interacción de factores como la estructura silábica, la reducción vocálica y la posición del acento” (p. 42). También Cuenca agrega que el estudio del ritmo es importante dentro de las investigaciones sobre lingüística debido a que “el ritmo, además de captar y mantener la atención del oyente, le proporcionaría pistas para la segmentación del mensaje” (2000, p. 41).

El ritmo en las lenguas es un fenómeno que se da tanto en la producción como en la percepción. En el caso de la producción, se trata de un fenómeno físico, en el cual algunas sílabas presentan mayor prominencia que otras (dada muchas veces por aumento de su intensidad) y esto tiene un correlato en la percepción, proceso en el que el oyente agrupa los segmentos silábicos al tomar como frontera o punto de referencia esta prominencia.

A partir de la idea de que el fenómeno rítmico en lingüística se manifiesta como una prominencia que se le da a algunas unidades silábicas en la producción y como un efecto en la percepción que tiene como consecuencia el agrupamiento que le dan los oyentes a las unidades silábicas en una lengua particular, Pike (1945) y Abercrombie (1967) clasifican las lenguas según su comportamiento rítmico, bajo lo que es conocido como la hipótesis de la isocronía. Este principio generalmente se entiende como una tendencia natural y universal a la división de unidades de habla en proporciones iguales de tiempo y que, además, se da de forma particular para cada lengua. Almeida y Toledo sostienen que “el principio de isocronía plantea que las lenguas se organizan en intervalos temporales regulares, bien sea en el nivel de la sílaba bien en el pie acentual” (1997, p. 35).

De acuerdo con esta hipótesis, las lenguas pueden ser clasificadas como lenguas de ritmo silábico (syllable-timed), cuya característica es que presentan un patrón de “distancias regulares entre las sílabas”; de ritmo acentual (stress-timed), que manifiestan un patrón de “distancias regulares entre los acentos” y moraicas (mora-timed) en las que el patrón es “distancias regulares entre moras” (Toledo, 2010a). Referido exactamente a lo mismo, pero con otros términos, algunos autores hablan de lenguas isosilábicas, que son aquellas en las que la regularidad está dada en la duración de los segmentos silábicos (característica de las lenguas románicas); de lenguas isoacentuales, que son aquellas en las que la regularidad se da en la duración de los intervalos acentuales (característica de las lenguas germánicas), y de lenguas moraicas, en las cuales la unidad mínima rítmica es la mora.

Al seguir la clasificación de Pike (1945) y Abercrombie (1967), dado que se trata de una lengua romance, el español es incluido dentro de la categoría de lenguas de ritmo silábico, sin embargo, varios estudios han encontrado resultados diferentes e incluso contrapuestos. Mientras que en algunos se propone como una lengua de ritmo silábico (Font & Ríos, 1940; Toledo, 2002, entre otros) en otros se le asigna una clasificación de tipo acentual o al menos se cuestiona que presente ritmo silábico (Navarro Tomas, 1922; Borzone & Signorini, 1983, entre otros).

1.2. El ritmo en el español

Quilis y Fernández plantean que “los acentos primarios de una oración van situados a intervalos aproximadamente iguales […] de forma que se mantenga el compás marcado por las sílabas acentuadas” (1969, p. 160). Luego, afirman que en las lenguas de tipo acentual el tiempo que emplea un hablante en emitir una oración depende más o menos del número de acentos de intensidad (p. 161). En cambio, una lengua de tipo silábico, como el español:

[…] tiene un ritmo silábicamente acompasado; [esto es] la sílaba es la que marca el compás. Por eso, el tiempo que emplea un hablante español en enunciar una oración, depende a grandes rasgos, del número de sílabas (1969, p. 161).

Por otro lado, Navarro Tomás (1922) en su estudio sobre La cantidad silábica en unos versos de Rubén Darío, llega a la conclusión de que la clasificación rítmica del español de España es de tipo acentual,

Las causas que han determinado en este ensayo la superioridad cuantitativa de unas sílabas con respecto a otras, superioridad que ha alcanzado más de una vez la proporción 4:1, han sido evidentemente el acento rítmico, el énfasis y la posición final ante pausa. El hecho de que las sílabas hayan sido o no gramaticalmente acentuadas no ha servido de fundamento para hacerlas largas o breves. El hecho de que hayan sido abiertas o cerradas tampoco ha dado por resultado hacerlas breves o propia. Toda sílaba, cualquiera que haya sido su naturaleza o estructura, ha recibido una u otra duración, según las circunstancias rítmicas, psíquicas o sintácticas en que se ha pronunciado (1922, p. 19).

Borzone y Signorini (1983) estudian el comportamiento rítmico del español de Buenos Aires y llegan a la conclusión de que este es de carácter acentual, al igual que Tomás Navarro con el español de España. Borzone y Signorini determinan, por medio de la medición de la duración de los pies acentuales, que la duración de estos fluctúa entre promedios de 447 y 467 ms. Así, sus resultados descartan que el español de Argentina se comporte como una lengua de carácter silábico. Entre otros estudios que han llegado a esta misma conclusión se puede mencionar los realizados por Hoequist (1983a, 1983b) y Clegg y Fails (1987), citados en Almeida (1997).

Font y Ríos (1991) analizan una muestra de 95 segundos de habla espontánea obtenida de una entrevista de 60 minutos de un informante hablante de español peninsular. Por medio de la medición de la duración de las sílabas acentuadas y no acentuadas, Font y Ríos llegan a la conclusión de que el español manifiesta una tendencia a ser una lengua de carácter silábico, porque la duración de la sílaba acentuada no depende de las sílabas no acentuadas que la acompañan.

Toledo (2010b), por su parte, plantea que “la condición acentuada de la sílaba provoca una prominencia temporal destacada; en las demás posiciones, las sílabas son cuasi isosilábicas” (p. 88), de tal forma que, según sus datos, el español presenta una tendencia rítmica de carácter silábico. Otros estudios que llegan a esta misma conclusión son los de Gili Gaya (1940), Delattre (1966) y Olsen (1972), citados por Almeida (1997).

Álvarez (1978), en un trabajo pionero para su época, realiza un análisis cuantitativo instrumental mediante análisis de espectrogramas y medición manual de la duración de segmentos vocálicos e intervalos acentuales de 3 hablantes del español de Chile (comparado con el inglés) y concluye que “los sujetos hablantes muestran una mayor tendencia al isocronismo en español que en inglés” (p. 38).

En estudios más recientes, de lingüística comparada, Grabe y Low (2002) clasifican al español de España como una lengua de ritmo silábico al igual que como lo planteaban años antes Pike (1945) y Hockett (1958). Del mismo modo, y en la misma línea, White y Mattys (2007) comparan el comportamiento rítmico del inglés, el holandés, el francés y el español y concluyen que, de acuerdo con algunos indicadores, el español presenta un ritmo de tipo más cercano al silábico, aunque dejan en claro que, de acuerdo con sus resultados, la distinción entre ritmo silábico y acentual como categorías para clasificar las lenguas es un asunto que aún es debatible. No obstante, aun cuando es posible reconocer que la forma como se ha aplicado la hipótesis del principio de la isocronía para clasificar las lenguas es, en algunos casos, extremadamente categórica, todos los estudios parten por tomar como punto de referencia inicial este principio para explorar el fenómeno del ritmo lingüístico.

1.3. Métodos cuantitativos de análisis del ritmo

En las últimas décadas, con el avance y desarrollo de los recursos informáticos que han permitido realizar análisis instrumental y cuantitativo más rápidos y precisos y que han permitido además el manejo de un volumen de datos mucho mayor que antes, se han desarrollado e implementado varios métodos de análisis cuantitativo de la dimensión prosódica del habla, entre ellos varios que se proponen analizar el comportamiento del fenómeno rítmico. Cuatro métodos de análisis cuantitativo han sido diseñados y propuestos en los últimos años para la medición y consecuente clasificación del ritmo lingüístico: Ramus, Nespor y Mehler (1999), Grabe y Low (2002), Delwoo (2006) y Bertinetto y Bertini (2008)1. Al aplicar estos métodos, se obtienen datos cuantitativos susceptibles además de ser proyectados en representaciones espaciales en el plano cartesiano para una mejor interpretación de los resultados del análisis.

El supuesto fundamental que subyace a estos procedimientos es que la medición de la duración, pero principalmente de la variabilidad de la duración (tanto en términos absolutos como relativos) de los segmentos vocálicos y consonánticos, es un indicador objetivo y cuantificable de la mantención de la integridad fonológica de la sílaba en el nivel fonético. En este caso, se asume que la mantención de la integridad de la sílaba, por lo tanto la uniformidad en sus duraciones, es una consecuencia de un ritmo de tipo silábico y lo contrario es una consecuencia de un ritmo acentual

El detalle de la forma y de la aplicación de estos métodos está expuesto y explicado más adelante en el apartado de materiales y métodos.

2. Objetivo

Hasta el momento, el comportamiento rítmico del español de Chile no ha sido estudiado desde el punto de vista de la hipótesis de la isocronía con una muestra considerable de informantes, ni tampoco mediante los métodos y procedimientos actuales de tipo instrumental cuantitativo. Sobre el tema, existe sólo un par de estudios que se realizaron con muy pocos informantes y en general se asume hasta ahora lo planteado por las investigaciones hechas sobre otras variantes del castellano, principalmente por las del español de España. No obstante, con los antecedentes bibliográficos que existen, se puede concluir que la discusión sobre si el español se debe clasificar como lengua silábica o acentual aún está en debate, por lo que es necesario realizar estudios que aporten más datos al conocimiento del comportamiento rítmico de esta variedad, y de esta y otras lenguas. En consecuencia, el propósito de este estudio es determinar el ritmo del español de Chile en habla controlada de hablantes en ocho ciudades del país.

3. Materiales y métodos

La investigación que aquí se expone es un estudio de carácter descriptivo y transversal, en el cual se busca determinar el comportamiento rítmico del español de Chile en situación de lectura en voz alta mediante la medición y determinación de los valores de varios indicadores cuantitativos (en particular, %V, ΔV, ΔC, VarcoΔC, CrPVI, VnPVI, CCI(V) y CCI(C), explicados en detalle en las secciones que siguen).

3.1. Métodos cuantitativos de análisis del ritmo

3.1.1. El método de Grabe y Low

El método para determinar la clasificación rítmica de una lengua propuesto por Low, Grabe y Nolan (2000) y por Grabe y Low (2002), en un estudio de lingüística comparada en el que se incluye al español, está basado en un procedimiento que mide la variabilidad de la sucesión temporal de los intervalos vocálicos y consonánticos por separado, lo que diferencia a este procedimiento de otras propuestas en las que se compara la duración de los segmentos con la duración de la oración (como el de Ramus et al., 1999). Este procedimiento entrega un indicador numérico que se ha denominado rPVI (raw Pairwise Variability Index). La ecuación para calcular el rPVI es la siguiente:

En esta fórmula, el valor de m corresponde al número de intervalos vocálicos o intervocálicos, según lo que se esté midiendo, y d corresponde a la duración de cada uno de los intervalos. La fórmula compara la duración de los intervalos en valor absoluto y por tipo de segmento (dk) con el intervalo siguiente (dk+1) hasta completar el número total de segmentos y finalmente divide el resultado obtenido por el número total de intervalos hasta el penúltimo (m - 1).

También se propone usar un indicador llamado nPVI (normalized Pairwise Variability Index), que corresponde a la versión normalizada de la duración de la medida de los intervalos. La ecuación es la siguiente:

Al igual que en la ecuación anterior, el valor de m corresponde al número de intervalos vocálicos o intervocálicos y d corresponde a la duración de cada uno de los intervalos. La diferencia es que, para proyectar los resultados en una escala porcentual, en esta fórmula se divide lo obtenido por el promedio de los intervalos, antes de dividirlo por la duración hasta el penúltimo, y luego se multiplica el total por cien.

En cuanto a la interpretación de los datos que entrega este método, para determinar la clasificación rítmica de una muestra de habla dentro de los supuestos de la hipótesis de la isocronía se entiende que cuanto más altos sean los valores de rPVI y de nPVI, el ritmo que presenta la muestra analizada tiende a ser más acentual y, por el contrario, si los valores son bajos se interpreta que la muestra de habla medida tiende a presentar un ritmo más silábico, en la medida en que las sílabas se parecen más entre sí en su duración.

3.1.2. El método de Bertinetto y Bertini

Como actualización al método de Grabe y Low, surge la propuesta de Bertinetto y Bertini (2008), el índice de control/compensación (Control/Compensation Index) o CCI que consiste en relativizar el PVI al número de segmentos que componen los intervalos vocálicos y consonánticos. En la práctica, la duración de cada intervalo es dividida por el número de sus segmentos de acuerdo con la siguiente fórmula:

En la fórmula, m corresponde al número de intervalos (V y C separados), d a la duración de cada intervalo y n al número de segmentos entre cada intervalo, la diferencia con el método propuesto por Grabe y Low es que compara la duración de los intervalos con la duración total de la sílaba y no solamente con los segmentos del mismo tipo.

3.1.3. El método de Ramus, Nespor y Mehler

De la aplicación de este método se obtienen tres indicadores: a) %V, que corresponde a la proporción de intervalos vocálicos dentro de la oración, expresada como la suma de los intervalos vocálicos divididos por la duración total de la oración; b) ΔV, que corresponde a la desviación estándar de la duración de los intervalos vocálicos dentro de cada oración y c) ΔC, que corresponde a la desviación estándar de la duración de los intervalos consonánticos dentro de cada frase (Ramus et al., 1999).

3.1.4. El método de Dellwo

Por otra parte, unos años después, Dellwo (2006) propone una actualización al método de Ramus et al., que corresponde a la normalización de ΔC, lo que da como resultado un indicador denominado VarcoΔC. La fórmula para realizar el cálculo de este indicador es:

Para llevar a cabo esta normalización, la desviación estándar de la duración de los intervalos consonánticos, representado por ΔC se multiplica por cien y se divide por el promedio de la duración de los intervalos consonánticos representados por Media(C).

3.2. Procedimiento

Se utilizó como corpus una muestra de habla en situación de lectura en voz alta correspondiente a las grabaciones de 30 informantes, las cuales fueron elicitadas en el contexto del proyecto Fondecyt Nº 1120886.2

Se analizaron solamente las grabaciones de lectura en voz alta del corpus ya mencionado. Esta lectura corresponde a una adaptación del cuento Inamible de Baldomero Lillo3. Los sujetos corresponden a hombres y mujeres profesionales chilenos hablantes nativos monolingües. Los informantes son residentes de las ciudades de Iquique (3), la Serena (2), Valparaíso (4), Santiago (8), Concepción (11), Temuco (3), Coyhaique (2) y Punta Arenas (2). Estas ciudades fueron elegidas como representativas de cuatro zonas geográficas de división dialectal que corresponden a las zonas propuestas por Wagner : zona norte, desde Arica hasta Choapa (5); zona centro, desde Petorca hasta Cauquenes (12); zona sur, desde Ñuble hasta Cautín (9) y zona austral desde Valdivia hasta Tierra del Fuego (4). Para más detalles sobre los criterios que se utilizan para la definición de estas cuatro zonas dialectales y la consecuente selección de las localidades en donde se tomaron las muestras véase Wagner (2004).

El número de hablantes por ciudad están en relación proporcional al número de profesionales de cada zona, como se determina y declara en el proyecto Fondecyt Nº 1120886. Todos los informantes de la muestra manifestaron una adecuada pronunciación, lo cual fue determinado a través de un test de apreciación subjetiva (Soto-Barba, Pereira, Pérez, Ortiz Lira & Ruiz Mella, 2015).

En cuanto al tratamiento del corpus, primero se realizó una selección y normalización de las grabaciones mediante el programa Audacity. Los archivos de sonido fueron capturados en formato WAV monofónico con una frecuencia de muestreo de 44100 Hz y con 16 bit de profundidad. Para cada archivo de sonido, se realizó un proceso de segmentación y etiquetado de las vocales y consonantes por medio de un procedimiento semiautomático, primero con el script EasyAling (Goldman, 2011) y luego mediante una revisión y corrección manual. Los criterios para el etiquetado fueron: a) se consideró a las vocales de los diptongos como elementos separados, si la frontera no era visible se buscaba un punto medio, b) las vocales de los hiatos se consideraron también como segmentos separados, c) las consonantes africadas como un solo segmento, d) los errores de lectura se consideraron parte de la misma, e) las consonantes aproximantes se analizaron caso a caso.

Finalmente, las grabaciones etiquetadas se procesaron con el programa Correlatore (Mairano & Romano, 2010), que es una aplicación de software que contiene los algoritmos para aplicar los procedimientos de cálculo de los indicadores cuantitativos asociados a cada uno de los métodos de análisis del ritmo que se consideran en esta investigación. Las grabaciones se etiquetaron en transcripción SAMPA por motivos prácticos, debido a que Correlatore trabaja con este tipo de transcripción. Los datos cuantitativos del comportamiento rítmico del habla de los informantes individuales fueron importados al programa R (R Core Team, 2018), para así poder analizar y comparar el comportamiento de cada uno de los indicadores, y para construir representaciones gráficas de los espacios cartesianos.

Figura 1. Captura de pantalla de programa Praat que muestra el etiquetaje con la transcripción SAMPA y los tipos de segmento.

En la Figura 1, se presenta una captura de pantalla del programa Praat (Boersma & Weenink, 2018), en la cual se ilustra el formato de etiquetado que se utilizó. Se observa en la primera fila el espectrograma; en la segunda, el sistema de transcripción SAMPA, y en la tercera, la transcripción del tipo de intervalo (vocálico o consonántico).

4. Resultados

4.1. Resultados del análisis mediante el método de Grave y Low

El gráfico que se presenta en la Figura 2 muestra el comportamiento de variabilidad de los indicadores VnPVI y CrPVI. Aparecen expresados todos los valores registrados de forma individual para cada sujeto, pero además la forma de cada punto permite observar el comportamiento de los datos agrupados por zona geográfica. A simple vista se puede observar que no parece existir ningún tipo de correlación clara (ni negativa ni positiva) entre ambos indicadores, tampoco es posible observar algún agrupamiento determinado por zona lingüística. Lo que sí se observa, es un agrupamiento general de la mayoría de los individuos en el rango de entre los 50 y 60 ms de variabilidad de la duración de las consonantes y también un agrupamiento en prácticamente todos los individuos en un rango que comprende entre el 42% y el 48% de variabilidad de la duración de las vocales.

Figura 2. Comportamiento individual de los valores del VnPVI confrontados con los valores del CrPVI. Los puntos indican el valor individual por informante. Los números representan la zona lingüística (1 = norte, 2 = centro, 3 = sur y 4 = austral).

En el gráfico que se muestra en la Figura 3, se presentan los valores promedio y los rangos de dispersión de los indicadores CrPVI y VnPVI de cada zona confrontados y comparados en el plano cartesiano con los valores promedio y rangos de dispersión del total de informantes de la muestra de todo Chile y con los valores promedio de algunas otras lenguas (Mairano 2011). Se puede apreciar que las zonas central, sur y austral se manifiestan con resultados bastante próximos al promedio nacional, no obstante, la zona austral presenta valores mucho más dispersos en cuanto a la variabilidad de la duración consonántica. El único promedio que se comporta de manera distinta al resto del grupo es el de la zona norte, que presenta valores levemente más altos tanto en la variabilidad de la duración consonántica como en la de la duración vocálica. Se observa, además, en la distribución espacial de los puntos, que la variabilidad de la duración vocálica del español de Chile separada por zonas se concentra mayormente entre el 42% y el 47% y, por otra parte, la variabilidad de la duración consonántica se concentra entre los 52 y 57 ms.

Figura 3. Promedio y dispersión de los valores de VnPVI y de CrPVI de cada zona comparados con los mismos valores del total de informantes de Chile y los promedios de otras lenguas. En esta, y en otras figuras similares, “SPCL” corresponde al promedio nacional para Chile, y los puntos “SPCL1”, “SPCL2”, “SPCL3” y “SPCL4” a los promedios por zona geográfica (1 = norte, 2 = centro, 3 = sur y 4 = austral); el punto “Spanish” corresponde al promedio para el castellano peninsular determinado por Mairano (2011).

Al observar la ubicación del promedio de todos los hablantes chilenos, el indicador VnPVI presenta un promedio de un 43% de variabilidad y el indicador CrPVI, un promedio de 53 ms de variabilidad. Comparados con los promedios de las otras lenguas, estos valores son más bajos, es decir, el español de Chile (al igual que el español de España) manifiesta una duración silábica mucho más uniforme.

Se puede apreciar también que, como sugiere la bibliografía existente, los valores del español, y específicamente en este caso del español de Chile, se presentan en la misma área del plano cartesiano que otras lenguas romances como el francés, además de otras lenguas como el chino y el ruso, pero están lejos de los registros que existen para otras lenguas como el inglés, el árabe y el holandés.

4.2. Resultados del análisis mediante la propuesta de Bertinetto y Bertini

En el gráfico que se presenta en la Figura 4, se puede ver el resultado de los valores de CCI(V) y CCI(C) de cada informante de manera individual, pero además la forma de cada punto permite observar también el comportamiento de los valores agrupados por zona geográfica. Se puede observar que se manifiesta una leve correlación positiva entre ambos indicadores. Pero, por otro lado, no es posible determinar algún agrupamiento determinado por la zona lingüística. Lo que sí es posible observar, es un agrupamiento general de la mayoría de los individuos en el rango de entre el 24% y el 30% de variabilidad de la duración vocálica y también un agrupamiento en prácticamente todos los individuos en un rango que comprende entre el 28% y el 36% de variabilidad de la duración de las consonantes.

Figura 4. Comportamiento individual de los valores del CCI(V) confrontados con los valores del CCI(C). Los puntos indican el valor individual por informante. Los números representan la zona lingüística (1 = norte, 2 = centro, 3 = sur y 4 = austral).

En el gráfico que se muestra en la Figura 5, se presentan los valores promedio y los rangos de variabilidad para los indicadores CCI(V) y CCI(C) de cada zona geográfica confrontados en el plano cartesiano y comparados además con los mismos valores, pero del total de informantes de la muestra de todo Chile. Para el indicador CCI(V) los datos concentran mayormente entre el 25% y el 30% de variabilidad de la duración vocálica, mientras que para el indicador CCI(C) los valores oscilan entre el 30% y 34%. Se puede apreciar que las zonas central y sur manifiestan valores cercanos al promedio nacional, no obstante, la zona austral presenta valores mucho más dispersos en cuanto a la variabilidad de la duración consonántica, por su parte la zona norte se aleja del promedio nacional con un valor un poco mayor al de las otras zonas.

Figura 5. Promedio y dispersión de los valores de CCI(V) y de CCI(C) de cada zona comparados con los mismos valores del total de informantes de Chile y los promedios de otras lenguas.

En el gráfico de la Figura 5, están también consignados los valores promedio de otras lenguas obtenidos por Mairano (2011). Comparados con los promedios de las otras lenguas, estos valores son bastante más bajos, es decir, el español de Chile (al igual que el español de España) manifiesta una duración silábica mucho más uniforme.

Se puede observar que la gran mayoría de los datos de los hablantes de español de Chile se concentran en un espacio bastante cercano al español de España, aunque a diferencia de los valores obtenidos a través del modelo de Grabe y Low, también aparecen como lenguas cercanas el japonés y el holandés, sin embargo, no se encuentra tan cerca del francés, el chino y el ruso. Por otra parte, en un espacio más lejano dentro del plano cartesiano, se encuentran lenguas como el árabe y el inglés.

4.3. Resultados según el método de Ramus, Nespor y Mehler (indicadores ΔV vs ΔC)

En el gráfico que se presenta en la Figura 6, se pueden ver los valores registrados de los indicadores ΔV y ΔC para cada informante, pero además la forma de cada punto permite observar también su comportamiento agrupados por zona lingüística. Se puede observar que existe leve correlación positiva entre ambos indicadores. No obstante, no es posible observar tampoco algún agrupamiento determinado por la zona lingüística. Lo que sí se puede apreciar es un agrupamiento general de la mayoría de los valores individuales en el rango de entre los 30 y 40 ms de variabilidad de la duración vocálica y también un agrupamiento la mayoría de los individuos en un rango que comprende entre los 45 y 50 ms de variabilidad de la duración de las consonantes.

En el gráfico que se muestra en la Figura 7, se presentan los valores promedio y los rangos de dispersión tanto de los indicadores ΔV como del ΔC para cada zona geográfica confrontados en el plano cartesiano y comparados además con el mismo valor, pero del total de informantes de la muestra de todo Chile y con los valores promedio en otras lenguas entregados por Mairano (2011). Los resultados para el español de Chile indican un promedio de 38 ms para ΔV y de 48 ms para los valores de ΔC. Se puede apreciar que la zona austral se manifiesta con valores bastante cercanos al promedio nacional, en cambio la zona sur se presenta con un valor menor y las zonas norte y centro se presentan con valores mayores. Se observa que la distribución de la variabilidad de la duración vocálica por zona se concentra mayormente alrededor de los 41 ms, por otro lado la variabilidad de la duración consonántica se concentra en un pequeño rango entre los 46 y 50 ms. Comparados estos valores con los promedios dados para las otras lenguas, se puede decir que la variabilidad de la duración vocálica es menor que la mayoría de ellas, pero la variabilidad de la duración consonántica se encuentra en un punto intermedio, sin manifestar una tendencia que la haga ver evidentemente diferente.

Figura 6. Comportamiento individual de los valores del ΔV confrontados con los valores del ΔC. Los puntos representan los valores individuales por informante y los números la zona lingüística de la cual provienen.

Se aprecia que los valores del español de Chile se presentan en un área relativamente cercana al de otras lenguas romances como español de España y el francés, aunque, a diferencia de los valores obtenidos con los métodos anteriores, también aparecen cercanas al inglés, al chino, al holandés y al ruso. En un espacio más lejano, se encuentran lenguas como el árabe y el japonés.

Figura 7. Promedio y dispersión de los valores de ΔV y de ΔC de cada zona comparados con los mismos valores del total de informantes de Chile y los promedios de otras lenguas.

4.4. Método de Ramus, Nespor y Mehler (indicadores %V vs ΔC)

A continuación, se presentan los resultados obtenidos por medio de la aplicación de otros dos indicadores del método cuantitativo propuesto por Ramus et al. (1999). Los indicadores que se utilizan en este análisis son ΔC (para valores intervocálicos) y %V (para valores vocálicos). La diferencia con el análisis que se presenta en el apartado anterior es que en aquel se trabaja con las desviaciones estándar de ambos tipos de segmento, en cambio, ahora se presentan los resultados de comparar los valores de la desviación estándar de los segmentos consonánticos con la proporción de intervalos vocálicos dentro del enunciado.

Figura 8. Comportamiento individual de los valores de %V confrontados con los valores de ΔC. Los puntos representan los valores individuales por informante y los números la zona geográfica en la que residen los individuos.

El gráfico que se presenta en la Figura 8 muestra el comportamiento de los indicadores %V y ΔC para cada informante, además la forma de cada punto permite observar el comportamiento de los valores asociados por zona lingüística. A simple vista se puede observar que no se da ningún tipo de correlación (ni negativa ni positiva) entre ambos indicadores. No es posible observar tampoco ninguna intersección determinada por la zona lingüística. Lo que sí es posible observar, es un agrupamiento general de la mayoría de los individuos en el rango de entre el 44% y el 50% de proporción de intervalos vocálicos en el enunciado. Así también se puede apreciar que prácticamente todos los individuos se agrupan en un rango entre 40 y 55 ms de variabilidad de la duración de las consonantes.

Figura 9. Promedio y dispersión de los valores de %V y de ΔC de cada zona comparados con los mismos valores del total de informantes de Chile y los promedios de otras lenguas.

En el gráfico que se muestra en la Figura 9, se presentan los valores promedio de %V y de ΔC de cada zona confrontados en el plano cartesiano con el promedio del total de informantes de la muestra de todo Chile y los promedios de otras lenguas entregados por Mairano (2011). El promedio nacional de la proporción de intervalos vocálicos en el enunciado es de un 46%, mientras que la variabilidad promedio de la duración consonántica es de 48 ms. Al comparar estos valores con los promedios de otras lenguas, se puede decir que tanto la proporción de intervalos vocálicos como la variabilidad absoluta de la duración consonántica se encuentran en un punto intermedio, sin que se manifieste una tendencia en términos relativos hacia la uniformidad o hacia la heterogeneidad de la duración silábica.

Se puede apreciar que las zonas centro y austral manifiestan valores bastante cercanos al promedio de todos los sujetos de la muestra; en cambio la zona sur presenta un valor un poco menor y la zona norte, un valor un poco mayor al promedio nacional. Se observa que la proporción de intervalos vocálicos en el enunciado se concentra mayormente entre el 45% y el 47%, mientras que la variabilidad de la duración consonántica se concentra entre los 46 y 50 ms. Los valores de otras lenguas más cercanos al espacio ocupado por el español de Chile son el español de España y el holandés.

4.5. Método de Dellwo

A continuación, se muestran los resultados obtenidos por medio del método cuantitativo de Dellwo. Los indicadores que se utilizan son VarcoΔC (para valores intervocálicos) y %V (para valores vocálicos), esto porque los estudios anteriores en otras lenguas se hicieron con estos indicadores, así los valores obtenidos pueden ser comparables.

Figura 10. Comportamiento individual de los valores del %V y confrontados con los valores del VarcoΔC. Los puntos representan los valores individuales por informante y los números la zona geográfica

En el gráfico que se presenta en la Figura 10, se puede ver el comportamiento de los indicadores (%V y VarcoΔC) de forma individual, pero además la forma de cada punto permite observar el comportamiento de los valores agrupados por zona lingüística. A simple vista se puede observar que no existe ningún tipo de correlación (ni negativa ni positiva) entre ambos indicadores. No es posible determinar tampoco algún agrupamiento determinado por la zona lingüística. Lo que sí es posible observar, es un agrupamiento general de la mayoría de los individuos en el rango de entre el 44% y el 49% de la proporción de intervalos vocálicos en el enunciado y también un agrupamiento en prácticamente todos los individuos en un rango que comprende entre el 50% y el 57% de la variabilidad de la duración de las consonantes.

En el gráfico que se muestra en la Figura 11, se presentan los valores promedio y los rangos de dispersión tanto del %V como del VarcoΔC de cada zona confrontados en el plano cartesiano y comparados además con los mismos valores, pero del total de informantes de la muestra de todo Chile. El promedio de la proporción de intervalos vocálicos en el enunciado de todos los informantes chilenos es de un 46% y el promedio de variabilidad de la duración consonántica es de un 53%. Se puede apreciar que las zonas norte, centro y austral se manifiestan con valores bastante cercanos al promedio nacional, en cambio la zona sur se presenta con un valor un poco menor al promedio nacional.

Se observa que la proporción de intervalos vocálicos en el enunciado se concentra mayormente entre el 45% y el 47%, por su parte que la variabilidad de la duración consonántica se concentra entre el 52% y el 55%. Si se comparan estos valores con los proporcionados para otras lenguas, se puede ver una variabilidad de la duración consonántica más alta que todas las otras lenguas, excepto el árabe. De igual forma, la proporción de intervalos vocálicos dentro del enunciado manifiesta un valor más alto que la mayoría de las otras lenguas.

Figura 11. Promedio y dispersión de los valores de %V y de VarcoC de cada zona comparados con los mismos valores del total de informantes de Chile y los promedios de otras lenguas.

Se puede apreciar que los valores del español de Chile se presentan en un área bastante cercana al español de España, pero a diferencia de los resultados de los métodos anteriores, también aparece como una lengua cercana al árabe y más alejado del resto de las otras lenguas, incluso las romances.

5. Conclusiones

En esta investigación se ha analizado cuantitativamente el ritmo del español de Chile en habla controlada en una muestra de sujetos profesionales residentes de ocho ciudades del país, las cuales fueron seleccionadas y clasificadas de acuerdo con las cuatro zonas dialectales propuestas por Wagner (2004). Para establecer estos resultados con base en el principio de isocronía, se utilizaron cinco procedimientos de análisis basados en 4 métodos que han sido propuestos para el análisis del comportamiento rítmico en diversas lenguas.

Se cuantificó la duración de los segmentos vocálicos y consonánticos con base en los métodos propuestos por Grabe y Low (2000), para ambos tipos de segmento en forma independiente; por Bertineto y Bertini (2008), para la comparación de cada segmento en relación con la sílaba; por Ramus et al. (1999), para la comparación de la duración de los segmentos y la proporción de los intervalos vocálicos en relación con la oración, y por el método propuesto por Dellwo (2006), en el cual se relativizan los segmentos consonánticos del modelo de Ramus. Los datos obtenidos fueron confrontados comparándolos por hablante y por zona lingüística. Los resultados de todos los métodos muestran una dispersión de datos en el plano cartesiano, sin que alguna tendencia permita clasificar o agrupar a los hablantes por zona lingüística. Esto permite concluir que en el español de Chile, la zona geográfica de residencia de los hablantes no determina su comportamiento rítmico en lectura, ya que, como se puede ver claramente, no existe una correlación entre la zona lingüística y la tendencia rítmica del habla de los sujetos de la muestra.

Asimismo, en tres de los análisis realizados (VnPVI vs. CrPVI, CCI(V) vs. CCI(C) y ΔV vs. ΔC), el español de Chile manifiesta una tendencia a mayor uniformidad en la duración de las sílabas, por lo tanto, comparativamente esto implica una tendencia al ritmo de tipo silábico. No obstante, en los otros dos análisis (%V vs. ΔC y %V vs. VarcoΔC), el español de Chile, en términos comparativos, se manifiesta con valores intermedios, es decir, no muestra una tendencia clara ni hacia un ritmo de tipo acentual o de tipo silábico.

Sin embargo, como es esperable, en general, el español de Chile tiende a comportarse de manera similar al español de España en cuanto a la proporción que guarda al ser comparado con las otras lenguas en los análisis gráficos, pero siempre con valores más altos de variabilidad de la duración de la sílaba (principalmente en la duración vocálica).

Como conclusión general, se puede afirmar que el español de Chile es una lengua de tendencia rítmica de tipo silábico, aunque más acentual que el español peninsular. En cuanto a la variación del español de Chile por zona lingüística, la diferencia es relativamente pequeña, de manera que no es posible postular que la zona realmente influye en el comportamiento rítmico del español de Chile en situación de lectura.

Queda pendiente determinar el comportamiento rítmico en situaciones diferentes a la lectura, ya que en los datos entregados por Dellwo (2006) se observa que, a distintas velocidades de habla, tiende a cambiar el comportamiento rítmico.

Referencias bibliográficas

Abercrombie, D. (1967). Elements of general phonetics. Edimburgo: Edinburgh University Press.

Almeida, M. (1997). Organización temporal del español: el principio de isocronía. Revista de Filología Románica, 14(1), 29-40.

Almeida, M. & Toledo, G. (1997). Alternancia del ritmo en español. En M. Almeida & J. Dorta (Eds.), Contribuciones al estudio de la lingüística hispánica: Homenaje al profesor Ramón Trujillo (pp. 35-41). Santa Cruz de Tenerife: Montesinos.

Alvarez, H. (1978). Estudio comparado de los ritmos del inglés y del español: análisis experimental. RLA, 16, 31-39.

Arvaniti, A. (2012). The Usefulness of Metrics in the Quantification of Speech Rhythm. Journal of Phonetics, 40, 351-373.

Bertinetto, P.M. & Bertini, C. (2008). On modeling the rhythm of natural languages. Proceedings of Speech Prosody Conference 2008, 427-430.

Boersma, P. & Weenink, D. (2018). Praat: doing phonetics by computer [Programa computacional]. Versión 6.0.39, descargada el 3 de abril de 2018 de http://www.praat.org/

Borzone, A. M. & Signorini, A. (1983). Segmental duration and rhythm in Spanish. Journal of Phonetics, 11, 117-128.

Clegg, J. H. & Fails, W.C. (1987). On syllable length in Spanish. En T. A. Morgan, J. F. Lee & B. VanPatten (Eds.), Language and language use: Studies in Spanish (pp. 69-78). Lanham, MD: University Press of America.

Crystal, D. (2000). Diccionario de lingüística y fonética. Barcelona: Octaedro.

Cuenca, M. (2000). Lenguas de compás acentual y lenguas de compás silábico, revisión teórica e implicaciones pedagógicas. Estudios de Lingüística Inglesa Aplicada, 1, 41-54.

Dellwo, V. (2006). Rhythm and speech rate: a variation coefficient for deltaC. En P. Karnowski & I. Szigeti (Eds.), Language and language-processing (pp. 231-241). Frankfurt/Main: Peter Lang.

Font, C. y A. Ríos (1991). Compensatory shortening in Spanish spontaneous speech. Proceedings of the ESCA ‘Phonetics and Phonology of Speaking Styles, 16, 1-5.

Gil, J. (2007). Fonética para profesores de español: de la teoría a la práctica. Madrid: Arco/Libros.

Gili Gaya, S., (1940). La cantidad silábica en la frase. Castilla, 1, 287-298.

Grabe, E. & Low, E. L. (2002). Durational variability in speech and the rhythm class hypothesis”. En C. Gussenhoven & N. Warner (Eds.), Papers in Laboratory Phonology 7 (pp. 515-546). Berlin, Mouton de Gruyter.

Goldman, J. P. (2011). EasyAlign: an automatic phonetic alignment tool under Praat. En Interspeech’11, 12th Annual Conference of the International Speech Communication Association (pp. 3233-3236). Firenze, Italy.

Hockett, C. F. (1958). A course in modern linguistics. Nueva York: Macmillan.

Hoequist, Ch. (1983a). Durational correlates of linguistic rhythm categories. Phonetica, 40, 19-23.

Hoequist, Ch. (1983b). Syllable duration in stress-, syllable- and mora-timed languages. Phonetica, 40, 202-237.

Low, E. L., Grabe, E. & Nolan, F. (2000). Quantitative Characterizations of Speech Rhythm: Syllable-Timing in Singapore English. Language and speech, 43(4), 377-401.

Luna, E., Vigueras, A. & Baez, G. (2005). Diccionario básico de lingüística. UNAM: Ciudad de México.

Mairano, P. & Romano, A. (2010). Un confronto tra diverse metriche ritmiche usando Correlatore. En S. Schmid, M. Schwarzenbach & D. Studer (Eds.), La dimensione temporale del parlato (pp. 79-100). Torriana (RN): EDK.

Mairano, P. (2011). Rhythm typology: Acoustic and perceptive studies (Tesis doctoral). Universidad de Turín, Turín, Italia.

Navarro Tomás, T. (1922). La cantidad silábica en unos versos de Rubén Darío. Revista de Filología Española, IX, 1-29.

Pike, K. (1945). The intonation of American English. Ann Arbor: University of Michigan Press.

Quilis, A. & Fernandez, J. (1969). Curso de fonética y fonología españolas para estudiantes angloamericanos. Madrid: C.S.I.C.

R Core Team (2018). R: A language and environment for statistical computing [Programa computacional]. Versión 3.4.4, descargada el 5 de abril de 2018 de https://www.R-project.org/

Ramus, F., Nespor, M. & Mehler, J. (1999). Correlates of linguistic rhythm in the speech signal”.Cognition, 73(3), 265-292.

Soto-Barba, J., Pereira, D. I., Pérez, H. E., Ortiz Lira, H. & Ruiz Mella, M. (2015). Apreciación subjetiva acerca de la variación diatópica en el habla de los profesionales chilenos. RLA, 53(1), 131-147.

Toledo, G. (2002). Reglas del acento en paroxítonos: el español peninsular. Estudios filológicos, 37, 133-149.

Toledo, G. (2010a). Métricas rítmicas en microdiscursos. Onomazein, 21, 71-95.

Toledo, G. (2010b). Métricas rítmicas en discursos peninsulares. Boletín de Lingüística, 22(33), 88-113.

Wagner, C. (2004). El atlas lingüístico y etnográfico de Chile. Localidades y cuestionario. Estudios Filológicos, 39, 83-120.

White, L. & Mattys, S. L. (2007). Calibrating rhythm: First language and second language studies. Journal of Phonetics 35, 501-522.

Notas

1. Si se desea conocer también una perspectiva crítica acerca de algunos de estos procedimientos, véase Arvaniti (2012).

2. Se reitera el agradecimiento y el reconocimiento a todos los investigadores miembros del proyecto Fondecyt Nº 1120886: Dr. Jaime Soto-Barba, Dr. Daniel Pereira, Dr. Hernán Emilio Pérez, Dr. Héctor Ortiz y Dra. Magaly Ruiz, por su valioso aporte en la elicitación del corpus, sin el cual no habría sido posible este estudio.

3. Se eligió este texto debido a que en su configuración contiene una gran cantidad de realizaciones de los fonemas del español en un considerable número de contextos variados. No obstante, se realizaron algunas modificaciones para propiciar algunos entornos fonéticos que no aparecían en el texto original.