Performance of the phonatory deviation diagram in the evaluation of rough and breathy synthesized voices
Desempenho do diagrama de desvio fonatório na avaliação de vozes sintetizadas rugosas e soprosas

Braz. j. otorhinolaryngol. (Impr.); 84 (4), 2018
Publication year: 2018

Abstract Introduction Voice disorders alter the sound signal in several ways, combining several types of vocal emission disturbances and noise. The phonatory deviation diagram is a two-dimensional chart that allows the evaluation of the vocal signal based on the combination of periodicity (jitter, shimmer, and correlation coefficient) and noise (Glottal to Noise Excitation) measurements. The use of synthesized signals, where one has a greater control and knowledge of the production conditions, may allow a better understanding of the physiological and acoustic mechanisms underlying the vocal emission and its main perceptual-auditory correlates regarding the intensity of the deviation and types of vocal quality. Objective To analyze the performance of the phonatory deviation diagram in the discrimination of the presence and degree of roughness and breathiness in synthesized voices. Methods 871 synthesized vocal signals were used corresponding to the vowel /ɛ/. The perceptual-auditory analysis of the degree of roughness and breathiness of the synthesized signals was performed using visual analogue scale. Subsequently, the signals were categorized regarding the presence/absence of these parameters based on the visual analogue scale cutoff values. Acoustic analysis was performed by assessing the distribution of vocal signals according to the phonatory deviation diagram area, quadrant, shape, and density. The equality of proportions and the chi-square tests were performed to compare the variables. Results Rough and breathy vocal signals were located predominantly outside the normal range and in the lower right quadrant of the phonatory deviation diagram. Voices with higher degrees of roughness and breathiness were located outside the area of normality in the lower right quadrant and had concentrated density. Conclusion The normality area and the phonatory deviation diagram quadrant can discriminate healthy voices from rough and breathy ones. Voices with higher degrees of roughness and breathiness are proportionally located outside the area of normality, in the lower right quadrant and with concentrated density.
Resumo Introdução Os distúrbios de voz alteram o sinal sonoro de diversas formas, combinam variados tipos de perturbações e ruídos na emissão vocal. O diagrama de desvio fonatório é um gráfico bidimensional que possibilita a avaliação do sinal vocal a partir da combinação de medidas de periodicidade (jitter, shimmer e coeficiente de correlação) e de ruído (Glottal to Noise Excitation). O uso de sinais sintetizados, no qual se tem um maior controle e conhecimento das condições de produção, pode possibilitar uma maior compreensão dos mecanismos fisiológicos e acústicos subjacentes à emissão vocal e seus principais correlatos perceptivo-auditivos quanto à intensidade do desvio e aos tipos de qualidade vocal. Objetivo Analisar o desempenho do diagrama de desvio fonatório na discriminação da presença e do grau de rugosidade e soprosidade em vozes sintetizadas. Método Foram utilizados 871 sinais vocais sintetizados correspondentes à vogal/ɛ/. Realizou-se a análise perceptivo-auditiva do grau de rugosidade e soprosidade dos sinais sintetizados, com uma escala visual analógica. Posteriormente, os sinais foram categorizados quanto à presença/ausência desses parâmetros a partir dos valores de corte da escala visual analógica. A análise acústica foi realizada por meio da avaliação da distribuição dos sinais vocais de acordo com a área, quadrante, forma e densidade do diagrama de desvio fonatório. Executou-se o teste de igualdade de proporções e o teste qui-quadrado para comparar as variáveis. Resultados Sinais vocais rugosos e soprosos localizaram-se predominantemente fora da área de normalidade e no quadrante inferior direito do diagrama de desvio fonatório. Vozes com maiores graus de rugosidade e soprosidade localizaram-se fora da área de normalidade, no quadrante inferior direito e apresentaram densidade concentrada. Conclusão A área de normalidade e o quadrante do diagrama de desvio fonatório são capazes de discriminar vozes saudáveis de rugosas e soprosas. Vozes com maior grau de rugosidade e soprosidade localizam-se proporcionalmente fora da área de normalidade, no quadrante inferior-direito e com densidade concentrada.

More related