Repetição de estímulos âncoras e natureza das amostras vocais no julgamento perceptivo-auditivo realizado por estudantes de fonoaudiologia

Bispo, Noemi de Oliveira; Yamasaki, Rosiane; Padovani, Marina Martins Pereira; Behlau, Mara

doi:10.1590/2317-1782/20212021064

Resumo

Objetivo

Verificar o efeito da repetição de estímulos âncoras no julgamento perceptivo auditivo do desvio vocal predominante realizado por estudantes de fonoaudiologia; analisar a relação entre o número de dimensões vocais dos estímulos sonoros e a acurácia; e investigar a relação entre o desvio vocal predominante e a acurácia.

Método

Participaram da pesquisa 54 estudantes de fonoaudiologia, divididos em: Grupo Com Repetição - GCR com 28 alunos; e Grupo Sem Repetição - GSR, 26 alunos. A amostra vocal consistiu de 220 vozes humanas disfônicas, vogal /ε/. O GCR escutou três estímulos âncoras, uma voz rugosa, uma soprosa e uma tensa, no início da tarefa e a cada 20 vozes. O GSR escutou os estímulos âncoras somente no início da tarefa de avaliação. Estas classificações foram comparadas com respostas referências produzidas por 3 fonoaudiólogas experientes. Analisamos a acurácia e a confiabilidade intra e interavaliadores, a correlação entre número de dimensões vocais e acurácia e a relação entre desvio vocal predominante e acurácia.

Resultados

Os grupos tiveram desempenhos semelhantes na acurácia do desvio vocal predominante. A confiabilidade intra e interavaliadores foi discretamente maior no GCR. A acurácia dos alunos foi inversamente proporcional ao número de dimensões vocais presentes nos estímulos. O desvio vocal de maior acurácia foi a soprosidade, e a de menor, a tensão.

Conclusão

A repetição dos estímulos âncoras melhorou a confiabilidade dos estudantes, mas não se mostrou efetiva na acurácia da classificação do desvio vocal predominante. O número de dimensões vocais nos estímulos sonoros interferiu na acurácia dos alunos.

Descritores
Voz; Distúrbios da voz; Disfonia; Qualidade da Voz; Percepção Auditiva

ABSTRACT

Purpose

Verify the effect of anchor repetition in the perceptual auditory judgement of the type of vocal deviation performed by speech-language pathology (SLP) students; analyze the correlation between the amount of different vocal dimensions in the same stimuli and accuracy; investigate the correlation between type of vocal deviation and accuracy.

Methods

54 SLP students were divided in two groups: Group with repetition (GwR), 28 students; and, Group with no repetition (GnR), 26 students. The analyzed sample counted with 220 dysphonic human voices, vowel /ε/. The GwR heard three anchor stimuli before the judgement and every 20 voices during the assessment. The GnR heard the anchor only before beginning the judgement. The anchor stimuli counted with one rough, one breathy and one strain voice. These classifications were compared with reference judgements from three expert SLPs. The intra and inter-rater reliability, the correlation between the amount of different vocal dimensions in the same stimuli and type of vocal deviation with accuracy were assessed.

Results

The accuracy between type of deviation was similar among groups. The GwR presented slightly higher intra and inter-rater reliability. The student’s accuracy was inversely proportional to the amount of different vocal dimensions in the stimuli. Breathiness presented the highest accuracy and strain presented the lowest accuracy.

Conclusion

The repetition of anchor stimuli improved intra and inter-rater reliability. However, it was not effective in the accuracy of the type of vocal deviation. The amount of different vocal dimensions in the stimuli have influence in the students’ accuracy.

Keywords
Voice; Voice Disorders; Dysphonia; Voice Quality; Auditory Perception

INTRODUÇÃO

A avaliação vocal deve ser realizada de forma multidimensional, considerando tanto a perspectiva do clínico como a do próprio paciente. Dentre os instrumentos da avaliação vocal, a análise perceptivo-auditiva da voz (APA) é considerada o padrão-ouro⁽¹1 Oates J. Auditory-perceptual evaluation of disordered voice quality. Folia Phoniatr Logopp. 2009;61(1):49-56. http://dx.doi.org/10.1159/000200768. PMid:19204393.
http://dx.doi.org/10.1159/000200768... ^,²2 Kreiman J, Gerratt BR, Kempster GB, Erman A, Berke GS. Perceptual evaluation of voice quality: review, tutorial, and a framework for future research. J Speech Hear Res. 1993;36(1):21-40. PMid:8450660.⁾, sendo amplamente utilizada para fins científicos e clínicos. A APA possibilita a descrição da qualidade e da magnitude do desvio vocal, a análise da funcionalidade vocal⁽³3 Behlau M. The 2016 G. Paul Moore Lecture: Lessons in Voice Rehabilitation: Journal of Voice and Clinical Practice. J Voice. 2019;33(5):669-81. http://dx.doi.org/10.1016/j.jvoice.2018.02.020. PMid:29567050.
http://dx.doi.org/10.1016/j.jvoice.2018.... ⁾, a realização do diagnóstico diferencial das disfonias neurológicas⁽⁴4 Duffy JR. Motor speech disorders: substrates, differential diagnosis and management. 4th ed. USA: Elsevier: 2020.⁾, o acompanhamento dos resultados pré e pós-intervenção e o desenvolvimento do raciocínio clínico para tomada de decisão⁽⁵5 Iwarsson J, Reinholt Petersen N. Effects of consensus training on the reliability of auditory perceptual ratings of voice quality. J Voice. 2012;26(3):304-12. http://dx.doi.org/10.1016/j.jvoice.2011.06.003. PMid:21840170.
http://dx.doi.org/10.1016/j.jvoice.2011.... ^,⁶6 Brinca L, Batista AP, Tavares AI, Pinto PN, Araújo L. The effect of anchors and training on the reliability of voice quality ratings for different types of speech stimuli. J Voice. 2015;29(6):776.e7-14. http://dx.doi.org/10.1016/j.jvoice.2015.01.007.
http://dx.doi.org/10.1016/j.jvoice.2015.... ⁾. Além disso, a APA é um instrumento simples, acessível, de baixo custo e eficiente⁽⁷7 Barsties B, De Bodt M. Assessment of voice quality: current State-of-the-art. Auris Nasus Larynx. 2015;42(3):183-8. http://dx.doi.org/10.1016/j.anl.2014.11.001. PMid:25440411.
http://dx.doi.org/10.1016/j.anl.2014.11.... ^,⁸8 Ghio A, Dufour S, Wengler A, Pouchoulin G, Revis J, Giovanni A. Perceptual evaluation of dysphonic voices: can a training protocol lead to the development of perceptual categories? J Voice. 2015;29(3):304-11. http://dx.doi.org/10.1016/j.jvoice.2014.07.006. PMid:25516201.
http://dx.doi.org/10.1016/j.jvoice.2014.... ⁾.

Uma das maiores críticas à APA está relacionada com a subjetividade envolvida nessa forma de avaliação. Por ser subjetiva, pode ser mais suscetível a erros. Embora uma fonte de erros na APA possa ser aleatória, outras podem ser sistemáticas e, quando identificadas, tornam-se mais passíveis de controle. Assim, o conhecimento de fontes de erros sistemáticos na APA permite maior controle da avaliação, diminui a subjetividade envolvida e contribui para uma avaliação mais robusta⁽¹1 Oates J. Auditory-perceptual evaluation of disordered voice quality. Folia Phoniatr Logopp. 2009;61(1):49-56. http://dx.doi.org/10.1159/000200768. PMid:19204393.
http://dx.doi.org/10.1159/000200768... ^,²2 Kreiman J, Gerratt BR, Kempster GB, Erman A, Berke GS. Perceptual evaluation of voice quality: review, tutorial, and a framework for future research. J Speech Hear Res. 1993;36(1):21-40. PMid:8450660.^,⁹9 Zraick RI, Kempster GB, Connor NP, Thibeault S, Klaben BK, Bursac Z, et al. Establishing validity of the consensus auditory-perceptual evaluation of voice (CAPE-V). Am J Speech Lang Pathol. 2011;20(1):14-22. http://dx.doi.org/10.1044/1058-0360(2010/09-0105). PMid:20739631.
http://dx.doi.org/10.1044/1058-0360(2010...

10 Kreiman J, Gerratt BR, Ito M. When and why listeners disagree in voice quality assesment tasks. J Acoust Soc Am. 2007;122(4):2354-64. http://dx.doi.org/10.1121/1.2770547. PMid:17902870.
http://dx.doi.org/10.1121/1.2770547...

11 Webb AL, Carding PN, Deary IJ, MacKenzie K, Steen N, Wilson JA. The reliability of three perceptual evaluation scales for dysphonia. Eur Arch Otorhinolaryngol. 2004;261(8):429-34. PMid:14615893.^-¹²12 Sauder C, Eadie T. Does the accuracy of medical diagnoses affect novice listeners’ auditory-perceptual judgments of dysphonia severity? J Voice. 2020;34(2):197-207. http://dx.doi.org/10.1016/j.jvoice.2018.08.001. PMid:30195410.
http://dx.doi.org/10.1016/j.jvoice.2018.... ⁾. Porém, ainda carecemos de informações da literatura sobre as fontes de erros sistemáticos na APA.

Os fatores que interferem na avaliação perceptivo-auditiva já descritos pela literatura estão relacionados com: experiência do avaliador, tarefas de fala, protocolo de avaliação, escolha dos parâmetros vocais, vieses cognitivos e uso de estímulos âncoras, por meio do qual cria-se uma referência externa para os avaliadores. Como cada avaliador desenvolve representações mentais dos desvios vocais de acordo com o treinamento e a experiência clínica, o uso de estímulos âncoras é uma estratégia que possibilita a calibração da percepção auditiva dos avaliadores. Além desses fatores, a falta de atenção e a fadiga auditiva também podem interferir na percepção dos estímulos sonoros⁽¹1 Oates J. Auditory-perceptual evaluation of disordered voice quality. Folia Phoniatr Logopp. 2009;61(1):49-56. http://dx.doi.org/10.1159/000200768. PMid:19204393.
http://dx.doi.org/10.1159/000200768... ^,²2 Kreiman J, Gerratt BR, Kempster GB, Erman A, Berke GS. Perceptual evaluation of voice quality: review, tutorial, and a framework for future research. J Speech Hear Res. 1993;36(1):21-40. PMid:8450660.^,¹³13 Patel RR, Awan SN, Barkmeier-Kraemer J, Courey M, Deliyski D, Eadie T, et al. Recommended protocols for instrumental assessment of voice: american speech-language-hearing association expert panel to develop a protocol for instrumental assessment of vocal function. Am J Speech Lang Pathol. 2018;27(3):887-905. http://dx.doi.org/10.1044/2018_AJSLP-17-0009. PMid:29955816.
http://dx.doi.org/10.1044/2018_AJSLP-17-... ^,¹⁴14 Anand S, Skowronski MD, Shrivastav R, Eddins DA. Perceptual and quantitative assessment of dysphonia across vowel categories. J Voice. 2017;33(4):473-81. http://dx.doi.org/10.1016/j.jvoice.2017.12.018.
http://dx.doi.org/10.1016/j.jvoice.2017.... ⁾.

A voz humana é um estímulo complexo e pode ser composta por um conjunto de desvios vocais. Dessa forma, um único estímulo sonoro pode conter diferentes tipos de vozes, como soprosidade e rugosidade, ou seja, duas dimensões numa única voz⁽¹⁵15 Eadie T, Kapsner-Smith M. The effect of listener experience and anchors on judgments of dysphonia. J Speech Lang Hear Res. 2011;54(2):430-47. http://dx.doi.org/10.1044/1092-4388(2010/09-0205). PMid:20884782.
http://dx.doi.org/10.1044/1092-4388(2010... ⁾. Estudos anteriores relatam que algumas dimensões vocais produzem maior confiabilidade do que outras. Em ordem de maior concordância interavaliadores, temos o grau geral do desvio vocal (G), a soprosidade (S) e a rugosidade (R); e o de menor concordância a tensão (T)⁽¹1 Oates J. Auditory-perceptual evaluation of disordered voice quality. Folia Phoniatr Logopp. 2009;61(1):49-56. http://dx.doi.org/10.1159/000200768. PMid:19204393.
http://dx.doi.org/10.1159/000200768... ^,⁶6 Brinca L, Batista AP, Tavares AI, Pinto PN, Araújo L. The effect of anchors and training on the reliability of voice quality ratings for different types of speech stimuli. J Voice. 2015;29(6):776.e7-14. http://dx.doi.org/10.1016/j.jvoice.2015.01.007.
http://dx.doi.org/10.1016/j.jvoice.2015.... ^,¹¹11 Webb AL, Carding PN, Deary IJ, MacKenzie K, Steen N, Wilson JA. The reliability of three perceptual evaluation scales for dysphonia. Eur Arch Otorhinolaryngol. 2004;261(8):429-34. PMid:14615893.^,¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ^,¹⁷17 Solomon NP, Helou LB, Stojadinovic A. Clinical versus laboratory of voice using the CAPE-V. J Voice. 2011;25(1):e7-14. http://dx.doi.org/10.1016/j.jvoice.2009.10.007. PMid:20430573.
http://dx.doi.org/10.1016/j.jvoice.2009.... ⁾.

A exposição dos avaliadores a vozes de pacientes com distúrbios vocais ajuda a moldar os padrões individuais de escuta, assim como o tempo de treinamento, as preferências culturais e os conceitos pessoais sobre a qualidade vocal⁽²2 Kreiman J, Gerratt BR, Kempster GB, Erman A, Berke GS. Perceptual evaluation of voice quality: review, tutorial, and a framework for future research. J Speech Hear Res. 1993;36(1):21-40. PMid:8450660.^,¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ^,¹⁸18 Gerratt BR, Kreiman J, Antonanzas-Barroso N, Berke GS. Comparing internal and external standards in voice quality judgments. J Speech Hear Res. 1993;36(1):14-20. http://dx.doi.org/10.1044/jshr.3601.14. PMid:8450655.
http://dx.doi.org/10.1044/jshr.3601.14... ^,¹⁹19 Pontes PAL, Vieira VP, Gonçalves MIR, Pontes AAL. Características de vozes roucas ásperas e normais: análise acústica espectrográfica comparativa. Rev Bras Otorronolaringol. 2002;68(2):182-8. http://dx.doi.org/10.1590/S0034-72992002000200005.
http://dx.doi.org/10.1590/S0034-72992002... ⁾. O grau da representatividade do padrão interno é afetado pela experiência clínica, sendo que a concordância perceptivo-auditiva se mostra maior em indivíduos experientes. Um avaliador é considerado experiente quando avaliou e tratou distúrbios vocais por pelo menos 3 anos, o que resulta no aumento da percepção do profissional em relação à qualidade vocal⁽¹⁵15 Eadie T, Kapsner-Smith M. The effect of listener experience and anchors on judgments of dysphonia. J Speech Lang Hear Res. 2011;54(2):430-47. http://dx.doi.org/10.1044/1092-4388(2010/09-0205). PMid:20884782.
http://dx.doi.org/10.1044/1092-4388(2010... ⁾.

Os padrões internos que podem causar variação na classificação das vozes, exercem menor influência quando o avaliador tem acesso a referências externas de vozes normais e desviadas⁽²2 Kreiman J, Gerratt BR, Kempster GB, Erman A, Berke GS. Perceptual evaluation of voice quality: review, tutorial, and a framework for future research. J Speech Hear Res. 1993;36(1):21-40. PMid:8450660.⁾. Como a confiabilidade intra e interavaliadores representa um grande desafio para a APA, o uso de estímulos âncoras parece ser uma boa estratégia para aumentar a consistência da avaliação e diminuir a variação de julgamento interavaliadores. Tanto avaliadores experientes como inexperientes apresentam maior concordância intra e interavaliadores quando utilizam referências externas para avaliação perceptiva da voz, pois reduz a subjetividade da avaliação⁽²2 Kreiman J, Gerratt BR, Kempster GB, Erman A, Berke GS. Perceptual evaluation of voice quality: review, tutorial, and a framework for future research. J Speech Hear Res. 1993;36(1):21-40. PMid:8450660.^,¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ^,¹⁸18 Gerratt BR, Kreiman J, Antonanzas-Barroso N, Berke GS. Comparing internal and external standards in voice quality judgments. J Speech Hear Res. 1993;36(1):14-20. http://dx.doi.org/10.1044/jshr.3601.14. PMid:8450655.
http://dx.doi.org/10.1044/jshr.3601.14... ⁾.

A repetição de âncoras pode causar efeito positivo na percepção do avaliador, como um melhor processamento do estímulo repetido, influenciando o tempo de decisão e a precisão no reconhecimento do estímulo⁽²⁰20 Grill-Spector K, Henson R, Martin A. Repetition and the brain: neural models of stimulus-specific effects. Trends Cogn Sci. 2006;10(1):14-23. http://dx.doi.org/10.1016/j.tics.2005.11.006. PMid:16321563.
http://dx.doi.org/10.1016/j.tics.2005.11... ⁾. Assim, repetir estímulos âncoras ao longo da tarefa de avaliação de vozes, pode contribuir para que os ouvintes reconheçam os tipos de desvios vocais com maior agilidade e acurácia.

Considerando a importância de se buscar estratégias para a realização do treinamento perceptivo-auditivo de avaliadores pouco experientes, esta pesquisa teve como objetivos verificar o efeito da repetição de estímulos âncoras na análise perceptivo-auditiva do desvio vocal predominante realizada por estudantes de fonoaudiologia; analisar a relação entre o número de dimensões vocais dos estímulos sonoros e a acurácia; e investigar a relação entre o desvio vocal predominante e a acurácia. Como hipóteses, a repetição de estímulos âncoras aumenta a acurácia das classificações e a confiabilidade intra e interavaliadores; a natureza das amostras vocais, como o número de dimensões vocais nos estímulos sonoros e o tipo de desvio vocal predominante influenciam a acurácia das classificações.

MÉTODO

Formação dos grupos

Participaram deste estudo 56 estudantes de graduação do curso de fonoaudiologia. Os estudantes foram alocados em dois grupos: Grupo Sem Repetição de estímulos âncoras – GSR composto por 28 alunos e Grupo Com Repetição – GCR composto por 28 alunos. Estudo prospectivo, quasi-experimental, aprovado pelo Comitê de Ética em Pesquisa da Universidade Cruzeiro do Sul, sob o parecer nº 2.994.785 e todos os participantes assinaram o Termo de Consentimento Livre e Esclarecido. Os critérios de inclusão foram: ser estudante de fonoaudiologia e ainda não ter participado de atividades práticas no ambulatório de voz clínica. Os critérios de exclusão foram: presença de queixa auditiva autorreferida, não ter preenchido adequadamente o protocolo de análise perceptivo-auditiva.

Análise perceptivo-auditiva das vozes realizada pelos alunos

A APA foi realizada na sala de aula dos estudantes. Os estímulos sonoros foram apresentados com a utilização de uma caixa de som, marca JBL, modelo Flip 5 portátil, posicionada na frente da sala de aula, em intensidade confortável e em ambiente silencioso. Antes de iniciar a sessão de escuta, os alunos assinalaram, no protocolo impresso, se tinham queixa auditiva.

Os participantes foram orientados a marcar no protocolo o desvio vocal predominante de cada um dos estímulos sonoros apresentados. O GCR escutou os três estímulos âncoras no início da tarefa e a cada 20 vozes. O GSR escutou os mesmos estímulos âncoras apenas no início da tarefa.

Os participantes foram instruídos a manter a atenção durante o período de escuta e a marcar no protocolo de avaliação o desvio vocal predominante, sendo “R” para voz rugosa, “S” para voz soprosa, “T” para voz tensa e “X” quando os participantes não detectavam predomínio vocal. Além disso, os alunos foram orientados a marcar no protocolo de avaliação o número da voz em que começaram a perceber fadiga auditiva. Sem intervalos, a duração da APA do GCR e do GSR foi de 1h e 10 minutos e de 42 minutos, respectivamente.

Amostra vocal

A amostra vocal foi composta por 200 vozes humanas disfônicas selecionadas de um banco de vozes. A tarefa de fala utilizada para a análise foi a emissão da vogal sustentada /ε/ em frequência e intensidade confortáveis, autosselecionadas. Para análise da confiabilidade intra-avaliadores, foram adicionadas 20 vozes repetidas ao fim da amostra, escolhidas aleatoriamente. Sendo assim, a amostra total foi composta por 220 estímulos sonoros.

Estímulos âncoras

Os estímulos âncoras selecionados foram extraídos de um banco de vozes e consistiram de três vozes humanas desviadas de grau moderado para melhor evidenciar o predomínio vocal. Foram selecionadas uma voz predominantemente rugosa, uma soprosa e uma tensa. Três avaliadoras especialistas em voz com mais de 10 anos de experiência em APA selecionaram os estímulos âncoras.

Análises de referência

Duas análises de referência foram desenvolvidas para esse estudo: uma para servir de base para avaliação da acurácia dos alunos quanto à classificação do predomínio do desvio vocal; e outra para identificação do número de dimensões vocais nos estímulos sonoros.

Para a análise de referência do desvio vocal predominante, três avaliadoras experientes realizaram a análise perceptivo-auditiva das 200 vozes, numa mesma sessão de escuta, em ambiente silencioso e com a utilização de caixa acústica externa para amplificação do som. A classificação das vozes foi realizada a partir do consenso de pelo menos duas avaliadoras. A partir dessa classificação, 74 vozes foram consideradas predominantemente rugosas, 67 soprosas e 59 tensas.

Para a análise do número de dimensões vocais, uma avaliadora experiente classificou os estímulos sonoros em vozes unidimensionais, bidimensionais ou multidimensionais. As vozes unidimensionais tinham como característica a presença de um desvio vocal, podendo ser rugosa, soprosa ou tensa. As vozes bidimensionais continham a associação de dois desvios, como rugosidade e soprosidade, rugosidade e tensão ou soprosidade e tensão. As vozes multidimensionais podiam conter a associação de mais de dois desvios vocais, inclusive de instabilidade. A amostra vocal não contém vozes com predomínio de instabilidade. A partir dessa classificação, 34 vozes foram avaliadas como unidimensionais, 131 como bidimensionais e 35 como multidimensionais. A Figura 1 mostra um diagrama da APA realizada pelas fonoaudiólogas experientes e pelos alunos de graduação.

Figura 1
Diagrama das análises perceptivo-auditivas realizadas por fonoaudiólogos experientes e por alunos de graduação

Relação entre o desvio vocal predominante e a acurácia

Os 200 estímulos sonoros foram distribuídos em dois grupos: Acurácia ≥ 75%: estímulos sonoros que tiveram ocorrência de acertos entre os participantes maior ou igual a 75%; Acurácia < 75%: estímulos sonoros que tiveram ocorrência de acertos entre os participantes menor que 75%. Optamos por utilizar o limite de separação de 75% por representar uma porcentagem de acurácia satisfatória. Sendo assim, após esta distribuição, apuramos qual dimensão vocal – soprosa, tensa ou rugosa – foi mais constante em cada um dos grupos.

Análise estatística

Os dados foram analisados estatisticamente, sendo utilizado o teste Shapiro-wilk para verificação do cumprimento do pressuposto de normalidade, de modo a auxiliar na decisão da escolha do teste para comparação das variáveis (teste paramétrico ou não paramétrico). As variáveis foram então analisadas tanto por testes paramétricos quanto por não paramétricos, de acordo com as características das variáveis.

Para a análise das variáveis deste estudo, foram utilizados os seguintes testes: t de Student para as amostras independentes, U de Mann – Whitney, Correlação de Spearman para testes não paramétricos, coeficiente Kappa, Exato de Fisher, ANOVA de Friedman, análise post hoc realizada com o teste de postos sinalizados de Wilcoxon com correção de Bonferroni e regressão linear múltipla.

O valor de significância estatística adotado foi igual a 5% (p ≤ 0,05). Utilizou-se o software SPSS Statistics, versão 25.9 (IBM Corp., Armonk NY, EUA). Para o cálculo dos intervalos de confiança de 95%, foi utilizado o método de viés corrigido e acelerado com base em 2000 amostra bootstrap.

RESULTADOS

Dos 56 alunos, 2 foram excluídos da pesquisa: um pela marcação incompleta no protocolo de avaliação e o outro, por referir queixa auditiva. Dessa forma, o GSR foi composto por 26 alunos e o GCR por 28, totalizando 54 indivíduos. O parâmetro de análise foi o desvio vocal predominante.

Acurácia na análise do desvio vocal predominante

A comparação da análise do desvio vocal predominante dos estudantes com a da análise de referência, realizada pelas três avaliadoras experientes, mostrou que o GSR e o GCR tiveram desempenhos semelhantes, com porcentagem média de acurácia de 54,65% e 52,29% e desvio padrão de 6,04 e 5,47, respectivamente. O GSR teve como valor mínimo de acertos 43,67% dos estímulos sonoros e o máximo de acertos de 65%. O GCR teve como valor mínimo de acertos 38,18% dos estímulos sonoros e o máximo de 63,64%. Para esta análise, o Tamanho de Efeito foi de 0,391^d e o valor de p = 0,137 ^a. Para comparar os grupos em relação a estas variáveis, foram utilizados os testes t de Student (paramétrico) para amostras independentes e teste U de Mann-Whitney (não-paramétrico). O tamanho do efeito da diferença entre os grupos foi medido por meio do cálculo do coeficiente r ou d.

Confiabilidade intra-avaliadores

A concordância intra-avaliadores foi verificada por meio da repetição de 10% da amostra e da aplicação do coeficiente Kappa. O GCR apresentou confiabilidade intra-avaliadores significantemente maior que o GSR, média de 0,431 (concordância mínima) e 0,359 (concordância fraca), respectivamente, p < 0,050.

Confiabilidade interavaliadores

Houve diferença significante na confiabilidade interavaliadores, sendo maior no GCR do que no GSR, média de 0,276 e 0,247, respectivamente, p < 0,001. Para essa análise, utilizou-se o coeficiente kappa. Os dois grupos apresentaram concordância mínima.

Correlação entre número de dimensões vocais e acurácia da análise

Os resultados da Tabela 1 mostram que a acurácia da análise dos alunos diferiu significantemente quanto ao número de dimensões vocais contido nos estímulos sonoros, em ambos os grupos e na amostra total, p < 0,001. A amostra de vozes contou com 17% de vozes com uma dimensão, 65,5% de vozes com duas dimensões e 17,5% de vozes com três dimensões.

Thumbnail

Tabela 1
Valores descritivos e análise comparativa do desempenho na tarefa de identificação do desvio vocal predominante, de acordo com o número de dimensões vocais (1 - unidimensional, 2 – bidimensional, 3 – mais de duas dimensões) para o GSR, GCR e amostra total

O GCR apresentou maior porcentagem de acertos na classificação de vozes com uma dimensão alterada em relação a vozes com duas dimensões alteradas ou três dimensões alteradas. A porcentagem de acertos para vozes com duas dimensões alteradas apresentou diferença significante em comparação à de três dimensões alteradas, com maior porcentagem de acertos para as vozes com duas dimensões alteradas. A análise post hoc, realizada com o teste de postos sinalizados de Wilcoxon com correção de Bonferroni, foi utilizada nestas análises.

Para vozes com uma dimensão alterada, os estudantes do GSR apresentaram diferença significante na porcentagem de acertos em relação a vozes com duas e três dimensões alteradas, sendo que as vozes com uma dimensão alterada tiveram maior porcentagem de acertos. A porcentagem de acertos nas vozes com duas e três dimensões alteradas foi semelhante.

Para a amostra total, a análise post hoc, realizada com o teste de Bonferroni, mostrou que, ao classificar vozes com uma dimensão alterada, houve diferença significante na porcentagem de acertos em relação à condição de duas ou três dimensões alteradas, com maior porcentagem de acertos para vozes com uma dimensão alterada. Além disso, houve maior porcentagem de acertos para a condição de duas dimensões alteradas do que com três dimensões. Sendo assim, quanto maior o número de dimensões vocais no estímulo sonoro, menor a acurácia dos participantes. A Figura 2 apresenta a média de acertos para a tarefa de identificação de vozes de acordo com o número de dimensões alteradas e o grupo.

Figura 2
Média de acertos para a tarefa de identificação de vozes de acordo com o número de dimensões alteradas e o grupo

Número de dimensões vocais: análises de regressão linear múltiplas

Os modelos de regressão linear múltipla foram elaborados para verificação da capacidade preditora do número de dimensões vocais em relação ao desempenho na tarefa de identificação do desvio vocal predominante, para cada grupo e amostra total. Nestes modelos, a porcentagem de acertos para cada estímulo sonoro foi considerada variável dependente e o número de dimensões alteradas como variável independente. O tipo de dimensão na voz - rugosa, soprosa ou tensa - foi inserida como primeiro passo nos modelos, de modo a controlar seu efeito. A variável independente, ou seja, o número de dimensões vocais alteradas, foi inserida no segundo passo.

Os resultados mostraram melhora significativa no modelo de regressão linear em relação à capacidade preditora do desempenho na tarefa de identificação do desvio vocal predominante após a inserção do número de dimensões alteradas, ordem indireta. A variância do número de dimensões alteradas foi capaz de explicar 12%, 16,1% e 16% da variância observada no GSR, GCR e amostra total, respectivamente, no desempenho da tarefa de classificação do desvio predominante. A variável número de dimensões vocais contribuiu de forma significante para os modelos, p < 0,001, sendo que o coeficiente não-padronizado b sugeriu que, controlando as demais variáveis do modelo, o aumento de uma dimensão alterada leva à redução de 13,13% de acertos no GSR, 15,51% de acertos no GCR e 14,36% de acertos na amostra total do estudo. Sendo assim, o número de dimensões vocais foi um preditor significativo no desempenho da tarefa de identificação dos desvios vocais predominantes, para ambos os grupos e para amostra total, Tabela 2.

Thumbnail

Tabela 2
Modelo de regressão linear múltipla do número de dimensões alteradas como preditora do desempenho na tarefa de identificação de vozes para o GSR, GCR e para amostra total

Relação entre o desvio vocal predominante e a acurácia da análise

A comparação da análise do GCR e do GSR com a de referência mostrou que houve diferença significante entre os grupos na acurácia das vozes tensas. O GSR apresentou maior acurácia na classificação de vozes tensas do que o GCR, p<0,001. Nos demais desvios vocais, os grupos tiveram desempenhos semelhantes, Tabela 3.

Thumbnail

Tabela 3
Valores descritivos e análise comparativa dos grupos em relação às porcentagens de acertos e de respostas sem predomínio na tarefa de classificação do desvio vocal predominante

A análise post hoc, realizada com o teste de Bonferroni, revelou que ao considerar todas as vozes avaliadas pelos estudantes, a repetição de estímulos âncoras não se associou a uma maior ou menor acurácia, não demonstrando efeito significante do grupo, p = 0,072, r = 0,247. Entretanto, para o desvio vocal predominante, houve efeito significante, p < 0,001, r = 0,600. Observou-se diferença entre “tensão” e “rugosidade”, p < 0,001, e entre “tensão” e “soprosidade”, p < 0,001, sendo que a tensão teve a menor acurácia. Não houve diferença entre “rugosidade” e “soprosidade”, p = 0,743. Portanto, considerando os dois grupos, vozes predominantemente tensas apresentaram menor acurácia em comparação às vozes com predomínio de rugosidade ou de soprosidade, que foram semelhantes entre si. A acurácia da análise relacionada ao tipo de dimensão vocal diferiu de acordo com o grupo, com interação estatisticamente significante, p = 0,003, r = 0,323.

Para verificação da ocorrência de alta ou baixa acurácia para as vozes soprosas, rugosas ou tensas, os estímulos sonoros foram organizados em dois grupos: ocorrência de acertos ≥ a 75% e < 75%. Ao relacionar a taxa de acertos com a amostra total de vozes, os resultados apontaram que as proporções de vozes soprosas, rugosas e tensas foram semelhantes nos grupos de ocorrência de acertos maior ou igual 75% e menor que 75%, tanto para GSR, quanto para GCR. No entanto, ao considerarmos a amostra total do estudo, observou-se que a voz soprosa predominou na distribuição de vozes com acurácia ≥ 75%, Tabela 4.

Thumbnail

Tabela 4
Comparação dos tipos de vozes em relação à acurácia para cada grupo e para a amostra total

Relação entre a acurácia e a fadiga autorreferida pelos participantes

Foi realizada a análise de variância univariada (ANOVA) de efeitos mistos para comparar o efeito da fadiga autorreferida pelos estudantes com a acurácia de suas respostas. Para esta análise, foram considerados apenas 23 participantes do GSR e 21 participantes do GCR, pois alguns participantes destes grupos não marcaram cansaço durante a tarefa de classificação de vozes. A porcentagem média da acurácia no momento pré-fadiga para o GSR foi de 55,77% e para o GCR foi de 55,18%. Já no momento pós- fadiga, o GSR apresentou uma porcentagem média 53,91% e o GCR de 52,65%. O tamanho do efeito dos fatores foi medido por meio do cálculo do coeficiente r, calculado a partir da conversão da estatística F proposta por Field. Não foram observadas interações estatisticamente significantes entre os fatores “Grupo” e “Momento Fadiga” para a porcentagem de acertos, p = 0,788.

Sendo assim, a diferença entre os participantes dos grupos com e sem repetição de âncoras, em relação à acurácia na tarefa de classificação de vozes, não foi acentuada pela fadiga autorreferida, tornando os momentos pré e pós-fadiga semelhantes entre si.

DISCUSSÃO

A avaliação perceptivo-auditiva da voz tem grande valor clínico e por isso é amplamente utilizada na rotina de atendimento⁽⁵5 Iwarsson J, Reinholt Petersen N. Effects of consensus training on the reliability of auditory perceptual ratings of voice quality. J Voice. 2012;26(3):304-12. http://dx.doi.org/10.1016/j.jvoice.2011.06.003. PMid:21840170.
http://dx.doi.org/10.1016/j.jvoice.2011.... ⁾. Entretanto, por ser uma análise subjetiva, pode ser susceptível a erros sistemáticos e aleatórios⁽¹²12 Sauder C, Eadie T. Does the accuracy of medical diagnoses affect novice listeners’ auditory-perceptual judgments of dysphonia severity? J Voice. 2020;34(2):197-207. http://dx.doi.org/10.1016/j.jvoice.2018.08.001. PMid:30195410.
http://dx.doi.org/10.1016/j.jvoice.2018.... ⁾. Erros sistemáticos na APA são mais passíveis de controle, mas torna-se necessário conhecer suas fontes de erros. Um dos fatores que influenciam a APA é o treinamento perceptivo-auditivo dos juízes. Avaliadores inexperientes necessitam de pelo menos 8 horas de treinamento para obter confiabilidade aceitável⁽²¹21 Bassich CJ, Ludlow CL. The use of perceptual methods by new clinicians for assessing voice quality. J Speech Hear Disord. 1986;51(2):125-33. http://dx.doi.org/10.1044/jshd.5102.125. PMid:3702360.
http://dx.doi.org/10.1044/jshd.5102.125... ⁾. O treinamento perceptivo, seja com vozes humanas ou sintetizadas, torna possível a criação de referências internas dos estímulos sonoros. Outro importante fator de interferência na APA é o uso de estímulos âncoras, que possibilita a calibração da percepção auditiva dos avaliadores.

A tarefa de fala escolhida também influencia a APA. No presente estudo, a tarefa de fala utilizada foi a emissão sustentada da vogal /ε/ em frequência e intensidade habituais. A tarefa de vogal sustentada é frequentemente utilizada na prática clínica e em pesquisas científicas por oferecer informações sobre as características vocais com foco na fonte glótica, sem interferências dos aspectos articulatórios e de prosódia⁽⁷7 Barsties B, De Bodt M. Assessment of voice quality: current State-of-the-art. Auris Nasus Larynx. 2015;42(3):183-8. http://dx.doi.org/10.1016/j.anl.2014.11.001. PMid:25440411.
http://dx.doi.org/10.1016/j.anl.2014.11.... ⁾. Desvios vocais como rugosidade e soprosidade são produzidos pela laringe, que funciona como transdutor da energia aerodinâmica, originada pelo fluxo de ar vindo dos pulmões, em energia acústica⁽²²22 Genihú PFL, Gama ACC. Medidas acústicas e aerodinâmicas em cantores: comparação entre homens e mulheres. 2018;30(5):e20170240. https://doi.org/10.1590/2317-1782/20182017240.
https://doi.org/10.1590/2317-1782/201820... ⁾. A tensão pode ser produzida na laringe e ao longo do trato vocal. Dessa forma, o uso de vogal sustentada no treinamento perceptivo-auditivo de vozes torna-se uma tarefa importante na identificação dos desvios vocais predominantes.

Os parâmetros internos dos avaliadores inexperientes são relativamente estáveis para julgar vozes normais ou próximas da normalidade. Isto se deve ao contato e experiência com vozes normais, que servem de base para seus julgamentos perceptivos⁽²2 Kreiman J, Gerratt BR, Kempster GB, Erman A, Berke GS. Perceptual evaluation of voice quality: review, tutorial, and a framework for future research. J Speech Hear Res. 1993;36(1):21-40. PMid:8450660.⁾. Para que treinamentos perceptivo-auditivos possam ser planejados de modo mais eficiente, é fundamental que a percepção auditiva de base dos alunos em formação seja conhecida. Os participantes de ambos os grupos tiveram desempenhos semelhantes na acurácia da análise do desvio vocal predominante, sendo de 54,65% no GSR e de 52,29% no GCR. De certa forma, a acurácia baixa já era esperada, uma vez que os participantes eram alunos de graduação, ainda com pouca experiência na avaliação de vozes disfônicas. Numa pesquisa realizada com fonoaudiólogos de um curso de especialização em voz, o valor médio da acurácia de acerto na classificação de vozes predominantes foi de 72%⁽²³23 Pacheco LRA, Madazio G, Yamasaki R, Behlau M, Gielow I. Simulation of auditory abilities and intra-rater reliability in auditory perceptual assessment of voices. Filadelfia, Estados Unidos: The Voice Foundation; 2019. Poster apresentado na The Voice Foundation.⁾.

A repetição de estímulos âncoras ao longo da avaliação perceptiva não aumentou a acurácia da análise dos alunos do GCR, sendo esse resultado contrário à hipótese inicial do estudo. Repetir um estímulo coopera para que cérebro reconheça os padrões de forma mais rápida e contribui para o refinamento da percepção das características do estímulo apresentado⁽²⁰20 Grill-Spector K, Henson R, Martin A. Repetition and the brain: neural models of stimulus-specific effects. Trends Cogn Sci. 2006;10(1):14-23. http://dx.doi.org/10.1016/j.tics.2005.11.006. PMid:16321563.
http://dx.doi.org/10.1016/j.tics.2005.11... ⁾. Embora a acurácia não tenha aumentado, a estratégia de repetir os âncoras resultou em maior confiabilidade intra e interavaliadores no GCR, mas ainda com concordâncias baixas. Esta diferença entre os grupos sugere que o GCR pôde fazer ajustes em seus padrões internos⁽¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ^,²⁴24 Awan SN, Lawson LL. The effect of anchor modality on the reliability of vocal severity ratings. J Voice. 2009;23(3):341-52. http://dx.doi.org/10.1016/j.jvoice.2007.10.006. PMid:18346869.
http://dx.doi.org/10.1016/j.jvoice.2007.... ^,²⁵25 Chan KMK, Yiu EM-L. The effect of anchors and training on the reliability of perceptual voice evaluation. J Speech Lang Hear Res. 2002;45(1):111-26. http://dx.doi.org/10.1044/1092-4388(2002/009). PMid:14748643.
http://dx.doi.org/10.1044/1092-4388(2002... ⁾.

Julgar a qualidade vocal de um estímulo sonoro da mesma forma em momentos diferentes configura concordância perceptivo-auditiva. A concordância é um desafio até mesmo entre juízes experientes, pois é influenciada por diversos fatores⁽⁶6 Brinca L, Batista AP, Tavares AI, Pinto PN, Araújo L. The effect of anchors and training on the reliability of voice quality ratings for different types of speech stimuli. J Voice. 2015;29(6):776.e7-14. http://dx.doi.org/10.1016/j.jvoice.2015.01.007.
http://dx.doi.org/10.1016/j.jvoice.2015.... ^,¹⁸18 Gerratt BR, Kreiman J, Antonanzas-Barroso N, Berke GS. Comparing internal and external standards in voice quality judgments. J Speech Hear Res. 1993;36(1):14-20. http://dx.doi.org/10.1044/jshr.3601.14. PMid:8450655.
http://dx.doi.org/10.1044/jshr.3601.14... ⁾. Como visto neste estudo, o uso de referências auditivas pôde contribuir de forma discreta para o aumento da concordância entre os participantes. De acordo com a literatura⁽¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ^,²⁴24 Awan SN, Lawson LL. The effect of anchor modality on the reliability of vocal severity ratings. J Voice. 2009;23(3):341-52. http://dx.doi.org/10.1016/j.jvoice.2007.10.006. PMid:18346869.
http://dx.doi.org/10.1016/j.jvoice.2007.... ^,²⁶26 Santos PCM, Vieira MN, Sansão JPH, Gama ACC. Effect of auditory-perceptual training with natural voice anchors on vocal quality evaluation. J Voice. 2019;33(2):220-5. PMid:29331406.^,²⁷27 Gurlekian JA, Torres HM, Vaccari ME. Comparison of two perceptual methods for the evaluation of vowel perturbation produced by jitter. J Voice. 2016;30(4):506.e1-8. http://dx.doi.org/10.1016/j.jvoice.2015.05.009. PMid:26106070.
http://dx.doi.org/10.1016/j.jvoice.2015.... ⁾, o treinamento perceptivo-auditivo com âncoras em ouvintes inexperientes na classificação de vozes desviadas é eficaz no aumento da acurácia das classificações e que ouvintes sem experiência podem apresentar o mesmo grau de concordância intra e interavaliadores que o ouvintes experientes após o treino. Dessa forma, o uso de estímulos âncoras tem mostrado grande potencial na redução da variabilidade das classificações das vozes e no aumento da concordância intra e inter-avaliador de ouvintes inexperientes, compactuando com o pressuposto inicialmente. O aumento da confiabilidade aponta que os participantes puderam se ajustar às referências externas, consolidando e ajustando seus padrões internos⁽²⁵25 Chan KMK, Yiu EM-L. The effect of anchors and training on the reliability of perceptual voice evaluation. J Speech Lang Hear Res. 2002;45(1):111-26. http://dx.doi.org/10.1044/1092-4388(2002/009). PMid:14748643.
http://dx.doi.org/10.1044/1092-4388(2002... ⁾. Contudo, ainda que o GCR tenha apresentado maior confiabilidade que o GSR, a concordância foi mínima. Isto sugere a necessidade de treinamentos perceptivo-auditivos constantes ao longo da formação dos alunos de graduação.

Com relação à confiabilidade interavaliadores, avaliadores inexperientes apresentaram melhora na confiabilidade com apenas duas horas de treinamento com estímulos âncoras de diferentes tipos de desvios vocais⁽¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ⁾. Quando inseridas no contexto de avaliação e classificação de vozes, os estímulos âncoras diminuem ou até mesmo eliminam a dependência dos variados padrões internos, atenuando interferências e aumentando a concordância entre os avaliadores experientes e inexperientes⁽¹⁸18 Gerratt BR, Kreiman J, Antonanzas-Barroso N, Berke GS. Comparing internal and external standards in voice quality judgments. J Speech Hear Res. 1993;36(1):14-20. http://dx.doi.org/10.1044/jshr.3601.14. PMid:8450655.
http://dx.doi.org/10.1044/jshr.3601.14... ^,²⁴24 Awan SN, Lawson LL. The effect of anchor modality on the reliability of vocal severity ratings. J Voice. 2009;23(3):341-52. http://dx.doi.org/10.1016/j.jvoice.2007.10.006. PMid:18346869.
http://dx.doi.org/10.1016/j.jvoice.2007.... ⁾. Neste estudo, a concordância interavaliadores foi mínima em ambos os grupos, menor que a confiabilidade intra-avaliadores, mas significantemente maior no GCR. Dessa forma, o uso de estímulos âncoras para calibração da percepção auditiva dos alunos pode ser um recurso positivo na avaliação de vozes desviadas.

Vozes humanas desviadas podem conter um único tipo de desvio vocal, como as vozes soprosas de alguns casos de paralisias de prega vocal, ou um sinal mais complexo, com duas ou mais dimensões vocais associadas. A avaliação de estímulos sonoros mais complexos exige do ouvinte maior refinamento perceptivo-auditivo, o que dificulta a identificação do desvio vocal predominante⁽¹1 Oates J. Auditory-perceptual evaluation of disordered voice quality. Folia Phoniatr Logopp. 2009;61(1):49-56. http://dx.doi.org/10.1159/000200768. PMid:19204393.
http://dx.doi.org/10.1159/000200768... ^,¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ⁾. Nessa pesquisa, o aumento do número de dimensões vocais contido nos estímulos sonoros, associou-se a uma diminuição na acurácia dos avaliadores, Tabela 1 e Figura 2, achados estes, que acordam com nossa hipótese inicial.

Sabendo que há fatores que podem interferir na classificação de vozes disfônicas⁽¹²12 Sauder C, Eadie T. Does the accuracy of medical diagnoses affect novice listeners’ auditory-perceptual judgments of dysphonia severity? J Voice. 2020;34(2):197-207. http://dx.doi.org/10.1016/j.jvoice.2018.08.001. PMid:30195410.
http://dx.doi.org/10.1016/j.jvoice.2018.... ⁾, o aumento do número de dimensões vocais nos estímulos sonoros foi um preditor significativo na classificação do desvio vocal predominante. Embora os valores tenham sido de 16,1% no GCR e de 12% no GSR, o número de dimensões vocais contidos nos estímulos respondeu por parte dos possíveis erros sistemáticos da APA, Tabela 2. Assim, o controle do número de dimensões vocais contido nos estímulos sonoros deve ser considerado no planejamento do treinamento auditivo de ouvintes inexperientes, iniciando-se com estímulos mais simples e evoluindo com estímulos mais complexos⁽¹1 Oates J. Auditory-perceptual evaluation of disordered voice quality. Folia Phoniatr Logopp. 2009;61(1):49-56. http://dx.doi.org/10.1159/000200768. PMid:19204393.
http://dx.doi.org/10.1159/000200768... ⁾.

Apesar da acurácia dos GSR e GCR ter sido semelhante na classificação das vozes soprosas e rugosas, o GSR apresentou maior porcentagem de acertos de vozes tensas quando comparado ao GCR, Tabela 3, mesmo sem âncoras auditivas repetidas ao longo da sessão de escuta. Dessa forma, a repetição de âncoras não contribuiu para a melhora da referência interna do parâmetro tensão, visto que o GCR não se destacou nesta análise quando comparado ao GSR⁽⁶6 Brinca L, Batista AP, Tavares AI, Pinto PN, Araújo L. The effect of anchors and training on the reliability of voice quality ratings for different types of speech stimuli. J Voice. 2015;29(6):776.e7-14. http://dx.doi.org/10.1016/j.jvoice.2015.01.007.
http://dx.doi.org/10.1016/j.jvoice.2015.... ^,¹¹11 Webb AL, Carding PN, Deary IJ, MacKenzie K, Steen N, Wilson JA. The reliability of three perceptual evaluation scales for dysphonia. Eur Arch Otorhinolaryngol. 2004;261(8):429-34. PMid:14615893.^,¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ⁾. De acordo com a literatura, o parâmetro tensão apresenta maior dificuldade de análise e menor confiabilidade⁽¹1 Oates J. Auditory-perceptual evaluation of disordered voice quality. Folia Phoniatr Logopp. 2009;61(1):49-56. http://dx.doi.org/10.1159/000200768. PMid:19204393.
http://dx.doi.org/10.1159/000200768... ^,¹²12 Sauder C, Eadie T. Does the accuracy of medical diagnoses affect novice listeners’ auditory-perceptual judgments of dysphonia severity? J Voice. 2020;34(2):197-207. http://dx.doi.org/10.1016/j.jvoice.2018.08.001. PMid:30195410.
http://dx.doi.org/10.1016/j.jvoice.2018.... ^,¹⁷17 Solomon NP, Helou LB, Stojadinovic A. Clinical versus laboratory of voice using the CAPE-V. J Voice. 2011;25(1):e7-14. http://dx.doi.org/10.1016/j.jvoice.2009.10.007. PMid:20430573.
http://dx.doi.org/10.1016/j.jvoice.2009.... ⁾.

Ouvintes podem ter maior sensibilidade a qualidades vocais específicas pelo fato de o estímulo ser mais facilmente reconhecido e identificado. A voz soprosa se destacou por ser o tipo de desvio vocal de maior acurácia, Tabela 4. Na análise da amostra total de participantes, observou-se maior acurácia na classificação das vozes soprosa e menor na de vozes tensas, como já era esperado. As qualidades vocais tensa e rugosa não tiveram alta taxa de acertos (≥ 75%) como a voz soprosa. De fato, as vozes desviadas podem ser instáveis e apresentar mais de um parâmetro qualitativo⁽¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ⁾ e determinadas dimensões vocais podem ser mais facilmente percebidas e mentalmente armazenadas do que outras.

O grau de experiência de avaliadores que classificam vozes pode interferir na APA, uma vez que indivíduos inexperientes não tiveram exposição a vozes desviadas e, portanto, não formaram padrões internos precisos quanto aos tipos de desvios vocais. A experiência implica em alocar os padrões internos de forma consistente ao longo da avaliação dos desvios vocais e discernir as dimensões em questão⁽¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ⁾.

A amostra de estímulos sonoros utilizada neste estudo foi extensa, 220 vozes. A duração da APA do GCR foi muito maior que a do GSR. Embora a fadiga possa reduzir o desempenho cognitivo após longos períodos de atividade que demande atenção⁽²⁸28 Ylikoski J, Lehtosalo J. Neurochemical basis of auditory fatigue: a new hypothesis. Acta Otolaryngol. 2009;99(3-4):353-62. http://dx.doi.org/10.3109/00016488509108923. PMid:2409739.
http://dx.doi.org/10.3109/00016488509108...

29 Jain S, Nataraja NP. The effect of fatigue on working memory and auditory perceptual abilities in trained musicians. Am J Audiol. 2019;28(2S):483-94. http://dx.doi.org/10.1044/2019_AJA-IND50-18-0102. PMid:31461329.
http://dx.doi.org/10.1044/2019_AJA-IND50... ^-³⁰30 Wang Y, Naylor G, Kramer SE, Zekveld AA, Wendt D, Ohlenforst B, et al. Relations between self-reported daily-life fatigue, hearing status, and pupil dilation during a speech perception in noise task. Ear Hear. 2018;39(3):573-82. http://dx.doi.org/10.1097/AUD.0000000000000512. PMid:29117062.
http://dx.doi.org/10.1097/AUD.0000000000... ⁾, neste estudo, a fadiga autorreferida pelos estudantes não interferiu diretamente nos valores de acurácia das classificações, tanto no momento inicial das classificações, quanto no momento final.

A fim de refinar a percepção auditiva, treinamentos auditivos graduais a partir dos primeiros anos letivos podem contribuir para que o grau de concordância e de acurácia entre graduandos aumentem⁽¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ^,²⁴24 Awan SN, Lawson LL. The effect of anchor modality on the reliability of vocal severity ratings. J Voice. 2009;23(3):341-52. http://dx.doi.org/10.1016/j.jvoice.2007.10.006. PMid:18346869.
http://dx.doi.org/10.1016/j.jvoice.2007.... ⁾. A partir dos resultados da pesquisa, pode-se sugerir que o treinamento perceptivo-auditivo de alunos da graduação utilize estímulos âncoras e que seja iniciado com estímulos sonoros mais simples, unidimensionais, evoluindo para os mais complexos; e com dimensões vocais mais concordantes, como a soprosidade e rugosidade, progredindo para dimensões menos concordantes, como a tensão.

Vozes desviadas frequentemente apresentam mais de um tipo de desvio vocal na APA, o que dificulta a avaliação principalmente por indivíduos inexperientes. Os estímulos âncoras têm se revelado uma ferramenta clínica útil no treinamento de ouvintes com dificuldade em manter a confiabilidade intra e intervaliadores na classificação de vozes⁽¹⁵15 Eadie T, Kapsner-Smith M. The effect of listener experience and anchors on judgments of dysphonia. J Speech Lang Hear Res. 2011;54(2):430-47. http://dx.doi.org/10.1044/1092-4388(2010/09-0205). PMid:20884782.
http://dx.doi.org/10.1044/1092-4388(2010... ^,¹⁶16 Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007. PMid:16324823.
http://dx.doi.org/10.1016/j.jvoice.2005.... ⁾. Entretanto, as características da amostra vocal também devem ser consideradas na elaboração do treinamento perceptivo-auditivo, como a complexidade dos estímulos sonoros e os tipos de desvios vocais.

CONCLUSÃO

A repetição de estímulos âncoras não aumentou a acurácia de classificação do desvio vocal predominante. Houve aumento da confiabilidade intra e interavaliadores no GCR, mas ainda se mostrou baixa. A complexidade dos estímulos sonoros interferiu na acurácia de ambos os grupos. Quanto mais simples o estímulo, maior a acurácia na identificação do desvio vocal predominante. O número de dimensões vocais foi um preditor na classificação do desvio. O tipo de desvio vocal também interferiu na acurácia, sendo que as vozes soprosas tiveram maior taxa de acertos.

Trabalho realizado no Centro de Estudos da Voz – CEV - São Paulo (SP), Brasil.
Fonte de financiamento: nada a declarar.

REFERÊNCIAS

¹
Oates J. Auditory-perceptual evaluation of disordered voice quality. Folia Phoniatr Logopp. 2009;61(1):49-56. http://dx.doi.org/10.1159/000200768 PMid:19204393.
» http://dx.doi.org/10.1159/000200768
²
Kreiman J, Gerratt BR, Kempster GB, Erman A, Berke GS. Perceptual evaluation of voice quality: review, tutorial, and a framework for future research. J Speech Hear Res. 1993;36(1):21-40. PMid:8450660.
³
Behlau M. The 2016 G. Paul Moore Lecture: Lessons in Voice Rehabilitation: Journal of Voice and Clinical Practice. J Voice. 2019;33(5):669-81. http://dx.doi.org/10.1016/j.jvoice.2018.02.020 PMid:29567050.
» http://dx.doi.org/10.1016/j.jvoice.2018.02.020
⁴
Duffy JR. Motor speech disorders: substrates, differential diagnosis and management. 4th ed. USA: Elsevier: 2020.
⁵
Iwarsson J, Reinholt Petersen N. Effects of consensus training on the reliability of auditory perceptual ratings of voice quality. J Voice. 2012;26(3):304-12. http://dx.doi.org/10.1016/j.jvoice.2011.06.003 PMid:21840170.
» http://dx.doi.org/10.1016/j.jvoice.2011.06.003
⁶
Brinca L, Batista AP, Tavares AI, Pinto PN, Araújo L. The effect of anchors and training on the reliability of voice quality ratings for different types of speech stimuli. J Voice. 2015;29(6):776.e7-14. http://dx.doi.org/10.1016/j.jvoice.2015.01.007
» http://dx.doi.org/10.1016/j.jvoice.2015.01.007
⁷
Barsties B, De Bodt M. Assessment of voice quality: current State-of-the-art. Auris Nasus Larynx. 2015;42(3):183-8. http://dx.doi.org/10.1016/j.anl.2014.11.001 PMid:25440411.
» http://dx.doi.org/10.1016/j.anl.2014.11.001
⁸
Ghio A, Dufour S, Wengler A, Pouchoulin G, Revis J, Giovanni A. Perceptual evaluation of dysphonic voices: can a training protocol lead to the development of perceptual categories? J Voice. 2015;29(3):304-11. http://dx.doi.org/10.1016/j.jvoice.2014.07.006 PMid:25516201.
» http://dx.doi.org/10.1016/j.jvoice.2014.07.006
⁹
Zraick RI, Kempster GB, Connor NP, Thibeault S, Klaben BK, Bursac Z, et al. Establishing validity of the consensus auditory-perceptual evaluation of voice (CAPE-V). Am J Speech Lang Pathol. 2011;20(1):14-22. http://dx.doi.org/10.1044/1058-0360(2010/09-0105) PMid:20739631.
» http://dx.doi.org/10.1044/1058-0360(2010/09-0105)
¹⁰
Kreiman J, Gerratt BR, Ito M. When and why listeners disagree in voice quality assesment tasks. J Acoust Soc Am. 2007;122(4):2354-64. http://dx.doi.org/10.1121/1.2770547 PMid:17902870.
» http://dx.doi.org/10.1121/1.2770547
¹¹
Webb AL, Carding PN, Deary IJ, MacKenzie K, Steen N, Wilson JA. The reliability of three perceptual evaluation scales for dysphonia. Eur Arch Otorhinolaryngol. 2004;261(8):429-34. PMid:14615893.
¹²
Sauder C, Eadie T. Does the accuracy of medical diagnoses affect novice listeners’ auditory-perceptual judgments of dysphonia severity? J Voice. 2020;34(2):197-207. http://dx.doi.org/10.1016/j.jvoice.2018.08.001 PMid:30195410.
» http://dx.doi.org/10.1016/j.jvoice.2018.08.001
¹³
Patel RR, Awan SN, Barkmeier-Kraemer J, Courey M, Deliyski D, Eadie T, et al. Recommended protocols for instrumental assessment of voice: american speech-language-hearing association expert panel to develop a protocol for instrumental assessment of vocal function. Am J Speech Lang Pathol. 2018;27(3):887-905. http://dx.doi.org/10.1044/2018_AJSLP-17-0009 PMid:29955816.
» http://dx.doi.org/10.1044/2018_AJSLP-17-0009
¹⁴
Anand S, Skowronski MD, Shrivastav R, Eddins DA. Perceptual and quantitative assessment of dysphonia across vowel categories. J Voice. 2017;33(4):473-81. http://dx.doi.org/10.1016/j.jvoice.2017.12.018
» http://dx.doi.org/10.1016/j.jvoice.2017.12.018
¹⁵
Eadie T, Kapsner-Smith M. The effect of listener experience and anchors on judgments of dysphonia. J Speech Lang Hear Res. 2011;54(2):430-47. http://dx.doi.org/10.1044/1092-4388(2010/09-0205) PMid:20884782.
» http://dx.doi.org/10.1044/1092-4388(2010/09-0205)
¹⁶
Eadie T, Baylor CR. The effect of perceptual training on inexperienced listeners’ judgments of dysphonic voice. J Voice. 2006;20(4):527-44. http://dx.doi.org/10.1016/j.jvoice.2005.08.007 PMid:16324823.
» http://dx.doi.org/10.1016/j.jvoice.2005.08.007
¹⁷
Solomon NP, Helou LB, Stojadinovic A. Clinical versus laboratory of voice using the CAPE-V. J Voice. 2011;25(1):e7-14. http://dx.doi.org/10.1016/j.jvoice.2009.10.007 PMid:20430573.
» http://dx.doi.org/10.1016/j.jvoice.2009.10.007
¹⁸
Gerratt BR, Kreiman J, Antonanzas-Barroso N, Berke GS. Comparing internal and external standards in voice quality judgments. J Speech Hear Res. 1993;36(1):14-20. http://dx.doi.org/10.1044/jshr.3601.14 PMid:8450655.
» http://dx.doi.org/10.1044/jshr.3601.14
¹⁹
Pontes PAL, Vieira VP, Gonçalves MIR, Pontes AAL. Características de vozes roucas ásperas e normais: análise acústica espectrográfica comparativa. Rev Bras Otorronolaringol. 2002;68(2):182-8. http://dx.doi.org/10.1590/S0034-72992002000200005
» http://dx.doi.org/10.1590/S0034-72992002000200005
²⁰
Grill-Spector K, Henson R, Martin A. Repetition and the brain: neural models of stimulus-specific effects. Trends Cogn Sci. 2006;10(1):14-23. http://dx.doi.org/10.1016/j.tics.2005.11.006 PMid:16321563.
» http://dx.doi.org/10.1016/j.tics.2005.11.006
²¹
Bassich CJ, Ludlow CL. The use of perceptual methods by new clinicians for assessing voice quality. J Speech Hear Disord. 1986;51(2):125-33. http://dx.doi.org/10.1044/jshd.5102.125 PMid:3702360.
» http://dx.doi.org/10.1044/jshd.5102.125
²²
Genihú PFL, Gama ACC. Medidas acústicas e aerodinâmicas em cantores: comparação entre homens e mulheres. 2018;30(5):e20170240. https://doi.org/10.1590/2317-1782/20182017240
» https://doi.org/10.1590/2317-1782/20182017240
²³
Pacheco LRA, Madazio G, Yamasaki R, Behlau M, Gielow I. Simulation of auditory abilities and intra-rater reliability in auditory perceptual assessment of voices. Filadelfia, Estados Unidos: The Voice Foundation; 2019. Poster apresentado na The Voice Foundation.
²⁴
Awan SN, Lawson LL. The effect of anchor modality on the reliability of vocal severity ratings. J Voice. 2009;23(3):341-52. http://dx.doi.org/10.1016/j.jvoice.2007.10.006 PMid:18346869.
» http://dx.doi.org/10.1016/j.jvoice.2007.10.006
²⁵
Chan KMK, Yiu EM-L. The effect of anchors and training on the reliability of perceptual voice evaluation. J Speech Lang Hear Res. 2002;45(1):111-26. http://dx.doi.org/10.1044/1092-4388(2002/009) PMid:14748643.
» http://dx.doi.org/10.1044/1092-4388(2002/009)
²⁶
Santos PCM, Vieira MN, Sansão JPH, Gama ACC. Effect of auditory-perceptual training with natural voice anchors on vocal quality evaluation. J Voice. 2019;33(2):220-5. PMid:29331406.
²⁷
Gurlekian JA, Torres HM, Vaccari ME. Comparison of two perceptual methods for the evaluation of vowel perturbation produced by jitter. J Voice. 2016;30(4):506.e1-8. http://dx.doi.org/10.1016/j.jvoice.2015.05.009 PMid:26106070.
» http://dx.doi.org/10.1016/j.jvoice.2015.05.009
²⁸
Ylikoski J, Lehtosalo J. Neurochemical basis of auditory fatigue: a new hypothesis. Acta Otolaryngol. 2009;99(3-4):353-62. http://dx.doi.org/10.3109/00016488509108923 PMid:2409739.
» http://dx.doi.org/10.3109/00016488509108923
²⁹
Jain S, Nataraja NP. The effect of fatigue on working memory and auditory perceptual abilities in trained musicians. Am J Audiol. 2019;28(2S):483-94. http://dx.doi.org/10.1044/2019_AJA-IND50-18-0102 PMid:31461329.
» http://dx.doi.org/10.1044/2019_AJA-IND50-18-0102
³⁰
Wang Y, Naylor G, Kramer SE, Zekveld AA, Wendt D, Ohlenforst B, et al. Relations between self-reported daily-life fatigue, hearing status, and pupil dilation during a speech perception in noise task. Ear Hear. 2018;39(3):573-82. http://dx.doi.org/10.1097/AUD.0000000000000512 PMid:29117062.
» http://dx.doi.org/10.1097/AUD.0000000000000512

Datas de Publicação

Publicação nesta coleção
21 Jan 2022
Data do Fascículo
2022

Histórico

Recebido
25 Mar 2021
Aceito
20 Jul 2021

Este é um artigo publicado em acesso aberto (Open Access) sob a licença Creative Commons Attribution, que permite uso, distribuição e reprodução em qualquer meio, sem restrições desde que o trabalho original seja corretamente citado.

[1] Trabalho realizado no Centro de Estudos da Voz – CEV - São Paulo (SP), Brasil.

[2] Fonte de financiamento: nada a declarar.

Variável	Grupos	Número de Dimensões vocais	Média	DP	Mediana	Mín.	Máx.	Valor de p	Post-hoc	Valor de p	^r
Acurácia (%)	GSR	1	72,29	14,65	76,47	26,47	91,18	< 0,001a^* * valor estatisticamente significante p ≤ 0,05	1D x 2D	0,001	0,577
		2	50,70	6,46	49,62	37,40	64,89		1D x 3D	0,001	0,635
		3	48,46	9,61	51,43	31,43	65,71		2Dx 3D	0,999	0,058
	GCR	1	67,65	10,12	67,65	52,94	85,29	< 0,001^a*	1D x 2D	0,001	0,500
		2	49,54	6,25	50,00	35,88	61,83		1D x 3D	0,001	0,946
		3	41,94	7,93	42,86	28,57	54,29		2Dx 3D	0,003	0,446
	Total	1	69,88	12,61	73,53	26,47	91,18	< 0,001b*	1D x 2D	0,001	1,569
		2	50,10	6,32	49,62	35,88	64,89		1D x 3D	0,001	1,967
		3	45,0	9,30	45,71	28,57	65,71		2Dx 3D	0,001	0,795

Passo		b	β	Valor de p
Grupo Sem Repetição de Âncoras – GSR
1	Constante	58,28	--	< 0,001 ^* * valor estatisticamente significante p ≤ 0,05
	Tipo de alteração predominante	-2,23	-0,083	0,240
	Tipo de alteração predominante	-5,81, 1,34	-0,083	0,240
2	Constante	88,61	--	< 0,001*
	Tipo de alteração predominante	-4,31	-0,161	0,019*
	Tipo de alteração predominante	-7,49, -0,96	-0,161	0,019*
	Número de dimensões alteradas	-13,13	-0,355	< 0,001*
	Número de dimensões alteradas	-18,11, -8,03	-0,355	< 0,001*
Grupo Com Repetição de âncoras – GCR
1	Constante	63,72	--	< 0,001*
1	Constante	56,04, 71,18	--	< 0,001*
	Tipo de alteração predominante	-6,46	-0,209	0,003*
	Tipo de alteração predominante	-10,75, -1,91	-0,209	0,003*
2	Constante	99,56	--	< 0,001*
2	Constante	85,52, 113,32	--	< 0,001*
	Tipo de alteração predominante	-8,92	-0,289	< 0,001*
	Tipo de alteração predominante	-12,54, -4,72	-0,289	< 0,001*
	Número de dimensões alteradas	-15,51	-0,363	< 0,001*
	Número de dimensões alteradas	-21,33, -9,73	-0,363	< 0,001*
Amostra Total
1	Constante	61,10	--	< 0,001*
	Tipo de alteração predominante	-4,42	-0,164	0,020*
	Tipo de alteração predominante	-8,32, -0,67	-0,164	0,020*
2	Constante	94,28	--	< 0,001*
2	Constante	81,88, 105,73	--	< 0,001*
	Tipo de alteração predominante	-6,70	-0,249	< 0,001*
	Tipo de alteração predominante	-10,03, -3,34	-0,249	< 0,001*
	Número de dimensões alteradas	-14,36	-0,386	< 0,001*
	Número de dimensões alteradas	-19,14, -9,66	-0,386	< 0,001*

ACURÁCIA	Grupo	Média	DP	Mediana	Mín.	Máx.	Valor de p	T.E.
Voz Rugosa	GSR	55,86	9,32	54,88	41,46	71,95	0,992^a	0,003^d
Voz Rugosa	GCR	55,84	10,27	56,10	26,83	73,17	0,992^a	0,003^d
Voz Soprosa	GSR	57,13	10,04	59,34	32,00	70,67	0,556^a	0,148^d
Voz Soprosa	GCR	58,62	8,40	58,00	45,33	73,33	0,556^a	0,148^d
Voz Tensa	GSR	50,12	9,80	50,79	30,16	66,67	< 0,001^* * valor estatisticamente significante p ≤ 0,05 a	1,019d
Voz Tensa	GCR	40,14	9,04	39,68	25,40	55,56		1,019d
Sem predomínio	GSR	2,15	3,28	0,45	0,00	10,00	0,121b	0,220r
Sem predomínio	GCR	3,07	3,64	1,82	0,00	13,18	0,121b	0,220r

GRUPO	Desvio Vocal Predominante	Acurácia da Análise			Valor de p
		Alta	Baixa	Total
		Número (%)	Número (%)	Número (%)
GSR	R	12 (28,57)	62 (39,24)	74 (37,00)	0,311
	S	18 (42,86)	49 (31,01)	67 (33,50)
	T	12 (28,57)	47 (29,75)	59 (29,50)
GCR	R	11 (25,58)	63 (40,13)	74 (37,00)	0,053
	S	21 (48,84)	46 (29,30)	67 (33,50)
	T	11 (25,58)	48 (30,57)	59 (29,50)
Total	R	9 (25,71)a	65 (39,39)^a	74 (37,00)	0,023 ^* * valor estatisticamente significante p ≤ 0,05
	S	19 (54,29)b	48 (29,09)^a	67 (33,50)
	T	7 (20,00)^a	52 (31,52)^a	59 (29,50)

Brasil

Brasil

Repetição de estímulos âncoras e natureza das amostras vocais no julgamento perceptivo-auditivo realizado por estudantes de fonoaudiologia

Resumo

Objetivo

Método

Resultados

Conclusão

ABSTRACT

Purpose

Methods

Results

Conclusion

INTRODUÇÃO

MÉTODO

Formação dos grupos

Análise perceptivo-auditiva das vozes realizada pelos alunos

Amostra vocal

Estímulos âncoras

Análises de referência

Relação entre o desvio vocal predominante e a acurácia

Análise estatística

RESULTADOS

Acurácia na análise do desvio vocal predominante

Confiabilidade intra-avaliadores

Confiabilidade interavaliadores

Correlação entre número de dimensões vocais e acurácia da análise

Número de dimensões vocais: análises de regressão linear múltiplas

Relação entre o desvio vocal predominante e a acurácia da análise

Relação entre a acurácia e a fadiga autorreferida pelos participantes

DISCUSSÃO

CONCLUSÃO

REFERÊNCIAS

Datas de Publicação

Histórico