Acessibilidade / Reportar erro

VoxMore: artefato tecnológico para auxiliar a avaliação acústica da voz no processo ensino-aprendizagem e prática clínica

RESUMO

Objetivo

apresentar um artefato tecnológico, o plugin VoxMore, para auxiliar o ensino acadêmico da avaliação acústica da voz, bem como otimizar a intervenção fonoaudiológica na prática da clínica vocal.

Método

trata-se de um estudo metodológico de caráter multidisciplinar para o desenvolvimento de um artefato tecnológico, plugin, a ser utilizado no software Praat. Essa ferramenta realiza análise acústica vocal e gera um relatório, com informações e imagens referentes aos domínios do tempo, frequência, tempo-frequência, e quefrência, bem como valores de medidas acústicas relacionadas a frequência fundamental (f0), medidas de período, medidas de perturbação do período da f0, medidas de perturbação de amplitude da f0, medidas espectrais, medidas de ruído glotal e medidas cepstrais.

Resultados

no relatório acústico do VoxMore são gerados quatro arquivos com as seguintes informações: oscilogramas do sinal de voz e traçados da f0 e intensidade; imagens relacionadas ao domínio da frequência, espectro de Fourier e espectro de LPC, e ao domínio do tempo-frequência, espectrograma; informações sobre a análise cepstral e cepstrograma; valores de todas as medidas acústicas, no formato de resultados numéricos e em gráficos de barras verticais.

Conclusão

o VoxMore pode contribuir tanto com o processo de ensino-aprendizagem, atuando como ferramenta auxiliar com caráter formativo nas disciplinas de graduação e pós-graduação em Fonoaudiologia, quanto com o processo da prática clínica, tornando viável a utilização da análise acústica na clínica vocal e apoiando a tomada de decisão dos fonoaudiólogos.

Descritores:
Voz; Avaliação; Acústica; Ensino; Tecnologia

ABSTRACT

Purpose

to present a technological artifact, the VoxMore plugin, to assist the academic teaching of voice acoustic assessment, as well as to optimize the speech therapy intervention in the practice of vocal clinics.

Methods

this is a multidisciplinary methodological study for the development of a technological artifact, a plugin, to be used in the Praat software. This tool performs vocal acoustic analysis and generates a report, with information and images referring to the domains of time, frequency, time-frequency, and que-frequency, as well as values of acoustic measures related to fundamental frequency (f0), period measures, disturbance measures of the period of f0, f0 amplitude perturbation measurements, spectral measurements, glottal noise measurements and cepstral measurements.

Results

in the VoxMore acoustic report, four files are generated with the following information: oscillograms of the voice signal and traces of f0 and intensity; images related to the frequency domain, Fourier spectrum and LPC spectrum, and to the time-frequency domain, spectrogram; information on cepstral and cepstrogram analysis; the values of all acoustic measurements, in numerical results format and in vertical bar graphs.

Conclusion

VoxMore can contribute both to the teaching-learning process, acting as an auxiliary tool with a formative character in the undergraduate and graduate courses in Speech-Language Pathology, as well as to the clinical practice process, making the use of acoustic analysis in the vocal clinic feasible and supporting decision-making by speech-language pathologist.

Keywords:
Voice; Assessment; Acoustic; Teaching; Technology

INTRODUÇÃO

Avaliação, diagnóstico e monitoramento de distúrbios vocais devem envolver, preferencialmente, informações multidimensionais, como o exame visual laríngeo, julgamento perceptivo-auditivo, análise acústica, avaliação aerodinâmica e autoavaliação do paciente(11 Dejonckere PH, Bradley P, Clemente P, Cornut G, Crevier-Buchman L, Friedrich G, et al. A basic protocol for functional assessment of voice pathology, especially for investigating the efficacy of (phonosurgical) treatments and evaluating new assessment techniques. Eur Arch Otorhinolaryngol. 2001;258(2):77-82. http://dx.doi.org/10.1007/s004050000299. PMid:11307610.
http://dx.doi.org/10.1007/s004050000299...
).

No universo da avaliação multidimensional da voz, a análise acústica é uma ferramenta de apoio que auxilia caracterizar e quantificar de maneira mais objetiva o desvio da qualidade vocal(22 Barsties B, De Bodt M. Assessment of voice quality: current state-of-the-art. Auris Nasus Larynx. 2015;42(3):183-8. http://dx.doi.org/10.1016/j.anl.2014.11.001. PMid:25440411.
http://dx.doi.org/10.1016/j.anl.2014.11....
). No contexto clínico, a análise acústica está entre os principais métodos de avaliação e monitoramento dos distúrbios da voz(33 Boominathan P, Samuel J, Arunachalam R, Nagarajan R, Mahalingam S. Multi parametric voice assessment: Sri Ramachandra University Protocol. Indian J Otolaryngol Head Neck Surg. 2014;66(Supl 1):246-51. http://dx.doi.org/10.1007/s12070-011-0460-y. PMid:24533392.
http://dx.doi.org/10.1007/s12070-011-046...
). Essa análise envolve técnicas de processamento digital do sinal de voz, com possibilidade de caracterização e extração de medidas acústicas do sinal, seja no domínio do tempo, no domínio da frequência, no domínio do tempo-frequência, ou no domínio da quefrência(44 Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. A meta-analysis: acoustic measurement of roughness and breathiness. J Speech Lang Hear Res. 2018;61(2):298-323. http://dx.doi.org/10.1044/2017_JSLHR-S-16-0188. PMid:29392295.
http://dx.doi.org/10.1044/2017_JSLHR-S-1...
).

As medidas acústicas podem ser associadas ao julgamento perceptivo-auditivo da qualidade vocal(55 Omori K, Slavit DH, Kacker A, Blaugrund SM. Influence of size and etiology of glottal gap in glottic incompetence dysphonia. Laryngoscope. 1998;108(4):514-8. http://dx.doi.org/10.1097/00005537-199804000-00010. PMid:9546262.
http://dx.doi.org/10.1097/00005537-19980...
), aos dados do exame visual laríngeo(66 Roy N, Barkmeier-Kraemer J, Eadie T, Sivasankar MP, Mehta D, Paul D, et al. Evidence-based clinical voice assessment: a systematic review. Am J Speech Lang Pathol. 2013;22(2):212-26. http://dx.doi.org/10.1044/1058-0360(2012/12-0014). PMid:23184134.
http://dx.doi.org/10.1044/1058-0360(2012...
) e às medidas aerodinâmicas da produção vocal(11 Dejonckere PH, Bradley P, Clemente P, Cornut G, Crevier-Buchman L, Friedrich G, et al. A basic protocol for functional assessment of voice pathology, especially for investigating the efficacy of (phonosurgical) treatments and evaluating new assessment techniques. Eur Arch Otorhinolaryngol. 2001;258(2):77-82. http://dx.doi.org/10.1007/s004050000299. PMid:11307610.
http://dx.doi.org/10.1007/s004050000299...
). A integração desses dados, juntamente com a autoavaliação do paciente, permite ao clínico compreender de maneira sistêmica, e/ou específica, a manifestação de um distúrbio de voz(33 Boominathan P, Samuel J, Arunachalam R, Nagarajan R, Mahalingam S. Multi parametric voice assessment: Sri Ramachandra University Protocol. Indian J Otolaryngol Head Neck Surg. 2014;66(Supl 1):246-51. http://dx.doi.org/10.1007/s12070-011-0460-y. PMid:24533392.
http://dx.doi.org/10.1007/s12070-011-046...
).

No entanto, os estudantes de Fonoaudiologia muitas vezes não conseguem compreender a relevância da análise acústica aplicada à prática clínica(77 Finan DS. Speech science education-roll over Beethoven. Perspect Speech Sci Orofac Disord. 2008;18(1):22-30. http://dx.doi.org/10.1044/ssod18.1.22.
http://dx.doi.org/10.1044/ssod18.1.22...
). Além de não compreender a importância dessa análise, o conhecimento básico da análise acústica da voz muitas vezes não é mantido na transição entre a graduação e a pós-graduação(88 Tessel CA, Grover V. Graduate student retention of prerequisite course content. Teaching and Learning in Communication Sciences & Disorders. 2020;4(1):1-33. http://dx.doi.org/10.30707/TLCSD4.1/ULMQ3912.
http://dx.doi.org/10.30707/TLCSD4.1/ULMQ...
). A aplicação da análise acústica na prática clínica, durante a graduação, é um caminho para apoiar a avaliação perceptivo-auditiva, como também uma importante tarefa do treinamento clínico em avaliação vocal(33 Boominathan P, Samuel J, Arunachalam R, Nagarajan R, Mahalingam S. Multi parametric voice assessment: Sri Ramachandra University Protocol. Indian J Otolaryngol Head Neck Surg. 2014;66(Supl 1):246-51. http://dx.doi.org/10.1007/s12070-011-0460-y. PMid:24533392.
http://dx.doi.org/10.1007/s12070-011-046...
).

A avaliação acústica tem sido amplamente discutida na literatura(44 Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. A meta-analysis: acoustic measurement of roughness and breathiness. J Speech Lang Hear Res. 2018;61(2):298-323. http://dx.doi.org/10.1044/2017_JSLHR-S-16-0188. PMid:29392295.
http://dx.doi.org/10.1044/2017_JSLHR-S-1...
). Pesquisas referem índices compostos por medidas multiparamétricas que são considerados robustos, como Acoustic Vocal Quality Index (AVQI)(99 Maryn Y, De Bodt M, Roy N. The Acoustic Voice Quality Index: toward improved treatment outcomes assessment in voice disorders. J Commun Disord. 2010;43(3):161-74. http://dx.doi.org/10.1016/j.jcomdis.2009.12.004. PMid:20080243.
http://dx.doi.org/10.1016/j.jcomdis.2009...
) e Acoustic Breathiness Index (ABI)(1010 Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. The Acoustic Breathiness Index (ABI): a multivariate acoustic model for breathiness. J Voice. 2017;31(4):511.e11-27. http://dx.doi.org/10.1016/j.jvoice.2016.11.017. PMid:28087124.
http://dx.doi.org/10.1016/j.jvoice.2016....
), inclusive utilizados como script do Praat. Apesar desses estudos, ainda não existe uma padronização internacional de quais medidas acústicas são as mais importantes a serem estudadas. Também observa-se pouca orientação pedagógica baseada em evidências para o ensino sobre a aplicabilidade da análise acústica em uma avaliação vocal.

Diante disso, surgem alguns questionamentos: como criar recursos que contribuam efetivamente para a atividade docente em análise acústica? Quais características um artefato tecnológico deve possuir para auxiliar a aprendizagem do estudante em análise acústica? Como desenvolver ou aproveitar um software que atenda às especificidades dos conhecimentos da análise acústica na clínica vocal?

Dada a escassez de evidências sobre o ensino efetivo do tema, as respostas a esses questionamentos não são triviais. A aprendizagem baseada em problemas, com o auxílio de tecnologias(1111 Walden PR. Learning acoustic assessment of voice: an action research-based SoTL Project. J Voice. In press. 2021. http://dx.doi.org/10.1016/j.jvoice.2021.11.015. PMid:34973895.
http://dx.doi.org/10.1016/j.jvoice.2021....
), pode ser uma maneira atrativa de contribuir para a maximização do aprendizado, interesse e empenho dos discentes nas aulas, tornando-os protagonistas na construção do seu conhecimento, bem como desenvolver raciocínio crítico e reflexivo para resolução de problemas.

Na análise acústica vocal, o Praat tem sido amplamente utilizado em aplicações de processamento digital de voz, por ser um software gratuito, que permite ao usuário desenvolver scripts, criação de plugins e possibilita uma interoperabilidade com outras linguagens de programação(1212 Boersma P, Weenink D. Praat: doing phonetics by computer (version 6.0.37) [software]. Amsterdã: Universidade de Amsterdã; 2018 [citado em 2022 Out 26]. Disponível em: http://www.praat.org/
http://www.praat.org/...
).

Diante do exposto, este estudo teve por objetivo apresentar um artefato tecnológico, um plugin do Praat denominado VoxMore, para auxiliar o ensino da análise acústica da voz, visando estudantes de graduação e pós-graduação em Fonoaudiologia, bem como otimizar o uso da análise acústica na clínica vocal.

MÉTODO

Trata-se de um estudo metodológico de caráter multidisciplinar para o desenvolvimento de um artefato tecnológico para análise acústica da voz. A equipe desenvolvedora foi composta por um fonoaudiólogo, um engenheiro e um estatístico.

Este trabalho foi avaliado e aprovado pelo comitê de Ética em Pesquisa da Instituição de origem (número 52492/12). Participaram dessa pesquisa sujeitos vocalmente saudáveis e disfônicos, ambos os gêneros, faixa etária de 19 a 60 anos, atendidos no laboratório de voz da Instituição de origem. Todos os participantes assinaram o Termo de Consentimento Livre e Esclarecido, autorizando a participação na pesquisa.

Para a gravação das amostras vocais foi utilizado o software Fonoview, versão 4.5, CTS Informática, desktop Dell all-in-one, microfone cardioide unidirecional, marca Sennheiser, modelo E-835, localizado em um pedestal e acoplado a um pré-amplificador Behringer, modelo U-Phoria UMC 204. As vozes foram coletadas em cabine de gravação com tratamento acústico, ruído inferior a 50 dB NPS, taxa de amostragem de 44.100 Hz, com 16 bits por amostra e distância de 10 cm entre o microfone e a boca do paciente. Para a coleta das vozes, os pacientes estavam em pé, situando-se o pedestal à sua frente, de acordo com a distância preconizada entre a boca e o microfone.

O recurso foi desenvolvido para o software Praat, versão 6.2.10, podendo ser utilizado nessa versão e posteriores, gerando um relatório com imagens e valores de medidas acústicas.

As imagens são apresentadas no domínio do tempo, através de oscilogramas; no domínio da frequência, através do espectro de Fourier e dos coeficientes de predição linear (LPC); no domínio do tempo-frequência, através do espectrograma de banda estreita; e no domínio da quefrência, através do pico cepstral proeminente (CPP) e pico cepstral proeminente suavizado (CPPS) e cepstrograma. Foi adotada a seguinte taxonomia para agrupar as medidas acústicas: medidas da f0, medidas de período, medidas de perturbação do período da f0, medidas de perturbação de amplitude da f0, medidas espectrais, medidas de ruído glotal e medidas cepstrais do CPPS.

Na atual versão do VoxMore, v1.0.0, o plugin é aplicado à análise acústica de vogais sustentadas. No presente estudo, a amostra vocal utilizada para demonstração dos resultados foi a vogal /Ɛ/ sustentada.

Foi fixado um período máximo de análise de três segundos para cada sinal de voz. Caso uma gravação seja maior do que três segundos, o plugin vai analisar os três segundos centrais da gravação. Caso seja uma emissão menor do que três segundos, o plugin vai analisar toda a gravação. É válido ressaltar que sinais com tempo de emissão inferior a um segundo não são viáveis para realizar uma análise efetiva. O tempo do sinal sonoro foi estabelecido com base nos trabalhos que utilizam os índices AVQI(99 Maryn Y, De Bodt M, Roy N. The Acoustic Voice Quality Index: toward improved treatment outcomes assessment in voice disorders. J Commun Disord. 2010;43(3):161-74. http://dx.doi.org/10.1016/j.jcomdis.2009.12.004. PMid:20080243.
http://dx.doi.org/10.1016/j.jcomdis.2009...
) e ABI(1010 Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. The Acoustic Breathiness Index (ABI): a multivariate acoustic model for breathiness. J Voice. 2017;31(4):511.e11-27. http://dx.doi.org/10.1016/j.jvoice.2016.11.017. PMid:28087124.
http://dx.doi.org/10.1016/j.jvoice.2016....
).

O primeiro passo para a criação desse recurso foi o desenvolvimento da estrutura do plugin. Durante o período de criação foram realizadas versões preliminares e, durante o processo de criação, a equipe desenvolvedora entrou em consenso sobre as informações a serem apresentadas, as medidas acústicas aplicadas e o formato do relatório, o qual foi idealizado em uma sequência lógica de informações, sendo essa estrutura adaptada com base na literatura(1313 Kent RD, Read C. Análise acústica da fala. São Paulo: Cortez; 2015.). Essas medidas foram selecionadas, considerando que algumas são classificadas como medidas tradicionais(44 Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. A meta-analysis: acoustic measurement of roughness and breathiness. J Speech Lang Hear Res. 2018;61(2):298-323. http://dx.doi.org/10.1044/2017_JSLHR-S-16-0188. PMid:29392295.
http://dx.doi.org/10.1044/2017_JSLHR-S-1...
), medidas aplicadas nas pesquisas dos índices AVQI(99 Maryn Y, De Bodt M, Roy N. The Acoustic Voice Quality Index: toward improved treatment outcomes assessment in voice disorders. J Commun Disord. 2010;43(3):161-74. http://dx.doi.org/10.1016/j.jcomdis.2009.12.004. PMid:20080243.
http://dx.doi.org/10.1016/j.jcomdis.2009...
) e ABI(1010 Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. The Acoustic Breathiness Index (ABI): a multivariate acoustic model for breathiness. J Voice. 2017;31(4):511.e11-27. http://dx.doi.org/10.1016/j.jvoice.2016.11.017. PMid:28087124.
http://dx.doi.org/10.1016/j.jvoice.2016....
), e outras fazem parte de um estudo de metanálise(44 Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. A meta-analysis: acoustic measurement of roughness and breathiness. J Speech Lang Hear Res. 2018;61(2):298-323. http://dx.doi.org/10.1044/2017_JSLHR-S-16-0188. PMid:29392295.
http://dx.doi.org/10.1044/2017_JSLHR-S-1...
).

No domínio do tempo, o relatório apresenta quatro imagens de oscilogramas do sinal de voz: sinal completo, máximo três segundos; sinal dos 50 milissegundos iniciais; sinal dos 50 milissegundos centrais, e sinal dos 50 milissegundos finais. Além dessas imagens, também são apresentadas outras duas imagens, relacionadas aos traçados da f0 e da intensidade do sinal, em relação ao tempo total.

No domínio da frequência são apresentadas seis imagens do espectro de Fourier da onda sonora, amostrada em 44.100 Hz: imagem do espectro até 22,05 kHz, toda a faixa de frequência; imagem de um espectro até 11 kHz; e imagem contendo o espectro de Fourier e o espectro de LPC na faixa de 5,5 kHz. As outras três imagens são de faixas de frequência menores, sendo uma até 2,75 kHz, outra até 1,38 kHz e uma última até 690 Hz, utilizadas para uma melhor visualização dos harmônicos.

Em relação ao domínio do tempo-frequência é apresentada uma imagem de um espectrograma de banda estreita. No domínio da quefrência, as imagens exibidas são do CPP, CPPS e o cepstrograma.

Por fim, o relatório os valores de todas as medidas acústicas, no formato de resultados numéricos e em gráficos de barras verticais:

  • Medidas da f0: média, desvio padrão, primeiro quartil, mediana, terceiro quartil, mínimo, máximo e coeficiente de variação.

  • Medidas do período: média, desvio padrão (PSD) e logaritmo natural do desvio padrão (LNPSD).

  • Medidas de perturbação do período da f0: jitter (local), jitter (local, absoluto), jitter (RAP), jitter (PPQ5) e jitter (ddp).

  • Medidas de perturbação de amplitude da f0: shimmer (local), shimmer (dB), shimmer (APQ3), shimmer (APQ5), shimmer (APQ11) e shimmer (dda).

  • Medidas espectrais: proporção harmônico-ruído (HNR), proporção harmônico-ruído de Dejonckere (HNRD), nível relativo de energia do ruído de alta frequência (Hfno), diferença entre a amplitude do primeiro e o segundo harmônico (H1H2), declínio e tilt.

  • Medidas de ruído glotal: excitação do ruído glotal em larguras de banda de 1.000 Hz, 2.000 Hz e 3.000 Hz.

  • Medidas cepstrais do CPPS: média, desvio padrão, primeiro quartil, mediana, terceiro quartil, mínimo, máximo, coeficiente de variação e f0 do CPPS.

Também foram inseridas outras medidas disponíveis no Praat, sendo intensidade, correlação média, voice breaks e unvoiced frames. A correlação média foi inserida pois é uma medida semelhante à medida pearson r at autocorrelation peak, descrita em estudos de metanálises(44 Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. A meta-analysis: acoustic measurement of roughness and breathiness. J Speech Lang Hear Res. 2018;61(2):298-323. http://dx.doi.org/10.1044/2017_JSLHR-S-16-0188. PMid:29392295.
http://dx.doi.org/10.1044/2017_JSLHR-S-1...
,66 Roy N, Barkmeier-Kraemer J, Eadie T, Sivasankar MP, Mehta D, Paul D, et al. Evidence-based clinical voice assessment: a systematic review. Am J Speech Lang Pathol. 2013;22(2):212-26. http://dx.doi.org/10.1044/1058-0360(2012/12-0014). PMid:23184134.
http://dx.doi.org/10.1044/1058-0360(2012...
). As medidas voice breaks e unvoiced frames foram inseridas pois a equipe desenvolvedora tem utilizado tais medidas para a identificação de quebras vocais e de trechos não vozeados no sinal sonoro. Ressalta-se que configurações de limiares, de algumas medidas, foram adaptadas conforme observado em outros estudos(99 Maryn Y, De Bodt M, Roy N. The Acoustic Voice Quality Index: toward improved treatment outcomes assessment in voice disorders. J Commun Disord. 2010;43(3):161-74. http://dx.doi.org/10.1016/j.jcomdis.2009.12.004. PMid:20080243.
http://dx.doi.org/10.1016/j.jcomdis.2009...
,1010 Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. The Acoustic Breathiness Index (ABI): a multivariate acoustic model for breathiness. J Voice. 2017;31(4):511.e11-27. http://dx.doi.org/10.1016/j.jvoice.2016.11.017. PMid:28087124.
http://dx.doi.org/10.1016/j.jvoice.2016....
).

Em relação ao relatório acústico, para compor o cabeçalho com as informações do paciente, foi criado um formulário no qual o usuário deve inserir o nome do paciente, sexo, idade, ocupação, resultado da avaliação perceptivo-auditiva nas escalas GRBAS e CAPE-V, e identificação do examinador. A data do relatório acústico é inserida automaticamente no cabeçalho. Após o preenchimento do formulário, irá aparecer uma tela para o usuário, na qual ele deve selecionar a pasta para salvar o documento. Realizadas essas ações, será gerado um relatório composto por quatro arquivos. Se o sistema operacional for Windows, os arquivos serão no formato PNG, se for Linux ou Mac, os arquivos serão no formato PDF.

Para instalar o VoxMore, o download do arquivo deve ser feito pelo link disponível na internet(1414 Abreu SR, Moraes RM, Lopes LW [Internet]. San Francisco: GitHub; c2022 [citado em 2022 Out 26]. Disponível em: https://github.com/abreusamuel/VoxMore
https://github.com/abreusamuel/VoxMore...
). Será baixado um arquivo compactado, o qual deve ser descompactado na pasta de preferências do Praat. Para localizar essa pasta, deve ser observado o sistema operacional utilizado no computador, pois cada sistema operacional utiliza caminhos diferentes, conforme descrição abaixo (considerar user_name como nome do usuário utilizado no sistema operacional):

  • Linux: /home/user_name/.praat-dir

  • Mac: /Users/user_name/Library/Preferences/Praat Prefs/

  • Windows: C:\Users\user_name\Praat

Vale ressaltar que, se o Praat estiver aberto no momento da instalação do plugin, será necessário encerrar e iniciar novamente o Praat para que a instalação do VoxMore funcione. Após a instalação concluída, o VoxMore estará disponível para ser acessado no menu dinâmico do Praat.

RESULTADOS

Para exemplificar a utilização do VoxMore, no presente estudo foi utilizada a emissão de vogal /Ɛ/ sustentada, voz disfônica, com presença de nódulos e fenda em ampulheta, sexo feminino, idade 36 anos.

Em relação ao relatório acústico gerado pelo VoxMore, a Figura 1a apresenta seis imagens, sendo quatro imagens de oscilogramas do sinal de voz, uma do traçado da f0 e uma referente ao traçado da intensidade. Na Figura 1b são apresentadas sete imagens, sendo seis relacionadas ao domínio da frequência e uma ao domínio do tempo-frequência. A imagem relacionada ao domínio do tempo-frequência fornece informações sobre o espectrograma de banda estreita.

Figura 1
(a) Arquivo I: informações sobre oscilogramas do sinal de voz, traçado da f0 e traçado da intensidade. (b) Arquivo II: informações sobre domínio da frequência, espectro de Fourier e espectro de LPC, e domínio do tempo-frequência, espectrograma

Já a Figura 2a apresenta cinco imagens contendo informações sobre a análise cepstral. As duas primeiras mostram os picos cepstrais com a reta de regressão e os picos cepstrais subtraídos da reta de regressão. Na sequência, terceira e quarta imagens mostram os picos cepstrais suavizados com a reta de regressão e os picos cepstrais suavizados subtraídos da reta de regressão, respectivamente. Na última imagem observa-se o cepstrograma, que tem o domínio do tempo e o domínio da quefrência, ambos em segundos. A Figura 2b apresenta os valores de todas as medidas acústicas, no formato de resultados numéricos e em gráficos de barras verticais, para facilitar a visualização e compreensão das informações.

Figura 2
(a) Arquivo III: informações sobre a análise cepstral e cepstrograma. (b) Arquivo IV: informações sobre as medidas acústicas

DISCUSSÃO

Levando em consideração a dinamicidade entre a universidade e a clínica-escola, e a otimização de ações na prática clínica, foi observada a necessidade de novas estratégias para o treinamento da avaliação acústica vocal. Diante disso, o VoxMore possibilita uma melhor compreensão das informações acústicas, bem como condições para que docentes, alunos e fonoaudiólogos possam explorar tal análise em domínios variados, apresentados no relatório.

No domínio do tempo, os oscilogramas podem fortalecer conceitos relacionados ao período, intensidade e f0. Nos oscilogramas segmentados, em vozes que apresentam desvios moderados a intensos, é possível observar perturbações de período e amplitude, podendo ser abordados conceitos relacionados ao jitter e shimmer. Com os traçados da intensidade, e da f0, é possível correlacionar conceitos relacionados à percepção da loudness e pitch, bem como observar possíveis instabilidades durante a emissão.

No domínio da frequência é possível analisar imagens do espectro da transformada de Fourier e do espectro de LPC. Nesse contexto, podem ser explorados conceitos sobre fonte-filtro, harmônicos, formantes, declínio espectral, entre outros. Em relação ao domínio tempo-frequência, no espectrograma de banda estreita é possível aplicar o protocolo de análise espectrográfica para análise das informações acústicas(1515 Lopes LW, Silva IMD, Sousa ESDS, Silva ACFD, Paiva MAAD, Diniz EGR, et al. Spectrographic classification of the vocal signal: relation with laryngeal diagnosis and auditory-perceptual analysis. Audiol Commun Res. 2020;25:e2194. http://dx.doi.org/10.1590/2317-6431-2019-2194.
http://dx.doi.org/10.1590/2317-6431-2019...
).

Na análise das imagens dos picos cepstrais podem ser reforçados, de forma mais clara, conceitos de CPP e CPPS, considerando a diferença do pico cepstral proeminente para a reta de regressão e o conceito de suavização desse pico. O presente estudo traz como sugestão que o cepstrograma seja utilizado como uma nova abordagem nas avaliações e, também, sugere que novos estudos sejam realizados, com o intuito de verificar as informações que podem ser extraídas do cepstrograma.

As imagens fornecidas pelo relatório favorecem tanto atividades educacionais quanto profissionais, pois fornecem informações visuais que podem ser analisadas e comparadas em diferentes qualidades vocais.

Sobre a descrição das medidas acústicas, um dos principais benefícios do VoxMore é abranger uma variedade de medidas que podem ser correlacionadas aos conceitos físicos da acústica e analisadas quantitativamente, considerando o desvio presente no sinal sonoro e comparação com dados normativos(22 Barsties B, De Bodt M. Assessment of voice quality: current state-of-the-art. Auris Nasus Larynx. 2015;42(3):183-8. http://dx.doi.org/10.1016/j.anl.2014.11.001. PMid:25440411.
http://dx.doi.org/10.1016/j.anl.2014.11....
), bem como podem ser analisadas qualitativamente, considerando os mecanismos fisiológicos relacionados à fonação e possíveis distúrbio vocais associados. Essas informações podem propiciar a compreensão da avaliação perceptivo-auditiva e da laríngea, condição essa que tem sido considerada um desafio tanto para clínicos quanto para pesquisadores(1616 Lopes LW, Sousa ESS, Silva ACF, Silva IM, Paiva MAA, Vieira VJD, et al. Cepstral measures in the assessment of severity of voice disorders. CoDAS. 2019;31(4):e20180175. http://dx.doi.org/10.1590/2317-1782/20182018175. PMid:31433040.
http://dx.doi.org/10.1590/2317-1782/2018...
), bem como auxiliar no acompanhamento de uma evolução terapêutica.

Uma limitação considerada no presente estudo é a de que o plugin está sendo testado em apenas uma universidade, em caráter experimental. Sendo assim, logo que disponibilizado para uso público, espera-se que o VoxMore seja testado em outras populações, e contextos, que podem oferecer sugestões para possíveis melhorias no plugin.

CONCLUSÃO

O plugin VoxMore é um artefato tecnológico desenvolvido para estimular as habilidades dos alunos em formação, bem como viabilizar a instrumentalização do profissional já formado. Nesse sentido, entende-se que o VoxMore pode contribuir tanto com o processo de ensino-aprendizagem, atuando como ferramenta auxiliar com caráter formativo nas disciplinas de graduação e pós-graduação em Fonoaudiologia, quanto com o processo da prática clínica, tornando viável a utilização da análise acústica na clínica vocal e apoiando a tomada de decisão dos fonoaudiólogos.

AGRADECIMENTOS

O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001.

  • Trabalho realizado no Programa de Pós-graduação em Modelos de Decisão e Saúde, Universidade Federal da Paraíba - UFPB - João Pessoa (PB), Brasil.
  • Fonte de financiamento: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001.

REFERÊNCIAS

  • 1
    Dejonckere PH, Bradley P, Clemente P, Cornut G, Crevier-Buchman L, Friedrich G, et al. A basic protocol for functional assessment of voice pathology, especially for investigating the efficacy of (phonosurgical) treatments and evaluating new assessment techniques. Eur Arch Otorhinolaryngol. 2001;258(2):77-82. http://dx.doi.org/10.1007/s004050000299 PMid:11307610.
    » http://dx.doi.org/10.1007/s004050000299
  • 2
    Barsties B, De Bodt M. Assessment of voice quality: current state-of-the-art. Auris Nasus Larynx. 2015;42(3):183-8. http://dx.doi.org/10.1016/j.anl.2014.11.001 PMid:25440411.
    » http://dx.doi.org/10.1016/j.anl.2014.11.001
  • 3
    Boominathan P, Samuel J, Arunachalam R, Nagarajan R, Mahalingam S. Multi parametric voice assessment: Sri Ramachandra University Protocol. Indian J Otolaryngol Head Neck Surg. 2014;66(Supl 1):246-51. http://dx.doi.org/10.1007/s12070-011-0460-y PMid:24533392.
    » http://dx.doi.org/10.1007/s12070-011-0460-y
  • 4
    Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. A meta-analysis: acoustic measurement of roughness and breathiness. J Speech Lang Hear Res. 2018;61(2):298-323. http://dx.doi.org/10.1044/2017_JSLHR-S-16-0188 PMid:29392295.
    » http://dx.doi.org/10.1044/2017_JSLHR-S-16-0188
  • 5
    Omori K, Slavit DH, Kacker A, Blaugrund SM. Influence of size and etiology of glottal gap in glottic incompetence dysphonia. Laryngoscope. 1998;108(4):514-8. http://dx.doi.org/10.1097/00005537-199804000-00010 PMid:9546262.
    » http://dx.doi.org/10.1097/00005537-199804000-00010
  • 6
    Roy N, Barkmeier-Kraemer J, Eadie T, Sivasankar MP, Mehta D, Paul D, et al. Evidence-based clinical voice assessment: a systematic review. Am J Speech Lang Pathol. 2013;22(2):212-26. http://dx.doi.org/10.1044/1058-0360(2012/12-0014) PMid:23184134.
    » http://dx.doi.org/10.1044/1058-0360(2012/12-0014)
  • 7
    Finan DS. Speech science education-roll over Beethoven. Perspect Speech Sci Orofac Disord. 2008;18(1):22-30. http://dx.doi.org/10.1044/ssod18.1.22
    » http://dx.doi.org/10.1044/ssod18.1.22
  • 8
    Tessel CA, Grover V. Graduate student retention of prerequisite course content. Teaching and Learning in Communication Sciences & Disorders. 2020;4(1):1-33. http://dx.doi.org/10.30707/TLCSD4.1/ULMQ3912
    » http://dx.doi.org/10.30707/TLCSD4.1/ULMQ3912
  • 9
    Maryn Y, De Bodt M, Roy N. The Acoustic Voice Quality Index: toward improved treatment outcomes assessment in voice disorders. J Commun Disord. 2010;43(3):161-74. http://dx.doi.org/10.1016/j.jcomdis.2009.12.004 PMid:20080243.
    » http://dx.doi.org/10.1016/j.jcomdis.2009.12.004
  • 10
    Latoszek BBV, Maryn Y, Gerrits E, De Bodt M. The Acoustic Breathiness Index (ABI): a multivariate acoustic model for breathiness. J Voice. 2017;31(4):511.e11-27. http://dx.doi.org/10.1016/j.jvoice.2016.11.017 PMid:28087124.
    » http://dx.doi.org/10.1016/j.jvoice.2016.11.017
  • 11
    Walden PR. Learning acoustic assessment of voice: an action research-based SoTL Project. J Voice. In press. 2021. http://dx.doi.org/10.1016/j.jvoice.2021.11.015 PMid:34973895.
    » http://dx.doi.org/10.1016/j.jvoice.2021.11.015
  • 12
    Boersma P, Weenink D. Praat: doing phonetics by computer (version 6.0.37) [software]. Amsterdã: Universidade de Amsterdã; 2018 [citado em 2022 Out 26]. Disponível em: http://www.praat.org/
    » http://www.praat.org/
  • 13
    Kent RD, Read C. Análise acústica da fala. São Paulo: Cortez; 2015.
  • 14
    Abreu SR, Moraes RM, Lopes LW [Internet]. San Francisco: GitHub; c2022 [citado em 2022 Out 26]. Disponível em: https://github.com/abreusamuel/VoxMore
    » https://github.com/abreusamuel/VoxMore
  • 15
    Lopes LW, Silva IMD, Sousa ESDS, Silva ACFD, Paiva MAAD, Diniz EGR, et al. Spectrographic classification of the vocal signal: relation with laryngeal diagnosis and auditory-perceptual analysis. Audiol Commun Res. 2020;25:e2194. http://dx.doi.org/10.1590/2317-6431-2019-2194
    » http://dx.doi.org/10.1590/2317-6431-2019-2194
  • 16
    Lopes LW, Sousa ESS, Silva ACF, Silva IM, Paiva MAA, Vieira VJD, et al. Cepstral measures in the assessment of severity of voice disorders. CoDAS. 2019;31(4):e20180175. http://dx.doi.org/10.1590/2317-1782/20182018175 PMid:31433040.
    » http://dx.doi.org/10.1590/2317-1782/20182018175

Datas de Publicação

  • Publicação nesta coleção
    30 Out 2023
  • Data do Fascículo
    2023

Histórico

  • Recebido
    27 Jun 2022
  • Aceito
    26 Out 2022
Sociedade Brasileira de Fonoaudiologia Al. Jaú, 684, 7º andar, 01420-002 São Paulo - SP Brasil, Tel./Fax 55 11 - 3873-4211 - São Paulo - SP - Brazil
E-mail: revista@codas.org.br