Acessibilidade / Reportar erro

Confusões perceptivas entre consoantes do Português Brasileiro em função do ruído

Resumos

Objetivo:

(a) Verificar se o comportamento do indivíduo, na percepção de consoantes em meio a diferentes ruídos, está ligado diretamente ao modo como os sons são mentalmente representados; (b) Verificar se há relação entre similaridade fonológica e perceptiva.

Métodos:

A pesquisa utilizou uma amostra não probabilística, por tipicidade, composta por 11 participantes adultos, com idade entre 20 e 30 anos. Os critérios de inclusão foram: ter idade entre 18 e 30 anos; ler, concordar e assinar o Termo de Consentimento Livre e Esclarecido; apresentar audição periférica e processamento auditivo dentro dos critérios de referência. A coleta de dados aconteceu em duas etapas: 1) Avaliação preliminar: audiometria tonal liminar, imitanciometria, logoaudiometria, teste de fala com ruído e teste dicótico de dígitos; 2) Avaliação da percepção de consoantes, com o objetivo de verificar a correta identificação das consoantes [p], [t], [d], [k], [f], [v], [ʃ] e [ʒ], seguidas da vogal [a], em meio aos ruídos branco e de festa, nas relações sinal ruído igual a 0 e +5 dB (NS).

Resultados:

No ruído branco, em ambas as relações sinal/ruído foram encontradas, em maior número, as confusões: [f]-[p], [ʃ]-[k] e [ʃ]-[ʒ]. No ruído de festa, foram mais encontradas as confusões: [f]-[p], [v]-[p], [v]-[f] e [t]-[d]. Observou-se que, quanto mais traços distintivos as consoantes compartilham, mais elas são confundidas.

Conclusão:

Ruído branco e ruído de festa afetam diretamente a percepção das consoantes, mas de forma diferente, sendo encontrada maior distância perceptiva entre consoantes no ruído de festa. Assim, as confusões entre consoantes parecem sofrer maior influência das características acústicas, do que fonológicas.

Percepção da fala; Percepção auditiva; Audição; Linguística; Ruído


Purpose

(a) to determine whether an individual’s behavior, in the perception of consonants in different noise conditions, is directly related to how these sounds are represented in the mind, (b) to determine whether there is a relationship between phonological and perceptual similarity.

Methods

The study used a non-probability sample based on typicality, with participation of eleven adults, aged between twenty and thirty years. The inclusion criteria were: age between eighteen and thirty years; to read, agree and sign the Free and Cleared Term of Consent; to present peripheral hearing and auditory processing within the reference criteria. The data were collected in two stages: 1) Preliminary evaluation consisting of the following tests: pure tone audiometry, tympanometry, speech audiometry and speech test in noise and dichotic digits test, 2) Evaluation of the auditory perception of the consonants [p], [t], [d], [k], [f], [v], [ʃ] and [ʒ] followed by the vowel [a], under white noise or cocktail party noise in the signal/noise ratio of 0 and +5 dB (NS).

Results

Under white noise, in both signal/noise ratios, there was more confusion between the consonants [f]-[p], [ʃ]-[k] and [ʃ]-[ʒ]. Under cocktail party noise, there was more confusion between the consonants [f]-[p], [v]-[p], [v]-[f] and [t]-[d]. It was observed that consonants that share more distinctive features are more confusing.

Conclusion

The white noise and the cocktail party noise directly affect the perception of the consonants, but in different ways, and a larger perceptive distance is found among consonants under cocktail party noise. Therefore, the confusions among consonants seem to be more influenced by their acoustic rather than their phonological characteristics.

Speech perception; Auditory perception; Hearing; Linguistics; Noise


INTRODUÇÃO

O comportamento do indivíduo na percepção de consoantes em diferentes situações pode estar ligado diretamente ao modo como os sons são mentalmente representados. Uma proposta sobre a representação linguística dos sons da fala supõe que estes se organizam numa hierarquia de traços, que constituem abstrações de suas características articulatórias(1 Clements GN. Feature organization. In: Brown K, editor. The Encyclopedia of Language and Linguistics. 2a ed. Oxford: Elsevier; 2006. p. 433-40.,2 Clements GN, Hume E. The internal organization of speech sounds. In: Goldsmith J, editor. Handbook of phonological theory. Oxford: Blackwell; 1995. p. 245-306.). As premissas básicas da geometria de traços podem ser descritas da seguinte maneira:

“a) Os traços podem ser agrupados em classes de traços; b) As classes formam uma hierarquia estrita, que pode ser representada por uma árvore com raiz; c) Essa hierarquia é universal; d) Cada traço e cada classe de traço são representados por nós, em camadas segmentais separadas; e) Cada nó se liga aos elementos de somente uma camada de nível mais alto.”

Numa análise do português segundo a geometria de traços(3 Mota HB. Aquisição segmental do português: um modelo implicacional de complexidade de traços [tese]. Porto Alegre: Pontifícia Universidade Católica do Rio Grande do Sul; 1996.), a estrutura da consoante, organizada hierarquicamente, é representada por nós de raiz, laríngeo, de cavidade oral (CO) e de ponto de consoante (PC). O nó de raiz representa o segmento como unidade fonológica e domina os outros traços. É representado pelos traços de classe principal [±soante], [±aproximante] e [-vocoide]. O nó laríngeo refere-se à participação da laringe na produção dos sons e é representado pelo traço de sonoridade [±vozeado]. O nó de CO corresponde à função da cavidade oral na produção articulatória dos sons. Nele estão ligados os traços de ponto de articulação (nó de ponto de consoante) e de modo de articulação [±contínuo]. O nó de ponto de consoante refere-se ao ponto de articulação na produção do segmento e é representado pelos traços [labial], [coronal] e [dorsal] e pelo traço [±anterior], dependente do [coronal]. Com base nessa descrição, propôs-se uma matriz fonológica dos segmentos consonantais do português.

A partir da geometria de traços, os sons da fala são mais ou menos distintos, em termos de sua similaridade fonológica. Segmentos que compartilham mais traços são mais semelhantes do que aqueles que compartilham menos traços.

Uma teoria da organização dos sons, contudo, deve ser integrada a outros conhecimentos para que se compreenda o uso da língua em situações cotidianas de comunicação. Sabe-se, por exemplo, que a percepção auditiva importa diretamente na comunicação eficiente do dia a dia e depende da adequada integração das habilidades auditivas para o reconhecimento eficaz dos sons da fala, principalmente em ambientes ruidosos(4 Markham D, Hazan V. The effect of talker- and listener-related factors on intelligibility for a real-word, open-set perception test. J Speech Lang Hear Res. 2004;47(4):725-37. http://dx.doi.org/10.1044/1092-4388(2004/055),5 Davies MG, Yellon L, Purdy SC. Speech-in-noise perception of children using cochlear implants and FM systems. Aust N Z J Audiol. 2001;23(1):52-62. http://dx.doi.org/10.1375/audi.23.1.52.31096), uma vez que a percepção auditiva no silêncio não reflete a percepção auditiva em um ambiente ruidoso(6 Fallon M, Trehub SE, Schneider BA. Children’s perception of speech in multitalker babble. J Acoust Soc Am. 2000;108(6):3023-9. http://dx.doi.org/10.1121/1.1323233,7 Paula A, Oliveira JÁ, Godoy NM, Canovas MBA. Discriminação de monossílabos em ambiente silencioso e ambiente ruidoso. Braz J Otorhinolaryngol. 2000;66(5):426-31.). Segundo o que se sabe sobre a constituição e a função do sistema auditivo, pode-se dizer que, sob diferentes tipos de ruído, diferentes capacidades auditivas periféricas ou centrais serão exigidas para se extrair do som da fala suas características importantes. Por exemplo, no ruído branco exige-se mais da capacidade de fechamento auditivo, enquanto no ruído de festa, mais da capacidade de figura-fundo para a percepção de fala. Por outro lado, como a geometria de traços propõe uma organização de sons numa hierarquia universal, entende-se que, independentemente das características do processamento (vale dizer, das habilidades utilizadas), os sons mais afetados e mais confusos, sob ruído, serão os mesmos, já que suas semelhanças fonológicas não serão influenciadas por qualquer ruído.

Este estudo foi elaborado para verificar se o comportamento do indivíduo, na percepção de consoantes em meio a diferentes ruídos, está ligado diretamente ao modo como os sons são mentalmente representados. Adicionalmente, visou-se verificar a relação entre similaridade fonológica e similaridade perceptiva. Em outras palavras, esperou-se que, ao perceber a fala, alguém viesse a confundir, mais facilmente, segmentos que compartilham mais traços. Por outro lado, sons que compartilham menos traços deveriam resistir mais à confusão e permanecer distintivamente percebidos, resistindo ao efeito deletério do ruído sobre a comunicação verbal.

A melhor compreensão sobre o comportamento dos indivíduos, diante de situações cotidianas de comunicação que envolvem as habilidades relacionadas tanto à percepção da fala, quanto ao processamento auditivo, associado à compreensão da relação entre os sistemas de traços distintivos e a percepção de fala, poderá trazer contribuições para as áreas da Linguística e da Fonoaudiologia.

MÉTODOS

Trata-se de um estudo transversal, com medidas repetidas, realizado com a aprovação prévia do Comitê de Ética em Pesquisa da Universidade Federal de Minas Gerais (UFMG), conforme parecer número ETIC – 0316.0.203.000-11.

A pesquisa utilizou uma amostra não probabilística, por tipicidade, composta por 11 participantes adultos, com idade entre 20 e 30 anos, recrutados na UFMG. Os critérios de inclusão considerados para o estudo foram:

  • Ter idade entre 18 e 30 anos;

  • Ler, concordar e assinar o Termo de Consentimento Livre e Esclarecido;

  • Apresentar audição periférica e processamento auditivo dentro dos critérios de referência para audiometria tonal liminar, imitanciometria, logoaudiometria, teste de fala com ruído e teste dicótico de dígitos, a saber:

  • Limiares auditivos até 25 dB nível de audição (NA)(8 Lloyd LL, Kaplan H. Audiometric interpretation: a manual of basic audiometry. Baltimore: University Park; 1978.);

  • Curva timpanométrica tipo A, com presença de reflexos acústicos contralaterais, bilateralmente(9 Jerger J. Clinical experience with impedance audiometry. Arch Otolaryngol. 1970;92(4):311-24.);

  • Número de acertos igual ou superior a 70% no teste de fala com ruído, com diferença de até 20% entre as porcentagens de acertos do Índice Percentual de Reconhecimento de Fala e do teste de fala com ruído(1010  Pereira LD, Schochat E. Processamento auditivo central: manual de avaliação. São Paulo: Lovise; 1997.);

  • Resultado igual ou superior a 95% de acertos no teste dicótico de dígitos, tanto na orelha direita, como na esquerda(1010  Pereira LD, Schochat E. Processamento auditivo central: manual de avaliação. São Paulo: Lovise; 1997.).

Os critérios de exclusão foram:

  • Desistir de participar da pesquisa;

  • Não realizar todas as tarefas experimentais propostas.

A coleta de dados da pesquisa foi dividida em duas etapas (avaliação preliminar para seleção da amostra e avaliação da percepção de consoantes), realizadas no Laboratório de Fonoaudiologia da Faculdade de Medicina da UFMG.

A avaliação preliminar da amostra constou da realização de testes para análise da audição periférica (audiometria tonal liminar, logoaudiometria e imitanciometria) e testes de processamento auditivo (teste de fala com ruído e teste dicótico de dígitos), que avaliaram habilidades (fechamento e figura-fundo) necessárias em nosso cotidiano para a percepção de fala no ruído. A avaliação da percepção de consoantes, em situação de ruído, visou verificar a confusão perceptiva entre consoantes seguidas da vogal /a/, em meio ao ruído branco ou ruído de festa, nas relações sinal/ruído igual a 0 e +5 dB (NS). O ruído branco constitui-se em uma forma de onda aperiódica, com igual energia dentro de qualquer banda de frequência e com todas as fases presentes em uma distribuição ao acaso. O ruído de festa consiste no espectro de fala associado a ruídos de uma situação de festa. O ruído branco age mascarando igualmente as frequências - no caso deste estudo, de 10 a 10000 Hz -, com efeito sobre o processamento periférico. Já o ruído de festa, age diferentemente em cada frequência. Por isso, afeta o processamento central em habilidades dependentes de atenção.

Foram apresentadas aos participantes as consoantes [p], [t], [d], [k], [f], [v], [ʃ] e [ʒ], seguidas da vogal [a]. Essas consoantes foram escolhidas pelos seguintes motivos: a) apresentam os mesmos traços de classe principal; b) variam apenas nos traços de classes não principais; c) formam sílabas do tipo consoante-vogal (CV) com significado, isto é, são itens lexicais do português brasileiro. Os traços distintivos que caracterizam os segmentos consonantais utilizados neste estudo são:

/p/: [-soante], [-vocoide], [-aproximante], [-contínuo], [-voz], [labial]

/t/: [-soante], [-vocoide], [-aproximante], [-contínuo], [-voz], [coronal]

/d/: [-soante], [-vocoide], [-aproximante], [-contínuo], [+voz], [coronal]

/k/: [-soante], [-vocoide], [-aproximante], [-contínuo], [-voz], [dorsal]

/f/: [-soante], [-vocoide], [-aproximante], [+contínuo], [-voz], [labial]

/v/: [-soante], [-vocoide], [-aproximante], [+contínuo], [+voz], [labial]

/ʃ/: [-soante], [-vocoide], [-aproximante], [+contínuo], [-voz], [coronal], [-anterior]

/ʒ/: [-soante], [-vocoide], [-aproximante], [+contínuo], [+voz], [coronal], [-anterior]

As sílabas foram gravadas por sujeito adulto homem, em sala acusticamente tratada e insonorizada. Cada sílaba foi gravada duas vezes.

As sílabas foram apresentadas aos participantes de forma diótica, associadas à presença do ruído branco ou do ruído de festa, nas relações sinal/ruído de 0 e +5 dB (NS). Tais relações sinal/ruído baseiam-se em estudos sobre os testes utilizados para processamento auditivo(1010  Pereira LD, Schochat E. Processamento auditivo central: manual de avaliação. São Paulo: Lovise; 1997.). Os dois tipos de ruído foram apresentados numa mesma sessão, com duração média de 30 minutos e intervalo entre os blocos de consoantes, com um e outro ruído. O nível de intensidade de apresentação das sílabas foi de 70 dB (NA). Sílabas e ruídos foram apresentados em ordem aleatória. No total, foram dez repetições por tipo de sílaba, o que totalizou 80 sílabas por indivíduo, em cada tipo de ruído.

Cada participante recebeu uma folha de resposta que continha, impressas, todas as opções de sílabas reproduzidas e foi orientado a prestar atenção somente na sílaba, ignorando o ruído. Assim que ouvisse a sílaba, deveria circular na folha de resposta, a opção que jugasse correta.

As respostas dos participantes foram analisadas numa matriz de confusão, em que cada linha correspondia às consoantes oferecidas como estímulo e cada coluna, à resposta do ouvinte para cada consoante. Nessa matriz foi contabilizada a frequência de ocorrência de erros e acertos para cada sílaba, para todo o grupo de sujeitos. Por meio da frequência de erros, calculou-se a distância perceptiva entre as consoantes, com base no julgamento do ouvinte. A distância foi estimada pela medida Phi (Φ), uma relação entre frequências de confusão obtidas e esperadas, ponderada pelo número de ocorrências(1111  Noruésis MJ. SPSS advanced statistics 6.1. 3a ed. Chicago: SPSS; 1994.).

As distâncias perceptivas entre cada consoante, assim calculadas, foram analisadas por meio de escalonamento multidimensional, que é uma representação geométrica das distâncias entre consoantes, tal como um mapa(1212  Leeuw J, Mair P. Multidimensional scaling using majorization: SMACOF in R. J Stat Softw. 2009;31(3):1-30.). Assim, pode-se dizer que seu resultado representa um mapa perceptivo das consoantes em cada nível e tipo de ruído. Com base nessa análise, investigou-se a hipótese de que não haveria diferenças entre as distâncias perceptivas em cada tipo de ruído, já que diferentes ruídos não afetam a similaridade fonológica.

A avaliação da percepção de consoantes (segunda etapa) objetivou verificar se as consoantes que se revelaram mais confusas compartilham, de fato, menos traços. Foi realizada por meio de um modelo linear (ANOVA), sendo a distância perceptiva, a variável dependente. Foram consideradas variáveis independentes a quantidade de traços em comum (três, quatro ou cinco), o tipo de ruído (branco ou festa) e o nível da relação sinal/ruído (0 ou +5 dB). Não foi possível incluir nesta análise o par de consoantes com seis traços em comum ([ʃ]-[ʒ]), por ser o único exemplar deste tipo. A relação sinal/ruído foi aninhada em tipo de ruído, o que permite comparar um nível com outro, dentro do mesmo tipo de ruído, já que não faz sentido comparar, por exemplo, o nível +5 dB do ruído branco com o nível 0 dB do ruído de festa. Utilizou-se, a posteriori, o teste HSD de Tukey para investigar as diferenças entre os níveis da variável “quantidade de traços”.

RESULTADOS

Os números absolutos e relativos de acertos resultaram em um total de 110 apresentações para cada som (somados todos os sujeitos da amostra). Na matriz de confusão de consoantes, a diagonal representa sempre o máximo de valores em que a consoante foi respondida corretamente, como ela mesma. Os valores fora da diagonal representam a percepção incorreta de cada consoante, quando foi percebida como outra (Tabelas 1 e 2).

Tabela 1
Matriz de confusão de consoante no ruído branco na relação sinal ruído igual a 0 dB (NS)
Tabela 2
Matriz de confusão de consoante no ruído branco na relação sinal ruído igual a +5 dB (NS)

No ruído branco, tanto na relação sinal/ruído 0 dB (NS) (Tabela 1), quanto +5 dB (NS) (Tabela 2), as consoantes que apresentaram maior confusão com outras foram: [f] - [p], [ʃ] - [k] e [ʃ] - [ʒ]. As consoantes menos confusas foram: [k], [ʒ], [v] e [t].

Comparando o desempenho no ruído de festa 0 dB (NS) (Tabela 3) com o ruído branco 0 dB (NS) (Tabela 1), observa-se que o percentual de acertos, na maioria dos casos, foi menor no ruído festa 0 dB (NS), o que demonstra maior confusão das consoantes, quando expostas nesse tipo de ruído (Tabela 3).

Tabela 3
Matriz de confusão de consoante no ruído festa na relação sinal ruído igual a 0 dB (NS)

No ruído de festa 0 dB (NS) (Tabela 3) e +5 dB (NS), as consoantes que apresentaram maior confusão foram: [f] - [p], [v] - [p] e [f] e [t] - [d]). As consoantes menos confusas foram: [k], [ʒ] e [p] (Tabela 4).

Tabela 4
Matriz de confusão de consoante no ruído festa na relação sinal ruído igual a +5 dB (NS)

Comparando-se o ruído de festa +5 dB (NS) (Tabela 4) ao ruído branco +5 dB (NS) (Tabela 2), observa-se que o percentual de acertos foi novamente menor no ruído de festa. Esse dado foi observado tanto na relação sinal/ruído igual 0, como em + 5 dB (NS). Não foi possível observar grandes diferenças de tipo de confusão nas duas relações sinal/ruído de um mesmo ruído.

Os resultados das matrizes de confusão de consoantes foram transformados em uma matriz simétrica de distância e, a partir dessa matriz, elaborou-se o mapa perceptivo das consoantes de cada tipo de ruído, em sua relação sinal/ruído. Embora o mapa seja uma representação bidimensional, seus dados foram obtidos considerando-se um espaço de quatro dimensões.

No mapa perceptivo do ruído branco 0 dB (NS) (Figura 1), observa-se uma divisão em três grupos das consoantes (classificadas a partir da geometria de traços), que se encontram em um mesmo plano no mapa perceptivo: 1º) consoantes labiais ([pa], [va] e [fa]); 2º) consoantes coronais anteriores ([ta] e [da]); 3º) consoantes coronais menos anteriores e consoante dorsal ([ʃa], [ʒa] e [ka]).

Figura 1
Mapa perceptivo das consoantes no ruído branco

No ruído branco, na relação sinal/ruído igual a +5 dB (NS), observa-se uma divisão em cinco grupos: 1º) consoantes labiais ([pa], [va] e [fa]); 2º) consoantes coronais anteriores ([ta] e [da]); 3º) consoantes coronais menos anteriores e consoante dorsal ([ʃa], [ʒa] e [ka]); 4º) consoantes vozeadas ([va], [da] e [ʒa]); 5º) consoantes não vozeadas ([fa], [pa], [ta], [ka], [ʃa]).

As consoantes mais próximas no mapa são aquelas que mais se confundem. Houve uma expressiva confusão entre o [pa] e o [fa], que compartilham entre si cinco traços distintivos(3 Mota HB. Aquisição segmental do português: um modelo implicacional de complexidade de traços [tese]. Porto Alegre: Pontifícia Universidade Católica do Rio Grande do Sul; 1996.), a saber: [-soante, -vocoide, -aproximante, -voz, labial].

No ruído branco na relação sinal/ruído igual 0 dB (NS), as consoantes labiais se confundem mais com as consoantes labiais, as coronais se confundem mais com as coronais e as consoantes dorsais se confundem mais com as consoantes dorsais. A +5dB (NS), as confusões acontecem mais entre as consoantes do mesmo grupo, podendo ainda acontecer em relação ao vozeamento (Figura 1).

No ruído de festa, nas relações sinal/ruído igual a 0 dB e a +5 dB (NS), (Figura 2), observa-se no mapa perceptivo uma divisão em quatro grupos, classificados pelos traços distintivos: 1º) consoantes labiais; 2º) consoantes coronais anteriores; 3º) consoantes coronais menos anteriores e consoante dorsal; 4º) pares mínimos quanto ao vozeamento.

Figura 2
Mapa perceptivo das consoantes no ruído festa

Observa-se, no ruído de festa, que o vozeamento não foi uma dimensão que sobressaiu para separar os grandes grupos, ao contrário do que ocorreu nas confusões causadas pelo ruído branco +5 dB. Com isso, não se verificou a hipótese do estudo, de que a confusão de consoantes pode ser explicada pela similaridade fonológica e, assim, não seria afetada pelo tipo de ruído (Figura 2).

Na comparação entre as relações sinal/ruído no ruído branco e no ruído de festa, nota-se um leve afastamento das consoantes na relação sinal/ruído igual a +5 dB (NS), o que representa menor confusão entre as consoantes (Figura 3).

Figura 3
Mapa perceptivo comparativo das consoantes no ruído branco e no ruído festa

Quanto à hipótese de relação entre similaridade fonológica e perceptiva, considerando a geometria de traços, verificou-se confusões entre consoantes que compartilham três, quatro, cinco e seis traços distintivos. Na análise dos sons que se diferenciam apenas por um traço distintivo - com cinco e seis traços compartilhados – (sons mais semelhantes linguisticamente), observa-se maior confusão entre os sons que se diferenciam pelos traços do nó de ponto de consoante (coronal- [t]-[p], [k]-[t], [f]-[ʃ], dorsal- [k]-[p]), seguindo-se do nó laríngeo (vozeamento- [f]-[v], [ʃ]-[ʒ], [d]-[t] e nó de cavidade oral (contínuo- [f]-[p], [ʃ]-[t], [d]-[ʒ]).

A distância média entre pares de consoantes, em função das variáveis “quantidade de traços distintivos”, “tipo de ruído” e “relação sinal ruído” está representada na Figura 4.

Figura 4
Relação entre quantidade de traços, distância média, ruído e relação sinal ruído

Consoantes que compartilham mais traços são perceptivamente menos distantes e a diferença em função da quantidade de traços compartilhados mostrou-se significativa na ANOVA (F2,102=6,23; p=0,0028). No ruído branco, as consoantes mostraram-se mais distantes entre si, do que no ruído de festa, o que mostra que este último produz maior confusão entre as consoantes. Essa diferença também se revelou significativa na ANOVA (F1,102=5,13; p=0,025). Finalmente, não houve diferença em função do nível de ruído, dentro de cada tipo de ruído (F2,102=0,015; p=0,984). Por esse motivo, a análise foi refeita, excluindo-se o fator “nível de ruído”, resultando numa ANOVA com tipo de ruído e quantidade de traços como variáveis independentes e distância perceptiva, como variável dependente. Na nova análise, o tipo de ruído (p=0,024) e a quantidade de traços distintivos (p=0,002) tiveram influência significativa sobre a confusão entre consoantes.

Finalmente, o teste HSD de Tukey (post hoc) mostrou que não houve diferença de distância perceptiva entre os pares de consoantes que compartilham três traços e os pares que compartilham quatro traços (0,0162; p=0,913). São significativas as diferenças de distância perceptiva entre os pares de consoantes que compartilham três traços e os pares que compartilham cinco traços (0,116; p=0,014) e entre os pares de consoantes que compartilham quatro traços e os pares que compartilham cinco traços (0,10; p=0,006).

DISCUSSÃO

No ruído branco, nas relações sinal/ruído igual a 0 e +5 dB (NS) - foram encontradas, em maior número, as seguintes confusões: [f] – [p] (se diferenciam pelo traço contínuo), [ʃ]  - [k] (se diferenciam em nível mais alto na hierarquia de traços pelo traço contínuo, seguido do traço coronal) e [ʃ] - [ʒ] (se diferenciam pelo traço vozeamento) -, observou-se confusões entre consoantes plosivas e fricativas. Tal fato pode ser explicado por estudo(1313  Bell TS, Dirks D, Carterette EC. Interactive factor in consonant confusion patterns. J Acoust Soc Am. 1989;85(1):339-46. http://dx.doi.org/10.1121/1.397685), que relata que o ruído afeta altas frequências, provocando confusões nas consoantes fricativas. No presente estudo, as confusões [p] - [f] e [ʃ] - [k] revelaram também uma diferença de ponto articulatório. A literatura(1414  Alm M, Behne DM, Wang Y, Eg R. Audio-visual indentification of place of articulation and voicing in white and babble noise. J Acoust Soc Am. 2009;126(1):377-87. http://dx.doi.org/10.1121/1.3129508) aponta que a percepção do ponto articulatório é mais prejudicada no ruído branco.

A confusão por vozeamento ocorrida em [ʃ] - [ʒ] difere da literatura, que relata que a percepção do vozeamento e da nasalidade são os traços menos afetados pelo ruído(1515  Miller GA, Nicely PE. An analysis of perceptual confusions among some English consonants. J Acoust Soc Am. 1955;27(2):338-52. http://dx.doi.org/10.1121/1.1907526,1616  Wang MD, Bilger RC. Consonant confusion in noise: a study of perceptual features. J Acoust Soc Am. 1973;54(5):1248-66. http://dx.doi.org/10.1121/1.1914417).

No ruído de festa, nas relações sinal/ruído igual a 0 e +5 dB (NS) - encontradas, em maior número as seguintes confusões: [f] – [p] (que se diferenciam pelo traço contínuo), [v] – [p] (que se diferenciam em nível mais alto na hierarquia de traços pelo vozeamento, seguido do traço contínuo) e [v] – [f] e [t] – [d] (se diferenciam pelo traço de vozeamento) -, percebeu-se que a alta confusão do traço vozeamento no ruído de festa demonstra que o traço vozeamento é mais suscetível a esse tipo de ruído, causando, assim, maior confusão entre consoantes que se diferenciam por este traço(1414  Alm M, Behne DM, Wang Y, Eg R. Audio-visual indentification of place of articulation and voicing in white and babble noise. J Acoust Soc Am. 2009;126(1):377-87. http://dx.doi.org/10.1121/1.3129508,1717  Phatak SA, Allen JB. Consonant and vowel confusions in speech-weighted noise. J Acoust Soc Am. 2007;121(4):2312-26. http://dx.doi.org/10.1121/1.2642397). Contudo, há autores(1818  Woods DL, Yund EW, Herron TJ, Malthew A, Ua Cruadhlaoich. Consonant identification in consonant-vowel-consonant syllables in speech-spectrum noise. J Acoust Soc Am. 2010;127(3):1609-23. http://dx.doi.org/10.1121/1.3293005,1919  Benkí JR. Analysis of English nonsense syllable recognition in noise. Phonetica. 2003;60(2):129-57. http://dx.doi.org/10.1159/000071450), que relatam que o traço vozeamento é menos afetado por esse ruído do que os traços de ponto e modo articulatórios.

Tanto para o ruído branco quanto para o ruído de festa, a confusão encontrada com maior frequência foi entre [f] e [p]. Essas consoantes compartilham cinco traços distintivos. Considerando que o [f] é descrito por seis traços e o [p] também é descrito por seis traços, esse par de confusões compartilha um número grande de traços, diferenciando-se apenas pelo traço [contínuo], uma vez que [f] é [+contínuo] e [p] é [-contínuo]. Apesar de se diferenciarem pelo modo articulatório, acusticamente esses sons apresentam uma transição comum de F2. Alguns estudos(1818  Woods DL, Yund EW, Herron TJ, Malthew A, Ua Cruadhlaoich. Consonant identification in consonant-vowel-consonant syllables in speech-spectrum noise. J Acoust Soc Am. 2010;127(3):1609-23. http://dx.doi.org/10.1121/1.3293005,2020  Li F, Menon A, Allen JB. A psychoacoustic method to find the perceptual cues of stop consonants in natural speech. J Acoust Soc Am. 2010;127(4):2599-610. http://dx.doi.org/10.1121/1.3295689) verificaram grandes confusões entre [va] e [ba], que, assim como a confusão observada neste estudo ([fa] e [pa]), diferenciam-se por apenas um traço distintivo (contínuo)(3 Mota HB. Aquisição segmental do português: um modelo implicacional de complexidade de traços [tese]. Porto Alegre: Pontifícia Universidade Católica do Rio Grande do Sul; 1996.). A evidência de confusão do som [f] foi encontrada em pesquisas internacionais(1717  Phatak SA, Allen JB. Consonant and vowel confusions in speech-weighted noise. J Acoust Soc Am. 2007;121(4):2312-26. http://dx.doi.org/10.1121/1.2642397,2121  Phatak SA, Yoon Y, Gooler DM, Allen JB. Consonant recognition loss in hearing impaired listeners. J Acoust Soc Am. 2009;126(5):2683-94. http://dx.doi.org/10.1121/1.3238257,2222  Dubno JR, Levitt H. Prediciting consonant confusions from acoustic analysis. J Acoust Soc Am. 1981;69(1):249-61. http://dx.doi.org/10.1121/1.385345), em que [f] aparece dentre as consoantes mais confusas dos estudos, na exposição ao ruído.

Os sons menos confusos, tanto no ruído branco quanto no ruído festa, nas duas relações sinal/ruído, foram [k] e [ʒ]. Dados da literatura(1717  Phatak SA, Allen JB. Consonant and vowel confusions in speech-weighted noise. J Acoust Soc Am. 2007;121(4):2312-26. http://dx.doi.org/10.1121/1.2642397,2121  Phatak SA, Yoon Y, Gooler DM, Allen JB. Consonant recognition loss in hearing impaired listeners. J Acoust Soc Am. 2009;126(5):2683-94. http://dx.doi.org/10.1121/1.3238257) apontaram que esses sons apresentaram melhores escores de reconhecimento quando comparados a outros na exposição ao ruído.

Observou-se um padrão diferente de confusão em relação aos ruídos branco e de festa, em que o percentual de erros na maioria dos casos foi maior no ruído festa. Esse dado foi observado para as duas relações sinal/ruído igual (0 e +5 dB (NS)). Em estudo nacional(2323  Caporali AS, Silva JA. Reconhecimento de fala no ruído em jovens e idosos com perda auditiva. Rev Bras Otorrinolaring. 2004;70(4):525-32. http://dx.doi.org/10.1590/S0034-72992004000400014), ficou evidenciada maior dificuldade de reconhecimento de fala na presença de ruído de festa. Além disso, um estudo internacional(1717  Phatak SA, Allen JB. Consonant and vowel confusions in speech-weighted noise. J Acoust Soc Am. 2007;121(4):2312-26. http://dx.doi.org/10.1121/1.2642397), observou que o ruído de festa mascara diferentemente as consoantes, afetando mais o reconhecimento, enquanto o ruído branco mascara uniformemente as consoantes. Contudo, há pesquisadores(1414  Alm M, Behne DM, Wang Y, Eg R. Audio-visual indentification of place of articulation and voicing in white and babble noise. J Acoust Soc Am. 2009;126(1):377-87. http://dx.doi.org/10.1121/1.3129508) que consideram que há piores respostas no reconhecimento, principalmente do ponto articulatório, no ruído branco.

Essa diferença no reconhecimento das consoantes em relação aos tipos de ruído, pode ser explicada pela característica acústica de cada ruído. Pode-se inferir que a maior dificuldade de percepção no ruído de festa deve ser relacionada à necessidade de maior refinamento das habilidades auditivas, em que o sujeito deveria esquecer o que estava sendo ouvido no ruído, para prestar atenção somente às sílabas a serem ouvidas(2424  Pereira LD. Sistema auditivo e desenvolvimento das habilidades auditivas. In: Ferreira LP, Befi-Lopes DM, Limongi SCO, editores. Tratado de fonoaudiologia. São Paulo: Roca; 2005. p.547-552.). Como foram incluídos na amostra apenas sujeitos com resultados dentro dos padrões indicativos de normalidade, ou seja, com todas as características necessárias para perceber as diferenças experimentais entre as consoantes, os resultados não podem ser devidos a efeitos sistemáticos no nível da audição, seja periférica ou central.

Quanto à relação sinal/ruído, observou-se menor confusão na relação sinal/ ruído igual a +5 dB, em comparação a 0 dB (NS), mas essa diferença não foi significativa. Os estudos compilados(1414  Alm M, Behne DM, Wang Y, Eg R. Audio-visual indentification of place of articulation and voicing in white and babble noise. J Acoust Soc Am. 2009;126(1):377-87. http://dx.doi.org/10.1121/1.3129508,1919  Benkí JR. Analysis of English nonsense syllable recognition in noise. Phonetica. 2003;60(2):129-57. http://dx.doi.org/10.1159/000071450,2525  Li N, Loizou PC. Factors influencing intelligibility of ideal binary-masked speech: implications for noise reduction. J Acoust Soc Am. 2008;123(3):1673-82. http://dx.doi.org/10.1121/1.2832617) relatam que, à medida que a relação sinal ruído fica positiva, maiores são os escores de acertos na percepção das consoantes. Entretanto, a diferença de apenas 5 dB não foi, neste estudo, suficiente para provocar uma diferença significativa nos escores.

Na construção do mapa perceptivo, utilizou-se da distância entre todas as consoantes. Tanto para o ruído branco, quanto para o ruído de festa foi possível organizar as consoantes em diferentes grupos, levando em consideração os traços distintivos comuns das consoantes próximas no mesmo plano do mapa perceptivo. Essa análise por agrupamento das consoantes por quantidade de acertos e erros é muito utilizada na literatura(1717  Phatak SA, Allen JB. Consonant and vowel confusions in speech-weighted noise. J Acoust Soc Am. 2007;121(4):2312-26. http://dx.doi.org/10.1121/1.2642397,1818  Woods DL, Yund EW, Herron TJ, Malthew A, Ua Cruadhlaoich. Consonant identification in consonant-vowel-consonant syllables in speech-spectrum noise. J Acoust Soc Am. 2010;127(3):1609-23. http://dx.doi.org/10.1121/1.3293005,2020  Li F, Menon A, Allen JB. A psychoacoustic method to find the perceptual cues of stop consonants in natural speech. J Acoust Soc Am. 2010;127(4):2599-610. http://dx.doi.org/10.1121/1.3295689,2121  Phatak SA, Yoon Y, Gooler DM, Allen JB. Consonant recognition loss in hearing impaired listeners. J Acoust Soc Am. 2009;126(5):2683-94. http://dx.doi.org/10.1121/1.3238257,2626  Soli SD, Arabie P, Carroll JD. Discrete representation of perceptual structure underlying consonant confusion. J Acoust Soc Am. 1986;79(3):826-37. http://dx.doi.org/10.1121/1.393473,2727  Van Tasell DJ, Soli SD, Kirby VM, Windin GP. Speech waveform envelope cues for consonant recognition. J Acoust Soc Am. 1987;82(4):1152-61. http://dx.doi.org/10.1121/1.395251). Os diferentes agrupamentos em função do tipo de ruído podem ser explicados pelo efeito de cada um em momentos diferentes do processamento auditivo, com o ruído branco mascarando todas as frequências, em um nível periférico e o ruído de festa afetando diferentes frequências, em um nível mais central do sistema auditivo.

É difícil de explicar, a partir da geometria de traços(7 Paula A, Oliveira JÁ, Godoy NM, Canovas MBA. Discriminação de monossílabos em ambiente silencioso e ambiente ruidoso. Braz J Otorhinolaryngol. 2000;66(5):426-31.), a diferença observada no desempenho dos sujeitos em relação aos tipos de ruído, pois a teoria considera o comportamento dos sons para a organização hierárquica dos traços como universal, seja qual for o meio em que estejam inseridos. Ou seja, independentemente do tipo de ruído, esperaria-se um mesmo comportamento nas respostas. Uma possível explicação para isso é que a organização hierárquica em traços, como é de ordem fonológica, não é afetada por características acústicas do ruído, sendo a confusão de consoantes e a hierarquia fonológica de diferentes ordens. Assim, não se poderia inferir uma da outra.

Quanto aos traços distintivos, observou-se que, quanto mais traços distintivos as consoantes compartilham, menor a distância entre os sons e mais confusos eles são. Considerando os sons que se diferenciam apenas por um traço distintivo (com cinco e seis traços compartilhados), observa-se maior confusão dos traços do nó de ponto de consoante (coronal: [t]-[p], [k]-[t], [f]-[ʃ], dorsal: [k]-[p]), seguidas do nó laríngeo (vozeamento: [f]-[v], [ʃ]-[ʒ], [d]-[t] e nó de cavidade oral (contínuo: [f]-[p], [ʃ]-[t], [d]-[ʒ]). Quanto aos sons que se diferenciam por dois traços, observou-se, ainda, que a confusão afetando o nó de cavidade oral também tende a afetar o nó de ponto de consoante, mais baixo na hierarquia. Esses dados confirmam as seguintes previsões da geometria de traços(7 Paula A, Oliveira JÁ, Godoy NM, Canovas MBA. Discriminação de monossílabos em ambiente silencioso e ambiente ruidoso. Braz J Otorhinolaryngol. 2000;66(5):426-31.): a) Um maior número de confusões ocorre na parte inferior da árvore da hierarquia de traços, no Nó de Ponto de Consoante; b) Quanto mais traços distintivos as consoantes compartilham, mais confusos eles são. Estas são as consequências observáveis de um nível fonológico mais abstrato, sobre a confusão de consoantes, cujo padrão pareceu ser mais determinado pela natureza acústica dos sons avaliados.

Este estudo demonstrou a importância de se estudar a percepção das consoantes, a fim de se compreender melhor os aspectos acústicos, auditivos e linguísticos que interferem diretamente na comunicação eficiente do dia a dia. O estudo reforçou a teoria de interferência dos ruídos na percepção auditiva e a importância de se ter um processamento auditivo adequado, para melhor percepção das consoantes. Os dados da percepção auditiva trazem informações que podem ser úteis na reabilitação fonoaudiológica de processos fonéticos e fonológicos da fala e percepção auditiva, em portadores de perda auditiva, e alterações do processamento auditivo, dentre outros. Revelou, também, que os aspectos acústicos da consoante interferem com mais peso na percepção auditiva do que os aspectos fonológicos, tal como proposto na geometria de traços. Além disso, trouxe uma associação da percepção de consoantes do português, no ruído associado aos traços distintivos, em indivíduos com audição normal. Essa associação no português mostrou-se escassa durante a revisão bibliográfica, em que a maioria dos estudos é de outras línguas e com outras análises fonológicas.

Como limitações do estudo, destacam-se a amostra não probabilística e o seu tamanho, a não utilização de todas as consoantes do português para uma compreensão de todo o espectro dos sons e a não separação das orelhas durante o teste, uma vez que foi realizado em escuta diótica e assim não se pôde comparar as duas orelhas, para verificar a existência de diferenças importantes.

CONCLUSÃO

O ruído branco e o ruído de festa afetam diretamente a percepção das consoantes, mas de forma diferente, encontrando-se maior número de erros da percepção das consoantes no ruído de festa.

A geometria de traços não explica totalmente as confusões entre consoantes nos diferentes ruídos, que parecem ter mais influência dos aspectos acústicos. Entretanto, em alguns pares de consoantes, verifica-se a previsão de que, quanto mais traços distintivos os pares de consoantes compartilham mais confusos eles são, bem como a de que o maior número de confusões ocorre na parte inferior da árvore na hierarquia de traços, no nó de ponto de consoante.

REFERÊNCIAS

  • 1
    Clements GN. Feature organization. In: Brown K, editor. The Encyclopedia of Language and Linguistics. 2a ed. Oxford: Elsevier; 2006. p. 433-40.
  • 2
    Clements GN, Hume E. The internal organization of speech sounds. In: Goldsmith J, editor. Handbook of phonological theory. Oxford: Blackwell; 1995. p. 245-306.
  • 3
    Mota HB. Aquisição segmental do português: um modelo implicacional de complexidade de traços [tese]. Porto Alegre: Pontifícia Universidade Católica do Rio Grande do Sul; 1996.
  • 4
    Markham D, Hazan V. The effect of talker- and listener-related factors on intelligibility for a real-word, open-set perception test. J Speech Lang Hear Res. 2004;47(4):725-37. http://dx.doi.org/10.1044/1092-4388(2004/055)
  • 5
    Davies MG, Yellon L, Purdy SC. Speech-in-noise perception of children using cochlear implants and FM systems. Aust N Z J Audiol. 2001;23(1):52-62. http://dx.doi.org/10.1375/audi.23.1.52.31096
  • 6
    Fallon M, Trehub SE, Schneider BA. Children’s perception of speech in multitalker babble. J Acoust Soc Am. 2000;108(6):3023-9. http://dx.doi.org/10.1121/1.1323233
  • 7
    Paula A, Oliveira JÁ, Godoy NM, Canovas MBA. Discriminação de monossílabos em ambiente silencioso e ambiente ruidoso. Braz J Otorhinolaryngol. 2000;66(5):426-31.
  • 8
    Lloyd LL, Kaplan H. Audiometric interpretation: a manual of basic audiometry. Baltimore: University Park; 1978.
  • 9
    Jerger J. Clinical experience with impedance audiometry. Arch Otolaryngol. 1970;92(4):311-24.
  • 10
    Pereira LD, Schochat E. Processamento auditivo central: manual de avaliação. São Paulo: Lovise; 1997.
  • 11
    Noruésis MJ. SPSS advanced statistics 6.1. 3a ed. Chicago: SPSS; 1994.
  • 12
    Leeuw J, Mair P. Multidimensional scaling using majorization: SMACOF in R. J Stat Softw. 2009;31(3):1-30.
  • 13
    Bell TS, Dirks D, Carterette EC. Interactive factor in consonant confusion patterns. J Acoust Soc Am. 1989;85(1):339-46. http://dx.doi.org/10.1121/1.397685
  • 14
    Alm M, Behne DM, Wang Y, Eg R. Audio-visual indentification of place of articulation and voicing in white and babble noise. J Acoust Soc Am. 2009;126(1):377-87. http://dx.doi.org/10.1121/1.3129508
  • 15
    Miller GA, Nicely PE. An analysis of perceptual confusions among some English consonants. J Acoust Soc Am. 1955;27(2):338-52. http://dx.doi.org/10.1121/1.1907526
  • 16
    Wang MD, Bilger RC. Consonant confusion in noise: a study of perceptual features. J Acoust Soc Am. 1973;54(5):1248-66. http://dx.doi.org/10.1121/1.1914417
  • 17
    Phatak SA, Allen JB. Consonant and vowel confusions in speech-weighted noise. J Acoust Soc Am. 2007;121(4):2312-26. http://dx.doi.org/10.1121/1.2642397
  • 18
    Woods DL, Yund EW, Herron TJ, Malthew A, Ua Cruadhlaoich. Consonant identification in consonant-vowel-consonant syllables in speech-spectrum noise. J Acoust Soc Am. 2010;127(3):1609-23. http://dx.doi.org/10.1121/1.3293005
  • 19
    Benkí JR. Analysis of English nonsense syllable recognition in noise. Phonetica. 2003;60(2):129-57. http://dx.doi.org/10.1159/000071450
  • 20
    Li F, Menon A, Allen JB. A psychoacoustic method to find the perceptual cues of stop consonants in natural speech. J Acoust Soc Am. 2010;127(4):2599-610. http://dx.doi.org/10.1121/1.3295689
  • 21
    Phatak SA, Yoon Y, Gooler DM, Allen JB. Consonant recognition loss in hearing impaired listeners. J Acoust Soc Am. 2009;126(5):2683-94. http://dx.doi.org/10.1121/1.3238257
  • 22
    Dubno JR, Levitt H. Prediciting consonant confusions from acoustic analysis. J Acoust Soc Am. 1981;69(1):249-61. http://dx.doi.org/10.1121/1.385345
  • 23
    Caporali AS, Silva JA. Reconhecimento de fala no ruído em jovens e idosos com perda auditiva. Rev Bras Otorrinolaring. 2004;70(4):525-32. http://dx.doi.org/10.1590/S0034-72992004000400014
  • 24
    Pereira LD. Sistema auditivo e desenvolvimento das habilidades auditivas. In: Ferreira LP, Befi-Lopes DM, Limongi SCO, editores. Tratado de fonoaudiologia. São Paulo: Roca; 2005. p.547-552.
  • 25
    Li N, Loizou PC. Factors influencing intelligibility of ideal binary-masked speech: implications for noise reduction. J Acoust Soc Am. 2008;123(3):1673-82. http://dx.doi.org/10.1121/1.2832617
  • 26
    Soli SD, Arabie P, Carroll JD. Discrete representation of perceptual structure underlying consonant confusion. J Acoust Soc Am. 1986;79(3):826-37. http://dx.doi.org/10.1121/1.393473
  • 27
    Van Tasell DJ, Soli SD, Kirby VM, Windin GP. Speech waveform envelope cues for consonant recognition. J Acoust Soc Am. 1987;82(4):1152-61. http://dx.doi.org/10.1121/1.395251
  • Trabalho realizado no Programa de Pós Graduação (Mestrado) em Estudos Linguísticos, Faculdade de Letras, Universidade Federal de Minas Gerais – UFMG – Belo Horizonte, Minas Gerais (MG), Brasil.

Datas de Publicação

  • Publicação nesta coleção
    Abr 2014

Histórico

  • Recebido
    20 Ago 2013
  • Aceito
    9 Abr 2014
Academia Brasileira de Audiologia Rua Itapeva, 202, conjunto 61, CEP 01332-000, Tel.: (11) 3253-8711, Fax: (11) 3253-8473 - São Paulo - SP - Brazil
E-mail: revista@audiologiabrasil.org.br