SciELO - Scientific Electronic Library Online

 
vol.61 issue1EMBODIED INTERACTION: MULTIMODALITY, BODY AND COGNITION IN THE ANALYSIS OF CONVERSATIONS INVOLVING INDIVIDUALS WITH ALZHEIMER’SA METHODOLOGY FOR THE ELABORATION OF A PORTUGUESE ANALOGICAL DICTIONARY author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

Share


Alfa: Revista de Linguística (São José do Rio Preto)

Print version ISSN 0002-5216On-line version ISSN 1981-5794

Alfa, rev. linguíst. (São José Rio Preto) vol.61 no.1 São Paulo Jan./Mar. 2017

https://doi.org/10.1590/1981-5794-1704-4 

ARTIGOS ORIGINAIS

DESEMPENHO PERCEPTIVO-AUDITIVO DE CRIANÇAS NA IDENTIFICAÇÃO DE CONTRASTES FÔNICOS

Larissa Cristina BERTI* 

*UNESP – Universidade Estadual Paulista. Faculdade de Filosofia e Ciências – Departamento de Fonoaudiologia. Marília – SP – Brasil. 17525-900 – berti.larissa@gmail.com


RESUMO

O objetivo deste estudo foi investigar o desempenho perceptivo-auditivo de crianças na tarefa de identificação de contrastes fônicos do Português Brasileiro (doravante PB). A hipótese foi a de que a aquisição perceptivo-auditiva se desenvolve maneira gradual, obedecendo a uma ordem sistemática de aquisição. Quatro tarefas de identificação, usando o instrumento PerceFAL, foram realizadas com 66 crianças (de ambos os gêneros), entre 4- 5 anos de idade. A tarefa consistiu na apresentação do estímulo acústico, por meio de fones de ouvido, e na escolha da gravura correspondente à palavra apresentada, dentre duas possibilidades de gravuras dispostas na tela do computador. O tempo de apresentação do estímulo e o tempo de reação das crianças foram computados automaticamente pelo software PERCEVAL. O desempenho perceptivo-auditivo de crianças ocorreu de modo gradual e é dependente da classe fônica. A maior acurácia na identificação dos contrastes fônicos parece obedecer a seguinte ordem: vogais, sonorantes, oclusivas e fricativas. O tempo de reação das respostas corretas foi menor do que das respostas incorretas (exceto para a classe das vogais). A partir dos mapas perceptuais, pode-se verificar que, no interior da classe das vogais, o parâmetro ântero-posterior parece exercer um importante papel na saliência perceptual. Para a classe das obstruintes e sonorantes (nasais e líquidas), as pistas acústicas que marcam o vozeamento (no caso das obstruentes) e o modo de articulação (no caso das sonorantes) são mais robustas perceptualmente do que as pistas de ponto de articulação. Embora a percepção da fala não deva ser reduzida a uma mera interpretação sensorial, as pistas acústicas dos segmentos da fala exercem uma importante influência para a sua categorização.

Palavras-Chave: Percepção de fala; Aquisição da linguagem; Fonética acústica; Português brasileiro

ABSTRACT

This study aimed at investigating children’s perceptual auditory performance in identifying phonemic contrast in Brazilian Portuguese (henceforth BP). The hypothesis is that the perceptual auditory acquisition develops in a gradual fashion, following a systematic acquisition order. We performed four identification tasks using the instrument PerceFAL with 66 children (of both genders) between 4-5 years old. The task relied on the presentation of an acoustic stimulus, through earphones, and the choice of an image corresponding to the word shown, having two image possibilities available on the computer screen. We compared both the stimulus length of time and reaction time of children automatically through the aid of the software PERCEVAL. The children’s perceptual auditory performance occurred gradually and depended on the phonemic class. A greater accuracy regarding the phonemic contrast identification seems to follow the sequence: vowels, sonorants, stops e fricatives. The reaction time for the correct answers was shorter than that of the incorrect answers (except for the vowel class). From the perceptual maps, we verified that, within the vowel class, the anterior-posterior parameter plays an important role in perceptual salience. For the obstruents and sonorants (nasal and liquid), the acoustic cues that characterize voicing (in the case of obstruents) and the articulation mode (in the case of sonorants) are perceptually more robust than the cues from the point of articulation. Although speech perception should not be reduced to a mere sensory interpretation, the acoustic cues of speech segments exert influence on their categorization.

Key words: Speech perception; Language Acquisition; Acoustic Phonetic; Brazilian Portuguese

Introdução

Durante o processo de aquisição fonético-fonológica de uma língua, pesquisadores comumente destacam o importante papel, não exclusivo, desempenhado pelas habilidades articulatórias e auditivas da criança, além da conexão sensório-motora que subjaz esse processo (MUNSON et al., 2005; GATHERCOLE, 2006; HARDCASTLE et al., 2010; PANNETON; NEWMAN, 2011; como referências de estudos mais recentes).

Destaca-se, entretanto, que no contexto nacional os estudos desenvolvidos na área de aquisição fônica têm se voltado, fundamentalmente, para a investigação da produção de fala, ou seja, quando e de que modo as crianças atingem a produção alvo de sua língua (LAMPRECHT et al., 2004).

Não há, até onde nosso levantamento bibliográfico preliminar nos possibilitou chegar, estudos que discorram o processo de aquisição de contrastes fonológicos do ponto de vista da percepção.

Diferentemente, na literatura internacional, há registros de pesquisas sobre o domínio de contrastes fônicos por parte de crianças, sobretudo no tocante às habilidades de discriminação e identificação de tais contrastes desde o final da década de 1940, com um grande impulso nas décadas de 1970 e 1980.

Entendemos aqui, de acordo com Hazan e Barret (2000), que a tarefa de discriminação avalia a habilidade para perceber uma diferença entre dois sons, em que não é exigida do ouvinte a categorização dos sons em questão. Isto é, a comparação entre os sons é feita in praesentia.

No que diz respeito ao desenvolvimento perceptivo-auditivo de crianças, já está bem estabelecido na literatura internacional que recém-nascidos de apenas um mês de vida são capazes de discriminar não somente contrastes fônicos de sua língua nativa, como também contrastes fônicos de outras línguas (EIMAS et al., 1971; STREETER, 1976; TREHUB, 1976; EILERS; GAVIN; OLLER, 1982; MEHLER, 1985, para uma revisão mais detalhada).

Igualmente, também já está bem estabelecido na literatura que a habilidade das crianças em discriminar contrastes não nativos diminui rapidamente na primeira infância, em função de sua experiência linguística, concomitante ao aumento da acurácia na discriminação dos contrastes fônicos de sua língua (WERKER; POLKA, 1993, para uma revisão dos estudos que estabelecem esta observação). Ou seja, a capacidade de discriminação fônica das crianças degrada gradualmente na seguinte direção: discriminação de contrastes fônicos potenciais (tanto não nativos, quanto nativos) para a discriminação dos contrastes de sua língua nativa.

Em uma série de estudos, Werker e colaboradores (WERKER et al., 1981; WERKER; TEES, 1984a, b; WERKER; LALONDE, 1988; BEST; McROBERTS, 1989; BEST, 1994) demonstraram que o declínio da habilidade em discriminar contrastes não nativos ocorre durante o primeiro ano de vida da criança.

O que é particularmente fascinante nos resultados descritos nos estudos citados é que o declínio na capacidade perceptiva não parece ocorrer de maneira uniforme para todos os contrastes não nativos. Ou seja, os resultados experimentais indicam que a perda da sensibilidade para determinados contrastes ocorre antes da perda para outros contrastes. Este resultado possibilita-nos hipotetizar que o declínio de desempenho perceptivo-auditivo é gradual e ocorre em uma ordem sistemática.

Como possibilidades explicativas para essa degradação na discriminação dos contrastes fônicos não nativos, autores como Best e McRoberts (1989), Best (1993), Best (1994), além de Werker e Tees (2002), têm sugerido que esse declínio pode estar refletindo o primeiro estágio da aquisição fonológica das crianças, embora não haja menção específica, por parte desses autores, sobre qual aspecto da fonologia em desenvolvimento poderia ser responsável por essa mudança no domínio perceptivo-auditivo.

Entretanto, do ponto de vista perceptivo-auditivo, para adquirir a fonologia de uma língua, a criança não somente deverá aprender a discriminar os padrões sonoros de sua língua, como também organizar, consistentemente, esses padrões sonoros em suas categorias fônicas apropriadas (HAZAN; BARRET, 2000). Esta última habilidade é referida na literatura de percepção de fala como sendo “categorização fônica”ou “identificação fônica”, em que se exige do ouvinte a categorização dos sons, isto é, a comparação é feita in absentia1.

Quanto ao desenvolvimento da habilidade de identificação, pesquisadores têm demonstrado experimentalmente que a habilidade de crianças para identificar (ou categorizar) contrastes fonológicos de sua língua nativa se desenvolve não somente de maneira gradual, como também obedece a uma ordem sistemática de aquisição (SHVACHKIN, 1948; GARNICA, 1973; EDWARDS, 1974; BARTON, 1980; BROWN; MATTHEWS, 1993, 1997).

Em um estudo clássico, por exemplo, Shvachkin (1948) constatou que o desempenho de crianças falantes do russo para identificar determinados contrastes tende a ser melhor que outros, propondo, desse modo, uma ordem de aquisição perceptivo-auditiva, similar àquela descrita por Jakobson (1968)2 no tocante à produção de fala. De acordo com aquele autor, as crianças passariam por dois grandes períodos no desenvolvimento perceptivo-auditivo: no primeiro ocorreria a distinção entre as vogais (discriminação e identificação) e no segundo, entre as consoantes. No segundo período, por sua vez, foi previsto o desenvolvimento de 11 estágios distintos, a saber: (1) distinção entre a presença x ausência de consoantes (ex: /ok/ x /bok/); (2) distinção entre sonorantes e o que o autor chamou de obstruintes articuladas (ex: /m/ x /b/); (3) distinção entre consoantes palatalizadas x não palatalizadas; (4) distinção entre as sonorantes (nasais x líquidas); (5) distinção entre sonorantes e o que o autor designou de obstruintes não articuladas (ex: /l/ x /x/); (6) distinção entre labiais e linguais; (7) distinção entre oclusivas e fricativas; (8) distinção entre coronais e dorsais; (9) distinção entre vozeadas e não vozeadas; (10) distinção entre sibilantes estridentes e não estridentes e, finalmente, (11) distinção entre as líquidas.

Estudos posteriores (EDWARDS, 1974; BARTON, 1980; BROWN; MATHEWS, 1993; HAZAN; BARRET, 2000; PARTER et al., 2004) têm sistematicamente reforçado três grandes tendências para a aquisição fônica, do ponto de vista perceptivo-auditivo, a saber: (a) crianças aos sete anos de idade não completaram o processo de percepção de contrastes fônicos; (b) a percepção fônica desenvolve-se gradualmente, geralmente com o avanço da produção; (c) a ordem de aquisição perceptiva tende para uma uniformidade entre as línguas do mundo, mas não é universal, ou seja, grandes tendências de diferenciações são comuns entre as línguas (como a distinção entre consoantes vs vogais, oral vs nasal), mas há divergências quanto ao surgimento das distinções entre labial vs dental vs dorsal ou mesmo entre oclusiva vs fricativas vs africadas.

Contudo, na medida em que as habilidades de discriminação e identificação fônica têm um papel bastante importante no processo de aquisição fônica, torna-se fundamental compreender como essas habilidades se modificam e se desenvolvem durante esse percurso.

Desse modo, o objetivo do presente estudo é o de investigar o desempenho perceptivo-auditivo de crianças na identificação de contrastes fônicos do PB. Especificamente, verificar-se-á: se uma determinada classe fônica apresenta maior ou menor dificuldade de identificação; e, no interior de cada classe, a similaridade/dissimilaridade entre os fonemas, propondo mapas perceptuais em função de cada classe fônica.

Baseando-se nos estudos existentes na literatura internacional, a hipótese que se pretende corroborar é a de que a aquisição perceptivo-auditiva se desenvolve de maneira gradual, de modo a obedecer a uma ordem sistemática de aquisição.

Esperam-se ganhos científicos tanto para o campo da Linguística quanto para o campo da Fonoaudiologia, tais como: (a) contribuição para a compreensão da aquisição e desenvolvimento da percepção auditiva em crianças com desenvolvimento típico de linguagem; (2) fornecimento de informações sobre a percepção auditiva dos contrastes fonológicos do PB; (3) contribuição para o estudo da relação entre produção e percepção da fala.

Método

Participantes

O estudo teve aprovação do Comitê de Ética em Pesquisa (CEP) da Universidade Estadual Paulista (UNESP/Marília), sob o protocolo de número 132/2010.

Foram coletados dados de 140 crianças entre 4 e 8 anos de idade. Os critérios de inclusão para a seleção da amostra foram: desenvolvimento típico de linguagem e ausência de alterações otológicas e/ou auditivas, confirmada por uma triagem auditiva prévia; enquanto o critério de exclusão foi a participação de cada criança nos quatro experimentos de identificação realizados.

Ao final, a amostra foi constituída por 66 crianças, de ambos os gêneros, entre 4 – 5 anos de idade. As crianças foram recrutadas de uma escola municipal de Educação Infantil da cidade de Marília-SP. Os responsáveis por todas as crianças incluídas na pesquisa permitiram, por escrito, sua participação a partir dos esclarecimentos contidos no Termo de Consentimento Livre e Esclarecido que lhes foi apresentado.

Material

Utilizou-se o instrumento de identificação de contrastes fônicos – PerceFAL (BERTI, 2011) e o software PERCEVAL (Perception Evaluation Auditive & Visuelle) (ANDRÉ et al., 2009).

O PerceFAL é composto por um subconjunto de quatro experimentos: (a) PerceVog (que avalia a identificação entre vogais tônicas); (b) PerceOcl (que avalia a identificação entre oclusivas); (c) PerceFric (que avalia a identificação entre fricativas); (d) PerceSon (que avalia a identificação entre sonorantes).

Nesse instrumento estão envolvidas, preferencialmente, palavras dissilábicas paroxítonas, familiares às crianças, contendo os 19 fonemas consonantais do PB na posição acentuada.

A seleção das palavras foi realizada de acordo com os seguintes critérios: (1) contrastarem as seis oclusivas do PB, de modo a comporem pares mínimos de palavras; (2) serem passíveis de representação por meio de gravuras; (3) pertencerem ao vocabulário infantil; (4) pertencerem ao rol de palavras elencadas num estudo prévio (MOTA, 2001).

No PerceVog, avalia-se a identificação de vogais tônicas a partir de um conjunto de 42 pares contrastivos (por análise combinatória: 7 vogais tônicas x 6 outras vogais distintivas); no PerceOcl, avalia-se a identificação entre os fonemas oclusivos, a partir de 30 pares mínimos (6 oclusivas x 5); no PerceFric, avalia-se a identificação entre as fricativas, considerando 30 pares contrastivos (6 fricativas x 5) e; finalmente, no PerceSon, avalia-se a identificação entre as sonorantes, a partir de 42 pares contrastivos (7 sonorantes (3 nasais e 4 líquidas) x 6).

Os Quadros (de 1 a 4), a seguir, apresentam os pares contrastivos selecionados para compor cada experimento proposto.

Quadro 1 – Pares mínimos de palavras envolvendo as vogais tônicas do PerceVog 

Contraste entre as vogais Pares Mínimos
/i/ - /e/ bico–beco
/i/ - /Ɛ/ vila–vela
/i/ - /a/ pipa–papa
/i/ - /ɔ/ chique–choque
/i/ - /o/ figo–fogo
/i/ - /u/ lixo–luxo
/e/ - /Ɛ/ feira–fera
/e/ - /a/ pera–para
/e/ - /ɔ/ feira–fora
/e/ - /o/ seco–soco
/e/ - /u/ seco–suco
/Ɛ/ - /a/ berro–barro
/Ɛ/ - /ɔ/ cheque–choque
/Ɛ/ - /o/ beca–boca
/Ɛ/ - /u/ fera–fura
/a/ - /ɔ/ bala–bola
/a/ - /o/ saco–soco
/a/ - /u/ lava–luva
/ɔ/ - /o/ toca–touca
/ɔ/ - /u/ coca–cuca
/o/ - /u/ soco–suco

Fonte: elaboração própria.

Quadro 2 – Pares mínimos de palavras envolvendo as oclusivas do PerceOcl 

Contraste entre as oclusivas Pares mínimos
/b/ x /t/ berço-terço
/b/ x /k/ bola-cola
/g/ x /b/ gola-bola
/b/ x /p/ bote-pote
/b/ x /d/ bucha-ducha
/d/ x /g/ danço-ganso
/g/ x /t/ guerra-terra
/p/ x /g/ pato-gato
/p/ x /d/ pente-dente
/p/ x /k/ porta-corta
/t/ x /d/ tia-dia
/t/ x /p/ torta-porta
/k/ x /g/ cola-gola
/k/ x /t/ couro-touro
/d/ x /f/ fada-faca

Fonte: elaboração própria.

Quadro 3 – Pares mínimos de palavras envolvendo as fricativas do PerceFric 

Contrastes entre as Fricativas Pares Mínimos
/f/-/v/ faca-vaca
/f/-/s/ fanta-santa
/f/-/z/ forro- zorro
/f/-/ᶴ/ fora-chora
/f/-/ʒ/ faca-jaca
/v/-/s/ vela-sela
/v/-/z/ cavar-casar
/v/-/ʃ/ veia-cheia
/v/-/ʒ/ vaca-jaca
/s/-/z/ caçar-casar
/s/-/ʃ/ sapa-chapa
/s/-/ʒ/ selo-gelo
/z/-/ʃ/ rosa-rocha
/z/-/ʒ/ zangada-jangada
/ʃ/-/ʒ/ xis-giz

Fonte: elaboração própria.

Quadro 4 – Pares mínimos de palavras envolvendo as sonorantes do PerceSon 

Contrastes entre as Sonorantes Pares Mínimos
/m/-/n/ mata-nata
/m/-/ɲ/ uma-unha
/m/-/l/ mata-lata
/m/-/ʎ/ comer-colher
/m/-/r/ fumo-furo
/m/-/R/ mata-rata
/n/-/ɲ/ sono-sonho
/n/-/l/ nata-lata
/n/-/ʎ/ fina-filha
/n/-/r/ caneta-careta
/n/-/R/ nata-rata
/ɲ/-/l/ punho-pulo
/ɲ/-/ʎ/ pinha-pilha
/ɲ/-/r/ sonho-soro
/ɲ/-/R/ unha-urra
/l/-/ʎ/ vela-velha
/l/-/r/ pulo-puro
/l/-/R/ lata-rata
/ʎ/-/r/ alho-aro
/ʎ/-/R/ colher-correr
/r/-/R/ caro-carro

Fonte: elaboração própria.

Para a realização do teste de identificação, o PerceFAL contém: estímulos auditivos, correspondentes a arquivos de gravações em áudio de todas as palavras por um falante adulto típico; estímulos visuais, gravuras representativas de cada palavra; além de scripts3 para execução do experimento de identificação no software PERCEVAL.

Procedimento experimental

O procedimento experimental de percepção consistiu em um teste de identificação (também designada de tarefa de escolha forçada). O referido teste é composto por três etapas distintas: reconhecimento das palavras do experimento, fase treino e fase teste.

A etapa de reconhecimento consiste na apresentação dos inputs visual e auditivo às crianças a fim de averiguar o conhecimento (ou não) das mesmas em relação às palavras e/ou figuras utilizadas no experimento, uma vez que há palavras no instrumento cujas gravuras são fáceis (pato, gato, etc.), mas outras que podem suscitar dúvidas (como em unha, gola, etc.). Após a familiarização das crianças com os inputs do experimento, realiza-se uma sondagem, ou seja, uma verificação do conhecimento das palavras pelas crianças. Adota-se um critério de 80% de acerto para que as crianças sejam conduzidas à fase treino e ao teste perceptual propriamente dito.

A fase treino é realizada automaticamente pelo software com o intuito de garantir a compreensão da tarefa pelos participantes. Essa fase consiste na própria tarefa de identificação perceptual, mas os resultados obtidos não são computados. São aleatorizados os estímulos do experimento e selecionadas dez apresentações. Logo após, inicia-se a fase teste propriamente dita.

Para a tarefa de identificação, as crianças foram dispostas confortavelmente em frente à tela do computador (contendo o software PERCEVAL) com fones KOSS acoplados aos seus ouvidos, no interior de uma cabine acústica. As crianças, individualmente, escutaram (com apresentação binaural) uma das palavras do par mínimo, e em seguida, precisavam decidir e indicar qual era a gravura correspondente à palavra apresentada auditivamente, dentre as duas possibilidades de gravuras que eram dispostas na tela do computador. Por exemplo: apresentava-se auditivamente à criança a palavra “pote”e, logo em seguida, dispunham-se na tela do computador as gravuras correspondentes às palavras “pote” e “bote”, para que o participante decidisse e indicasse qual das gravuras correspondia ao estímulo auditivo apresentado. Tanto o tempo de apresentação dos estímulos auditivo e visual quanto o tempo de resposta foram controlados e mensurados automaticamente pelo software PERCEVAL.

A duração total de cada experimento foi de, aproximadamente, 15 minutos por criança. Embora os experimentos tenham sido realizados em diferentes dias para evitar exaustão por parte das crianças, sua finalização não ultrapassou o intervalo de uma semana.

Critérios de análise

Foram utilizados os seguintes critérios para análise: a) acurácia perceptivo-auditiva; b) tempo de reação dos erros e acertos; c) reconhecimento de padrões com o uso do escalonamento multidimensional e matriz de similaridade.

Resultados

Acurácia perceptivo-auditiva

Uma vez que um dos objetivos da análise proposta é detectar a acurácia perceptivo-auditiva na identificação dos contrastes fônicos do PB, ao invés de se analisar somente as porcentagens de respostas corretas, os dados foram transformados usando uma medida de sensibilidade designada de d’prime (MACMILLAN; CREELMAN, 1991). Esta medida de sensitividade leva em conta os vieses de respostas inerentes aos sujeitos pelo ajuste entre o número de hits (respostas corretas, ou seja, escolha do estímulo “A”quando o estímulo apresentado é“A”) pelo número de falsos alarmes (respostas incorretas, escolha do estímulo “A”, quando o estímulo apresentado é“B”). O d’prime é calculado pela conversão da proporção de hits (H) e falsos alarmes (FA) para z-score e, em seguida, pela subtração de tais proporções (d’= z(H) –z(FA)).

Uma acurácia perfeita (ou seja, somente hits e nenhum falso alarme) teria um valor de d’prime infinito. No entanto, ajustam-se os valores de hits e falsos alarmes a uma proporção de H=0,99 e FA=0,01, obtendo-se um valor de acurácia quase perfeita de d’=4,65. Desse modo, quanto mais próximo o valor de d’prime for de 4,65, maior será a acurácia perceptivo-auditiva.

Na Tabela 1, a seguir, encontram-se discriminados os valores de d’prime em função das classes fônicas.

Tabela 1 – Acurácia perceptivo-auditiva em função da classe fônica 

Classe fônica Número de repostas (n°de pares contrastivos x 66 crianças) % de respostas corretas d’prime
Vogais 2.772 88,34 (2449/2772) 1,73
Sonorantes 2.772 87,01 (2412/2772) 1,56
Oclusivas 1980 84,04 (1664/1980) 1,43
Fricativas 1980 75 (1485/1980) 0,93

Fonte: elaboração própria.

Verifica-se que a acurária perceptivo-auditiva das crianças foi dependente da classe fônica, obdecendo a seguinte ordem decrescente: voagis>sonorantes>oclusivas>fricativas. Os valores da acurária (d’prime) variaram entre 1,73 a 0,93.

Tempo de reação dos erros e acertos

A Tabela 2, a seguir, apresenta a comparação entre o tempo médio de resposta dos acertos e erros por classe fônica.

Tabela 2 – Comparação entre o tempo de reação dos acertos e dos erros 

Classe Fônica Média do tempo de reação dos acertos (ms) Média do tempo de reação dos erros (ms) Teste T para amostras independentes
Vogais 2158,31 (±221,49) 2243,83 (±455,80) t=-1,34, p= 0,17
Sonorantes 2171,17 (±251,99) 2388,74 (±478,09) t=-2,92, p= 0,00
Oclusivas 2037,04 (±218,90) 2200,90 (±543,34) t=-6,45, p= 0,00
Fricativas 2346,71 (±236,02) 2411,51 (±346,39) t=-2,10, p= 0,03

Fonte: elaboração própria.

O tempo de reação refere-se ao tempo utilizado pelas crianças para tomada de decisão na tarefa de identificação. Uma vez que as tarefas de identificação foram realizadas no interior de quatro classes fônicas (vogais, sonorantes, oclusivas e fricativas), os tempos de reação dos erros e dos acertos foram comparados considerando cada classe individualmente e não a comparação entre as classes.

De acordo com a Tabela 2, nota-se que a média numérica do tempo de reação dos erros sempre foi superior à média numérica do tempo de reação dos acertos para todas as classes fônicas. Um teste T foi rodado para averiguar se a média de tempo de reação dos acertos era significantemente diferente da média de tempo de reação dos erros. Estabeleceu-se um alpha no valor de 0,05. Isso significa dizer que quando o valor de p for menor que 0,05, rejeita-se a hipótese nula (de que não há diferenças entre o tempo médio de acertos e erros) e assume-se a hipótese alternativa (de que há diferença entre o tempo médio de erros e acertos). Desse modo, a análise estatística inferencial mostrou que o tempo de reação dos acertos foi sempre inferior ao tempo de reação dos erros, exceto para a classe das vogais.

Um último passo foi verificar, no interior de cada classe, as similaridades e dissimilaridades entre os fonemas transformando-as em medidas de distância, tal como propõe Johnson (1991), para a criação de mapas perceptuais.

A partir das matrizes de confusão4 de cada classe fônica, geradas com base no padrão de resposta das crianças, realizou-se uma análise estatística exploratória (Escalonamento multidimensional e Matriz de similaridade) para verificar as similaridades/dissimilaridades entre os pares contrastivos investigados.

Baseando-se nos valores de similaridades de todos os pares contrastivos investigados, foram projetadas medidas de distância entre os pares, resultando em mapas perceptuais. Por exemplo, no interior da classe das fricativas, erros de identificação envolvendo o par /s/ vs /∫/ foram muito mais frequentes do que erros envolvendo o par /s/ vs /v/. Isso significa dizer que a frequência com que um som é confundido com o outro é um reflexo de sua similaridade. Então, as fricativas coronais desvozeadas tiveram uma maior similaridade para as crianças do que o par /s/ vs /v/. Ao projetar uma medida de distância a partir da similaridade apresentada entre os pares contrastivos, temos que a distância entre as fricativas coronais desvozeadas seria menor do que a distância entre /s/ e /v/.

A seguir, são dispostos os quatro mapas perceptuais de acordo com cada classe fônica investigada: vogais, oclusivas, fricativas e sonorantes.

Fonte: elaboração própria.

Figura 1 – Mapa perceptual das crianças relativo às vogais tônicas 

O mapa perceptual das crianças em relação à classe das vogais mostra uma distribuição não igualitária entre os fonemas vocálicos. Observa-se uma clara divisão entre os elementos vocálicos considerando o parâmetro ântero-posterior. As vogais anteriores estão concentradas no quadrante inferior à direita, as vogais posteriores estão dispostas na metade esquerda do mapa e a vogal central /a/ localiza-se no quadrante superior à direita. Além disso, nota-se que, entre as vogais anteriores, as vogais /e/ e /i/ apresentam uma pequena distância, refletindo a sua grande similaridade perceptual nas crianças.

Fonte: elaboração própria.

Figura 2 – Mapa perceptual das crianças relativo às oclusivas 

O mapa perceptual das crianças concernente às oclusivas demonstra uma evidente separação entre as oclusivas surdas (localizadas à esquerda do mapa) e as oclusivas sonoras (localizadas à direita do mapa). Adicionalmente, observa-se que, perceptualmente para as crianças, as oclusivas labiais e dentais estão mais próximas entre si comparativamente às oclusivas dentais e velares.

Fonte: elaboração própria.

Figura 3 – Mapa perceptual das crianças relativo às fricativas 

O mapa perceptual das crianças em relação à classe das fricativas demonstra, embora de modo mais sutil que a classe das oclusivas, uma separação entre as fricativas sonoras (distribuídas mais nas extemidades do mapa) e as fricativas surdas (localizadas mais ao centro do mapa). Adicionalmente, as fricativas coronais apresentam uma menor distância entre si.

Fonte: elaboração própria.

Figura 4 – Mapa perceptual das crianças relativo às sonorantes 

Finalmente, a partir do mapa perceptual das crianças no tocante às sonorantes, nota-se uma clara distinção entre a classe das nasais e das líquidas, já que as nasais se concentram no quadrante inferior esquerdo do mapa enquanto as líquidas se distribuem nos dois terços direito do mapa. Além disso, no interior de cada sub-classe, as nasais encontram-se mais próximas entre si, comparativamente à distribuição das líquidas.

Discussão

Acurácia perceptivo-auditiva

Destacam-se três aspectos dos resultados obtidos na acurácia perceptivo-auditiva. O primeiro refere-se ao valor da acurácia (d’prime) apresentado pelas crianças, variando de 0,93 a 1,73. Observa-se que as crianças da faixa etária estudada (4-5 anos) ainda não apresentam um domínio efetivo na identificação dos contrastes, já que todos os valores foram muito inferiores a 4,65 (valor de referência para uma acurácia perfeita).

O fato de as crianças de quatro a cinco anos não apresentarem um domínio efetivo da identificação fônica concorda com os achados descritos por Edwards (1974) e Werker e Lalonde (1988), de que crianças aos sete anos de idade ainda não completaram o processo de percepção de contrastes fônicos, sugerindo que a finalização e a estabilização da percepção de contrastes fônicos ocorrem posteriormente a essa idade. Pode-se depreender deste resultado que é possível não somente pensar em um processo de aquisição fonológica do ponto de vista perceptivo-auditivo dependente da classe fônica, como também um processo que se desenvolve ao longo do desenvolvimento.

O segundo aspecto diz respeito a um domínio gradativo das classes fônicas, ou seja, do ponto de vista perceptivo o desempenho das crianças estaria de acordo com a seguinte ordem decrescente: vogais >sonorantes>oclusivas>fricativas.

Os resultados obtidos corroboram os descritos em estudos clássicos internacionais (SHVACHKIN, 1973; EDWARDS, 1974; BROWN, 1997; 2000; PATER; STAGER; WERKER, 2004), os quais prevêem não apenas uma aquisição perceptivo-auditiva gradual, como também uma hierarquia na aquisição.

Particularmente, as vogais são as primeiras a serem diferenciadas, seguida das consoantes. No interior da classe das consoantes, a distinção entre sonorantes x oclusivas antecede a distinção entre oclusivas x fricativas, tal como descrito em Shvachkin (1948).

Nota-se, interessantemente, que as classes fônicas com maior acurácia na tarefa de identificação, vogais e sonorantes, apresentam em comum um padrão formântico bem definido em sua estrutura acústica (KENT; READ, 1992). Esse padrão formântico caracteriza-se pelo reforçamento de frequências entre 300-3000 Hz. Esta faixa de frequência está contida na faixa de frequências beneficiada pelo ouvido humano, uma vez que esse conjunto de frequências recebe uma amplificação (estimada em torno de 10 - 12 dB) devido às características físicas e fisiológicas do ouvido (LOPES; CAMPOS, 1994; JOHNSON, 1991).

Por outro lado, a menor acurácia para a classe das fricativas, também reforça a importante interação entre as características acústicas e as características anátomo-fisiológicas do ouvido humano para a identificação fônica. Do ponto de vista acústico, as fricativas caracterizam-se pela presença de uma energia aperiódica distribuída no espectro de frequência de acordo com o comprimento da cavidade anterior resultante de sua produção. Mais especificamente, quanto menor o comprimento da cavidade anterior nas fricativas, mais altas serão as frequências de ressonância (KENT; READ, 1992). Em termos de sensibilidade do ouvido humano, frequências acima de 5000 Hz não recebem qualquer incremento, sendo, portanto, menos salientes comparativamente às frequências abaixo desse valor (JOHNSON, 1991).

Esses resultados, tomados juntos, sugerem a importância das características acústicas dos sons da fala para a sua categorização.

Finalmente, o terceiro aspecto refere-se a não correspondência com a ordem estabelecida em termos de aquisição oral. A classe das líquidas é a última a ser adquirida em termos de produção (JAKOBSON, 1968; LAMPRECHT et al., 2004). Nos dados perceptivos, embora as líquidas tenham sido tratadas conjuntamente com as nasais, no interior da classe das sonorantes, a classe das líquidas apresentou uma menor porcentagem de erros (18,57% - 60/323) do que a classe das nasais (36,22% - 117/323). O desdobramento desse resultado mostra que, embora haja uma clara relação entre produção e percepção da fala, essa relação não é de natureza linear.

Em concordância com Casserly e Pisoni (2010), da mesma forma que a produção da fala não pode ser reduzida a uma mera execução motora, a percepção da fala também não pode ser reduzida a uma mera interpretação sensorial.

Tempo de reação dos erros e acertos

Considerando cada classe individualmente, o tempo de reação dos acertos foi sempre inferior ao tempo de reação dos erros, exceto para a classe das vogais.

Pisoni e Tash (1974) predizem a relação entre similaridade perceptiva e tempo de reação em experimentos perceptivos. Para os autores, quanto maior a diferença acústica entre dois pares de estímulos, mais rápida deveria ser a resposta dos sujeitos (menor o tempo de reação) e, ao contrário, quanto menor a diferença acústica entre os estímulos, maior seria o tempo utilizado pelos sujeitos para a tomada de decisão (maior tempo de reação).

Tomando como base a ideia de que o tempo de reação deva ser maior para segmentos semelhantes do que para segmentos diferentes, especulamos que os erros perceptivo-auditivos apresentados pelas crianças poderiam envolver justamente segmentos de maior semelhança, o que demandariam um maior tempo de reação por parte das crianças.

Pode-se, pois, depreender desses resultados que os contrastes fônicos consonantais que apresentaram erros na tarefa de identificação impõem maior similaridade perceptivo-auditiva, exigindo, consequentemente, maior tempo para a tomada de decisão, em termos de processamento psicolinguístico.

A exceção para as vogais justifica-se, possivelmente, pelas próprias características acústicas dessa classe sonora. Isto é, as vogais são segmentos sonoros de maior duração e energia acústica, além de apresentarem reforçamento de frequências (formantes) em uma faixa privilegiada pelo ouvido humano, favorecendo, possivelmente, a sua percepção (KENT; READ, 1992; JOHNSON, 1991). Assim sendo, presume-se que a similaridade no interior da classe das vogais seja menor do que a similaridade no interior da classe das consoantes.

Outra possibilidade interpretativa para o fato de o tempo de reação para os erros ser maior do que para os acertos diz respeito a não causalidade das respostas, conferindo a sua confiabilidade. Se os erros cometidos pelas crianças na tarefa de identificação tivessem ocorrido ao acaso, ou seja, se as crianças tivessem “chutado” uma resposta, certamente poder-se-ia encontrar um tempo de reação menor para os erros do que para os acertos.

Mapas perceptuais

O mapa perceptual das crianças relativo às vogais tônicas mostra uma distribuição não igualitária entre os fonemas vocálicos, o que reflete diferentes graus de similaridade perceptual dos elementos desta classe para as crianças. Adicionalmente, as vogais anteriores /e/ e /i/ foram as que apresentaram a menor distância entre si, demonstrando uma enorme similaridade perceptual para as crianças.

Diferentes graus de similaridade perceptivo-auditiva entre vogais têm sido reportados em estudos prévios (POLKA; WERKER, 1994; POLKA; BOHN, 1996; BERTI; ROQUE, 2013). A explicação dada por Polka e Bohn (1996) é a de que os estímulos, em um domínio perceptual, não são igualmente salientes. Para esses autores, as vogais periféricas funcionam como uma espécie de “ponto de ancoragem” na tarefa perceptivo-auditiva, designado pelos autores de “natural perceptual magnets”.

Os dados obtidos no desempenho perceptual das crianças em relação à classe das vogais vão ao encontro não somente da explicação dada por Polka e Bohn (1996), na medida em que podemos observar a presença das vogais extremas distribuídas mais perifericamente no mapa; como também parecem refletir a similaridade fonética presente nas vogais do PB. O fato de encontrarmos no PB o processo fonológico de alçamento vocálico envolvendo, justamente, as vogais médias (TENANI; SILVEIRA, 2008), evidencia que um fato da língua já é refletido na similaridade/dissimilaridade perceptual das crianças entre 4-5 anos.

Em relação aos resultados do mapa perceptual das crianças no tocante à classe das oclusivas e fricativas, dois aspectos podem ser destacados. O primeiro aspecto diz respeito à divisão entre as obstruintes sonoras e surdas, mais evidente no caso das oclusivas (já que há uma clara separação no mapa) e mais sutil no caso das fricativas (uma vez que as sonoras estão distribuídas nas extremidades e as surdas ao centro do mapa).

O segundo aspecto refere-se ao papel que as pistas fonéticas relativas ao ponto de articulação das obstruintes imprimem no desempenho perceptual das crianças. No caso das oclusivas, observa-se uma menor distância entre as oclusivas labiais e dentais do que entre as labias vs velares e dentais vs velares, principalmente nas oclusivas surdas. No caso das fricativas, as fricativas coronais apresentam uma menor distância entre si.

Como possibilidade explicativa, hipotetiza-se que características fonéticas em relação ao ponto de articulação e ao vozeamento das obstruintes parecem imprimir um papel significativo no desempenho perceptual das crianças.

A distinção perceptual entre obstruintes surdas e sonoras tamém foi descrita em um estudo prévio (MILLER; NICELY, 1955). Os autores observaram que o vozeamento é a pista acústica mais robusta perceptualmente para os adultos falantes do inglês. Ou seja, pistas acústicas que marcam o vozeamento são mais salientes do que as pistas que marcam o ponto de articulação, por exemplo.

Ferreira-Silva e Pacheco (2011), em seu estudo sobre a percepção de contrastes fricativos, também destacaram a importância da pista vozeamento para a distintividade entre fricativas.

Em relação ao papel das pistas acústicas que marcam o ponto de articulação, embora os autores destaquem diferenças perceptuais em função do ponto de articulação das obstruintes, parece não haver um consenso sobre como essas diferenças se estabelecem perceptualmente em adultos (MILLER; NICELY, 1955; WANG; BILGER, 1973; WINTERS, 2000).

De acordo Miller e Nicely (1955), dentre os pontos de articulação das consoantes obstruintes, as coronais apresentam maior saliência perceptivo-auditiva. No entanto, para os autores não há diferenças substanciais entre as obstruintes labiais e velares em termos de saliência perceptivo-auditiva. Diferentemente, Wang e Bilger (1973) observaram que tanto as obstruintes labiais quanto as coronais apresentam, similarmente, alta saliência perceptivo-auditiva, enquanto as obstruintes velares apresentam menor saliência. Mais recentemente, Winters (2000) constatou que, de forma geral, as obstruintes labiais são tipicamente mais salientes enquanto ponto de articulação, enquanto as obstruintes velares são descritas como consoantes de menor saliência. Berti et al. (2012) descreveram que as oclusivas labiais e coronais apresentaram maior similaridade na percepção infantil comparativamente às oclusivas velares.

Os resultados perceptuais das crianças relativos às obstruintes se assemelham aos descritos por Wang e Bilger (1973), já que labiais (no caso das oclusivas) e coronais apresentaram uma menor distância entre si, sugerindo uma maior similaridade perceptivo-auditiva.

Mais uma vez, características fonéticas das obstruintes parecem imprimir um papel fundamental na percepção infantil.

Por último, no que se refere ao mapa perceptual das crianças relativo à classe das sonorantes observa-se uma clara distinção entre as nasais e as líquidas e, ainda, no interior de cada sub-classe as nasais apresentam-se mais próximas entre si do que as líquidas.

Uma possível interpretação pode ser atribuída, mais uma vez, ao papel das características fonéticas dos segmentos na percepção das crianças. O fato de haver uma clara divisão entre nasais e líquidas evidencia uma maior similaridade perceptual entre os elementos de uma mesma sub-classe. Acústicamente as nasais são caracterizadas pela presença de um formante nasal bem definido (KENT; READ, 1992) o que pode explicar tanto a separação das classes quanto a maior proximidade dos fonemas nasais entre si.

Esses resultados também corroboram as previsões de Borden et al. (1994) sobre as distintas saliências perceptuais de pistas acústicas, as quais interpretamos como sendo uma espécie de hierarquia perceptual. As pistas acústicas que marcam o modo de articulação parecem ser mais salientes do que as pistas acústicas que marcam o ponto de articulação, na medida em que observa-se no mapa uma divisão mais clara entre modos (nasais e líquidas) do que ponto de articulação.

Os resultados, tomados juntos, confirmam integralmente a hipótese do estudo de que haveria uma aquisição perceptivo-auditiva de constrastes do PB. Essa aquisição ocorre de modo gradual e obedece a uma ordem sistemática em que a noção de classe fônica desempenha um papel fundamental. Isso significa dizer que, de modo semelhante à aquisição fônica da produção, na aquisição perceptivo auditiva deve-se considerar as diferentes classes fônicas e, ainda, no interior de cada classe, deve-se levar a uma hierarquia interna, onde pistas que marcam o vozeamento e a distinção de modo são mais robustas do que pistas que marcam o ponto de articulação.

Alertamos como uma importante limitação desse estudo o fato de o instrumento utilizado depender de gravuras que não apresentam a mesma representatibilidade e, ainda, cujas palavras não foram controladas em termos de frequência na língua, classe gramatical, contexto vocálico, etc., o que pode ter influenciado no desempenho perceptual das crianças.

Conclusões

O desempenho perceptivo-auditivo de crianças ocorre de modo gradual e é dependente da classe fônica. A identificação dos contrastes fônicos parece obedecer a seguinte ordem: vogais, sonorantes, oclusivas e fricativas.

A partir dos mapas perceptuais, pode-se verificar que, no interior da classe das vogais, o parâmetro ântero-posterior pode exercer um importante papel na saliência perceptual. Para a classe das obstruintes (fricativas e oclusivas) e sonorantes (nasais e líquidas), as pistas acústicas que marcam o vozeamento (no caso das obstruentes) e o modo de articulação (no caso das sonorantes) são mais robustas perceptualmente do que as pistas de ponto de articulação.

Finalmente, embora haja uma estreita relação entre produção e percepção de fala, não se pode afirmar que essa relação seja de natureza linear ou espelhada. Teorias e evidências experimentais precisam convergir para descobrir como a produção e a percepção de fala interagem no complexo ato da comunicação.

A investigação perceptivo-auditiva dos contrastes fônicos deverá ser ampliada considerando não apenas a extensão da faixa etária estudada, como também o desenvolvimento de estudos longitudinais.

REFERÊNCIAS

ANDRÉ, C.; GHIO, A.; CAVÉ, C.; TESTON, B. PERCEVAL: Perception Evaluation Auditive & Visuelle (v. 5.0.30) (Programa de computador). Aix-en-Provence, 2009. Disponível em: <http://www.lpl-aix.fr/~lpldev/perceval/>. Acesso em: 23 mai. 2015. [ Links ]

BARTON, D. Phonemic perception in children. In: YENI-KOMSHIAN, G.; KAVANAGH, J.; FERGUSON, C. (Ed.). Child Phonology, v.2. New York: Academic Press, 1980. p.97-116. [ Links ]

BERTI, L. C. Instrumento de Avaliação da Percepção da Fala – PERCEFAL. In: I Simpósio Internacional do Grupo de Pesquisa Avaliação da Fala e da Linguagem – Perspectivas Interdisciplinares em Fonoaudiologia, 2011. Marília: UNESP, 2011. [ Links ]

BERTI, L. C.; FALAVIGNA, A. E.; SANTOS, J. B.; OLIVEIRA, R. A. Desempenho perceptivo-auditivo de crianças na identificação de contrastes fonológicos entre as oclusivas. J. Soc. Bras. Fonoaudiol., São Paulo, v.24, n.4, p.348-354, 2012. Disponível em: <http://dx.doi.org/10.1590/S2179-64912012000400010>. Acesso em: 23 mai. 2015. [ Links ]

BERTI, L. C.; ROQUE L. M. R. Desempenho perceptivo-auditivo de crianças na identificação de contrastes fonológicos entre as vogais tônicas. CoDAS, São Paulo, v.25, n.26, p.534-541, 2013. [ Links ]

BEST, C. Emergence of language-specific constraints in perception of non-native speech: A window on early phonological development. In: BOYSSON-BARDIES, B. et al. (Ed.). Developmental Neurocognition: Speech and Face Processing in the First Year of Life. Dordrecht: Kluwer Academic Publishers, 1993. p.289-304. [ Links ]

BEST, C. The emergence of native-language phonological influence in infants: A perceptual assimilation model. In: NUSBAUM, H.; GOODMAN, J.; HOWARD, C. (Ed.). The Transition from Speech Sounds to Spoken Words: The Development of Speech Perception. Cambridge, MA: MIT Press, 1994. p.167-224. [ Links ]

BEST, C.; McROBERTS, G. Phonological influences in infants’discrimination of two non-native speech contrasts. Paper presented at the Society for Research in Child Development, Kansas City, Kansas, 1989. [ Links ]

BORDEN, G. J.; HARRIS, K. S.; RAPHAEL, L. J. Speech science primer: Physiology, acoustics and perception of speech. 3. ed. Baltimore: Lippincott Williams & Wilkins, 1994. [ Links ]

BROWN, C.; MATTHEWS, J. The acquisition of segmental structure. In: MATTHEWS, J.; WHITE, L. (Ed.). McGill Working Papers in Linguistics, Special Issue on Language Acquisition, v.9. Montreal: McGill University, Department of Linguistics, 1993. p.46-76. [ Links ]

BROWN, C.; MATTHEWS, J. The role of feature geometry in the development of phonemic contrasts. In: HANNAHS, S. J.; YOUNG-SCHOLTEN, M. (Ed.). Generative Studies in the Acquisition of Phonology. Amsterdam: John Benjamins Publishing Company, 1997. p.67-112. [ Links ]

BROWN, C. The interrelation between speech perception and phonological acquisition from infant to adult. In: ARCHIBALD, J. (Ed.). Second language grammars. Oxford, England: Blackwell, 2000. p.4-63. [ Links ]

CASSERLY, E.; PISONI, D. B. Speech perception & production. Wiley Interdisciplinary Reviews: Cognitive Science, Hoboken, v.1, n.5, p.629-647, 2010. [ Links ]

EDWARDS, M. Perception and production in child phonology: The testing of four hypotheses. Journal of Child Language, Cambridge, n.2, p.205-219, 1974. [ Links ]

EILERS, R.; GAVIN, W.; OLLER, D. Cross-linguistic perception in infancy: early effects of linguistic experience. Journal of Child Language, Cambridge, n.9, p.289-302, 1982. [ Links ]

EIMAS, P.; SIQUELAND, E.; JUSCZYK, P.; VIGORITO, J. Speech perception in infants. Science, Washington, v.171, p.303-306, 1971. [ Links ]

FERREIRA-SILVA, A.; PACHECO, V. Evidências da relação entre duração segmental e percepção de fricativas surdas e sonoras em ataque silábico. Confluência, Rio de Janeiro, n.37/38, p.180-200, 2011. [ Links ]

GARNICA, O. The development of phonemic speech perception. In: MOORE, T. (Ed.). Cognitive Development and the Acquisition of Language. New York: Academic Press, 1973. p.215-222. [ Links ]

GATHERCOLE, S. Nonword repetition and word learning: The nature of the relationship. Applied Psycholinguistics, Cambridge, n.27, p.513-543, 2006. [ Links ]

GERRITS, E. The categorisation of speech sounds by adults and children: a study of the categorical perception hypothesis and the developmental weighting of acoustic speech cues. 126 f. Tese (Doutorado) – Utrecht University, Utrecht, 2001. [ Links ]

HARDCASTLE, W. J.; LAVER, J.; GIBBON, F. E. (Ed.). The Handbook of Phonetic Sciences. 2. ed. Oxford: Blackwell, 2010. [ Links ]

HAZAN, V.; BARRETT, S. The development of phoneme categorisation in children aged 6 to 12 years. Journal of Phonetics, London, n.28, p.377-396, 2000. [ Links ]

JAKOBSON, R. Child language, aphasia and phonological universals. The Hague: Mouton, 1968. [ Links ]

JOHNSON, K. Acoustic and auditory phonetics. London: Blackwell, 1997. [ Links ]

KENT, R. D.; READ, C. The Acoustic Analysis of Speech. San Diego, California: Singular Publishing Group, Inc., 1992. [ Links ]

LAMPRECHT, R. R. et al. Aquisição fonológica do português: perfil de desenvolvimento e subsídios para a terapia. Porto Alegre: Artmed, 2004. [ Links ]

LOPES, O.; CAMPOS, C. H. Tratado de Otorrinolaringologia. São Paulo: Editora Roca, 1994. [ Links ]

MACMILLAN, N. A.; CREELMAN, C. D. Detection theory: A user’s guide. Cambridge: Cambridge University Press, 1991. [ Links ]

MEHLER, J. Language related dispositions in early infancy. In: MEHLER, J.; FOX, R. (Ed.). Neonate Cognition: Beyond the Blooming, Buzzing Confusion. Hillside, NJ: Erlbaum, 1985. [ Links ]

MILLER, G. A.; NICELY, P. E. An analysis of perceptual confusions among some English consonants. Journal of the Acoustical Society of America, Melville, n.27, p.338-352, 1955. [ Links ]

MOTA, H. B. Pares mínimos: os contrastes do português brasileiro. Pró-Fono, Barueri, n.13, p.98-106, 2001. [ Links ]

MUNSON, B.; EDWARDS, J.; BECKMAN, M. E. Relationships between nonword repetition accuracy and other measures of linguistic development in children with phonological disorders. Journal of Speech, Language, and Hearing Research, Rockville, n.48, p.61-78, 2005. [ Links ]

PANNETON, R.; NEWMAN, R. Development of Speech Perception. In: WENER, L.; FAY, R.; POPPER, A. N. (Ed.). Human Auditory Development. New York, USA: Springer New York Dordrecht Heidelberg London, 2011. p.197-222. [ Links ]

PATER, J.; STAGER, C; WERKER, J. The Perceptual Acquisition of Phonological Contrasts. Language, Washington, n.80, p.384-402, 2004. [ Links ]

PISONI, D. B.; TASH, J. Reaction times to comparisons within and across phonetic categories. Perception & Psychophysics, Austin, n.15, v.2, p.285-290, 1974. [ Links ]

POLKA, L.; WERKER, J. F. Developmental changes in perception of nonnative vowel contrasts. Journal of Experimental Psychology: Human Perception and Performance, Washington, n.20, v.2, p.421-435, 1994. [ Links ]

POLKA, L.; BOHN, O. S. A cross-language comparison of vowel perception in English-learning and German-learning infants. The Journal of the Acoustical Society of America (JASA), Melville, n.100, p.577-592, 1996. [ Links ]

SHVACHKIN, N. Kh. The development of phonemic speech perception in early childhood. Traduzido por E. Dernbach e republicado em 1973. In: FERGUSON, C.; SLOBIN, D. (Ed.). Studies of Child Language Development. New York: Holt, Rinehart and Winston, 1948. p.91-127. [ Links ]

STREETER, L. Language perception of 2-month-old infants shows effects of both innate mechanisms and experience. Nature, London, v.259, p.39-41, 1976. [ Links ]

TREHUB, S. The discrimination of foreign speech contrasts by infants and adults. Child Development, Ann Arbor, v.47, p.466-472, 1976. [ Links ]

TENANI, L.; SILVEIRA, A. A. M. D. O alçamento das vogais médias na variedade culta do noroeste paulista. ALFA: Revista de Linguística, v.52(2), p.467-464, 2008. [ Links ]

WANG, M. D.; BILGER, R. C. Consonant confusion in noise: a study of perceptual features. The Journal of the Acoustical Society of America (JASA), Melville, v.54, p.1248-1266, 1973. [ Links ]

WERKER, J.; GILBERT, J.; HUMPHREY, K.; TEES, R. Developmental aspects of crosslanguage speech perception. Child Development, Ann Arbor, v.52, p.349-353, 1981. [ Links ]

WERKER, J.; TEES, R. Cross-language speech perception: Evidence for perceptual reorganization during the first year of life. Infant Behavior and Development, Amsterdam, v.7, p.49-63, 1984a. [ Links ]

WERKER, J.; TEES, R. Phonemic and phonetic factors in adult cross-language speech perception. The Journal of the Acoustical Society of America (JASA), Melville, v.75, p.1866-1878, 1984b. [ Links ]

WERKER, J.; TEES, R. Cross-language speech perception: Evidence for perceptual reorganization during the first year of life. Infant Behavior & Development, Amsterdam, v.25, p.121-133, 2002. [ Links ]

WERKER, J.; LALONDE, C. Cross-language speech perception: Initial capabilities and developmental change. Developmental Psychology, Washington, v.24, p.672-683, 1988. [ Links ]

WERKER, J.; POLKA, L. Developmental change in speech perception: New challenges and new directions. Journal of Phonetics, London, v.21, p.83-101, 1993. [ Links ]

WINTERS, S. Turning phonology inside out: testing the relative salience of audio and visual cues for place of articulation. In: LEVINE, R.; MILLER-OCKHUIZEN, A.; GONSALVEZ, A. J. (Ed.). Ohio State Working Papers in Linguistics, n.53, p.168-199, 2000. [ Links ]

1 Para um aprofundamento dos conceitos de discriminação e identificação auditiva, bem como das tarefas que avaliam tais habilidades, recomendamos a leitura do trabalho de Gerrits (2001).

2 Jakobson (1968) estabelece como regra geral que o desenvolvimento fonológico, em termos de produção, procede de uma condição original indiferenciada em direção a uma maior diferenciação e separação. A primeira grande oposição ocorre entre as consoantes e as vogais, seguida da oposição oral vs. nasal tanto para as consoantes quanto para as vogais. Na sequência, há a distinção entre as labiais e dentais para as consoantes e a distinção entre vogais largas e estreitas, antecedendo a oposição entre as consoantes anteriores e posteriores. A presença das fricativas pressupõe a presença das oclusivas. Da mesma forma, a presença das africadas pressupõe a presença das fricativas. Vogais arredondadas surgem após vogais não-arredondadas. Consoantes posteriores emergem após a presença das consoantes anteriores, assim como consoantes sonoras ocorrem após as consoantes surdas. As líquidas são as últimas a surgirem, sendo que a distinção entre líquidas laterais e não laterais é de aquisição tardia nas línguas que as tiverem em seu inventário.

3 A obtenção dos scripts dos experimentos de identificação pode ser solicitada à autora do trabalho no seguinte e-mail: berti.larissa@gmail.com.

4 A matriz de confusão é uma forma notacional utilizada para catalogar quantitativamente e qualitativamente o padrão de resposta das crianças. Registram-se tantos os erros quanto os acertos cometidos pelas crianças. Destaca-se que esse tipo de registro propicia informações relativas aos contrastes com maior ou menor similaridade na tarefa de identificação, bem como aos padrões de erros mais recorrentes.

Recebido: Junho de 2015; Aceito: Agosto de 2016

Creative Commons License  This is an Open Access article distributed under the terms of the Creative Commons Attribution License, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.