SciELO - Scientific Electronic Library Online

 
vol.14 issue2Cognitive Assessment of Reading and Writing: Reading-Aloud and Spelling TasksAnaphoric Resolution and Discourse Focus: The Case of the French "Hybrid" Demonstrative Pronoun (celui-ci) author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Article

Indicators

Related links

Share


Psicologia: Reflexão e Crítica

Print version ISSN 0102-7972

Psicol. Reflex. Crit. vol.14 no.2 Porto Alegre  2001

http://dx.doi.org/10.1590/S0102-79722001000200015 

Rota Perilexical na Leitura em Voz Alta

 

Rota Perilexical na Leitura em Voz Alta: Tempo de Reação, Duração e Segmentação na Pronúncia

 

Fernando César Capovilla 1
Universidade de São Paulo
Alessandra Gotuzo Seabra Capovilla
Universidade de Santo Amaro
Elizeu Coutinho de Macedo
Universidade Presbiteriana Mackenzie

 

 


Resumo
Conforme o modelo de leitura por dupla rota, na rota lexical a pronúncia é resgatada como um todo a partir do léxico, mas, na perilexical, é construída por segmentos silábicos. Esta análise computadorizada da leitura em voz alta de 270 pseudopalavras por 44 universitários avaliou proporção de acertos, tempo de reação, duração e freqüência de segmentação da pronúncia. Resultados revelaram que: 1) quanto mais curtas e simples as sílabas, mais rápida e segmentar a leitura perilexical; 2) quanto maior o número dessas sílabas, menor a velocidade, mas maior a segmentação; 3) dígrafos diminuem acertos e segmentação, e aumentam duração e tempo de reação; 4) dígrafos aumentam o tempo de reação só quando estão nas primeiras sílabas; 5) este tempo cresce dos grafemas simples aos encontros consonantais aos dígrafos. Tais achados ampliam a validade e complexidade do modelo e a compreensão dos processos seriais e paralelos envolvidos na rota perilexical.
Palavras-chave: Leitura em voz alta; leitura de pseudopalavras; freqüência de segmentação; tempo de reação; duração.

Perilexical Processing During Reading Performance: Effects Upon Reaction Time, Duration and Segmentation of Utterances

Abstract
According to dual-route reading models, in the lexical route pronunciation is retrieved as a whole from the lexicon, whereas in the perilexical route, it is constructed via phonological decoding of syllabic segments. The study assessed perilexical reading aloud of 270 isolated non-words by 44 college students. A computer analyzed error frequency and temporal parameters of pronunciation: reaction time (RT), duration, and segmentation frequency, as function of non-word characteristics. Results showed that: 1) the shortest and simplest syllables produced the highest reading speed and segmentation frequency; 2) the longest non-words produced the highest segmentation frequency, but the lowest reading speed; 3) digraphs increased error frequency, as well as duration and RT, but decreased segmentation frequency; 4) digraphs (two letters: one phoneme) increased RT only when they occurred in the initial syllables; 5) digraphs produced greater RT than did consonantal combinations (two letters: two phonemes), which in turn produced greater RT than did simple graphemes. Such findings increase the validity of the dual-process reading model, as well as the understanding of serial and parallel processes involved in perilexical processing.
Keywords: Reading aloud; non-word reading; segmentation frequency; reaction time; duration.


 

 

Há dois modelos de leitura, o de rota única e o de rota dupla. O de rota única (Seidenberg & McClelland, 1989) é inspirado em modelos associacionistas e de processamento paralelo distribuído ou de redes neurais, e pressupõe que toda leitura é feita por reconhecimento visual direto a partir de informações ortográficas, fonológicas e semânticas. O de rota dupla (Ellis & Young, 1988) é inspirado em fluxogramas de processamento de informação, e pressupõe a operação de dois processos em paralelo, o de reconhecimento visual direto, também chamado lexical, e o de decodificação fonológica, também chamado de perilexical ou fonológico. Conforme o modelo de rota dupla, a leitura por reconhecimento visual direto só pode ser feita eficazmente quando a palavra a ser lida tiver forte representação no léxico ortográfico. Isto normalmente só ocorre se a palavra tiver alta freqüência de ocorrência no ambiente do leitor, e se o leitor tiver relativamente boa proficiência de leitura. Se o item escrito não tiver representação no léxico ortográfico, ele não é lido por reconhecimento visual direto. Isto ocorre com pseudopalavras, ou seja, conjuntos de caracteres que compõem todos pronunciáveis, mas carentes de significado, e que estão, portanto, fora do dicionário ou léxico do idioma. Neste caso, tais itens podem ser lidos por decodificação grafofonêmica. O processo envolve a segmentação do item em grafemas, a aplicação de regras de conversão de grafemas em fonemas, e a junção dos fonemas durante a pronúncia.

A leitura pela rota lexical beneficia-se da freqüência de ocorrência das palavras na língua, uma vez que quanto maior tal freqüência, tanto mais estabelecida sua representação lexical e mais fácil o seu resgate a partir do léxico. Como as pseudopalavras têm freqüência nula de ocorrência, não têm representação lexical e, logo, não são recuperáveis do léxico. A leitura por decodificação grafofonêmica é feita a partir da aplicação de regras de correspondência grafema-fonema, que permite ler em voz alta pseudopalavras e palavras, desde que sejam regulares grafofonemicamente. Se a palavra contiver irregularidades, o uso da decodificação irá produzir erros de regularização grafofonêmica, dificultando sua compreensão.

Assim, pseudopalavras ou palavras de muito baixa freqüência e com relações grafofonêmicas regulares tendem a ser lidas pela rota perilexical, enquanto que palavras de alta freqüência de ocorrência na língua e contendo irregularidades grafofonêmicas tendem a ser lidas pela rota lexical. Durante a leitura em voz alta, a pronúncia de itens lidos pela rota lexical é recuperada como um todo do léxico. Já a pronúncia de itens pela rota perilexical é construída segmento a segmento pela decodificação grafofonêmica, sendo, portanto, mais segmentada que a da rota lexical. Se a leitura perilexical é mais segmentar que a lexical, e se pseudopalavras tendem a ser lidas pela rota perilexical enquanto que palavras grafofonemicamente irregulares e de alta freqüência tendem a ser lidas pela lexical, então durante a leitura em voz alta deve ser possível documentar uma maior segmentação na pronúncia de pseudopalavras do que na de palavras irregulares de alta freqüência. De fato, tal expectativa já foi demonstrada experimentalmente por Capovilla, Capovilla e Macedo (1998), num estudo comparando o número de picos de energia de milhares de registros de onda (i.e., waveforms) resultantes da leitura de pseudopalavras e de palavras irregulares de alta freqüência.

Este estudo concentrou-se na análise do processamento perilexical, e em variáveis que afetam seu funcionamento, mais precisamente nas características dos itens a serem processados, tais como a extensão das pseudopalavras, sua estrutura silábica, a complexidade dos grafemas, e a posição de grafemas compostos (i.e., dígrafos2). Inspirado num importante estudo anterior (Parente & Manarini, em preparação) que analisou os tempos de reação e as proporções de erro de dez universitários expostos a 270 pseudopalavras, o presente estudo objetivou replicar e estender aquele estudo, desta feita aumentando o tamanho da amostra de 10 para 44 universitários, e aumentando o número de medidas temporais da pronúncia, para avaliar não apenas o tempo de reação, como também a duração e a freqüência de segmentação.

O objetivo foi verificar sob que condições o processamento fonológico pode ser facilitado. Tal questão é de interesse teórico, já que pode auxiliar a elucidar a natureza dos processamentos serial e paralelo na leitura perilexical. É também de interesse aplicado e tecnológico, uma vez que pode auxiliar a programar situações específicas ideais para trabalhar, nos contextos educacionais e clínicos, os diferentes processamentos que devem estar envolvidos na decodificação grafofonêmica bem sucedida.

Uma primeira premissa operacional é de que a facilidade do processamento perilexical poderia ser indicada por uma série de medidas, como freqüência de erro, tempo de reação e duração locucionais. Nos três casos, a hipótese é de que se trataria de uma proporcionalidade inversa, ou seja, quanto mais fácil o processamento, tanto menor a freqüência de erros, o tempo de reação, e a duração locucionais. Nestes três casos, uma primeira hipótese articulada à primeira premissa operacional é de que o processamento perilexical seria mais fácil em pseudopalavras curtas do que longas, naquelas compostas de sílabas curtas e simples (i.e., CV) do que longas e complexas (i.e., CCV ou CVC), e naquelas compostas de grafemas simples do que compostos (e.g., dígrafos). Se as evidências a partir das três medidas (i.e., freqüência de erro, tempo de reação e duração locucionais) coalescessem de modo harmonioso, isto daria suporte não apenas à primeira hipótese articulada (i.e., de que a facilidade de processamento seria maior em itens curtos, com sílabas curtas e simples, com grafemas simples), como também à primeira premissa operacional (i.e., de que haveria uma relação de proporcionalidade inversa entre a facilidade de processamento de um lado e, de outro, a freqüência de erros, o tempo de reação, e a duração locucionais), o que aumentaria a validade do arcabouço teórico-conceitual.

Uma segunda premissa, um pouco menos intuitiva, é de que a pureza do processamento perilexical também poderia ser indicada pelo padrão de segmentação. Neste caso, trata-se de uma proporcionalidade direta, ou seja, quanto mais puramente perilexical o processamento, tanto maior deveria ser a freqüência de segmentação (i.e., tanto maior a correspondência entre o número de sílabas que compõem o item escrito e o número de sílabas identificáveis na sua pronúncia). Neste caso específico, a segunda hipótese articulada à segunda premissa operacional é de que o processamento perilexical seria mais puro (i.e., a freqüência de segmentação seria maior) em pseudopalavras compostas de um maior número de sílabas (i.e., trissílabas em vez de bissílabas), por sílabas curtas e simples (i.e., CV) do que longas e complexas (i.e., CCV ou CVC), e com grafemas simples do que compostos (i.e., dígrafos).

Esta série de experimentos analisou o processamento perilexical na leitura em voz alta de pseudopalavras isoladas em adultos. Pesquisas anteriores (Parente & Manarini, em preparação) analisando o tempo de reação e o tipo de erros indicaram que o processamento perilexical é linear e segmentar. Este estudo expande a análise temporal da locução na leitura em voz alta, incluindo os parâmetros duração locucional e freqüência de segmentação locucional. Se o processamento perilexical é linear e segmentar, não apenas o tempo de reação, como também a duração locucional e a freqüência de segmentação devem ser afetados, regularmente, pela extensão, complexidade grafêmica e composição silábica dos itens. Neste estudo, os três parâmetros temporais e a proporção de acertos foram analisados como função da extensão dos itens de leitura, de sua complexidade grafêmica e da composição silábica resultante. Três experimentos foram conduzidos, cada qual com um conjunto de listas diferente. O Experimento 1 examinou os efeitos da complexidade grafêmica e da extensão. O Experimento 2 examinou os efeitos da estrutura silábica e da complexidade grafêmica. O Experimento 3 examinou o efeito da posição do dígrafo. Os parâmetros temporais foram medidos diretamente a partir dos sinais vocálicos (i.e., waveforms), emitidos pelos leitores frente a cada item, que foram registrados pelo software CronoFonos (Capovilla, Macedo, Duduchi & Sória, 1999). As propriedades dos waveforms foram medidas de modo visuo-manual por meio do software Wave for Windows version 2 (Turtle Beach Systems, 1993).

Desta forma, foi obtida uma medida articulatória dos diversos processamentos cognitivos envolvidos na leitura em voz alta, tornando possível analisar o efeito da estrutura ortográfica sobre as variações nos parâmetros temporais da articulação, independentemente de considerações quanto à freqüência do item no idioma, do grau de familiaridade do leitor, de sua concretude, etc. Submetendo leitores a listas de pseudopalavras, controlando a freqüência grafêmica, o número de letras e de sílabas, a estrutura e composição destas em termos de grafemas simples ou compostos, seria possível obter uma linha de base que permite analisar o efeito de uma série de variáveis psicolingüísticas (e.g., concretude, freqüência) sobre a leitura. Isto também permite analisar o efeito dessas próprias variáveis ortográficas sobre o processamento perilexical na leitura em voz alta, permitindo testar hipóteses sobre a natureza segmentar e serial ou paralela daquela leitura. Por exemplo, o modelo de múltiplas vias postulado por Lecours e Parente (1997) parte do princípio de que a produção oral é silábica e de que uma série de operações mentais está envolvida no reconhecimento das letras enquanto grafemas simples ou complexos, na identificação de sílabas escritas e em sua conversão em sílabas faladas. De tal modelo decorre que, para um mesmo número de letras, o tempo de reação (que indica a demanda de processamento) deve ser maior quanto maior o número de sílabas. Além disso, a estrutura silábica deve ser relevante, sendo que a presença de dígrafos também deveria demandar maior tempo de reação. Segundo Lecours, Delgado e Pimenta (1993), o processamento da leitura ocorre de forma seqüencial, da esquerda para a direita do item. Assim, seria esperado um maior tempo de reação locucional para itens com grafemas compostos nas primeiras sílabas.

 

Método

Participantes

Participaram voluntariamente do estudo 44 universitários, sendo 19 homens e 25 mulheres, com idades entre 17 e 47 anos, e média de 21 anos e nove meses. Todos tinham hábitos de leitura e escrita freqüentes, eram destros, e tinham visão normal ou corrigida. Nenhum deles apresentava histórico de distúrbio de aprendizagem ou de linguagem oral e escrita. Nenhum deles recebeu qualquer pagamento ou benefício por sua participação.

Equipamentos

Foram empregados quatro microcomputadores Pentim 200 MHz equipados com kit multimídia e microfone Coby CV-M30 (gama de freqüência 50Hz-16KHz, impedância baixa, e sensibilidade de ¾62dB). Foram também empregados o software CronoFonos (Capovilla, Macedo, Duduchi & Sória, 1999) programado com a lista de Manarini (1996), que permitia a coleta e análise automática dos registros de onda, e o software Wave for Windows Version 2 (Turtle Beach Systems, 1993) que permitia análise visuo-manual dos registros de onda.

Software

O software CronoFonos implementa provas de leitura em voz alta de itens com características psicolingüísticas variadas, e avalia as distribuições de erro e de parâmetros temporais da locução como função dessas características. Registra a pronúncia do leitor, e analisa seus parâmetros temporais como o tempo de reação, a duração e a freqüência de segmentação. É executado em Windows 95 e apresenta itens escritos em letra preta com fonte e tamanho customizáveis. Pode ser programado para apresentar diferentes listas como a de Pinheiro (1994), usada em Capovilla e Capovilla (2000a, 2000b) e de Manarini (1996), usada no presente estudo. Dependendo da lista empregada, é possível avaliar efeitos como os de lexicalidade, regularidade de correspondências grafofonêmicas, extensão, concretude e freqüência de ocorrência da palavra no idioma.

CronoFonos apresenta listas de itens psicolingüísticos isolados e registra a pronúncia do leitor durante sua leitura em voz alta. A Figura 1 representa o layout de uma das telas do software, com a palavra criança. Na parte inferior direita da tela, encontram-se os botões finalizar (X), seguinte (>), pausa (II), e ajuda (dica). O botão seguinte é pressionado pelo examinador a cada término de locução pelo sujeito. Isto armazena a locução em um arquivo de som, mas não afeta quaisquer parâmetros temporais da locução. O botão pausa permite interromper momentaneamente a apresentação seqüencial dos estímulos escritos. O botão finalizar permite interromper definitivamente a apresentação seqüencial dos estímulos escritos. O botão ajuda pode ser pressionado pelo examinador caso o sujeito fracasse na nomeação de um item ou na leitura de uma palavra, como em estudos sobre o efeito de dicas fonológicas ou semânticas sobre o desempenho anômico ou disléxico. A Figura 2 representa o layout da tela de programação, que contém a janela de seleção de tabelas com diferentes tipos de seqüências de itens a serem lidos.

 

 

 

A Figura 3 ilustra o layout da tabela de programação que contém seis colunas: Palavra, msg1 (mensagem 1), ndicas (número de dicas), somdica1 (som da dica 1), somdica2 (som da dica 2), somdica3 (som da dica 3). A coluna palavra contém os nomes dos itens a serem lidos ou o nome do arquivo (i.e., arquivo do tipo .BMP) da figura a ser apresentada. A coluna msg1 contém o nome dos arquivos de som que podem soar antes do aparecimento de um item (i.e., arquivo do tipo .WAV). A coluna ndicas contém um número de 0 a 3 dependendo do número de dicas disponíveis para cada item. As colunas somdica1, somdica2 e somdica3 contêm os nomes dos arquivos de som com as mensagens de ajuda.

 

 

A Figura 4 representa o layout de configuração do tipo, estilo, tamanho e cor do caractere (letra) dos itens escritos a serem apresentados para leitura. O botão fonte permite determinar o tipo, tamanho e cor dos caracteres dos itens escritos. Tal facilidade de customização é de grande importância diagnóstica. Por exemplo, ser capaz de avaliar a leitura frente ao mesmo item escrito em letra cursiva e de fôrma é instrumental em identificar o quadro disléxico de leitura letra a letra (Shallice, 1990).

 

 

A Figura 5 mostra as representações gráficas dos sinais vocálicos (i.e., waveforms) dos itens gostava, criança, posdava e friença, respectivamente. Cada sinal vocálico consiste num registro de amplitude de sinal (ordenada) em função de duração da locução numa escala de milésimos de segundo (abscissa). No sinal vocálico o ponto N0 indica o momento de apresentação do estímulo escrito, N1 indica o momento do início da locução (ou primeiro segmento locucional), e N2, o de seu término. O tempo de reação locucional (TRL) é calculado subtraindo N0 de N1. A duração locucional total (DLT) é calculada subtraindo N1 do último N registrado. Por exemplo, nos sinais vocálicos, a duração locucional total do item gostava é N4-N1, de criança é N2-N1, do item posdava é N6-N1, e do item friença é N8-N1. O número de segmentos locucionais (NSL) corresponde ao índice do último N dividido por 2, e indica o número de trechos com voz de inerente sonoridade. Assim, NSL de gostava é 2 (i.e., 4/2), de criança é 1 (i.e., 2/2), de posdava é 3 (i.e., 6/2), e de friença é 4 (i.e., 8/2). A duração do segmento locucional (DSL) (i.e., do primeiro segmento locucional) é calculada subtraindo N1 de N2. Do mesmo modo, N3 indica o momento do início do segundo segmento locucional e N4 de seu fim, e a duração deste segundo segmento é calculada subtraindo N3 de N4. E assim por diante. Se a leitura pela rota fonológica for, de fato, segmentada, então a identificação precisa do número de segmentos locucionais pode ser bastante informativa.

Na rota fonológica a pronúncia tende a ser segmentada, já que é construída por decodificação. Neste caso, espera-se que haja tantos, ou quase tantos, segmentos locucionais quantos segmentos ortográficos (i.e., silábicos). Já na lexical a pronúncia é menos segmentada, visto que é recuperada como um todo a partir do léxico. Neste caso, esperam-se menos segmentos locucionais que ortográficos. Assim, uma freqüência de segmentação relativa mais elevada indica um padrão de leitura fonológica, e uma mais baixa, lexical. Avaliando o padrão de segmentação, a duração e o tempo de reação, CronoFonos fornece medidas articulatórias diretas para o processamento de informação envolvido na leitura, que é eminentemente cognitivo.

Para calcular o padrão de segmentação o software subtrai, para cada item lido, a freqüência de segmentos ortográficos da freqüência de segmentos locucionais. Por exemplo, dado um item ortograficamente definido como bissílabo, a locução produzida durante sua leitura em voz alta pode apresentar apenas um, dois ou mesmo três picos de energia (Gielow, 1993). O primeiro caso poderia indicar leitura lexical; o segundo, leitura fonológica bem estabelecida; e o terceiro, leitura fonológica incipiente e hesitante ou disfluência. Neste exemplo, ao subtrair a freqüência de segmentos ortográficos (i.e., 2) da de segmentos locucionais (i.e., 1, 2 ou 3, respectivamente), o software atribui à leitura desse item bissílabo específico o valor -1, 0 e +1, respectivamente. Assim, em termos de padrões de segmentação, a leitura desse item específico estaria a exibir um padrão de subsegmentação (PS-), igualação (PS=) ou supersegmentação (PS+), respectivamente. Na supersegmentação, há excesso de segmentos locucionais em relação aos ortográficos. Na subsegmentação, há déficit de segmentos locucionais em relação aos ortográficos. A freqüência de segmentos em excesso (super) ou déficit (sub) é obtida subtraindo NSO de NSL. Quando o resto de NSL - NSO for negativo, ele é chamado PS-n; quando for positivo, é chamado de PS+n, sendo que n designa o número de segmentos a menos ou a mais.

Como a tarefa de leitura envolve uma amostra grande de itens com características psicolingüísticas variadas, o padrão de segmentação médio (PSM) de um dado leitor deve indicar o tipo de estratégia ou rota que ele emprega na maior parte das vezes quando faz leitura em voz alta. Assim, uma média próxima a zero (i.e., padrão de segmentação de igualação PS=) é consistente com um padrão preferencial de leitura bem estabelecida pela rota fonológica. Já uma média positiva (i.e., padrão de supersegmentação PS+) indica um padrão de disfluência ou leitura incipiente pela rota fonológica, com hesitações e autocorreções. Finalmente, uma média negativa (i.e., padrão de subsegmentação PS-) indica um padrão preferencial de leitura lexical, ou seja, uma tendência a ler as palavras como um todo.

Os itens escritos programados para leitura em voz alta podem ser palavras ou pseudopalavras, com diferentes números de sílabas escritas ou NSO (número de segmentos ortográficos). Como as pseudopalavras são lidas fonologicamente, é esperado um NSL (número de segmentos locucionais) mais próximo ao NSO. Assim, é esperado um matching (PS=), ou seja, uma igualação ou concordância entre NSL e NSO para pseudopalavras. Logo, para pseudopalavras, NSO - NSL @ 0. Por outro lado, como palavras de alta freqüência são lidas lexicalmente, é esperado que NSL seja mais baixo que NSO. Logo, para palavras, a expectativa é NSO > NSL. A disparidade entre o NSL registrado e o NSO esperado pode ser de dois tipos: Subsegmentação (PS-) quando NSL < NSO; e supersegmentação (PS+) quando NSL > NSO. Os termos subsegmentação e supersegmentação resultam da expectativa teórica (confirmada por Capovilla, Capovilla, & Macedo, 1998) de que no início da leitura alfabética o número de segmentos locucionais emitidos durante a leitura em voz alta tende a coincidir (i.e., tende a haver matching ou igualação) com o número de segmentos ortográficos (i.e., NSL= NSO), com uma forte tendência à subsegmentação com o aumento na proficiência da leitura.

Um exemplo de igualação (PS=) é apresentado no sinal vocálico da Figura 5 referente à pronúncia da pseudopalavra posdava emitida por uma criança de primeira série. Como pode ser observado, como se trata de uma pseudopalavra, a leitura foi feita por meio de decodificação fonológica dos segmentos correspondentes às sílabas. Assim, o número de segmentos locucionais coincidiu com o de segmentos ortográficos (NSL= NSO= 3). Além disso, o tempo de reação locucional (TRL) foi maior do que dos itens gostava e criança. Um exemplo de subsegmentação (PS-) é apresentado no sinal vocálico da Figura 5 referente à palavra criança. Como se trata de uma palavra de alta freqüência, a leitura em voz alta foi fluente e não-interrompida por pausas ou intervalos locucionais. Consequentemente o número de segmentos locucionais (NSL) resultante foi 1, embora o número de segmentos ortográficos (NSO) fosse 3. Isto resultou num padrão de subsegmentação 2, ou seja, em dois segmentos locucionais a menos que ortográficos (i.e., PS-2) (i.e., PS= NSL - NSO= 1 - 3= -2). Um exemplo de supersegmentação (PS+) é apresentado no sinal vocálico da Figura 5 referente à pseudopalavra friença. Como pode ser observado, a pronúncia da leitora de primeira série foi não apenas escandida como também hesitante, a ponto de ter introduzido segmentos locucionais adicionais no registro. Consequentemente NSL= 4, embora NSO= 3. Isto resultou num padrão de supersegmentação igual a 1, ou seja, de um segmento locucional a mais que ortográfico (i.e., PS= NSL ¾ NSO= 4 - 3= +1).

A leitura fonológica é obtida pela decodificação serial dos segmentos ortográficos (e.g., sílabas), e tende a ser escandida e, portanto mais claramente segmentada do que a lexical. Assim, para um mesmo número de sílabas escritas, como a leitura fonológica é usualmente feita quando os itens escritos são pseudopalavras, e a lexical quando são palavras de alta freqüência, tenderá a haver um maior número de segmentos locucionais na leitura (fonológica) de pseudopalavras do que na leitura (lexical) de palavras de alta freqüência.

Listas de Pseudopalavras

No presente estudo CronoFonos foi programado para apresentar as nove listas de pseudopalavras elaboradas por Manarini (1996). As nove listas eram divididas em três conjuntos (1, 2, 3) de três listas cada uma (A, B, C), compostas de 30 pseudopalavras cada uma. As listas do primeiro conjunto (1A, 1B, 1C) permitiam avaliar os efeitos de extensão e de estrutura silábica. A lista 1A continha itens bissílabos de quatro letras, com estrutura silábica CV (e.g., dazu, rija, cegi, sube, molu, nivo). A lista 1B continha itens trissílabos de seis letras com estrutura CV (e.g., tabicu, fesura, poladi, vucelo, livoru, burige). A lista 1C continha itens bissílabos com estrutura silábica CVC (e.g., disbor, meljus, milzor, zelrur, puldos, jelrir). A comparação entre os desempenhos nas listas 1A e 1B permitiu obter o efeito de extensão em termos de número de sílabas e de letras (i.e., itens bissílabos de quatro letras versus trissílabos de seis letras) para itens com a mesma estrutura silábica CV. A comparação entre os desempenhos nas listas 1A e 1C permitiu obter o efeito de uma combinação entre estrutura silábica e extensão em termos de letras (i.e., itens CV de quatro letras versus CVC de seis letras) nos itens bissílabos. A comparação entre os desempenhos nas listas 1B e 1C permitiu obter o efeito de outra combinação entre extensão (em termos de número de sílabas) e estrutura silábica (i.e., trissílabos CV versus bissílabos CVC) nos itens de seis letras.

As listas do segundo conjunto (2A, 2B, 2C) permitiam avaliar os efeitos da estrutura silábica e da composição grafêmica em pseudopalavras de seis letras. A lista 2A continha itens com estrutura CCV e dois grafemas compostos (e.g., chunha, chalhu, guenhi, guique, quesçu, quilhe). A lista 2B continha itens com estrutura CCV e grafemas simples (e.g., platri, plupra, plibre, brigla, treglu, treplu). A lista 2C continha itens com estrutura CVC e grafemas simples (e.g., felmis, sulpas, nosfil, derfus, pirtas, zisner). A comparação entre os desempenhos nas listas 2A e 2B permitiu obter o efeito da composição grafêmica (i.e., grafema composto versus simples) na mesma estrutura CCV. A comparação entre os desempenhos nas listas 2A e 2C permitiu obter o efeito da combinação entre composição grafêmica e estrutura silábica (i.e., dígrafo CCV versus grafema simples CVC). A comparação entre os desempenhos nas listas 2B e 2C permitiu obter o efeito da estrutura silábica (i.e., estrutura CCV versus estrutura CVC) em itens compostos de grafemas simples.

As listas do terceiro conjunto (3A, 3B, 3C) permitiam avaliar o efeito da posição do dígrafo em pseudopalavras trissílabas com sete letras. Na lista 3A o grafema composto encontrava-se na primeira sílaba (e.g., guesobi, guijuca, hujimo, chipuco, guipuda, chamali), na 3B na segunda sílaba (e.g., vachinu, ciguefo, poquinu, duquebo, tichelu, lochusi), e na 3C na terceira (e.g., sibogue, bamigui, tigacho, mibague, poruqui, mugache). A comparação entre os desempenhos nas três listas permitiu avaliar se a posição do dígrafo afeta o processamento de pseudopalavras trissílabas com sete letras.

Procedimentos

Os participantes eram testados individualmente em local silencioso. Eles se sentavam defronte ao computador, com o monitor a uma distância de 40 cm dos olhos. Eles eram instruídos a ler o mais rápida e corretamente possível os itens escritos que iriam aparecer individualmente no monitor. Todos participaram de todos os três experimentos que diferiam apenas em termos das listas de itens de leitura e da ordem de apresentação dos itens em cada lista. Cada experimento tomava apenas uma sessão de cerca de dez minutos. No Experimento 1 foram usadas as listas 1A, 1B e 1C para examinar os efeitos da complexidade grafêmica e extensão. No Experimento 2 foram usadas as listas 2A, 2B e 2C para examinar os efeitos da estrutura silábica e complexidade grafêmica. No Experimento 3 foram usadas as listas 3A, 3B e 3C para examinar o efeito da posição do dígrafo.

Em cada experimento, a ordem de apresentação das listas era aleatorizada entre sujeitos e, em cada lista, a ordem de apresentação dos estímulos era aleatorizada de sujeito a sujeito. Os estímulos eram apresentados individualmente em preto sobre fundo branco, escritos em fonte Times New Roman com tamanho 72. O tempo de apresentação era ilimitado e seu desaparecimento era controlado pelo examinador, apertando uma tecla após cada resposta do sujeito. Um novo estímulo aparecia na tela 100 milésimos de segundo (ms) após o desaparecimento do anterior. Um microfone acoplado ao computador registrava o tempo de reação locucional (i.e., o intervalo entre a apresentação visual do estímulo e o início da locução pelo leitor), a duração locucional (i.e., o intervalo entre o início e o fim dessa locução), e a freqüência de segmentação (i.e., o número de picos de energia de grande amplitude de onda separados por pausas ou períodos sem energia).

Nestes três experimentos, os parâmetros temporais tempo de reação locucional, duração locucional, e freqüência de segmentação locucional foram medidos diretamente a partir dos registros de onda da pronúncia dos leitores frente a cada item. Os três parâmetros temporais e a proporção de acertos foram analisados como função da extensão dos itens de leitura, de sua complexidade grafêmica e da composição silábica resultante. Em cada experimento, os dados foram analisados por meio de ANOVAs unifatoriais intrasujeitos (três listas) seguidas de análises de contraste entre as listas específicas. Antes de proceder às ANOVAs, eram obtidas a média e o desvio-padrão de cada variável dependente (i.e., proporção de acerto, tempo de reação, duração, freqüência de segmentação) em cada lista. Então, para cada variável dependente e em cada lista, eram excluídos os dados marginais (i.e., outliers), isto é, aqueles acima ou abaixo de dois desvios-padrão em relação à média. Só então os dados eram submetidos às análises estatísticas.

 

Experimento 1

Efeito de Complexidade Grafêmica e Extensão

O Experimento 1 examinou os efeitos de complexidade grafêmica e extensão por meio de ANOVA unifatorial de medidas repetidas, tendo a variável lista três níveis (1A, 1B e 1C). A lista 1A continha itens bissílabos de quatro letras, com estrutura silábica CV. A lista 1B continha itens trissílabos de seis letras com estrutura CV. A lista 1C continha itens bissílabos de seis letras com estrutura silábica CVC. A ANOVA unifatorial de medidas repetidas foi seguida de análises de contraste entre os desempenhos nas listas. A comparação entre os desempenhos nas listas 1A e 1B permitiu obter o efeito de extensão em termos de número de sílabas e de letras (i.e., bissílabos de quatro letras versus trissílabos de seis letras) para itens com a mesma estrutura silábica CV. A comparação entre os desempenhos nas listas 1A e 1C permitiu obter o efeito de uma combinação entre estrutura silábica e extensão em termos de letras (i.e., CV de quatro letras versus CVC de seis letras) nos itens bissílabos. A comparação entre os desempenhos nas listas 1B e 1C permitiu obter o efeito de outra combinação entre extensão (i.e., em termos de número de sílabas) e estrutura silábica (i.e., trissílabos CV versus bissílabos CVC) nos itens de seis letras.

Expectativas Experimentais

Esperava-se encontrar os mesmos efeitos de extensão e de estrutura silábica sobre o tempo de reação e a duração locucional, sendo tais medidas maiores na lista 1B (i.e., itens trissílabos CV) que na 1C (i.e., itens bissílabos CVC), e nesta que na 1A (i.e., itens bissílabos CV). Ou seja, esperava-se que quanto mais longa a pseudopalavra (trissílabas em vez de bissílabas), e quanto mais longas as sílabas componentes (CVC em vez de CV), tanto maiores o tempo de reação e a duração locucional. Esperava-se também encontrar uma maior freqüência de segmentação em itens compostos de um número maior de sílabas (trissílabos em vez de bissílabos), e com sílabas curtas e simples (CV) do que mais longas (CVC). Ou seja, esperava-se que a segmentação fosse maior na lista 1B (trissílabos CV) que na 1A (bissílabos CV), e nesta que na 1C (bissílabo CVC). Finalmente, quanto à proporção de acerto, esperava-se que fosse maior em itens com sílabas curtas e simples (CV) e com menor número de sílabas (bissílabos). Ou seja, esperava-se que a proporção de acertos fosse maior na lista 1A (i.e., itens bissílabos CV) do que nas listas 1B (i.e., trissílabos CV) e 1C (i.e., bissílabos CVC).

Avaliando o tempo de reação, Parente e Manarini (em preparação) identificaram efeitos de extensão e de estrutura silábica, corroborando a hipótese da natureza segmentar do processamento perilexical. Seus achados foram precisamente que o tempo de reação é maior na lista 1B que na 1C, e nesta que na 1A.

 

Resultados

A Figura 6 mostra a representação gráfica obtida a partir de um dos sujeitos numa amostra de seis sinais vocálicos das Listas 1. Acima, das pseudopalavras dazu e rija da Lista 1A (i.e., bissílabas, quatro letras, estrutura silábica CV). Ao centro, das pseudopalavras dazuni e rejifa da Lista 1B (i.e., trissílabas, seis letras, estrutura silábica CV). E abaixo, das pseudopalavras tirvel e disbor da Lista 1C (i.e., bissílabas, seis letras, estrutura silábica CVC).

A Figura 7 representa a proporção de acertos (à esquerda) e o tempo de reação locucional (à direita) em cada uma das três listas. Conforme a figura à esquerda, a proporção de acertos variou entre as listas (1A > 1B > 1C). Foi maior na lista 1A que 1B (i.e., nas CV, foi maior nos bissílabos de quatro letras que nos trissílabos de seis letras), na 1A que 1C (i.e., nos bissílabos, foi maior nos CV de quatro letras que nos CVC de seis letras), e na 1B que 1C (i.e., nos de seis letras, foi maior nos trissílabos CV que nos bissílabos CVC). De fato, ANOVA revelou que a proporção de acertos foi afetada pelas listas, F (2, 80)= 18,65, p= 0,000. Análises de contraste revelaram que ela foi maior na lista 1A que 1B, F (1, 40)= 8,60, p= 0,000, na 1A que 1C, F (1, 40)= 35,73, p= 0,000, e na 1B que 1C, F (1, 40)= 10,31, p= 0,000. Em suma, a proporção de acertos foi maior em itens simples (i.e., CV) que complexos (i.e., CVC), e em itens curtos (i.e., bissílabos de quatro letras) que longos (i.e., trissílabos de seis letras). Contrastando os efeitos de estrutura silábica e extensão (i.e., trissílabos CV versus bissílabos CVC), nota-se que a proporção de acertos foi mais afetada pela estrutura silábica do item do que pela sua extensão, em termos de sílabas.

Conforme a Figura 7, à direita, o tempo de reação locucional variou entre as listas (1B > 1C > 1A). Foi maior na lista 1B que na 1C (i.e., nos de seis letras, foi maior nos trissílabos CV que nos bissílabos CVC), na 1B que na 1A (i.e., nos CV, foi maior nos trissílabos de seis letras que nos bissílabos de quatro letras), e na 1C que na 1A (i.e., nos bissílabos, foi maior nos CVC com seis letras que nos CV com quatro letras). De fato, ANOVA revelou que o tempo de reação foi afetado pelas listas, F (2, 80)= 42,91, p= 0,000. Análises de contraste revelaram que ele foi maior na lista 1B que 1C, F (1, 40)= 7,97, p= 0,007, na 1B que 1A, F(1, 40)= 55,02, p= 0,000, e na 1C que 1A, F(1, 40)= 95,80, p= 0,000. Em suma, o tempo de reação foi maior nos itens longos que curtos (i.e., foi maior nos trissílabos de seis letras que nos bissílabos de quatro letras), e nos complexos (i.e., CVC) que nos simples (i.e., CV), ainda que a evidência dada pelo delineamento tenha sido fraca devido ao efeito sinérgico da extensão (já que os CVC tinham seis letras e os CV, apenas quatro). Contrastando os efeitos de extensão e estrutura silábica (i.e., trissílabos CV versus bissílabos CVC), nota-se que o tempo de reação foi mais afetado pela extensão (em termos de número de sílabas) do que pela estrutura silábica.

A Figura 8 representa a duração locucional (à esquerda) e a freqüência de segmentação locucional (à direita) em cada uma das três listas. Conforme a figura à esquerda, a duração locucional variou entre as listas (1B > 1C > 1A) exatamente como o tempo de reação. A duração locucional foi maior na lista 1B que na 1C (i.e., para itens de seis letras, foi maior nos trissílabos CV que nos bissílabos CVC), na 1B que na 1A (i.e., para itens CV, foi maior nos trissílabos de seis letras que nos bissílabos de quatro letras), e na 1C que na 1A (i.e., para itens bissílabos, foi maior nos CVC de seis letras que nos CV de quatro letras). De fato, ANOVA revelou que a duração locucional foi afetada pelas listas, F (2, 80)= 370,90, p= 0,000. Análises de contraste revelaram que ela foi maior na lista 1B que 1C, F (1, 40)= 13,50, p= 0,001, na 1B que 1A, F (1, 40)= 729,63, p= 0,000, e na 1C que 1A, F (1, 40)= 424,77, p= 0,000. Em suma, a duração locucional foi maior em itens longos (i.e., trissílabos de seis letras) que curtos (i.e., bissílabos de quatro letras), e nos complexos (i.e., CVC) que simples (i.e., CV), ainda que a evidência dada pelo delineamento tenha sido fraca devido ao efeito sinérgico da extensão. Contrastando os efeitos de extensão e estrutura silábica (i.e., trissílabos CV versus bissílabos CVC), nota-se que a duração locucional foi mais afetada pela extensão (em termos de sílabas) do que pela estrutura silábica.

Conforme a Figura 8, à direita, a freqüência de segmentação locucional variou entre as listas (1B > 1A > 1C). A freqüência de segmentação foi maior na lista 1B que na 1A (i.e., nos CV, foi maior nos trissílabos de seis letras que nos bissílabos de quatro letras), na 1B que na 1C (i.e., nos de seis letras, foi maior nos trissílabos CV que nos bissílabos CVC), e na 1A que na 1C (i.e., nos bissílabos, foi maior nas CV de quatro letras que nos CVC de seis letras). De fato, ANOVA revelou que a freqüência de segmentação locucional foi afetada pelas listas, F (2, 76)= 68,14, p= 0,000. Análises de contraste revelaram que ela foi maior na lista 1B que 1A, F(1, 38)= 16,44, p= 0,000, na 1B que 1C, F(1, 38)= 93,68, p= 0,000, e na 1A que 1C, F(1, 38)= 84,97, = 0,000. Em suma, a freqüência de segmentação locucional foi maior em itens longos (i.e., trissílabos de seis letras) que curtos (i.e., bissílabos de quatro letras), e nos simples (i.e., CV) que complexos (i.e., CVC), ainda que a evidência dada pelo delineamento tenha sido fraca devido ao efeito sinérgico da extensão. Contrastando os efeitos de estrutura silábica e extensão (i.e., CV de quatro letras versus CVC de seis letras), nota-se que a freqüência de segmentação locucional foi mais afetada pela estrutura silábica do que pela extensão, em termos de letras.

 

Discussão

Neste experimento, todas as expectativas foram satisfeitas. Foram encontrados os mesmos efeitos de extensão e de estrutura silábica sobre o tempo de reação e a duração locucional, sendo que tais medidas foram maiores na lista 1B (i.e., itens trissílabos CV) que 1C (i.e., itens bissílabos CVC), e nesta que na 1A (i.e., itens bissílabos CV). Ou seja, quanto mais longa a pseudopalavra (i.e., trissílabas em vez de bissílabas), e quanto mais longas as sílabas que as compunham (i.e., CVC em vez de CV), tanto maiores foram o tempo de reação e a duração locucional. Foi também encontrada uma maior freqüência de segmentação em itens compostos de um número maior de sílabas (i.e., trissílabos em vez de bissílabos), e com sílabas curtas e simples (CV) do que com sílabas mais longas (CVC). Ou seja, conforme esperado, a segmentação foi maior na lista 1B (i.e., trissílabos CV) que na 1A (i.e., bissílabos CV), e nesta que na 1C (i.e., bissílabo CVC). Finalmente, a proporção de acerto foi maior em itens com sílabas curtas e simples (CV em vez de CVC) e com um menor número de sílabas (i.e., bissílabos em vez de trissílabos). Ou seja, ela foi maior na lista 1A (i.e., itens bissílabos CV) que 1B (i.e., trissílabos CV), e nesta que 1C (i.e., bissílabos CVC). Em suma, para a proporção de acertos prevaleceu o efeito da estrutura silábica, sendo maior em itens com estrutura silábica CV do que nos CVC; enquanto que para as medidas temporais (i.e., tempo de reação, duração e freqüência de segmentação) prevaleceu o efeito da extensão, sendo tais medidas maiores nos trissílabos de seis letras do que nos bissílabos de quatro letras.

O presente experimento replicou precisamente os dados de Parente e Manarini (em preparação) quanto aos efeitos de extensão e de estrutura silábica sobre o tempo de reação, estendendo-os também para a duração locucional. Além disso, documentou os efeitos das mesmas variáveis sobre a freqüência de segmentação dos itens, fornecendo forte evidência em suporte à hipótese da natureza segmentar do processamento perilexical.

 

Experimento 2

Efeitos da Estrutura Silábica e da Complexidade Grafêmica

O Experimento 2 examinou os efeitos da estrutura silábica e da complexidade grafêmica em pseudopalavras de seis letras por meio de ANOVA unifatorial de medidas repetidas, tendo a variável lista três níveis (2A, 2B e 2C). A lista 2A continha itens com estrutura CCV e dois grafemas compostos. A lista 2B, itens com estrutura CCV e grafemas simples. A lista 2C, itens com estrutura CVC e grafemas simples. A ANOVA unifatorial de medidas repetidas foi seguida de análises de contraste entre os desempenhos nas listas. A comparação entre os desempenhos nas listas 2A e 2B permitiu obter o efeito da composição grafêmica (i.e., grafema composto versus simples) na mesma estrutura CCV. A comparação entre os desempenhos nas listas 2A e 2C permitiu obter o efeito da combinação entre composição grafêmica e estrutura silábica (i.e., grafema simples e estrutura CVC versus dígrafos e estrutura CCV). A comparação entre os desempenhos nas listas 2B e 2C permitiu obter o efeito da estrutura silábica (i.e., CCV versus CVC) em itens compostos de grafemas simples.

Expectativas Experimentais

Com respeito à complexidade grafêmica (i.e., grafemas compostos versus simples), esperava-se que em pseudopalavras com grafemas compostos, o tempo de reação e a duração locucional fossem maiores, e que a freqüência de segmentação fosse menor, do que naquelas com grafemas simples. Ou seja, mantida a estrutura silábica constante (i.e., CCV) esperava-se que o tempo de reação e a duração locucional fossem maiores na lista 2A (i.e., com grafemas compostos e estrutura CCV) que na 2B (i.e., com grafemas simples e estrutura CCV); e também que a freqüência de segmentação fosse maior na lista 2B (i.e., com grafemas simples e estrutura CCV) que na 2A (i.e., com grafemas compostos e estrutura CCV).

No entanto, não havia expectativas claras quanto ao efeito da estrutura silábica sobre essas medidas. Observando os dados do Experimento 1 comparando CVC e CV com igual número de sílabas, nota-se que CVC tendeu a diminuir a proporção de acerto e a freqüência de segmentação, e a aumentar o tempo de reação e a duração locucional. No entanto, não havia qualquer dado comparando CVC e CCV, exceto os de Parente e Manarini (em preparação), em que o efeito dessa variável não foi identificado. Avaliando o tempo de reação, aquele estudo relatou o efeito esperado do tipo de grafema, mas não da estrutura silábica. Seus dados corroboraram a expectativa de que, no processamento perilexical, o tempo de reação é afetado pela complexidade grafêmica. Naquele estudo o tempo de reação foi maior na lista 2A (i.e., itens com dois grafemas compostos e estrutura CCV) que nas listas 2B (i.e., itens com grafemas simples e estrutura CCV) e 2C (i.e., itens com grafemas simples e estrutura CVC), não havendo diferença significativa entre estas.

 

Resultados

A Figura 9 mostra a representação gráfica de uma amostra de seis sinais vocálicos. Acima, das pseudopalavras chilha e quelhu da Lista 2A (i.e., dois grafemas compostos, seis letras, estrutura silábica CCV). Ao centro, das pseudopalavras plupla e brecru da Lista 2B (i.e., só grafemas simples, seis letras, estrutura silábica CCV). E abaixo, das pseudopalavras tosvul e gestur da Lista 2C (i.e., só grafemas simples, seis letras, estrutura silábica CVC).

A Figura 10 representa a proporção de acerto (à esquerda) e o tempo de reação locucional (à direita), em cada uma das três listas 2A, 2B e 2C. Conforme a figura à esquerda, a proporção de acertos variou entre as listas (i.e., 2B > [2A @ 2C]). Ela foi maior na lista 2B do que nas listas 2A (i.e., nas com estrutura CCV, foi maior nas de grafema simples que nas de dígrafo), e 2C (i.e., nas de grafema simples, foi maior na estrutura CCV que na CVC), mas foi aproximadamente equivalente em 2A (i.e., dígrafo do tipo CCV) e 2C (i.e., grafema simples do tipo CVC). ANOVA revelou que a proporção de acertos foi afetada pelas listas, F (2, 78)= 8,34, p= 0,001. Análises de contraste revelaram que ela foi maior na lista 2B que 2A, F(1, 39)= 8,18, p= 0,007, e na 2B que 2C, F(1, 39)= 30,93, p= 0,000. Revelou também equivalência estatística entre 2A e 2C. Em suma, a proporção de acertos foi maior nos itens com grafemas simples que compostos, e com estrutura silábica CCV que CVC. Contrastando os efeitos de estrutura silábica e complexidade grafêmica (i.e., dígrafo CCV versus grafema simples CVC), nota-se que foram igualmente efetivos.

Conforme a Figura 10, à direita, o tempo de reação locucional variou entre as listas (i.e., 2C < [2A @ 2B]). O tempo de reação foi maior na lista 2A (i.e., com dígrafo CCV) que 2C (i.e., com grafema simples CVC); e maior na 2B que na 2C (i.e., nas com grafema simples, foi maior na estrutura CCV que na CVC), mas foi aproximadamente equivalente em 2A e 2B (i.e., nas com estrutura CCV, não importava se o grafema era composto ou simples). ANOVA revelou que o tempo de reação foi afetado pelas listas, F(2, 82)= 24,35, p= 0,000. Análises de contraste revelaram que ele foi maior na lista 2A que 2C, F(1, 41)= 33,54, p= 0,000, e na 2B que 2C, F(1, 41)= 32,67, p= 0,000. Revelaram também equivalência estatística entre 2A e 2B (i.e., para itens CCV, não houve diferença entre grafema composto e simples). Em suma, o tempo de reação foi maior em itens com estrutura CCV que CVC, e com grafemas complexos que simples, ainda que a evidência experimental do delineamento tenha sido enfraquecida no procedimento pelo efeito sinérgico da estrutura silábica (i.e., foi maior no dígrafo CCV que no grafema simples CVC). No entanto, mantendo CCV constante, não houve evidência de efeito da complexidade grafêmica (i.e., nas listas com estrutura CCV, não houve diferença entre os tempos nos itens com grafema composto e simples).

A Figura 11 representa a duração locucional (à esquerda) e a freqüência de segmentação locucional (à direita) em cada uma das três listas 2A, 2B e 2C. Conforme a figura à esquerda, a duração locucional variou entre as listas (i.e., 2C > 2A > 2B). Ela foi maior na lista 2C (i.e., grafema simples CVC) do que nas listas 2A (i.e., dígrafo CCV) e 2B (i.e., nas com grafema simples, foi maior naquelas com estrutura CVC que CCV); e foi maior maior na 2A que na 2B (i.e., nas com estrutura CCV, foi maior nas com dígrafo que naquelas com grafema simples). De fato, ANOVA revelou que a duração locucional foi afetada pelas listas, F(2, 78)= 125,90, p= 0,000. Análises de contraste revelaram que ela foi maior na lista 2C que 2A, F(1, 39)= 128,16, p= 0,000, na 2C que 2B, F(1, 39)= 169,00, p= 0,000, e na 2A que 2B, F(1, 39)= 10,14, p= 0,003. Em suma, a duração locucional foi maior em itens CVC que CCV. Para itens com grafema simples, a duração em CVC foi maior que em CCV; e a duração em itens com grafema simples e estrutura CVC foi maior que naqueles com dígrafo e estrutura CCV. A duração também foi maior nos itens com grafemas compostos que simples (i.e., para itens CCV, a duração dos grafemas compostos foi maior que dos simples). No entanto, contrastando os efeitos de estrutura silábica e complexidade grafêmica, nota-se que a duração locucional foi mais afetada pela estrutura silábica (i.e., a duração nos itens com grafema simples e estrutura CVC foi maior que nos itens com dígrafo e estrutura CCV).

Conforme a Figura 11, à direita, a freqüência de segmentação locucional variou entre as listas (i.e., 2B > 2C > 2A). A segmentação foi maior na lista 2B que na 2C (i.e., nos itens com grafema simples, foi maior na estrutura CCV que na CVC), na 2B que na 2A (i.e., nos itens CCV, foi maior nos grafemas simples que compostos), e na 2C (i.e., itens com grafema simples e estrutura CVC) que 2A (i.e., itens com dígrafo e estrutura CCV). De fato, ANOVA revelou que a freqüência de segmentação locucional foi afetada pelas listas, F(2, 74)= 132,75, p= 0,000. Análises de contraste revelaram que ela foi maior na lista 2B que 2C, F(1, 37)= 4,28, p= 0,046, na 2B que 2A, F(1, 37)= 150,16, p= 0,000, e na 2C que 2A, F(1, 37)= 4,28, p= 0,046. Em suma, a freqüência de segmentação locucional foi maior em itens contendo grafemas simples que compostos (i.e., nos itens CCV, foi maior nos grafemas simples que nos compostos) e em itens CCV que CVC (i.e., para itens com grafema simples, foi maior nos CCV que nos CVC). No entanto, contrastando os efeitos de complexidade grafêmica e de estrutura silábica (i.e., grafema simples CVC versus dígrafo CCV), nota-se que a freqüência de segmentação locucional foi mais afetada pela complexidade grafêmica do que pela estrutura silábica.

 

Discussão

Este experimento confirmou as expectativas com respeito à complexidade grafêmica. Assim, nas pseudopalavras com grafemas compostos, o tempo de reação e a duração locucional foram maiores do que nas pseudopalavras com grafemas simples. Além disso, nas pseudopalavras com grafemas compostos a freqüência de segmentação e a proporção de acertos foram menores do que nas pseudopalavras com grafemas simples. Ou seja, mantida a estrutura silábica constante (i.e., CCV), o tempo de reação e a duração locucional foram maiores na lista 2A (com grafemas compostos e estrutura CCV) que na 2B (com grafemas simples e estrutura CCV); e, além disso, a freqüência de segmentação e a proporção de acertos foram menores na 2A (com grafemas compostos e estrutura CCV) do que na 2B (com grafemas simples e estrutura CCV). Portanto, os grafemas simples resultam em maior proporção de acerto, maior segmentação, menor tempo de reação e menor duração locucional do que os grafemas compostos. Tais achados replicam os de Manarini e Parente (em preparação) e os estendem para as outras medidas.

No entanto, conforme esperado, o efeito da estrutura silábica sobre essas medidas mostrou-se consideravelmente menos previsível e mais complexo. Mantida constante a complexidade grafêmica (i.e., grafemas simples), a estrutura CVC (i.e., lista 2C) produziu não apenas menor proporção de acerto e menor segmentação, como também maior duração que a estrutura CCV (i.e., lista 2B). Curiosamente, entretanto, ela produziu menor tempo de reação. Para compreender mais intuitivamente as diferenças entre as estruturas CCV da lista 2B, e CVC da lista 2C, pode-se observar mais atentamente os itens que compõem tais listas. Uma breve comparação entre os itens da lista 2B (e.g., plofri, triglo, plupra, brepli, trifla) e 2C (e.g., sulpas, vescur, serbil, ruslor, meljis) é suficiente para revelar algumas diferenças.

Em primeiro lugar, na estrutura CCV, cada sílaba começa com uma consoante e termina com uma vogal (como nas sílabas CV), o que tende a resultar numa maior definição da segmentação, com marcação pausada mais clara entre as sílabas, e em menor duração locucional. Já na estrutura CVC, ambas as sílabas começam e terminam com consoantes, o que tende a diminuir a segmentação e a aumentar a duração. Em segundo lugar, parece haver uma diferença entre sílaba simples CV (i.e., lista 1A), sílaba simples CVC (i.e., 1C ou 2C), sílaba com encontro consonantal3 CCV (i.e., 2B), e sílaba com dígrafo CCV (i.e., 2A). Os dados parecem sugerir uma gradação de demanda de processamento inicial (tal como indicada pelos tempos de reação) nas sílabas CCV desde os dígrafos da lista 2A onde houve maior demanda, passando pelos encontros consonantais da lista 2B que produziram demanda intermediária até as sílabas com grafemas simples CVC das listas 2C e 1C, e finalmente as sílabas simples CV da lista 1A, que produziram a menor demanda. Comparando a distribuição dos tempos de reação entre todas essas cinco listas de bissílabos, observa-se que eles diminuirem na proporção esperada conforme este modelo hierárquico.

Em terceiro lugar, finalmente, em adendo à explicação da maior duração locucional verificada na lista 2C, observa-se que, de acordo com as regras de pronúncia do português que dizem respeito à sílaba terminal, enquanto os itens da lista 2B podiam ser lidos como paroxítonos, boa parte dos da lista 2C deviam ser lidos como oxítonos (e.g., ruslor, serbil, vescur). Uma eventual necessidade de evocar e processar regras de pronúncia envolvendo a tonicidade da última sílaba para o término da locução poderia ter contribuído para aumentar a duração locucional de alguns desses itens da lista 2A em relação àqueles paroxítonos canônicos que prevaleciam na lista 2B.

 

Experimento 3

Efeito da Posição do Grafema Composto

O Experimento 2 demonstrou claramente os efeitos da complexidade grafêmica em diminuir a proporção de acertos, aumentar o tempo de reação e a duração locucional, e diminuir a segmentação. Portanto, ele permitiu afirmar que o processamento perilexical do dígrafo é mais difícil que o do grafema simples em todas essas quatro medidas. Estabelecida a dificuldade causada pelo dígrafo, o Experimento 3 examinou o efeito que a posição desse dígrafo pode exercer sobre as quatro medidas durante o processamento de pseudopalavras trissílabas com sete letras. Novamente, foi empregada ANOVA unifatorial de medidas repetidas, tendo a variável lista três níveis (3A, 3B e 3C). Na lista 3A o dígrafo encontrava-se na primeira sílaba, na 3B na segunda, e na 3C na terceira. A ANOVA unifatorial de medidas repetidas foi seguida de análises de contraste entre os desempenhos nas listas. A comparação entre os desempenhos nas três listas permitiu avaliar se a posição do dígrafo afetava o processamento de pseudopalavras trissílabas com sete letras.

Expectativas Experimentais

Se o dígrafo dificultasse o processamento diminuindo o acerto e a segmentação, e aumentando o tempo de reação e a duração, então era esperado que sua posição afetasse o modo como o item é processado. Deve-se ressaltar, no entanto, que, avaliando o tempo de reação, Parente e Manarini (em preparação) não identificaram o efeito esperado da posição do dígrafo, não encontrando, assim, suporte à tese da linearidade. Com o aumento do poder estatístico decorrente do aumento do tamanho da amostra de 10 para 44, e com o aumento no número de medidas, incluindo a duração locucional e o tempo de reação locucional, esperava-se que o presente experimento pudesse fornecer um teste mais completo e rigoroso daquela hipótese. Se o processamento perilexical fosse linear, poderia ser esperado que o tempo de reação refletisse mais a complexidade grafêmica da(s) primeira(s) sílaba(s), enquanto que a duração locucional, a complexidade grafêmica da(s) última(s) sílaba(s). Por outro lado, não havia expectativas claras quanto aos efeitos sobre proporção de acertos ou freqüência de segmentação.

 

Resultados

A Figura 12 mostra a representação gráfica de uma amostra de seis sinais vocálicos da Lista 3. Acima, das pseudopalavras chigume e guetavu da Lista 3A (i.e., trissílabas, sete letras, dígrafo na primeira sílaba). Ao centro, das pseudopalavras gachitu e rugueba da Lista 3B (i.e., trissílabas, sete letras, dígrafo na segunda sílaba). E abaixo, das pseudopalavras nuvoque e vosichu da Lista 3C (i.e., trissílabas, sete letras, dígrafo na terceira sílaba).

A Figura 13 representa a proporção de acerto (à esquerda) e o tempo de reação locucional (à direita) em cada uma das três listas 3A, 3B e 3C. Conforme a figura à esquerda, houve pouca diferença entre as proporções de acertos nas listas (1A @ 1B @ 1C). De fato, ANOVA falhou em revelar diferenças significativas entre as proporções de acertos na listas.

Conforme a Figura 13 à direita, o tempo de reação locucional variou entre as listas, sendo menor na 3C do que nas demais (i.e., 3C < [3A @ 3B]). O tempo de reação foi menor na lista 3C (i.e., em que o dígrafo encontrava-se na terceira sílaba) que na 3A (i.e., em que ele se encontrava na primeira sílaba) e 3B (i.e., em que ele se encontrava na segunda). Mas não houve diferença entre 3A e 3B, ou seja, não fazia diferença se o dígrafo se encontrasse na primeira ou segunda sílaba. ANOVA revelou que o tempo de reação foi afetado pelas listas, F (2, 80)= 9,56, p= 0,000. Análises de contraste revelaram que ele foi maior na lista 3A que na 3C, F(1, 40)= 11,72, p= 0,001, e na 3B que 3C, F(1, 40)= 19,00, p= 0,000, falhando em revelar diferença entre 3A e 3B. Em suma, o tempo de reação foi maior quando o dígrafo estava na primeira ou segunda sílaba do que quando estava na terceira.

A Figura 14 representa a duração locucional (à esquerda) e a freqüência de segmentação locucional (à direita) em cada uma das três listas 3A, 3B e 3C. Conforme a figura à esquerda, a duração locucional variou entre as listas (i.e., 3B > [3A @ 3C]). A duração foi maior na lista 3B (i.e., em que o dígrafo estava na segunda sílaba) do que nas listas 3A (i.e., em que estava na primeira sílaba) e 3C (i.e., em que estava na terceira sílaba). Mas não houve diferença entre 3A e 3C (i.e., não houve diferença quando o dígrafo estava na primeira ou terceira sílaba). A ANOVA revelou que a duração locucional foi afetada pelas listas, F(2, 82)= 13,82, p= 0,000. Análises de contraste revelaram que ela foi maior na lista 3B que 3A, F (1, 41)= 21,45, p= 0,000, e na 3B que 3C, F(1, 41)= 16,76, p= 0,000. Mas não revelaram diferença entre 3A e 3C. Em suma, a duração locucional foi maior quando o dígrafo encontrava-se na segunda sílaba (i.e., com tonicidade canônica nas paroxítonas) do que em qualquer das demais.

Conforme a Figura 14, à direita, a freqüência de segmentação locucional variou entre as listas do mesmo modo que a duração locucional (3B > [3A @ 3C]). A segmentação foi maior na lista 3B (i.e., em que o dígrafo estava na segunda sílaba) que na 3A (i.e., em que estava na primeira sílaba) e 3C (i.e., em que estava na terceira), mas não houve diferença entre 3A e 3C (i.e., entre primeira e terceira sílaba). ANOVA revelou que a freqüência de segmentação locucional foi afetada pelas listas, F(2, 76)= 16,19, p= 0,000. Análises de contraste revelaram que ela foi maior na lista 3B que 3A, F(1, 38)= 29,58, p= 0,000, e na 3B que 3C, F(1, 38)= 16,79, p= 0,000. Mas falharam em revelar diferença entre 3A e 3C. Em suma, a freqüência de segmentação locucional foi maior quando o dígrafo encontrava-se na segunda sílaba, com tonicidade canônica paroxítona, do que em qualquer das demais.

 

Discussão

Como o Experimento 2 já havia demonstrado que o dígrafo dificulta o processamento diminuindo o acerto e a segmentação, e aumentando o tempo de reação e a duração, então no Experimento 3 esperava-se encontrar evidência de que a posição desse dígrafo pudesse afetar o modo como o item é processado, embora o estudo de Parente e Manarini (em preparação) não houvesse identificado efeito dessa posição sobre o tempo de reação. Como o Experimento 3 teve maior poder estatístico em decorrência do aumento do tamanho da amostra de 10 para 44, e como ele avaliou outras medidas como a duração locucional e o tempo de reação locucional, ele deveria ser capaz de encontrar alguma evidência do efeito da posição do dígrafo, caso ele existisse, corroborando parcialmente, assim, a hipótese da linearidade da leitura. De acordo com tal hipótese, se o processamento perilexical fosse linear, seria esperado que o tempo de reação refletisse mais a complexidade grafêmica da(s) primeira(s) sílaba(s), enquanto que a duração locucional refletisse mais a complexidade grafêmica da(s) última(s) sílaba(s). De fato, os achados revelaram que quando o dígrafo estava na primeira ou segunda sílaba, o tempo de reação foi maior do que quando ele estava na terceira. Por outro lado, tanto a duração locucional quanto à freqüência de segmentação foram maiores quando o dígrafo estava na segunda sílaba do que na primeira ou terceira. É possível que tais medidas tenham alguma relação com a incidência do dígrafo na sílaba tônica paroxítona. Tal achado específico não estava previsto, e não parece decorrer do modelo.

Como o tempo de reação refletiu a complexidade grafêmica das primeiras sílabas, mas a duração locucional não refletiu a complexidade das últimas, a hipótese da linearidade parece ter sido corroborada apenas parcialmente. Para explicar porque quando estava na última sílaba o dígrafo não produziu aumento na duração locucional, mas quando estava nas primeiras sílabas ele produziu aumento no tempo de reação, parece ser necessário postular a operação de um processo adicional em paralelo ao processamento linear de leitura, capaz de pré-processar o dígrafo, reduzindo os efeitos de sua complexidade. Como tal processo demanda um certo tempo mínimo, ele tenderia a operar sobre as últimas sílabas, reduzindo-lhes o tempo de processamento, mas não das primeiras. Portanto, tal processo deveria afetar não o tempo de reação, mas sim a duração locucional, e não a duração do processamento das primeiras sílabas, mas apenas a das últimas sílabas.

Evidência indireta da existência de um tal processo hipotético pode ser encontrada no estudo de Rayner, Sereno, Lesch, e Pollatsek (1995). Nesse estudo eram apresentadas palavras-pista visuais cuja pronúncia era semelhante ou diferente da pronúncia de palavras-alvo a serem lidas. Quando o tempo de exposição das palavras-pista era de 36 ms, foi observado que a similaridade de pronúncia beneficiou a pronúncia da palavra-alvo, reduzindo-lhe o tempo de processamento. No entanto, o efeito se perdeu quando o tempo de exposição das palavras-pista caía apenas seis milésimos de segundo, de 36 para 30 ms. Tais dados de Rayner e colaboradores parecem confirmar a existência de um processamento prévio que opera em paralelo à decodificação e que é capaz de facilitar a pronúncia de uma palavra subseqüente a ser lida, reduzindo seu tempo de processamento. Confirmam também a possibilidade de medir o tempo necessário à operação de tal processamento facilitador paralelo.

Fazendo uma transposição heurística de tais achados para a interpretação dos dados deste experimento é possível que a exposição a uma pseudopalavra tenda a evocar no leitor um processamento serial de pronúncia por decodificação e, ao mesmo tempo, um processamento facilitador em paralelo. Se o dígrafo não for previamente processado, ele tende a aumentar o tempo de reação da pronúncia. Quando ele se encontra logo no início ou até no meio da palavra, na primeira ou segunda sílaba, pode não haver tempo suficiente para a ocorrência do processamento facilitador em paralelo, e, em conseqüência, o dígrafo acaba por aumentar o tempo de reação. Já quando ele se encontra no fim da palavra, o processo facilitador paralelo tem tempo de ocorrer enquanto o leitor vai decodificando as duas primeiras sílabas. Assim, neste caso, como as duas primeiras sílabas contêm grafemas simples, o tempo de reação é curto e inicia-se logo a decodificação. Como o grafema complexo encontra-se apenas por último, o processamento facilitador em paralelo tem tempo de operar, pré-processando a complexidade do grafema e, assim, reduzindo o tempo necessário à sua emissão, resultando numa redução da duração locucional.

Tal hipótese é ainda meramente heurística e seu teste demandará análises ulteriores como, por exemplo, a do tempo de processamento de sílabas como função de sua posição em pseudopalavras multissilábicas. O importante é que todos esses testes podem ser conduzidos de modo mais completo e sistemático, agora que foi demonstrada a validade das novas medidas de duração locucional e de segmentação locucional possibilitadas por CronoFonos, e que foi demonstrada a covariação sistemática de tais medidas de acordo com o modelo expandido.

 

Referências

Capovilla, A. G. S. & Capovilla, F. C. (2000a). Efeitos do treino de consciência fonológica em crianças com baixo nível sócio-econômico. Psicologia: Reflexão e Crítica, 13, 7-24.         [ Links ]

Capovilla, A. G. S. & Capovilla, F. C. (2000b). Problemas de leitura e escrita: Como identificar, prevenir e remediar numa abordagem fônica. São Paulo, SP: Memnon-FAPESP.         [ Links ]

Capovilla, F. C. & Capovilla, A. G. S. (1999). Phonological awareness training: effects on phonological, reading and spelling skills in Brazilian children. The Brazilian Journal of Dysmorphology and Speech-Hearing Disorders, 3, 45-66.         [ Links ]

Capovilla, F. C., Capovilla, A. G. S. & Macedo, E. C. (1998). Validação do software CronoFonos para análise de tempo de reação, duração e freqüência de segmentação locucionais na leitura em voz alta de itens isolados. Ciência Cognitiva: Teoria, Pesquisa e Aplicação, 2(3), 253-340.         [ Links ]

Capovilla, F. C., Macedo, E. C., Duduchi, M. & Sória, R. A. B. (1999). Desenvolvimento das rotas de leitura fonológica e lexical em escolares e de seu comprometimento em disléxicos. Em L. Pasquali (Org.), Instrumentos psicológicos: Manual prático de elaboração (pp. 259-294). Brasília, DF: LabPAM/IBAPP.         [ Links ]

Ellis, A. & Young, A. W. (1988). Human cognitive neuropsychology. London, UK: Lawrence Erlbaum.         [ Links ]

Gielow, I. (1993). Análise espectrográfica da zona de transição dos formantes das vogais subsequentes aos sons plosivos do português brasileiro. Monografia de especialização. Escola Paulista de Medicina. São Paulo, SP.         [ Links ]

Lecours, A. R., Delgado, A. P. & Pimenta, M. A. M. (1993). Distúrbios adquiridos da leitura e da escrita. Em L. L. Mansur & N. Rodrigues (Orgs.), Temas em neurolingüística, (pp.31-44). São Paulo: Tec Art.         [ Links ]

Lecours, A. R. & Parente, M. A. M. P. (1997). As dislexias no português: As manifestações das dislexias adquiridas no sistema ortográfico do português. Porto Alegre, RS: Artes Médicas.         [ Links ]

Manarini, A. S. (1996). Influência do sistema de escrita do português nos processamentos perilexicais de leitura. Dissertação de Mestrado não publicada. Instituto de Psicologia, Universidade de São Paulo. São Paulo, SP.         [ Links ]

Parente, M. A. M. P. & Manarini, A. S. (em preparação). Processamentos iniciais de leitura: Um estudo das características da leitura por conversão grafofonêmica. Curso de Pós-Graduação em Psicologia do Desenvolvimento, Universidade Federal do Rio Grande do Sul. Porto Alegre, RS.         [ Links ]

Pinheiro, A. M. V. (1994). Leitura e escrita: Uma abordagem cognitiva. Campinas, SP: Editorial Psy II.         [ Links ]

Seidenberg, M. S. & McClelland, J. L. (1989). A distributed, developmental model of word recognition and naming. Psychological Review, 96(4), 523-568.         [ Links ]

Shallice, T. (1990). From neuropsychology to mental structure. Cambridge, Cambridge University Press.         [ Links ]

Turtle Beach Systems (1993). Wave for Windows. v.2. Turtle Beach, Inc.         [ Links ]

 

 

Recebido: 28/8/2000
Revisado: 20/12/2000
Aceite final: 21/12/2000

 

 

Sobre os autores

Fernando César Capovilla é Psicólogo, Mestre em Psicologia da Aprendizagem e do Desenvolvimento pela Universidade de Brasília (1984), Ph.D. em Psicologia Experimental pela Temple University (1989), Livre-Docente em Neuropsicologia pela Universidade de São Paulo (2000), Bolsista de Produtividade, CNPq. Professor Associado do Instituto de Psicologia da USP, onde criou e dirige o Laboratório de Reabilitação Cognitiva de Distúrbios de Comunicação e Linguagem.

Alessandra Gotuzo Seabra Capovilla é Psicóloga, Mestre e Doutora em Psicologia Experimental pela Universidade de São Paulo, com Pós-Doutorado pela FAPESP. Professora do Mestrado em Psicopedagogia da Universidade de Santo Amaro, da Especialização em Psicopedagogia das Faculdades Campos Salles, e do Instituto de Psicologia e Fonoaudiologia da Pontifícia Universidade Católica de Campinas.

Elizeu Coutinho de Macedo é Psicólogo, Mestre e Doutor em Psicologia Experimental pela Universidade de São Paulo. Professor da Faculdade de Psicologia da Universidade Mackenzie, das Faculdades Campos Salles, e da Universidade de Guarulhos.

 

 

1 Endereço para correspondência: PSE, Instituto de Psicologia, Universidade de São Paulo, Av. Prof. Mello Moraes, 1721, CEP 05508-900, São Paulo, SP. Fone: (11) 8184444, Fax: (11) 8184357. E-mail: capovilla@usp.br
2 Dígrafo consiste na combinação de duas letras para representar um único som ou fonema (e.g., como nas palavras inglesas show e read, e nas palavras portuguesas chuva, osso, unha, quem e olho).
3 Encontro consonantal consiste num agrupamento de duas ou mais consoantes numa palavra. Pode ser próprio, quando não pode ser separado na divisão silábica (e.g., psicologia, branco, prato), ou impróprio, quando é separado na divisão silábica (e.g., ignorante, pasta, ritmo).