SciELO - Scientific Electronic Library Online

 
vol.17 issue3Assisted assessment of cognitive abilities in children with visual impairment and learning difficultiesAn analysis of the effects of history of behavioral variation on rule-following behavior author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Article

Indicators

Related links

Share


Psicologia: Reflexão e Crítica

Print version ISSN 0102-7972

Psicol. Reflex. Crit. vol.17 no.3 Porto Alegre  2004

http://dx.doi.org/10.1590/S0102-79722004000300012 

Investigação do controle por regras e do controle por histórias de reforço sobre o comportamento humano

 

Investigation of rule control by controlling the effetcts of reinforcement history on human behavior

 

 

Luiz Carlos de AlbuquerqueI, 1; Maria Amélia MatosII; Deisy das Graças de SouzaIII; Carla Cristina Paiva ParacampoI

IUniversidade Federal do Pará
IIUniversidade de São Paulo
IIIUniversidade Federal de São Carlos

 

 


RESUMO

Este estudo investigou, com 16 universitários, o papel da história de reforço e da densidade relativa de reforço no seguimento de regra. Utilizou-se um procedimento de escolha segundo o modelo, com 3 estímulos de comparação; a tarefa consistia em apontar cada um dos 3 estímulos de comparação, em seqüência, de acordo com a dimensão (Cor, Espessura ou Forma) em comum com o modelo. As Fases 1, 2, 3 e 4 eram iniciadas, respectivamente, por instruções mínimas, regra discrepante (especificava a seqüência FCE), correspondente (especificava EFC) e discrepante. A seqüência CEF era a única reforçada em todas as fases. Na Fase 3, EFC era reforçada concorrentemente com CEF (concorrente FR2 FR6 e concorrente FR6 FR2). Nenhuma outra seqüência era reforçada. Observou-se tanto controle por regras quanto pela história de reforço, sob condições específicas. Os resultados têm implicações para a distinção entre o comportamento controlado por regras e o controlado por contingências.

Palavras-chave: Regras; contingências; histórias experimentais; freqüência relativa de reforço; procedimento de escolha segundo o modelo; estudantes universitários.


ABSTRACT

This study investigated the role of experimental history and of relative density of reinforcement on rule following behavior. Sixteen undergraduate students participated. Under a matching-to-sample procedure, with 3 comparison stimuli, the participants were asked to point the comparisons in sequence, according to their dimension, Color, Thickness or Form, in common to the sample. At the beginning of Phases 1, 2, 3 and 4, participants were exposed, respectively, to minimal instructions, a discrepant rule (specifying a non reinforced sequence), a corresponding rule (specifying a TFC sequence) and a repeated discrepant rule. Only the CTF sequence was reinforced in all phases. In Phase 3, two sequences, TFC and CTF, were concurrently reinforced (Concurrent FR 2 FR6 and FR2 FR6). Control by rules and by reinforcement history were both observed, under specific conditions. These findings have implications for drawing a distinction between behaviors controlled by rules and those shaped by contingencies.

Keywords: Rules; contingencies; experimental histories; relative reinforcement rate; matching-to-sample; undergraduate students.


 

 

Na linha de pesquisa que investiga o comportamento governado por regras, a noção de que esse comportamento difere do comportamento controlado por contingências encontra unanimidade. No entanto, há algumas controvérsias sobre alguns pontos críticos, principalmente sobre quais as propriedades definidoras do comportamento controlado por regras e do comportamento controlado por contingências (Albuquerque, de Souza, Matos & Paracampo, 2003; Andronis, 1991; Parrott, 1987); as funções de regras (Albuquerque, 2001; Cerutti, 1989; Schlinger, 1993); e as variáveis responsáveis pelo seu seguimento. O presente estudo constitui uma investigação desta última questão, na tentativa de identificar as condições sob as quais o seguimento de regras é mais provável (ou menos provável) de ser mantido e de esclarecer por que regras são seguidas.

De acordo com Skinner (1969), regras são seguidas porque o comportamento de seguir regras similares foi reforçado no passado. Consistente com essa proposição, alguns autores têm sugerido que o comportamento sob controle de regras é determinado por uma história de reforço social para o responder de acordo com regras (Catania, Matthews & Shimoff, 1990; Hayes, Zettle & Rosenfarb, 1989). Por esta proposição, o comportamento governado por regras seria um operante de ordem superior, cujos membros seriam exemplos individuais de seguimento de regras particulares. Conseqüências sociais (providas por uma comunidade verbal ao longo da história do indivíduo) para o responder de acordo com regras, seriam as conseqüências responsáveis pelo estabelecimento e manutenção deste tipo de operante (Catania & cols., 1990; Cerutti, 1989). Conseqüências atuais produzidas por ocorrências individuais de seguimento de regras particulares seriam conseqüências que poderiam alterar a probabilidade de certos comportamentos de seguir regras virem a ocorrer no futuro (Malott, 1989; Perone, Galizio & Baron, 1988), mas não a sua probabilidade presente. A probabilidade presente seria determinada pela história do ouvinte (Hayes & cols., 1989; Parrott, 1987).

De acordo com Catania, Shimoff e Matthews (1989), as conseqüências que seguem o comportamento de seguir regras particulares são mais prováveis de determinar a probabilidade de certas regras virem a ser seguidas quando as regras correspondem às contingências. Se as regras forem discrepantes das contingências, é mais provável que o controle pela história de conseqüências mediadas socialmente para o responder de acordo com regras possa superar o controle pelas conseqüências atuais que seguem o comportamento de seguir regras particulares.

Entretanto, há evidências experimentais de que, sob algumas condições, o controle pelas conseqüências atuais para o comportamento de seguir regras particulares pode prevalecer sobre o controle por regras discrepantes das contingências de reforço. Por exemplo, o comportamento de seguir regra discrepante das contingências pode deixar de ocorrer quando mantém contato prolongado com as conseqüências que contradizem a própria regra (Michael & Bernstein, 1991).

Também tem sido proposto que a insensibilidade2 do seguimento de regras às contingências de reforço programadas tem maior probabilidade de ocorrer quando essas contingências são fracas, mas não quando são fortes (Cerutti, 1989). Em outras palavras, é mais provável que regras gerem comportamento insensível às contingências de reforço quando não se demonstra controle por estas contingências do que quando tal controle é demonstrado, antes de se apresentar uma regra ao ouvinte (Torgrud & Holborn, 1990).

Por outro lado, também há algumas evidências de que o seguimento de regras discrepantes das contingências de reforço pode ser mantido, mesmo quando se demonstra controle por essas contingências, antes da apresentação da regra ao ouvinte. Por exemplo, procurando testar a proposição sugerida por Torgrud e Holborn (1990), Albuquerque e colaboradores (2003) expuseram 8 estudantes universitários a um procedimento de escolha segundo o modelo. Em cada tentativa, 1 estímulo modelo e 3 de comparação eram apresentados, simultaneamente, em uma bandeja em forma de T. Cada estímulo de comparação possuía apenas uma dimensão - cor (C), espessura (E) ou forma (F) - em comum com o modelo e diferia nas demais. Na presença destes estímulos, o participante deveria apontar para os 3 estímulos de comparação em uma dada seqüência. O experimento era constituído de 4 fases. A Fase 1 era iniciada com a apresentação de instruções mínimas (não especificavam seqüências de respostas), as Fases 2 e 4, com a apresentação da regra discrepante das contingências (especificava que se o participante apontasse para os estímulos de comparação na seqüência FCE ele ganharia pontos trocáveis por dinheiro) e a Fase 3, com a apresentação da regra correspondente (especificava EFC). No início da Fase 1, a seqüência CEF era reforçada diferencialmente em CRF (reforço contínuo) até a obtenção de 20 pontos. Depois, era feito um aumento gradual no valor do esquema de razão fixa (modelagem), até FR 4. Esta fase era encerrada após a obtenção de 4 pontos consecutivos em FR 4, desde que o participante já tivesse obtido no mínimo 16 pontos em FR 4. Apenas os participantes que atingissem este critério de encerramento da Fase 1, eram expostos às demais fases. Durante as Fases 2, 3 e 4, a seqüência CEF continuava sendo reforçada em FR4. Na Fase 3 a seqüência EFC também era reforçada em FR4, concorrentemente com CEF. A emissão de qualquer outra seqüência não era reforçada durante o experimento. Cada uma das Fases 2, 3 e 4 era encerrada quando um dos seguintes critérios fosse atingido, o que ocorresse primeiro: após a obtenção de 20 pontos ou após a ocorrência de 240 tentativas. Os resultados mostraram que 6 dos 8 participantes atingiram o critério de encerramento da Fase 1. Destes 6, 4 seguiram e 2 deixaram de seguir regra durante as Fases 2, 3 e 4. Estes 2, ao deixarem de seguir regra, passaram a apresentar a seqüência CEF (estabelecida por reforço diferencial na Fase 1). Estes resultados, sugerindo que a demonstração de controle pelas contingências, antes de se apresentar uma regra ao ouvinte, não é uma condição suficiente para tornar o seguimento de regras sensível a contingências de reforço programadas em situações experimentais, indicam que o problema de identificar as condições sob as quais o seguimento de regras é mais ou menos provável de ser mantido, deve continuar sendo investigado.

Considerando isto, o presente estudo procurou manipular a freqüência de reforço programada para o seguimento de regra e para o comportamento estabelecido por reforço diferencial, com o objetivo de investigar os efeitos da história de reforço e da densidade relativa de reforço sobre o comportamento de seguir regra. Tal investigação é importante, porque tem sido proposto que a manutenção do seguimento de regras depende da freqüência relativa de reforço programada para o comportamento instruído, em relação à programada para o comportamento não instruído (Chase & Danforth, 1991). De acordo com esta proposição, se em uma situação experimental for arranjada uma história em que o comportamento de acordo com instruções seja mais freqüentemente reforçado do que o comportamento diferente do instruído, os participantes responderão de acordo com as instruções. Contudo, se for arranjada uma história na qual o seguimento de instruções seja menos freqüentemente reforçado do que o responder diferente do instruído, pode-se supor o efeito oposto. Esta proposição está baseada em uma anterior que sugere que a insensibilidade do seguimento de regras às contingências de reforço programadas pode ser devida a uma competição entre o controle pelas conseqüências mediadas socialmente para o responder de acordo com regras e o controle pelas conseqüências atuais que seguem o comportamento de seguir regras particulares (Hayes, Brownstein, Zettle, Rosenfarb & Korn, 1986b).

O presente estudo avaliou os efeitos da história de reforço e da densidade relativa de reforço sobre o comportamento de seguir regra usando um procedimento similar ao usado por Albuquerque e colaboradores (2003), ao qual foi acrescentada uma variação nos esquemas de reforço para os dois tipos de comportamento.

Os participantes foram expostos a duas condições experimentais, uma com FR 2 e outra com FR 6. Na primeira condição, o comportamento modelado por contingências era mantido em um esquema de FR 2, enquanto o comportamento de seguir a regra correspondente era conseqüenciado em esquema de FR 6 e o comportamento de seguir a regra discrepante não produzia a conseqüência reforçadora descrita na regra. Na segunda condição o comportamento modelado por contingências era mantido em um esquema de FR 6, enquanto o comportamento de seguir a regra correspondente era conseqüenciado em esquema de FR 2 e o comportamento de seguir a regra discrepante não produzia a conseqüência reforçadora descrita na regra. Se a manutenção do seguimento de regras depende do quanto o comportamento instruído é mais ou menos freqüentemente reforçado do que o comportamento não instruído (Chase & Danforth, 1991), então, deveria ser esperado que o seguimento da regra discrepante (sob extinção) não se instalasse nas duas condições, e que o seguimento da regra correspondente não se instalasse na condição em que ele era conseqüenciado em FR 6, mas que prevalecesse na condição em que era conseqüenciado em FR 2. Assim, o presente experimento avaliou experimentalmente essas possibilidades.

 

Método

Participantes

Os participantes foram 16 estudantes universitários, de diferentes cursos (exceto o de Psicologia), matriculados em diferentes semestres, sem experiência prévia neste tipo de experimento, e com idades variando entre 18 e 26 anos. Os estudantes foram distribuídos em duas condições experimentais com 8 participantes em cada uma. Todos foram convidados a participar do experimento, como se segue:

Estou realizando uma pesquisa sobre aprendizagem e queria saber se você estaria interessado em participar. O objetivo da pesquisa é investigar processos de aprendizagem comuns a todas as pessoas e será realizada no laboratório de Psicologia, aqui da universidade. A pesquisa funcionará de 2ª a 6ª-feira, durante 1 hora por dia, e deve durar, aproximadamente, 2 semanas. A pessoa que participar receberá a passagem de ônibus de ida e volta à universidade. Além disso, poderá receber mais uma quantia em dinheiro no final da pesquisa. Você está interessado em participar?

Ao aluno que aceitasse o convite, o experimentador entregava um cartão que, além do endereço do laboratório, identificava o experimentador como professor da universidade. Essa identificação foi feita visando a uniformizar as informações dos participantes sobre o experimentador.

Equipamentos e Material

Foi utilizada uma mesa de madeira, medindo 150 x 78 x 70 cm. Fixado à mesa, de modo a dividi-la ao meio em todo o seu comprimento, havia um anteparo com espelho unidirecional de 150 x 60 cm, fixado em uma moldura de madeira e localizado 13 cm acima do tampo da mesa. No centro do anteparo, junto ao tampo da mesa, havia uma abertura retangular de 45 x 3 cm. Dois centímetros acima e ao centro dessa abertura havia um contador operado pelo experimentador e com os dígitos voltados para o participante. Uma lâmpada fluorescente de 15 watts estava instalada na borda superior e ao centro do anteparo. Ao lado direito do experimentador, havia duas fitas cassetes, um amplificador e um tape-deck. Conectados ao tape-deck, havia 2 fones de ouvido. A mesa estava situada no centro de uma sala.

Os estímulos modelo e de comparação eram peças de madeira, partes de quatro conjuntos iguais de blocos lógicos, variando em 3 dimensões: forma (quadrado, círculo, retângulo e triângulo), cor (azul, vermelha e amarela), e espessura (grossa e fina). Estas peças de madeira formavam 40 diferentes arranjos de estímulos, cada um constituído de 1 estímulo modelo e 3 estímulos de comparação. Cada estímulo de comparação apresentava apenas uma dimensão (cor, espessura ou forma) em comum com o estímulo modelo e diferia nas demais. A combinação dos estímulos era aleatória, assim como a ordem de apresentação dos 40 arranjos. Os arranjos de estímulos previamente preparados ficavam sobre a mesa, ao lado do experimentador, na ordem em que seriam apresentados a cada tentativa. Para facilitar o manejo dos arranjos, sentado ao lado esquerdo do experimentador, um auxiliar de pesquisa aproximava os arranjos, conforme os mesmos iam sendo apresentados. Os estímulos eram apresentados ao participante através da abertura retangular na base do anteparo divisor da mesa, em uma bandeja de madeira em forma de 'T'. Na parte final do cabo dessa bandeja, rente à base retangular, quatro ripas de madeira formavam um quadrado, no qual era colocado o estímulo modelo. Na base retangular da bandeja, dividida por ripas de madeira em 3 quadrados, eram apresentados os 3 estímulos de comparação.

As respostas de escolha emitidas pelos participantes eram registradas pelo experimentador em um protocolo previamente preparado e eram também gravadas por uma filmadora, para avaliação da confiabilidade.

Situação Experimental

Durante as sessões experimentais, participante e experimentador ficavam sentados à mesa, de frente um para o outro, separados pelo anteparo divisor da mesa. A lâmpada na borda superior do anteparo ficava constantemente acesa, voltada para o participante, de maneira a assegurar que seu lado apresentasse iluminação em maior intensidade, garantindo que apenas as ações emitidas pelo participante, bem como o arranjo dos estímulos apresentados, pudessem ser observados através do espelho. O experimentador, em algumas sessões, inicialmente apresentava ao participante uma determinada instrução e em seguida apresentava os arranjos de estímulos; em outras, só apresentava os arranjos de estímulos. As sessões duravam em média 30 minutos e o intervalo entre sessões era de aproximadamente 10 minutos.

Em cada tentativa, após o experimentador apresentar um dos 40 arranjos de estímulos, e enquanto este ainda estava presente, o participante deveria apontar para os estímulos de comparação em uma dada seqüência. As seqüências corretas eram reforçadas com pontos trocados por dinheiro no final da pesquisa. Caso a seqüência de respostas emitida estivesse de acordo com as contingências de reforço programadas (seqüência correta), um ponto era acrescentado no contador e a bandeja com o arranjo de estímulos era retirada. Caso a seqüência de respostas fosse incorreta, a bandeja era retirada, sem ser acrescentado um ponto no contador. Havia um intervalo variável de aproximadamente 5 segundos entre uma tentativa e outra.

Procedimentos

Orientações preliminares

Na primeira sessão, quando participante e experimentador entravam na sala, a bandeja com um arranjo de estímulos estava sobre a mesa, visível ao participante. O experimentador pedia ao participante para sentar-se na cadeira e, ao lado do participante, sempre apontando com o dedo para cada um dos estímulos a que se referia, dizia:

Este objeto, aqui em cima, é um modelo. Estes três objetos, aqui em baixo, são para você comparar com o modelo. Nós vamos chamar estes três objetos, aqui em baixo, de objetos de comparação. Observe que cada um destes três objetos de comparação tem uma única propriedade comum ao modelo.

(Veja. Este, só tem a espessura comum ao modelo. Este aqui, só tem a cor comum ao modelo. Este aqui, só tem a forma igual ao modelo). Durante a pesquisa você poderá ganhar pontos que serão trocados por dinheiro. Quando você ganhar pontos, os pontos sempre aparecerão aqui neste contador. Veja como os pontos aparecem no contador (o auxiliar, que se encontrava no outro lado da mesa, acionava o contador por cinco vezes). Quando você não ganhar pontos, nenhum ponto será acrescentado no contador. Entendeu?"

Este procedimento era repetido por duas vezes e ocorria apenas no início da primeira sessão. Na segunda vez em que estas orientações preliminares eram apresentadas, o trecho entre colchetes era omitido.

Regras

Logo após as orientações preliminares serem apresentadas ao participante, o experimentador pedia para o participante colocar os fones de ouvido e se deslocava em direção à sua cadeira. Separado do participante pelo anteparo com espelho unidirecional, o experimentador também colocava os seus fones de ouvido e, dependendo da fase experimental, entregava ao participante, pela abertura na base do anteparo, uma folha de papel contendo uma das seguintes instruções (regras) datilografadas:

Instruções Mínimas- "A sua tarefa será ganhar pontos. Para você ganhar pontos, você deve apontar com o dedo em seqüência para cada um dos três objetos de comparação. Toda vez que você apontar na seqüência correta, você poderá ganhar um ponto no contador. Cada ponto que você ganhar será trocado por R$ 0,50 (50 centavos de Real), mas apenas no final da pesquisa. Tente descobrir como se pode ganhar pontos apontando em seqüência para cada um dos três objetos de comparação".

Regra correspondente 3- "Quando eu mostrar estes objetos para você, você deve fazer o seguinte: Primeiro aponte com o dedo para o objeto de comparação que tem a mesma espessura do objeto modelo. Depois aponte para o objeto de comparação que tem a mesma forma do objeto modelo. Em seguida aponte para o objeto de comparação que tem a mesma cor do objeto modelo. Ou seja, você deve apontar primeiro para a mesma espessura, depois para a mesma forma e em seguida para a mesma cor. Entendeu? Repita para mim o que você deve fazer. Fazendo isso, você poderá ganhar pontos, que serão mostrados no contador à sua frente. Cada ponto que você ganhar será trocado por R$ 0,50 (50 centavos de real), mas apenas no final da pesquisa".

Regra discrepante- "Quando eu mostrar estes objetos para você, você deve fazer o seguinte: Primeiro aponte com o dedo para o objeto de comparação que tem a mesma forma do objeto modelo. Depois aponte para o objeto de comparação que tem a mesma cor do objeto modelo. Em seguida aponte para o objeto de comparação que tem a mesma espessura do objeto modelo. Ou seja, você deve apontar primeiro para a mesma forma, depois para a mesma cor e em seguida para a mesma espessura. Entendeu? Repita para mim o que você deve fazer. Fazendo isso, você poderá ganhar pontos que serão mostrados no contador à sua frente. Cada ponto que você ganhar será trocado por R$0,50 (50 centavos de Real), mas apenas no final da pesquisa".

Delineamento Experimental

Os participantes foram distribuídos em duas condições experimentais, conforme indicado na Tabela 1. Cada condição era constituída de quatro fases e era realizada com 8 participantes. Nas duas condições, a Fase 1 era iniciada com a apresentação das instruções mínimas, as Fases 2 e 4 com a apresentação da regra discrepante e a Fase 3 com a apresentação da regra correspondente. A Fase 1 era encerrada de acordo com um critério de desempenho (descrito a seguir), e cada uma das Fases 2, 3 e 4 era encerrada quando um dos seguintes critérios fosse atingido, o que ocorresse primeiro: 1) após serem completadas três sessões ou 2) após a obtenção de 20 pontos. Cada sessão era constituída de 80 tentativas. O início e o encerramento de uma sessão eram marcados, respectivamente, pela entrada e saída do participante da sala experimental.

 

 

Condição FR 2

Durante a Fase 1 apenas a seqüência de respostas CEF era reforçada. A emissão de qualquer outra seqüência não era reforçada. No início desta fase a seqüência CEF era reforçada em CRF até a obtenção 20 pontos; depois passava a ser reforçada em FR 2. Neste esquema de razão fixa, cada duas emissões consecutivas de uma mesma seqüência correta produzia um ponto no contador. Erros ou a não emissão consecutiva de uma mesma seqüência correta, reiniciavam a razão fixa - 2 para obtenção de um ponto. A Fase 1 era encerrada após a obtenção de quatro pontos consecutivos em FR 2, desde que o participante já tivesse obtido no mínimo 16 pontos em FR 2. Caso o desempenho do participante variasse (i.e., caso o participante passasse a emitir outras seqüências de respostas entre uma e outra emissão da seqüência CEF) na transição do CRF para o FR 2, voltava-se a reforçar a seqüência CEF em CRF em duas a cinco tentativas, depois voltava-se a reforçar a seqüência CEF em FR 2. Se o desempenho do participante continuasse variando, mesmo com este procedimento, sua participação no experimento era encerrada na Fase 1. Assim, só eram expostos à Fase 2 os participantes que atingissem o critério de encerramento desta Fase 1. Nas Fases 2, 3 e 4 a emissão da seqüência CEF continuava sendo reforçada em FR 2.

Durante as Fases 2 e 4 o seguimento da regra discrepante não era reforçado; só eram reforçadas, em FR 2, emissões consecutivas da seqüência CEF (a mesma modelada na Fase 1) Durante as Fases 2 e 4, portanto, os participantes foram expostos a um esquema concorrente: extinção para a emissão de qualquer seqüência que não a seqüência CEF e FR 2 para emissões consecutivas desta seqüência. Deste modo, a freqüência de reforço programada para emissões da seqüência CEF era maior do que a programada para a emissão de qualquer outra seqüência, inclusive a especificada na regra.

Durante a Fase 3 o seguimento da regra correspondente (EFC) era reforçado em FR 6. Concorrentemente, emissões consecutivas da seqüência CEF eram reforçadas em FR 2. Durante esta fase, portanto, os participantes foram expostos a esquemas concorrentes: FR 6 para a seqüência EFC e FR 2 para a seqüência CEF. Deste modo, a freqüência de reforço programada para emissões da seqüência CEF (estabelecida por reforço diferencial na Fase l) era maior do que a programada para emissões consecutivas da seqüência EFC (seqüência especificada pela regra correspondente).

Condição FR 6

Durante a Fase 1 apenas a seqüência de respostas CEF era reforçada. A emissão de qualquer outra seqüência não era reforçada. No início desta fase a seqüência CEF era reforçada em CRF. Imediatamente após o participante receber 20 pontos em CRF, era feito um aumento gradual no valor do esquema de razão fixa (modelagem), até FR 6. Neste esquema de razão fixa, cada seis emissões consecutivas de uma mesma seqüência correta produzia um ponto. Erros ou a não emissão consecutiva de uma mesma seqüência correta, reiniciavam a razão fixa- 6 para obtenção de um ponto. O procedimento de modelagem variou dependendo do desempenho de cada participante, mas, em geral, no início deste procedimento, a seqüência CEF era reforçada em FR 2. Depois que o participante tivesse obtido seis pontos em FR 2 a seqüência CEF passava a ser reforçada em FR 3. Obtidos mais cinco pontos em FR 3 passava a ser reforçada em FR 4. Obtidos mais quatro pontos em FR 4 passava a ser reforçada em FR 5. Obtidos mais quatro pontos em FR 5, passava a ser reforçada em FR 6, até que o critério de encerramento desta fase fosse atingido. A Fase 1 era encerrada após a obtenção de três pontos consecutivos em FR 6, desde que o participante já tivesse obtido no mínimo 16 pontos em FR 6. Caso o desempenho do participante variasse durante a modelagem, voltava-se a reforçar a seqüência CEF em CRF em duas a cinco tentativas, e em seguida, reiniciava-se a modelagem. Se o desempenho do participante continuasse variando, mesmo com este procedimento, sua participação no experimento era encerrada na Fase 1. Assim, só eram expostos à Fase 2 os participantes que atingissem o critério de encerramento desta Fase 1. Este procedimento de modelagem só ocorria na Fase 1. Nas Fases 2, 3 e 4 a emissão da seqüência CEF continuava sendo reforçada em FR 6.

Durante as Fases 2 e 4 o seguimento da regra discrepante não era reforçado; só eram reforçadas, em FR 6, emissões consecutivas da seqüência CEF (a mesma modelada na Fase 1) Durante as Fases 2 e 4, portanto, os participantes foram expostos a um esquema concorrente: extinção para a emissão de qualquer seqüência que não a seqüência CEF e FR 6 para emissões consecutivas desta seqüência. Deste modo, a freqüência de reforço programada para emissões da seqüência CEF era maior do que a programada para a emissão de qualquer outra seqüência, inclusive a especificada na regra.

Durante a Fase 3 o seguimento da regra correspondente era reforçado em FR 2. Concorrentemente, emissões consecutivas da seqüência CEF eram reforçadas em FR 6. Durante esta fase, portanto, os participantes foram expostos a esquemas concorrentes: FR 2 para a seqüência EFC e FR 6 para a seqüência CEF. Deste modo, a freqüência de reforço programada para emissões da seqüência CEF (estabelecida por reforço diferencial na Fase l) era menor do que a programada para emissões consecutivas da seqüência EFC (seqüência especificada pela regra correspondente).

Durante o presente experimento, portanto, a seqüência CEF (seqüência estabelecida por reforço diferencial) era a única que, quando emitida, era reforçada em todas as quatro fases. A seqüência EFC (especificada pela regra correspondente na Fase 3) também era concorrentemente reforçada durante a Fase 3. A emissão de qualquer outra seqüência, inclusive da seqüência FCE (especificada pela regra discrepante nas Fases 2 e 4), não era reforçada.

Forma de apresentação das regras

Nas duas condições, imediatamente após entregar ao participante a folha de papel contendo as instruções datilografadas, o experimentador ligava o tape-deck e, através dos fones de ouvido, o participante passava a ouvir uma fita, previamente gravada, que dizia: "Eu vou ler estas instruções para você em voz alta. Acompanhe minha leitura, lendo silenciosamente". A gravação continuava com a leitura das instruções contidas na folha de papel. Terminada essa primeira leitura, a gravação prosseguia: "Agora, você deve ler estas instruções sozinho, silenciosamente. Leia com calma e bastante atenção. Você tem todo o tempo que achar necessário para entendê-las. Quando você achar que entendeu bem as instruções, avise-me". A gravação era interrompida e logo após o participante avisar que havia terminado esta segunda leitura, a gravação prosseguia: "Eu vou ler mais uma vez estas instruções para você, acompanhe a minha leitura, lendo em voz baixa". A gravação continuava com a leitura das instruções escritas. Terminada esta terceira leitura, a gravação prosseguia: "Devolva-me a folha com as instruções. Eu só posso falar com você agora, no início da próxima sessão. Você pode retirar os fones de ouvido agora". Esse procedimento era usado apenas no início de cada fase.

A partir da Fase 2, inclusive, se o critério de encerramento de uma fase não fosse atingido na primeira sessão, cada uma das demais sessões dessa fase era iniciada com a mesma regra que havia sido apresentada no início da primeira sessão. Neste caso, era repetido apenas o procedimento da primeira leitura. Ou seja, no início da segunda e/ou terceira sessão de cada uma dessas fases, imediatamente após o participante receber a folha de papel contendo as instruções datilografadas, o experimentador ligava o tape-deck e, através dos fones de ouvido, o participante passava a ouvir uma fita, previamente gravada, que dizia: "Eu vou ler estas instruções para você em voz alta. Acompanhe minha leitura, lendo silenciosamente". A gravação continuava com a leitura das instruções contidas na folha de papel. Terminada essa leitura, a gravação prosseguia: "Devolva-me a folha com as instruções. Eu só posso falar com você agora, no início da próxima sessão. Você pode retirar os fones de ouvido agora".

A gravação era interrompida (o experimentador apertava a tecla pause no tape-deck) toda vez que o participante fosse solicitado a verbalizar as instruções (Ex.: após o participante ouvir o trecho da instrução escrita que dizia: "Entendeu? Repita para mim o que você deve fazer"), prosseguindo imediatamente após a verbalização do participante. Deste modo, o participante lia as instruções por três vezes seguidas no início de cada fase e, nas fases em que a segunda e/ou terceira sessão teve de ser realizada, lia as instruções uma única vez no início da sessão.

Logo após o participante devolver a folha com as instruções, o experimentador removia a bandeja, voltava a apresentar a bandeja com um novo arranjo de estímulos, e dizia: "Comece a apontar".

Comparação dos registros (acordo entre observadores)

Nas duas condições, a cada duas sessões, um observador independente comparava o registro feito pelo experimentador com o registro feito pela filmadora. Caso houvesse 100% de concordância entre os registros, o participante continuava participando do experimento. Caso contrário, o participante seria descartado por erro do experimentador na condução da sessão. No presente estudo, nenhum participante foi descartado por essa razão.

Término da participação do estudante no experimento

Nas duas condições, cada ponto valia 50 centavos de Real (R$ 0,50)4 , mas o total de pontos obtidos em cada sessão somente era trocado por dinheiro ao final da pesquisa. Antes de o participante entrar na sala experimental, isto é, antes do início de cada sessão, o contador era sempre zerado. Assim, os pontos eram registrados cumulativamente, no contador, apenas dentro de uma mesma sessão. No entanto, a partir da segunda sessão, logo após entrar na sala experimental, antes do início de cada sessão, o participante era informado pelo experimentador sobre o número total de pontos obtidos nas sessões anteriores.

As sessões eram realizadas de 2ª a 6ª-feira e eram realizadas duas sessões, no máximo, por dia. O intervalo entre sessões realizadas em um mesmo dia era de 10 minutos, aproximadamente. Cada sessão durava, em média, 30 minutos.

A participação no experimento era encerrada quando o participante atingisse o critério de encerramento da Fase 4, ou se o participante não atingisse o critério de encerramento da Fase 1.

 

Resultados

Condição FR 2

A Figura 1 mostra a freqüência acumulada de seqüências de respostas corretas e incorretas, emitidas por cada participante da Condição FR 2, ao longo de tentativas sucessivas, durante as fases a que foram expostos. Pode-se observar que dos 8 estudantes dessa condição, 6 (P 21 a P 26) atingiram o critério de encerramento da Fase 1 e foram expostos às Fases 2, 3 e 4, os 2 restantes (P 27 e P 28) não atingiram o critério. Por essa razão, apenas os dados dos 6 participantes que atingiram esse critério serão considerados nas análises seguintes. O padrão de aceleração positiva na curva de seqüências de respostas corretas ao final da Fase 1 é a linha de base para a avaliação da distribuição relativa das seqüências de respostas nas Fases 2, 3 e 4. As tendências nas curvas acumuladas serão descritas juntamente com os dados das Tabelas 2 a 4.

 

 

 

 

 

 

 

 

A Tabela 2 5 mostra os dados da Fase 1 dos participantes que atingiram o critério de encerramento desta fase nas Condições FR 2 e FR 6, relativos ao número ordinal da tentativa: 1) na qual estes participantes emitiram a seqüência correta - cor (C) - espessura (E) -forma (F) - pela primeira vez, 2) a partir da qual a modelagem ao esquema de razão fixa foi iniciada e, 3) a partir da qual passaram a responder sem erros. Já a Tabela 3 mostra as porcentagens de seqüências de respostas apresentadas por estes participantes durante a modelagem.

Pode-se observar na Tabela 2 e na Figura 1, que os participantes da Condição FR 2 (P 21, P 22, P 23, P 24, P 25 e P 26) iniciaram a Fase 1 emitindo seqüências incorretas e começaram a responder corretamente a partir de um número variável de tentativas: 18; 15; 3; 8; 87 e 74, respectivamente. A partir das tentativas 52; 130; 75; 147; 185 e 126, respectivamente, passaram a responder de maneira correta e consistente até atingirem o critério de encerramento da Fase 1.

Na Tabela 3 pode-se observar que durante a modelagem, quando a seqüência correta passou a ser reforçada intermitentemente na Fase 1, P 23, P 24 e P 25 apresentaram um desempenho mais variável do que os P 21, P 22 e P 26. Ou seja, P 23, P 24 e P 25 responderam incorretamente em 20, 30 e 30% das tentativas, respectivamente, enquanto P 21, P 22 e P 26 responderam incorretamente em 0, 9 e 6% das tentativas, respectivamente. A distribuição dos erros ao longo da Fase 1 fica melhor evidenciada nas curvas acumuladas da Figura 1.

A Tabela 4 mostra as porcentagens de seqüências de respostas apresentadas durante as Fases 2, 3 e 4, pelos participantes da Condição FR 2. Pode-se observar que todos os 6 participantes iniciaram a Fase 2 emitindo a seqüência FCE especificada pela regra discrepante das contingências (seqüência incorreta) em 100% das duas primeiras tentativas dessa fase. Durante esta fase, P 21 e P 22 seguiram a regra durante a maior parte das tentativas. Isto é, emitiram a seqüência FCE em 94 e 90% das tentativas, respectivamente. Quando não seguiram a regra, chegaram a emitir a seqüência correta (i.e., a seqüência cor-espessura-forma, estabelecida por reforço diferencial na Fase 1), mas fizeram isso em menos de 2% das tentativas. P23 seguiu a regra (i.e., emitiu a seqüência FCE) em 55% das tentativas. Quando não seguiu a regra, chegou a emitir a seqüência correta (CEF) em 12% das tentativas dessa fase. Mas por não ter persistido respondendo na seqüência CEF, não atingiu o critério de obtenção de 20 pontos para o encerramento desta fase e terminou a fase seguindo a regra. Já P 24, P 25 e P 26 seguiram a regra em 31, 15 e 35% das tentativas, respectivamente. Quando não seguiram a regra, estes três participantes emitiram a seqüência correta (CEF) durante a maior parte das tentativas (57, 67 e 58%, respectivamente). Deste modo, atingiram o critério de obtenção de 20 pontos para o encerramento desta fase.

Na Fase 3, quando a regra correspondente foi apresentada e o seu seguimento era conseqüenciado de acordo com o esquema de FR 6, 5 participantes (P 21, P 22, P 23, P 24 e P 25) iniciaram respondendo corretamente, emitindo a seqüência EFC (especificada pela regra correspondente) em 100% das duas primeiras tentativas; P 26 iniciou respondendo nessa seqüência em uma (50%) das duas primeiras tentativas. Durante esta fase, P 21 e P 22 seguiram a regra em 98% das tentativas e P 23 fez o mesmo em 85% das tentativas. Diferentemente destes 3 participantes, P 24, P 25 e P 26 seguiram a regra em apenas 15; 8 e 12% das tentativas, respectivamente. Quando não seguiram a regra, estes últimos participantes emitiram, durante a maior parte das tentativas, a seqüência CEF (estabelecida por reforço diferencial na Fase 1), que também produzia a conseqüência. Isto é, emitiram esta seqüência em 62, 82 e 80% das tentativas dessa fase, respectivamente. Deste modo, atingiram o critério de obtenção de 20 pontos para o encerramento desta fase.

Na Fase 4, com a reapresentação da regra discrepante, P 21, P 22 e P 23 seguiram a regra (isto é, emitiram a seqüência FCE) em praticamente 100% das tentativas dessa fase. Já P 24, P 25 e P 26 emitiram a seqüência FCE em apenas 28, 10 e 7% das tentativas dessa fase, respectivamente. Quando não seguiram a regra, estes participantes (P 24, P 25 e P 26) responderam na seqüência correta (CEF) em 56, 86 e 93% das tentativas dessa fase, respectivamente. Deste modo, atingiram o critério de obtenção de 20 pontos para o encerramento desta fase.

Novamente, as distribuições de seqüências de respostas ao longo das tentativas, mostradas na Figura 1, confirmam e ilustram os padrões de desempenhos subjacentes às porcentagens apresentadas na Tabela 4. No conjunto, a Figura 1 e a Tabela 4, mostram que nas Fases 2, 3 e 4 da Condição FR 2, três participantes (P 21, P 22 e P 23) seguiram regra, e três (P 24, P 25 e P 26) deixaram de regra e passaram a responder na seqüência cor-espessura-forma, de acordo com as suas histórias experimentais.

Condição FR 6

A Figura 2 mostra a freqüência acumulada de seqüências de respostas corretas e incorretas, emitidas por cada participante da Condição FR 6, durante as fases a que foram expostos. Pode-se observar que dos 8 estudantes dessa condição, 6 (P 61, P 62, P 63, P 64, P 65 e P 66) atingiram o critério de encerramento da Fase 1 e foram expostos às Fases 2, 3 e 4. Os 2 restantes (P 67 e P 68) não atingiram o critério de encerramento da Fase 1 e, portanto, não foram expostos às fases subseqüentes. P 68 pediu para não mais continuar participando do experimento no final da 5ª sessão da Fase 1. Em função disso, apenas os dados dos participantes que atingiram o critério de encerramento da Fase 1 serão considerados para análise. Como na condição precedente, as curvas da Figura 2 subsidiarão as análises quantitativas apresentadas nas Tabelas 2, 3 e 5.

 

 

 

 

Na Tabela 2 pode-se observar que 5 participantes (P 61, P 62, P 64, P 65 e P 66) iniciaram a Fase 1 respondendo incorretamente; P 63 iniciou respondendo corretamente. A partir das tentativas 12, 3, 7, 13, e 10, respectivamente, estes 5 participantes (P 61, P 62, P 64, P 65 e P 66) começaram a responder corretamente, mas só passaram a responder sem erros a partir das tentativas 285, 169, 301, 298 e 525, respectivamente. P 63 só passou a responder sem erros a partir da tentativa 309.

Na Tabela 3, pode-se observar que, quando a seqüência correta passou a ser reforçada intermitentemente na Fase 1, durante a modelagem ao esquema de razão fixa 6, P 61, P 64 P 65 e P 66 apresentaram um desempenho mais variável do que os P 62 e P 63. Ou seja, durante a modelagem, P 61, P 64, P 65 e P 66 responderam incorretamente em 19, 15, 13 e 29% das tentativas, respectivamente. Já P 62 e P 63 responderam incorretamente em 2 e 8% das tentativas, respectivamente. A distribuição dos erros ao longo da Fase 1 pode ser examinada nas curvas acumuladas da Figura 2. Com uma razão fixa maior (FR 6), a freqüência acumulada de seqüências de respostas tendeu a ser maior para os participantes desta condição do que para os participantes da Condição FR 2.

A Tabela 5 mostra as porcentagens de seqüências de respostas apresentadas, durante as Fases 2, 3 e 4, pelos participantes da Condição FR 6. Pode-se observar que todos os 6 participantes iniciaram a Fase 2 respondendo incorretamente, emitindo a seqüência FCE especificada pela regra discrepante (responder incorreto) em mais de 80% das seis primeiras tentativas dessa fase. Durante esta fase, P 62 seguiu a regra em 100% das tentativas. P 61, P 63, P 64 e P 65 também seguiram a regra na maior parte das tentativas, isto é, emitiram a seqüência especificada pela regra discrepante (FCE) em 97; 93, 77 e 88% das tentativas, respectivamente. Quando não seguiram a regra, estes participantes chegaram a emitir a seqüência correta (CEF), modelada na Fase 1. Fizeram isso em 1; 6, 7 e 6% das tentativas dessa fase, respectivamente, mas não persistiram respondendo na seqüência correta e terminaram a fase seguindo a regra. P 66 seguiu a regra em apenas 24% das tentativas. Quando deixou de seguir a regra, emitiu a seqüência correta (CEF) em 72% das tentativas dessa fase. Em outras palavras, ao deixar de seguir a regra, emitiu a seqüência CEF por 6 vezes consecutivas (completando deste modo os requisitos do esquema FR 6), obteve ponto e continuou respondendo nessa seqüência.

Na Fase 3, quando a regra correspondente foi apresentada e o seu seguimento era reforçado de acordo com o esquema de FR 2, todos os 6 participantes (P61, P62, P63, P64, P65 e P66) iniciaram emitindo a seqüência EFC, especificada por esta regra, em mais de 67% das seis primeiras tentativas e continuaram emitindo esta seqüência em mais de 88% das tentativas dessa fase.

Na Fase 4, quando a regra discrepante foi reapresentada, 5 participantes (P 61 a P 65) iniciaram seguindo esta regra em 100% das seis primeiras tentativas, enquanto P 66 iniciou respondendo na seqüência FCE em 50% dessas seis primeiras tentativas. Durante esta fase, P 61, P 62, P 63 e P 64 seguiram a regra em mais 82% das tentativas. Já P 65 e P 66 seguiram a regra em 69 e 4% das tentativas dessa fase, respectivamente. Quando não seguiram a regra, estes 2 participantes (P 65 e P 66) passaram a responder na seqüência correta (em 27 e 96% das tentativas, respectivamente). Em outras palavras, emitiram a seqüência CEF por seis vezes consecutivas, ganharam ponto e continuaram emitindo esta seqüência até o fim da fase.

Os dados globais da Tabela 5, juntamente com os da Figura 2, indicam que na Fase 2 5 participantes (P 61, P 62, P 63, P 64 e P 65) seguiram a regra discrepante e um (P 66) deixou de seguir esta regra e passou a responder na seqüência CEF, de acordo com a sua história experimental. Na Fase 3, todos estes 6 participantes seguiram a regra correspondente, o que produzia reforços mais freqüentemente (em FR 2) do que o responder na seqüência CEF (reforçada em FR 6). E na Fase 4, 4 participantes (P 61, P 62, P 63 e P 64) voltaram a seguir a regra discrepante, e 2 (P 65 e P 66) deixaram de seguir esta regra e passaram a responder na seqüência CEF, de acordo com as suas histórias experimentais.

Em síntese, os resultados deste experimento mostraram que 12 dos 16 participantes atingiram o critério de encerramento da Fase 1. Desses 12, 7 participantes (P 21, P 22 e P 23 da Condição FR 2 e P 61, P 62, P 63 e P 64 da Condição FR 6) seguiram regra nas Fases 2, 3 e 4, e 5 (P 24, P 25 e P 26 da Condição FR 2 e P 65 e P 66 da Condição FR 6), abandonaram o seguimento da regra discrepante e passaram a responder na seqüência cor-espessura-forma, de acordo com as suas histórias experimentais. No entanto, há algumas diferenças entre os desempenhos desses 5 participantes. P 24, P 25 e P 26, ao deixarem de seguir a regra no início da Fase 2, passaram a emitir o comportamento previamente estabelecido por reforço diferencial na Fase 1 (isto é, a seqüência cor-espessura-forma), ganharam pontos e continuaram emitindo essa seqüência nas Fases 3 e 4. P 66 apresentou um desempenho bastante similar ao apresentado pelos P 24, P 25 e P 26, com a diferença de que P 66 respondeu de acordo com a regra correspondente durante a Fase 3. Já o desempenho de P 65 diferiu do apresentado pelo P 66, principalmente, porque só foi deixar de emitir o comportamento especificado pela regra discrepante e, em seu lugar, passar a emitir o comportamento previamente estabelecido por reforço diferencial, na última sessão da Fase 4. Quanto às contingências de reforço na Fase 3, enquanto 3 participantes (P 24, P 25 e P 26) da Condição FR 2 (seguimento da regra correspondente conseqüenciado em FR 6) deixaram de seguir a regra correspondente e passaram a emitir a seqüência modelada na Fase 1 e mantida em FR 2, todos os 6 participantes da Condição FR 6 (seguimento da regra correspondente reforçado em FR 2) seguiram a regra correspondente apresentada nesta fase e não emitiram a seqüência concorrente a ponto desta seqüência chegar a ser reforçada em FR 6. Embora essa comparação entre o número de participantes da Condição FR 2 e da Condição FR 6 que mantiveram o seguimento da regra na Fase 3, seja um indicador do peso relativo da distribuição de reforços entre o comportamento de seguir a regra e o comportamento estabelecido por reforço diferencial, os dados das Fases 2 e 4 são importantes porque fornecem um controle complementar. Esse controle (entre fases, para um mesmo indivíduo) replica e confirma a tendência de 4 (P 24, P 25 e P 26 da Condição FR 2 e P 66 da Condição FR 6) dos 12 participantes a alocarem mais comportamentos na alternativa com maior densidade de reforços, enquanto essa replicação não ocorreu no caso dos outros participantes, que mantiveram o comportamento de seguir a rega na Fase 3, mas também o fizeram nas Fases 2 e 4 (quando o comportamento de seguir a regra discrepante não produzia a conseqüência reforçadora descrita na regra e a emissão da seqüência modelada na Fase 1 era reforçada em esquema de razão fixa).

 

Discussão

O presente experimento foi realizado com o objetivo de testar a proposição que sugere que a manutenção do seguimento de regras depende do quanto o comportamento instruído é mais ou menos freqüentemente reforçado do que o comportamento não instruído (Chase & Danforth, 1991). Por esta proposição, que está de acordo com a noção de que qualquer tipo de comportamento ocorre no contexto de escolha entre comportamentos simultaneamente disponíveis (Herrnstein, 1970; McDowell, 1988), se uma situação experimental apresentar um arranjo em que o comportamento de acordo com instruções seja mais freqüentemente reforçado do que o comportamento diferente do instruído, os indivíduos responderão de acordo com as instruções. Contudo, se for arranjada uma história na qual o responder não instruído seja mais freqüentemente reforçado que o seguimento de instruções, pode-se supor o efeito oposto.

Os dados de P 24, P 25 e P 26 estão de acordo com esta proposição, já que durante as Fases 2, 3 e 4 da Condição FR 2 a freqüência de reforço programada para o seguimento de regra foi sempre menor (extinção nas Fase 2 e 4 e FR 6 na Fase 3) do que a programada para emissão do comportamento estabelecido por reforço diferencial (mantido em FR 2) e estes 3 participantes deixaram de seguir regra e passaram a emitir o comportamento previamente estabelecido por reforço diferencial na Fase 1 (isto é, a seqüência cor-espessura-forma). Mas de todos os 12 participantes que foram expostos às Fases 2, 3 e 4, P 66 da Condição FR 6 foi o que apresentou um desempenho que melhor exemplifica a predição proposta por Chase e Danforth (1991). Este participante deixou de seguir a regra discrepante e passou a apresentar o comportamento estabelecido por reforço diferencial, quando a emissão do comportamento especificado pela regra não era reforçada e a emissão do comportamento estabelecido por reforço diferencial era reforçada em FR 6 (caso das Fases 2 e 4) e respondeu de acordo com a regra correspondente quando o seguimento de regra era reforçado em FR 2 e a emissão do comportamento estabelecido por reforço diferencial continuava sendo reforçada em FR 6 (caso da Fase 3). Os dados das Fases 2 e 3 deste participante (P 66) sugerem que, quando o seguimento de regra é reforçado (como na Fase 3), ele pode ser mantido, mesmo tendo o participante uma história passada de ser reforçado por não seguir regra (como na Fase 2). Mas a história de reforço do comportamento de não seguir a regra na Fase 2 pode ter contribuído para que esse participante voltasse a deixar de seguir a regra discrepante na Fase 4. Além disso, os resultados das Fases 2, 3 e 4 deste participante, mostrando que o seguimento de regra só foi mantido quando reforçado, sugerem que o comportamento estabelecido pela regra na Fase 3 dependia claramente da freqüência relativa das conseqüências imediatas desse comportamento.

O desempenho dos 4 participantes (P 24, P 25, P 26 e P 66) que deixaram de seguir a regra discrepante na Fase 2 parece ter ocorrido, não apenas como resultado das diferenças entre a freqüência de reforço programada para o seguimento de regra e para o comportamento estabelecido por reforço diferencial, mas também como resultado da interação entre três variáveis: 1) da história de exposição às contingências de reforço programadas na Fase 1; 2) da exposição à discrepância entre as conseqüências descritas na regra e as conseqüências produzidas pelo comportamento de segui-la; e, 3) do comportamento de não seguir regra ter sido reforçado. Esta análise também pode ser aplicada aos dados da última sessão da Fase 4 do P 65 da Condição FR 6, uma vez que nesta sessão este participante também deixou de seguir a regra e passou a emitir o comportamento previamente estabelecido por reforço diferencial na Fase 1. Neste caso, a exposição prolongada à discrepância entre a regra e as conseqüências produzidas pelo comportamento de segui-la nas Fases 2 e 4 pode também ter contribuído para a ocorrência dos resultados observados na última sessão da Fase 4.

Os resultados dos outros 7 participantes (P 21, P 22 e P 23 da Condição FR 2 e P 61, P 62, P 63 e P 64 da Condição FR 6) dos 12 que atingiram o critério de encerramento da Fase 1, também não são prontamente explicados pela proposição de Chase e Danforth (1991), uma vez que todos estes 7 participantes seguiram a regra discrepante durante as Fases 2 e 4. Os resultados destes 7 participantes sugerem que regras podem ser seguidas, mesmo quando a freqüência de reforço programada para o seguimento de regra é menor do que a programada para a emissão do comportamento estabelecido por reforço diferencial. Sugerem ainda que o comportamento de escolha pode ser determinado não apenas por suas conseqüências (como foi observado na Fase 1), mas também pode ser determinado por regras (como foi observado nas Fases 2 e 4), mesmo quando: 1) o comportamento de seguir a regra produz conseqüências que contradizem a própria regra; 2) existe na situação experimental contingências de reforço programadas para a emissão de um comportamento alternativo ao especificado pela regra; e, 3) esse comportamento alternativo faz parte do repertório do participante, já que esse comportamento havia sido freqüentemente reforçado, antes da regra ser apresentada.

Daqueles 7 participantes, 1 (P 62) seguiu a regra discrepante sem apresentar variação em seu desempenho e 6 (P 21, P 22, P 23, P 61, P 63 e P 64) chegaram a não seguir esta regra. Destes 6, ao deixarem de seguir a regra, 3 (P 21, P 22 e P 61) responderam muito pouco na seqüência cor-espessura-forma, isto é, responderam nesta seqüência em menos de 2% das tentativas. Os outros 3 (P 23, P 63 e P 64) chegaram a persistir respondendo nesta seqüência. P 63 e P 64 chegaram até a responder por três vezes consecutivas na seqüência cor-espessura-forma, mas como não persistiram respondendo nesta seqüência a ponto de atingirem o requisito de FR 6 (a emissão desta seqüência por seis vezes consecutivas), não ganharam ponto e voltaram a seguir a regra discrepante. Mas destes 6 participantes, P 23 foi o que apresentou um desempenho mais atípico. Ou seja, quando este participante abandonou o seguimento de regra no início da primeira sessão da Fase 2, passou a emitir a seqüência cor-forma-espessura, mas no final desta sessão, chegou a ganhar 12 pontos por responder na seqüência cor-espessura-forma. Na segunda sessão voltou a abandonar o seguimento de regra, mas ao invés de emitir a seqüência cor-espessura-forma, voltou a emitir a seqüência cor-forma-espessura. Como não ganhou ponto, voltou a seguir a regra na Fase 2 e continuou seguindo a regra nas Fases 3 e 4, tal como fizeram P 21, P 22, P 61, P 63 e P 64.

Não está claro porque estes 6 participantes (P 21, P 22, P 23, P 61, P 63 e P 64) voltaram a seguir a regra discrepante. Uma suposição seria que não havia dicas que assegurassem ao participante que as contingências de reforço programadas na Fase 1 ainda continuavam em vigor na Fase 2 e tentar descobrir isso, envolvia alto custo de respostas. Ou seja, envolvia emitir consecutivamente a seqüência cor-espessura-forma, o que, por sua vez, implicava em não fazer o que as instruções diziam que deveria ser feito. Instruções estas, apresentadas por um experimentador que, no convite aos alunos-participantes, foi identificado como professor e que durante a pesquisa ficava de frente para o participante, embora separado deste pelo espelho unidirecional, conseqüenciando diferencialmente as suas respostas com pontos. Pesquisas futuras que investigassem esta possibilidade seriam importantes, primeiro porque alguns autores (Cerutti, 1989; Hayes & cols., 1986b; Zettle & Hayes, 1982) têm sugerido que o seguimento de regra tem mais probabilidade de ser mantido quando a correspondência entre a regra e o comportamento de segui-la é monitorada por membros da comunidade verbal identificados como "autoridades" (Ex.: policiais, parentes, professores, patrões, médicos, etc.) do que quando essa correspondência não é monitorada. Segundo, porque, embora haja evidências apoiando essa sugestão, alguns dos estudos que mostraram essas evidências (Barret, Deitz, Gaydos & Quinn, 1987; Capovilla & Hineline, 1989), não demonstraram controle pelas contingências de reforço antes da regra ser apresentada ao ouvinte. E terceiro porque, no presente experimento, 5 dos 12 participantes que foram expostos às Fases 2, 3 e 4 (P 24, P 25, P 26, P 65 e P 66), deixaram de seguir regra e passaram a emitir o comportamento previamente estabelecido por reforço diferencial na Fase 1, apesar da correspondência entre a regra e o comportamento de segui-la ter sido monitorada pela presença do experimentador na situação experimental.

As diferenças entre os desempenhos dos participantes nas Fases 2, 3 e 4 podem ter ocorrido devido a diferenças em suas histórias pré-experimentais. Mas diferenças entre os seus desempenhos na Fase 1, também podem ter contribuído para as diferenças observadas nas fases subseqüentes.

Uma análise do desempenho na Fase 1 dos 12 participantes que foram expostos às Fases 2, 3 e 4, pode tornar mais clara esta sugestão. Quando a seqüência cor-espessura-forma passou a ser reforçada intermitentemente durante a modelagem, todos os 12 participantes que atingiram o critério continuaram emitindo esta seqüência até o encerramento desta fase. Mas, principalmente no início da modelagem, o desempenho da maior parte dos participantes que nas fases subseqüentes deixaram de seguir regra e passaram a apresentar o comportamento estabelecido por reforço diferencial foi mais variável do que o desempenho da maior parte dos participantes que seguiram regra (ver Tabela 3 e Figuras 1 e 2). Ou seja, no início da modelagem, 4 (P 24, P 25, P 65 e P 66) dos 5 participantes que abandonaram o seguimento de regra e passaram a apresentar o comportamento previamente estabelecido por reforço diferencial, variaram os seus desempenhos apresentando diferentes seqüências de respostas, antes de atingirem o critério de encerramento da Fase 1. Por outro lado, dos 7 participantes que seguiram a regra discrepante, 2 (P 21 e P 62) praticamente não variaram os seus desempenhos (isto é, emitiram a seqüência CEF em mais de 98% das tentativas da modelagem) e 2 (P 22 e P 63) variaram muito pouco (uma vez que quando não emitiram a seqüência cor-espessura-forma, praticamente só emitiram a seqüência forma-cor-espessura) antes de atingirem o critério de encerramento dessa fase. Esta análise sugere que os participantes que mais variaram os seus desempenhos no início da etapa de manutenção da seqüência cor-espessura-forma na Fase 1, foram os mais prováveis de, posteriormente, abandonar o seguimento de regra e passar a apresentar o comportamento previamente estabelecido por reforço diferencial. Contudo, os dados do participante (P 26) que variou muito pouco na Fase 1 e respondeu de acordo com a sua história experimental na Fase 2 e os dos três (P 23, P 61 e P 64) que variaram apresentando diferentes seqüências na Fase 1 e seguiram regra durante as fases subseqüentes, sugerem que esta proposição deveria ser investigada em um experimento planejado com este objetivo.

A investigação dessa possibilidade seria importante, porque tem sido sugerido que para o comportamento humano tornar-se sensível às contingências de reforço programadas, ele deve ser exposto a condições que possam gerar variação comportamental antes ou no momento das mudanças nas contingências de reforço programadas (Chase & Danforth, 1991; Joyce & Chase, 1990; LeFrancois, Chase & Joyce, 1988). Pesquisas futuras também poderiam expor os participantes por um período mais prolongado às contingências de reforço programadas, antes da introdução da regra. Tais investigações seriam importantes porque tem sido sugerido que a longa exposição a tais contingências poderia minimizar possíveis efeitos de histórias pré-experimentais (Baron, Perone & Galizio, 1991). Poderiam ainda verificar se o seguimento de regras discrepantes das contingências seria mantido quando, antes da apresentação da regra, o comportamento alternativo ao por ela especificado fosse reforçado em CRF. Isto porque tem sido proposto que o seguimento de regra tem mais probabilidade de ser abandonado quando o não seguimento de regras é reforçado em CRF do que quando é reforçado em esquema de razão (Newman, Buffington & Hemmes, 1995).

Considerando também que diferenças entre os desempenhos de participantes humanos dentro de uma mesma condição experimental, têm sido atribuídas às diferenças entre os seus repertórios verbais (Catania & cols. 1989; Lowe, 1979), pesquisas futuras poderiam registrar o comportamento verbal dos participantes ao longo da construção de uma história experimental de reforço e observar os efeitos dessa história sobre seguimento subseqüente de regras apresentadas pelo experimentador. Isto permitiria fazer comparações entre as verbalizações dos participantes antes da introdução das regras, bem como fazer comparações, em um mesmo participante, entre os eventuais efeitos de regras geradas pelos participantes com os efeitos de regras apresentadas pelo experimentador. No presente estudo não foi possível fazer tais comparações, porque o comportamento verbal dos participantes não foi solicitado durante experimento. Em síntese, investigações futuras dos efeitos de outras histórias sobre o seguimento subseqüente de regras poderiam contribuir para delimitar as condições sob as quais o controle exercido por uma história experimental prevaleceria ou não sobre o controle subseqüente por regras.

Os resultados do presente experimento também têm implicações para a distinção entre o comportamento controlado por regras e o comportamento controlado por contingências. Nas publicações científicas sobre o comportamento governado por regras (para uma revisão, ver Baron & Galizio, 1983; Chase & Danforth, 1991; Hayes & cols., 1989; Lowe, 1979; Vaughan, 1989; Weiner, 1983), o controle por regras tem sido mostrado baseando-se, principalmente, no padrão de respostas apresentado pelos participantes. Um dado padrão de respostas tem sido considerado estar sob controle de regras (no caso, regras discrepantes das contingências), se não mostrar as características conhecidas de um padrão sob controle do esquema de reforço a que foi exposto, ou se este padrão não mudar acompanhando mudanças nas contingências.

Quando regras correspondem às contingências, no entanto, argumenta-se que não há base para decidir se é a regra ou as contingências que exercem controle. Neste caso, tem sido sugerido que se o comportamento for estabelecido por uma regra, pode-se dizer que este comportamento está sob controle de regra, mesmo que ele apresente o padrão característico do esquema a que foi submetido (Catania & cols., 1989; Hayes, Brownstein, Haas & Greenway, 1986ª; Shimoff, Matthews & Catania, 1986). Entretanto, tem sido argumentado que o verdadeiro seguimento de regra é somente o que ocorre antes que o comportamento de seguir regra tenha tido oportunidade de ser afetado pelas conseqüências presentes (Andronis, 1991; Joyce & Chase, 1990; Paracampo, 1991). Depois disso, o comportamento é controlado por contingências (Andronis, 1991; Joyce & Chase, 1990).

Os resultados do presente estudo sugerem que nem todo comportamento estabelecido por uma determinada regra pode ser classificado de puramente controlado por regras (como mostram os dados da Fase 3 do P 66, por exemplo). Para ser classificado de controlado por regras, o comportamento estabelecido por uma regra tem que ocorrer independentemente de suas conseqüências imediatas (como mostram os dados das Fases 2 e 4 do P 61, por exemplo). Isto não implica que o comportamento de seguir uma regra não possa ser afetado pelas conseqüências imediatas por ele produzidas. Pode, mas quando isto ocorre, este comportamento deixa de ser controlado pela regra e passa ou a ser controlado pela interação entre a regra e as conseqüências imediatas por ele produzidas (como mostram os dados da Fase 3 do P 66, por exemplo) ou a ser controlado por suas conseqüências imediatas (como mostram os dados das Fases 2 e 4 do P 66, por exemplo).

Deste modo, pode-se dizer que um dado exemplo particular de comportamento pode ser classificado de controlado por contingências (Ex.: Fase 4 do P 66), quando ele é estabelecido por suas conseqüências imediatas, independentemente de uma descrição antecedente das contingências. Pode ser classificado de controlado por regras (Ex.: Fase 2 do P 61), quando o comportamento que se segue à apresentação de uma regra é o previamente especificado pela regra e este comportamento ocorre independentemente de suas conseqüências imediatas. E pode ainda ser classificado de controlado pela interação entre regra e contingência (Ex.: Fase 3 do P 66), quando é estabelecido por uma regra e sua manutenção depende de suas conseqüências imediatas. O que implica que nem todo comportamento, depois de ser reforçado, pode ser classificado de puramente controlado pelas suas conseqüências imediatas (Albuquerque, 2001, 2002; Albuquerque & cols., 2003).

Por esta proposição, então, quando uma determinada regra corresponde às contingências de reforço programadas, o seguimento de regra pode estar em contato com dois tipos de contingências (Cerutti, 1989; Zettle & Hayes, 1982). Além das conseqüências imediatas produzidas pelo comportamento de seguir a regra (Ex.: continuar seguindo a regra porque no passado o comportamento de segui-la produziu pontos trocáveis por dinheiro), o seguimento de regra também pode ser mantido por uma história de conseqüências mediadas socialmente para o responder de acordo com regras (Ex.: seguir a regra porque no passado o comportamento de segui-la evitou sanções sociais). Ou seja, neste caso, o comportamento estaria sob controle da interação entre estes dois conjuntos de conseqüências. Quando uma determinada regra é discrepante das contingências de reforço programadas, no entanto, o seguimento da regra seria mantido pela história de conseqüências mediadas socialmente para o responder de acordo com regras, já que as conseqüências imediatas produzidas pelo comportamento de segui-la não corresponderiam às conseqüências descritas na regra. Ou seja, o comportamento de seguir uma determinada regra discrepante das contingências de reforço programadas, por definição, ocorreria independentemente das conseqüências imediatas por ele produzidas, mas não independentemente das conseqüências mediadas socialmente para o responder de acordo com regras. Esta proposição, portanto, é compatível com a noção skinneriana de que os comportamentos, de modo geral, são controlados por contingências (Skinner, 1974). Além disso, é consistente com as proposições (Catania & cols., 1990; Cerutti, 1989; Hayes & cols., 1989; Malott, 1989; Skinner, 1969) acerca das variáveis responsáveis pelo seguimento de regras (ver o segundo parágrafo da introdução do presente trabalho), que sugerem que o comportamento de seguir uma determinada regra seria mantido pelas contingências sociais que operam para a classe geral de seguir regras.

 

Referências

Albuquerque, L. C. (2001). Definições de regras. Em H. J. Guilhardi, M. B. B. P. Madi, P. P. Queiroz, P. P. & M. C. Scoz (Orgs.), Sobre comportamento e cognição: Expondo a variabilidade (pp.132-140). Santo André: ARBytes.         [ Links ]

Albuquerque, L. C. (2002). Condições sob as quais pode-se dizer que um comportamento é controlado por regras [Resumos]. Em Associação Brasileira de Psicoterapia e Medicina Comportamental (Org.), Anais, XI Encontro Brasileiro de Psicoterapia e Medicina Comportamental (pp. 275-276). Londrina, PR: ABPMC.         [ Links ]

Albuquerque, L. C., Souza, D. G., Matos, M. A. & Paracampo, C. C. P. (2003). Análise dos efeitos de histórias experimentais sobre o seguimento subseqüente de regras. Acta Comportamentalia, 11, 87-126.         [ Links ]

Andronis, P. (1991). Rule-governance: Enough to make a term mean. Em L. J. Hayes & P. N. Chase (Orgs.), Dialogues on verbal behavior (pp. 226-235). Hillsdale: Lawrence Erlbaum.         [ Links ]

Baron, A. & Galizio, M. (1983). Instructional control of human operant behavior. The Psychological Record, 33, 495-520.         [ Links ]

Baron, A., Perone, M. & Galizio, M. (1991). The experimental analysis of human behavior: Indispensable, ancillary, or irrelevant? The Behavior Analyst, 14, 145-155.         [ Links ]

Barret, D. H., Deitz, S. M., Gaydos, G. R. & Quinn, P. C. (1987). The effects of programmed contingencies and social conditions on response stereotypy with human subjects. The Psychological Record, 37, 489-505.         [ Links ]

Capovilla, F. C. & Hineline, P. N. (1989). Voluntariar-se para experimentos e seguir instruções experimentais: O que todo experimentador deveria saber e fazer saber. Resumos da XIX Reunião Anual de Psicologia da Sociedade de Psicologia de Ribeirão Preto, p. 194.         [ Links ]

Catania, A. C., Matthews, A. & Shimoff, E. (1990). Properties of rule-governed behaviour and their implications. Em D. E. Blackman & H. Lejeune (Orgs.), Behaviour analysis in theory and practice: Contributions and controversies (pp. 215-230). Brighton: Lawrence Erlbaum.         [ Links ]

Catania, A. C., Shimoff, E. & Matthews, A. (1989). An experimental analysis of rule-governed behavior. Em S. C. Hayes (Org.), Rule-governed behavior: Cognition, contingencies, and instructional control (pp. 119-150). New York: Plenum.         [ Links ]

Cerutti, D. T.(1989). Discrimination theory of rule-governed behavior. Journal of the Experimental Analysis of Behavior, 51, 259-276.         [ Links ]

Chase, P. N. & Danforth, J. S. (1991). The role of rules in concept learning. Em L. J. Hayes & P. N. Chase (Orgs.), Dialogues on verbal behavior (pp. 205-225). Hillsdale: Lawrence Erlbaum.         [ Links ]

Hayes, S. C., Brownstein, A. J., Haas, J. R. & Greenway, D. (1986a). Instructions, multiple schedules, and extinction: Distinguishing rule-governed from schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 46, 137-147.         [ Links ]

Hayes, S. C., Brownstein, A. J., Zettle, R. D., Rosenfarb, I. & Korn, Z. (1986b). Rule governed behavior and sensitivity to changing consequences of responding. Journal of the Experimental Analysis of Behavior, 45, 237-256.         [ Links ]

Hayes, S. C., Zettle, R. & Rosenfarb. I. (1989). Rule-following. Em S. C. Hayes (Org.), Rule governed behavior: Cognition, contingencies, and intructional control (pp.191-220). New York: Plenum.         [ Links ]

Herrnstein, R. J. (1970). On the law of effect. Journal of the Experimental Analysis of Behavior, 13, 243-266.         [ Links ]

Joyce, J. H. & Chase, P. N. (1990). Effects of response variability on the sensivity of rule-governed behavior. Journal of the Experimental Analysis of Behavior, 54, 251-262.         [ Links ]

LeFrancois, J. R., Chase, P. N. & Joyce, J. (1988). The effects of variety of instructions on human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 49, 383-393.         [ Links ]

Lowe, C. F. (1979). Determinants of human operant behaviour. Em M. D. Zeiler & P. Harzem (Orgs.), Advances in analysis of behaviour: Reinforcement and the organization of behaviour (Vol.1; 159-192). Chichester: Wiley.         [ Links ]

Malott, R. W. (1989). The achievement of evasive goals: Control by rules describing contingencies that are not direct acting. Em S. C. Hayes (Org.), Rule governed behavior: Cognition, contingencies, and intructional control (pp.269-322). New York: Plenum.         [ Links ]

McDowell, J. J. (1988). Matching theory in natural human environments. The Behavior Analyst, 11, 95-109.         [ Links ]

Michael, R. L. & Bernstein, D. J. (1991). Transient effects of acquisition history on generalization in a matching-to-sample task. Journal of the Experimental Analysis of Behavior, 56, 155-166.         [ Links ]

Newman, B., Buffington, D. M. & Hemmes, N. S. (1995). The effects of schedules of reinforcement on instruction following. The Psychological Record, 45, 463-476.         [ Links ]

Paracampo, C. C. P. (1991). Alguns efeitos de estímulos antecedentes verbais e reforçamento programado no seguimento de regra. Psicologia: Teoria e Pesquisa, 7, 149-161.         [ Links ]

Parrott, L. J. (1987). Rule-governed behavior. Na implicit analysis of reference. Em S. Modgil & C. Modgil (Orgs.), B. F. Skinner: Consensus and Controversy (pp. 265-276). Sussex: Falmer Press.         [ Links ]

Perone, M., Galizio, M. & Baron, A. (1988). The relevance of animal-based principles in the laboratory study of human operant conditioning. Em G. Davey C. & Cullen (Orgs.), Human operant conditioning and behavior modification (pp. 59-85). New York: Wiley & Sons.         [ Links ]

Schlinger, H. (1993). Separating discriminative and function-altering effects of verbal stimuli. The Behavior Analyst, 16, 9-23.         [ Links ]

Shimoff, E., Matthews, B. A. & Catania, A. C. (1986). Human operant performance: Sensitivity and pseudosensitivity to contingencies. Journal of the Experimental Analysis of Behavior, 46, 149-157.         [ Links ]

Skinner, B. F. (1969). Contingencies of reinforcement: A theoretical analysis. New York: Appleton-Century-Crofts.         [ Links ]

Skinner, B. F. (1974). About behaviorism. New York: Alfred A. Knopf.         [ Links ]

Torgrud, L. J. & Holborn, S. W. (1990). The effects of verbal performance descriptions on nonverbal operant responding. Journal of the Experimental Analysis of Behavior, 54, 273-291.         [ Links ]

Vaughan, M. E. (1989). Rule-governed behavior in behavior analysis: A theoretical and experimental history. Em S. C. Hayes (Org.), Rule-governed behavior: Cognition, contingencies, and instructional control (pp. 97-118). New York: Plenum.         [ Links ]

Weiner, H. (1983). Some thoughts on discrepant human-animal performances under schedules of reinforcement. The Psychological Record, 33, 521-532.         [ Links ]

Zettle, R. D. & Hayes, S. C. (1982). Rule-governed behavior: A potential theoretical framework for cognitive-behavior therapy. Em P. C. Kendall (Org.), Advances in cognitive-behavioral research and therapy (pp. 73-118). New York: Academic Press.         [ Links ]

 

 

Recebido:28/01/2003
1ª Revisão: 12/09/2003
Aceite Final: 05/11/2003

 

 

Sobre os autores
Luiz Carlos de Albuquerque é Psicólogo, Doutor em Psicologia Experimental pela Universidade de São Paulo. É Professor da Universidade Federal do Pará.
Maria Amélia Matos é Psicóloga, Doutora em Psicologia pela Columbia University. É Professora da Universidade de São Paulo.
Deisy das Graças de Souza é Psicóloga, Pós-doutora pela University of Maryland System. É Professora na Universidade Federal de São Carlos.
Carla Cristina Paiva Paracampo é Psicóloga, Doutora em Psicologia Experimental pela Universidade de São Paulo. É Professora da Universidade Federal do Pará.
1 Endereço para correspondência: Rua Oliveira Belo, 238,1702, 66050 380, Umarizal, Belém, PA. Fone: (91) 2238995. E-mail: lca@cpgp.ufpa.br
2 O termo insensibilidade está sendo usado no presente estudo para descrever o comportamento que não é afetado por suas conseqüências imediatas, em uma determinada situação particular.
3 Esta regra foi denominada de correspondente, porque a emissão do comportamento por ela especificado na Fase 3 produzia conseqüências que correspondiam às conseqüências por ela descritas. Contudo, esta regra não descrevia as contingências de reforço programadas, concorrentemente em vigor na Fase 3, para a emissão do comportamento estabelecido por reforço diferencial.
4 Em 1996, ano em que os dados do presente estudo foram coletados, 1 (um) Real correspondia a 1 (um) Dólar.
5 As Tabelas 2 e 3 incluem dados de todos os participantes, mas nesta seção serão descritos apenas os relativos aos participantes da Condição FR 2.