Acessibilidade / Reportar erro

Controle de estímulos e história comportamental em humanos

Stimuli control and behavioral history in human beings

Resumos

O controle de estímulos da história comportamental foi analisado com quatro universitários, expostos inicialmente a um múltiplo razão-fixa (FR) - reforçamento-diferencial-de-baixas-taxas (DRL) e, depois, a um múltiplo intervalo-fixo (FI) - FI. Três participantes apresentaram efeitos da história (altas e baixas taxas de respostas nos componentes do múltiplo FI-FI previamente correlacionados, respectivamente, ao FR e ao DRL) por, no máximo, três sessões e um participante durante todo o teste. Para este participante, os estímulos correlacionados aos componentes do múltiplo FI-FI (cor do botão de respostas) foram alterados por 10 sessões e seu comportamento ficou semelhante ao dos outros três (não diferenciação na taxa de respostas dos componentes).

História comportamental; controle de estímulos; esquemas de reforço; humanos


Stimuli control of behavioral history was studied in a sample of four undergraduates who were first exposed to a multiple fixed-ratio (FR) - differential-reinforcement-of-low-rates (DRL) and then, to a multiple fixed-interval (FI) - FI. Three participants showed history effects (high and low response rates in the multiple FI components previously correlated with the FR and DRL) for no more than three sessions, and one participant during the entire test. For this participant, the stimuli correlated with the components of the multiple FI (color of the response button) were changed in 10 sessions, and his behavior became similar to that of the other three participants (no differentiation in response rates between components). These results suggest that human behavior tends to be controlled by current contingencies.

Behavioral history; stimuli control; schedules of reinforcement; humans


PROCESSOS PSICOLÓGICOS BÁSICOS

Controle de estímulos e história comportamental em humanos

Stimuli control and behavioral history in human beings

Paulo Guerra SoaresI,II,III; Carlos Eduardo CostaI; Carlos Renato Xavier CançadoIV; Sérgio Dias CirinoIII

IUniversidade Estadual de Londrina, Londrina, Brasil

IIUniversidade Norte do Paraná, Londrina, Brasil

IIIUniversidade Federal de Minas Gerais, Belo Horizonte, Brasil

IVWest Virginia University, Morgantown, USA

Endereço para correspondência Endereço para correspondência: Departamento de Psicologia Geral e Análise do Comportamento Centro de Ciências Biológicas, Universidade Estadual de Londrina Rodovia Celso Garcia Cid, Km 380, Caixa Postal 6001 Londrina, PR, Brasil, 86051-990. E-mail: caecosta@uel.br.

RESUMO

O controle de estímulos da história comportamental foi analisado com quatro universitários, expostos inicialmente a um múltiplo razão-fixa (FR) – reforçamento-diferencial-de-baixas-taxas (DRL) e, depois, a um múltiplo intervalo-fixo (FI) – FI. Três participantes apresentaram efeitos da história (altas e baixas taxas de respostas nos componentes do múltiplo FI-FI previamente correlacionados, respectivamente, ao FR e ao DRL) por, no máximo, três sessões e um participante durante todo o teste. Para este participante, os estímulos correlacionados aos componentes do múltiplo FI-FI (cor do botão de respostas) foram alterados por 10 sessões e seu comportamento ficou semelhante ao dos outros três (não diferenciação na taxa de respostas dos componentes).

Palavras-chave: História comportamental, controle de estímulos, esquemas de reforço, humanos.

ABSTRACT

Stimuli control of behavioral history was studied in a sample of four undergraduates who were first exposed to a multiple fixed-ratio (FR) – differential-reinforcement-of-low-rates (DRL) and then, to a multiple fixed-interval (FI) – FI. Three participants showed history effects (high and low response rates in the multiple FI components previously correlated with the FR and DRL) for no more than three sessions, and one participant during the entire test. For this participant, the stimuli correlated with the components of the multiple FI (color of the response button) were changed in 10 sessions, and his behavior became similar to that of the other three participants (no differentiation in response rates between components). These results suggest that human behavior tends to be controlled by current contingencies.

Keywords: Behavioral history, stimuli control, schedules of reinforcement, humans.

Experimentos sobre história comportamental são comumente realizados utilizando esquemas simples de reforço (Cole, 2001; Costa et al., 2008; Salgado, Cançado, & Costa, 2011; Weiner, 1964, 1969). O estudo de Weiner (1964), por exemplo, teve como objetivo investigar experimentalmente o efeito de duas diferentes histórias sobre o comportamento subsequente em FI, com seres humanos. Os participantes foram seis enfermeiros, distribuídos em dois grupos. A resposta experimental era pressionar um botão, e as consequências eram pontos. Os participantes recebiam, ainda, uma quantia fixa de dinheiro após cada sessão. Durante a Fase 1, os participantes do Grupo 1 foram submetidos a um esquema de razão fixa (FR, do inglês fixed ratio), enquanto os participantes do Grupo 2 foram expostos a um esquema de reforçamento diferencial de baixas taxas (DRL, do inglês differential reinforcement of low rates). Posteriormente, na Fase 2, os participantes de ambos os grupos foram expostos a um esquema de intervalo fixo (FI, do inglês fixed interval). Luzes de cores diferentes estavam presentes quando cada esquema de reforço estava em vigor. Weiner observou que os participantes do Grupo 1 emitiram taxas altas de respostas quando expostos ao esquema de FI, em relação aos participantes do Grupo 2, que emitiram baixas taxas de respostas quando expostos ao mesmo esquema. Estes resultados sugerem que uma exposição prévia de humanos a uma contingência de reforço pode influenciar o comportamento posterior em FI.

O método proposto por Freeman e Lattal (1992) também permite avaliar os efeitos da história, porém utilizando esquemas complexos (múltiplos). No Experimento 3, pombos foram expostos a um múltiplo (tandem VI-FR)-(tandem VI-DRL) [VI do inglês variable interval, ou intervalo variável], até que a estabilidade na taxa de respostas fosse atingida (de acordo com o critério de Cumming & Schoenfeld, 1960). Cada componente do múltiplo era correlacionado a uma luz da chave de resposta de cor diferente. Na fase de teste, apenas os esquemas de reforço em cada componente foram alterados para um VI (múltiplo VI-VI). Altas e baixas taxas de respostas foram observadas, respectivamente, no componente anteriormente correlacionado ao tandem VI-FR e ao tandem VI-DRL. Estes resultados indicam que comportamento presente pode ficar sob o controle de estímulos selecionados durante história do organismo, e que esta parece ser a maneira pela qual o comportamento atual é "influenciado" pela história (Dinsmoor, 1995, p. 52).

Também utilizando esquemas complexos (mistos), Okouchi (2003a) avaliou se o desempenho de humanos ficaria sob o controle discriminativo do intervalo entre reforços (IRI). Os experimentos foram realizados com estudantes universitários que tinham como tarefa pressionar um disco na tela do computador. As consequências programadas eram pontos que apareciam na tela do computador. Os participantes eram pagos em dinheiro pelos pontos obtidos na sessão e ao final do experimento. No Experimento 1, os participantes foram expostos a um esquema misto FR-DRL e foram distribuídos em dois grupos. Para os participantes do Grupo 1, o IRI do FR foi menor do que o do DRL e o oposto foi programado para os participantes do Grupo 2. Na fase de teste, todos os participantes foram expostos a um esquema misto FI 5 s-FI 20 s. Os participantes do Grupo 1 emitiram altas e baixas taxas de respostas sob FI 5 s (IRI semelhante ao FR) e FI 20 s (IRI semelhante ao DRL), respectivamente. Controle discriminativo pelo IRI foi também observado para os participantes do Grupo 2, que emitiram altas e baixas taxas de respostas sob FI 20 s e FI 5 s, respectivamente.

Okouchi (2003b) avaliou se os efeitos da história comportamental podem se generalizar para outras dimensões dos estímulos. O equipamento, a tarefa experimental e as consequências programadas eram as mesmas utilizadas em Okouchi (2003a). Todos os participantes foram expostos, em uma primeira fase a um múltiplo VR-DRL e os estímulos correlacionados a cada componente foram linhas de diferentes comprimentos. Na fase de teste, os participantes foram expostos a esquemas múltiplos FI-FI (Experimento 1) ou extinção-extinção (Experimento 2), e linhas de diferentes comprimentos foram apresentadas aos participantes. Em ambos os experimentos, durante a fase de teste, quando o comprimento da linha foi semelhante ao do VR, os participantes responderam em taxas mais altas do que quando o comprimento da linha foi semelhante ao do DRL, sugerindo a generalização do controle de estímulos previamente estabelecido pela exposição ao múltiplo VR-DRL.

Ao demonstrar a generalização do controle discriminativo da história comportamental, Okouchi (2003b) replicou e ampliou os resultados de Freeman e Lattal (1992). No entanto, no estudo de Okouchi a mudança de fases ocorreu após um número fixo de sessões, ou seja, nenhum critério de estabilidade foi utilizado. Freeman e Lattal (1992) utilizaram, no Experimento 3, um critério de estabilidade para mudança da fase de construção da história para a fase de teste. Outra variável importante não controlada por Okouchi foi a taxa de reforços entre os esquemas de reforço em ambas as fases. Sobre isso, Freeman e Lattal destacam que "as mudanças subsequentes no comportamento nestes estudos dos efeitos da história comportamental podem ser, em parte, resultado de diferenças na taxa de reforço nos esquemas de treino" (1992, p. 6).

O objetivo do presente experimento foi replicar o estudo de Freeman e Lattal (1992, Experimento 3), utilizando humanos como participantes de pesquisa, e levando em consideração os aspectos não controlados por Okouchi (2003b). Assim, os efeitos de uma exposição a um múltiplo FR-DRL sobre o desempenho em um múltiplo FI-FI foram analisados quando (a) as taxas de reforços entre os componentes do múltiplo foram controladas entre as fases do estudo; e (b) um critério de estabilidade foi utilizado para a mudança de fases.

Método

Participantes

Participaram quatro universitários (um do sexo masculino e três do sexo feminino, com idades variando entre 20 e 25 anos). Foram excluídos estudantes de Psicologia ou com queixa ou diagnóstico de Lesão por Esforço Repetitivo, porque a tarefa experimental poderia agravar tais lesões.

Equipamentos e Instrumento

Foram utilizados dois computadores do tipo PC, com monitor em cores de 14 polegadas, mouse e teclado padrões, e um gravador com fones de ouvido para emissão de ruído branco (som constante de rádio fora de estação, utilizado para isolamento acústico durante toda a sessão).

Para coleta de dados, foi utilizado o software ProgRef v3.1 (Costa & Banaco, 2002, 2003). Uma tela cinza com um retângulo no centro inferior da tela (botão de respostas) era exibida no monitor. A tarefa experimental consistia de pressões no botão esquerdo do mouse com o cursor sobre o botão de respostas. Quando a exigência de um esquema de reforço era cumprida, aparecia no canto superior direito da tela um ícone (smile). O participante deveria, então, pressionar o botão esquerdo do mouse com o cursor sobre um retângulo (botão de resposta de consumação) situado no canto superior direito, acima do smile. O smile, então, desaparecia e um ponto era registrado no visor de pontuação localizado acima do botão de respostas. Em um esquema de FI ou DRL o intervalo tinha início após o aparecimento do smile. Portanto, o tempo para deslocar o cursor entre os botões de respostas e de consumação era parte dos intervalos do FI ou do DRL.

Procedimento

Antes da primeira sessão, os participantes leram as informações sobre o estudo e assinaram o Termo de Consentimento Livre e Esclarecido, que informava que o objetivo da pesquisa era "estudar algumas variáveis que possam afetar o modo como as pessoas se comportam em determinadas situações", o número aproximado de sessões, a duração de cada uma e que os participantes poderiam abandonar o experimento a qualquer momento. Solicitou-se ao participante que deixasse seu material (incluindo relógio e telefone celular) fora da sala experimental e que lesse a seguinte instrução impressa:

Obrigado por sua participação! O experimentador não está autorizado a dar qualquer informação adicional. Caso houver dúvidas, releia o texto a seguir e prossiga o experimento. Sua tarefa será manusear o mouse de algum modo específico com o objetivo de conseguir pontos. Os pontos aparecerão em uma janela (contador) que se localizará na parte superior da tela do computador na posição central. Boa Sorte!

Os componentes dos esquemas de reforço, a duração de cada componente e a duração das sessões em cada fase do estudo estão resumidos na Tabela 1. As sessões eram diárias (exceto sábados, domingos e feriados) e os participantes receberam R$ 0,05 por ponto obtido.

Fase 1 – Aquisição. Os participantes foram expostos a um esquema múltiplo FR-DRL por três sessões. Na primeira, um múltiplo FR 10-DRL t s estava em vigor e o valor de t era ajustado gradativamente. Os componentes alternavam após a obtenção de 10 pontos e de um timeout (TO) de 5 s, no qual a tela do computador não continha os botões de resposta e de consumação, nem o visor de pontos. A cor do botão de respostas era verde no componente FR e vermelha no componente DRL.

A primeira sessão tinha início com um FR e a cada nova apresentação do DRL o valor do intervalo aumentava em 2 s, até 10 s. A primeira sessão terminava quando o participante obtinha o 10º ponto no esquema DRL 10 s. Na segunda sessão, o FR continuou fixo e o intervalo do DRL aumentou gradativamente de 12 s até 20 s. Na terceira sessão, o intervalo do DRL era fixo em 20 s e o valor do FR aumentou, a cada 10 pontos, de acordo com a sequência 10, 15, 20, 30 e 40 respostas.

Fase 2 – Aproximação do IRI. Os participantes foram expostos, inicialmente, a um múltiplo FR 40-DRL 20 s. As sessões, que tinham a duração de 30 minutos, começavam com o componente FR e os componentes alternavam após 5 minutos. Em cada sessão, para que o IRI fosse semelhante nos componentes FR e DRL (aproximadamente 20 s), o valor do FR era baseado no IRI médio da sessão anterior para cada participante. Isso foi feito para igualar a taxa de pontos obtidos nos dois componentes e para que o IRI não funcionasse como um controle de estímulo adicional do múltiplo FR-DRL (cf. Okouchi, 2003a). A mudança para a Fase 3 ocorreu quando a diferença no número total de pontos obtidos em cada componente fosse inferior a 10 (aproximadamente 0,7 pontos/minuto) em duas sessões consecutivas.

Fase 3 – Construção da Linha de Base. Os participantes foram expostos a um múltiplo FR n-DRL 20 s até que a taxa de respostas estáveis fossem obtidas em cada componente. O desempenho foi considerado estável quando, tomando-se o bloco das quatro últimas sessões, a diferença entre a média da taxa de respostas das duas primeiras e das duas últimas sessões não era maior que 10% da média da taxa de respostas das quatro sessões (cf. Cumming, & Schoenfeld, 1960; Schoenfeld, Cumming, & Hearst, 1956). Outros detalhes do procedimento foram semelhantes àqueles da Fase 2.

Fase 4 – Teste. Os participantes foram expostos a um múltiplo FI t s-FI t s. O valor de t foi baseado na média dos IRIs das quatro últimas sessões da Fase 3 em cada componente. O botão de resposta era verde para um componente, vermelho para o outro. Outros detalhes do procedimento foram semelhantes àqueles das Fases 2 e 3. Assim, os estímulos presentes em cada componente do múltiplo foram constantes entre as Fases 1, 2, 3 e 4. Foram realizadas 15 sessões nessa fase. P4 foi exposto a mais quatro sessões do múltiplo FI-FI, 38 dias após a 15ª sessão, porque as taxas de respostas entre os componentes permaneceram diferenciadas durante toda a Fase 4 para esse participante.

Fase 5 – Mudança no Controle de Estímulos. P4 foi exposto a um múltiplo FI t s-FI t s, no qual o valor de t era o mesmo da Fase 4, mas a cor do botão de resposta era preta em um componente e branca no outro. Outros detalhes do procedimento foram semelhantes aqueles das Fases 2, 3 e 4.

Resultados

A Figura 1 exibe as taxas de respostas (em Respostas por minuto; R/min) dos participantes em todas as fases do experimento. Para todos os participantes, as taxas de respostas na terceira sessão da Fase 1 foram mais altas no componente FR do que no DRL. Essa diferenciação entre os componentes aumentou na Fase 2, para cada participante.


A Fase 2 foi encerrada quando os IRIs do componente FR eram aproximadamente iguais aos do DRL. A maior diferença de pontos obtidos entre os componentes nesta fase foi de 0,5 pontos/min (P2) – o que corresponde a 7,5 pontos por sessão. Para P1, a mudança para a Fase 3 foi adiada. Entre as Sessões 6 e 7 houve uma diferença menor do que 10 pontos obtidos entre os componentes do múltiplo. Porém, após a Sessão 8 (que deveria ser a primeira sessão da Fase 3 para esse participante), a diferença no número de pontos obtidos foi superior a 10. Os IRIs médios da Sessão 8 foram de 22,2 s para o FR e de 29,2 s para o DRL.

Todos os participantes continuaram a emitir taxas de respostas mais altas no FR do que no DRL até o final da Fase 3. Hayes, Brownstein, Haas e Greenway (1986) propuseram um critério para avaliar a diferenciação da taxa de respostas entre componentes de um esquema de reforço múltiplo. Este índex de diferenciação é calculado dividindo-se a taxa de respostas no componente com taxa mais baixa pela soma das taxas de respostas em ambos os componentes. Valores menores que 0,25 indicariam diferenciação na taxa de respostas entre os componentes. O índex de diferenciação no final da Fase 3 (baseado nas quatro últimas sessões desta fase) foi de 0,005 para P1; de 0,008 para P2; de 0,010 para P3 e de 0,009 para P4.

Efeitos da exposição ao múltiplo FR-DRL foram observados nas primeiras sessões da Fase 4 para todos os participantes, que continuaram a emitir altas e baixas taxas de respostas nos componentes com botão verde e vermelho, respectivamente. As taxas de respostas de P1, P2 e P3 tenderam a se igualar a partir da quarta sessão de exposição ao múltiplo FI-FI. Para P4, o padrão de altas e baixas taxas observado nas Fases 2 e 3 persistiu durante toda a Fase 4 e nas sessões adicionais dessa fase. Após a mudança na cor do botão de respostas na Fase 5, as taxas de respostas de P4 nos dois componentes tenderam a se igualar, assim como para os outros participantes, sugerindo controle do comportamento pelos esquemas de FI.

Os efeitos de história mais duradouros de P4 poderiam ser função de uma menor variação nos IRIs (cf. Okouchi, 2003a) – e na taxa de pontos obtidos – entre as Fases 3 e 4 em relação aos outros participantes. A Figura 2 exibe as taxas médias dos pontos obtidos (pontos por minuto; pontos/min) em cada componente do múltiplo para cada participante, nas quatro últimas sessões da Fase 3 e nas quatro primeiras (Bloco Inicial) e últimas (Bloco Final) sessões da Fase 4.


A taxa de pontos não variou muito quando o esquema foi mudado de um múltiplo FR-DRL para um múltiplo FI-FI. A diferença das taxas médias de pontos entre os componentes para P1 durante o Bloco Final da Fase 3 foi de 0,2 pontos/min e nas Fases Inicial e Final da Fase 4 esta diferença não foi observada. Para P2, a diferença que era de 0,5 pontos/min durante a Fase 3 manteve-se durante o Bloco Inicial da Fase 4, mas diminuiu: 0,2 pontos/min. No Bloco Final da Fase 4, a diferença não foi mais observada. Para P3, não havia diferença na taxa de pontos no Bloco Final da Fase 3. Durante a Fase 4 a taxa de pontos nos dois componentes diminuiu em relação à Fase 3, mas a diferença na taxa de pontos entre os componentes continuou inexistente. Para P4, havia uma diferença de 0,4 pontos/min entre os componentes durante o Bloco Final da Fase 3 e o Bloco Inicial da Fase 4. No Bloco Final da Fase 4, a diferença entre os componentes ainda podia ser observada (0,2 pontos/min).

A Figura 3 exibe a proporção de mudança nas taxas de respostas (cf. Nevin, 1974) nos componentes do múltiplo FI-FI das Fases 4 (P1, P2 e P3) e 5 (P4) em relação às quatro últimas sessões da Fase 3 (P1, P2, P3) e da Fase 4 (P4). A comparação da proporção de mudança permite observar quanto a taxa de respostas em cada componente variou em relação à sua linha de base. Como as taxas de respostas no FR e no DRL eram muito diferentes durante a Fase 3, a Figura 1 pode sugerir que houve maior mudança no componente FI com botão verde (FR) do que no FI com botão vermelho (DRL). Uma representação proporcional, como na Figura 3, pode diminuir este viés.


Para P1, P2 e P3, a proporção de mudança da taxa de respostas foi maior no componente anteriormente correlacionado ao DRL (botão vermelho) do que no componente anteriormente correlacionado ao FR (botão verde), indicando que uma história de FR pode produzir uma taxa de respostas mais resistente à mudança. Para P4, observa-se que a mudança nas taxas de respostas foi maior no componente FI com botão branco em relação ao componente FI com botão preto.

Talvez a diferença na resistência comportamental à mudança entre componentes possa ser explicada pela diferença no total de pontos obtidos em cada componente nas Fases 1, 2 e 3 (cf. Nevin & Grace, 2000; Nevin, Tota, Torquato, & Shull, 1990, Experimento 1). A Figura 4 exibe o total de pontos obtidos por participante em cada componente do múltiplo FR-DRL nas Fases 1, 2 e 3. A quantidade total de pontos obtidos no FR foi maior do que no DRL para todos os participantes. A diferença entre os componentes foi de 315 pontos para P1; 100 pontos para P2 e 103 pontos para P3 e P4.


A Figura 5 exibe os registros cumulativos das sessões da exposição ao múltiplo FI-FI na qual o comportamento dos participantes começou a mudar em relação a Fase 3 (P1, P2 e P3) e 4 (P4).


Para P1, P2 e P3, a taxa de respostas começa a mudar durante a exposição ao FI com botão vermelho (anteriormente correlacionado ao DRL). Para P1, o comportamento começa a mudar na primeira sessão da Fase 4 (Sessão 29) durante a apresentação do segundo componente FI com botão vermelho (quarto componente do múltiplo nessa sessão). Uma análise adicional indicou que a média dos intervalos entre respostas (IRT) de P1 diminuiu (15,5 s; 12,4 s e 0,7 s), e a taxa de respostas aumentou durante as três apresentações consecutivas do componente FI com botão vermelho durante a sessão. Para P2 (Sessão 15) e P3 (Sessão 16) a mudança ocorreu na terceira sessão da Fase 4.

O registro cumulativo de P2 permite identificar a mudança durante a segunda apresentação do FI com botão vermelho (quarto componente do múltiplo). A média dos IRTs de P2 diminuiu (26,9 s, 9,3 s e 0,6 s) durante as três apresentações sucessivas do FI com botão vermelho, e houve um aumento na taxa de respostas semelhante a de P1. Para P3, a mudança ocorreu durante a primeira apresentação do FI com botão vermelho (no segundo componente do múltiplo) e a média dos IRTs nos três componentes FI com botão vermelho foi de 13,4 s; 11,8 s e 3,1 s, respectivamente. O desempenho final de P2 e P3 nessa sessão de mudança assemelha-se ao padrão final observado para esses participantes na última sessão da Fase 4.

O comportamento de P4 em cada componente do múltiplo continuou diferenciado durante toda a Fase 4. Quando as cores dos botões de resposta foram alteradas na Fase 5, o comportamento de P4 mudou no primeiro componente da primeira sessão (sessão 37). O comportamento de P4 durante a primeira sessão da Fase 5 foi semelhante ao comportamento deste participante durante as outras sessões desta fase. A diminuição dos IRTs durante o componente FI com botão vermelho (previamente correlacionado ao DRL) observada para P1, P2 e P3 não ocorreu para P4. Uma análise da variação dos IRTs durante a linha de base poderia lançar luz sobre a probabilidade de mudança no comportamento durante a fase de teste. A Figura 6 mostra as medianas, em segundos e milissegundos, dos IRTs dos componentes DRL para os quatro participantes, em todas as sessões da Fase 3.


Para P1 e P2 houve maior variação nas medianas dos IRTs durante a Fase 3 (valores em torno de 0,1 segundo durante as sessões iniciais dessa fase, refletindo altas taxas de respostas durante o DRL). Esta variabilidade diminuiu nas quatro últimas sessões (as medianas foram aproximadamente 23 s para P1 e 25 s para P2). Para P2, na quarta sessão da Fase 3 houve maior variação nas medianas dos IRTs (indicada pela diferença entre a barra de erro desta e de outras sessões), que tendeu a diminuir nas sessões seguintes. Para P3 e P4, uma menor variabilidade foi observada durante as sessões desta fase. Portanto, a análise das medianas dos IRTs do componente DRL durante a Fase 3 não revelou uma relação entre a variabilidade nesta medida e a probabilidade de mudança na taxa de respostas em fases subsequentes.

Discussão

Efeitos da história de exposição ao múltiplo FR-DRL sobre o comportamento em um múltiplo FI-FI foram observados para cada participante, e apresentaram menor duração para três participantes (P1, P2 e P3). Com a exposição continuada ao múltiplo FI-FI, as taxas de respostas se ajustaram ao parâmetro temporal deste esquema de reforço. Os resultados destes três participantes, portanto, replicaram aqueles obtidos por Freeman e Lattal (1992), com pombos, e Okouchi (2003a, 2003b), com humanos.

Os resultados de P4 foram diferentes dos outros participantes. Para esse participante, até a 15ª sessão da Fase 4 podem ser observados efeitos da exposição ao múltiplo FR-DRL (altas taxas de respostas no componente FI quando o botão de resposta era verde – correlacionado ao FR na Fase 3 – e baixas taxas no FI quando o botão de respostas era vermelho – correlacionado ao DRL na Fase 3). Os resultados deste participante são semelhantes aos obtidos em alguns estudos de Weiner (1964, 1969), que sugerem efeitos de longa duração de uma história de FR ou DRL sobre o comportamento de humanos em FI. Após 38 dias de intervalo entre a 15ª e a 16ª sessão da Fase 4, a taxa de respostas de P4 nos componentes do múltiplo FI-FI continuou diferenciada por quatro sessões. Estes resultados sugerem que a mera passagem do tempo não é suficiente para eliminar os efeitos de uma exposição a um esquema de reforço. Resultados semelhantes foram obtidos por Ono e Iwabuchi (1997, Parte 2). Pombos foram expostos, na Fase 1, a um múltiplo DRH-DRL. A chave de respostas era iluminada de verde no DRH e de vermelho no DRL. Após seis meses de intervalo, durante a Fase 2, os pombos foram expostos a um VI, com a chave de respostas iluminada de branco. Na Fase 3, um múltiplo VI-VI entrou em vigor, com a cor do disco variando entre verde e vermelha. Mesmo após a passagem de seis meses e a exposição a um VI com o disco branco, foram observados efeitos da história de exposição ao múltiplo DRH-DRL sobre o comportamento no múltiplo VI-VI. Resultados semelhantes foram relatados por Skinner (1950, pp. 200-201) em um estudo em que pombos foram inicialmente treinados a bicar uma chave na qual era projetada um estímulo específico. Em seguida os pombos foram alojados em suas gaiolas-viveiro sem exposição a condições experimentais por um período que variou entre seis meses e quatro anos. Então, os pombos foram novamente expostos ao contexto experimental em um esquema de extinção. No período inicial da extinção no qual a chave de respostas estava presente, mas o estímulo não era projetado, os pombos não responderam. Quando o estímulo foi projetado na chave de respostas, os pombos emitiram cerca de 700 respostas.

Por que as taxas de respostas de P4 permaneceram diferenciadas durante toda a Fase 4 (sugerindo efeitos de história de longa duração)? Okouchi (2003a) sugeriu que o IRI pode controlar discriminativamente o responder quando se muda o esquema de reforço em vigor. Como no presente experimento o IRI, em ambos os componentes, foi aproximadamente o mesmo durante as Fase 3 e 4 (ver Figura 2), o comportamento de P4 parece ter ficado, principalmente, sob controle dos estímulos que estavam presentes nas fases anteriores do estudo, isto é, as cores do botão de respostas. Como o comportamento diferenciado nos dois componentes do múltiplo FI-FI continuou produzindo uma taxa de pontos semelhante à que produzia anteriormente (Figura 2), não foi observada mudança comportamental substancial. Com o objetivo de verificar se a manutenção do padrão comportamental era função das cores do botão de respostas, elas foram alteradas na Fase 5. A mudança no comportamento de P4 (ver Figura 1) indica controle preponderante das cores do botão de resposta (verde e vermelho) sobre o responder desse participante. Os resultados de um experimento de Ferster e Skinner (1957/1972, pp. 515-517) sugerem que tal controle pode influenciar o comportamento entre componentes de um esquema de reforço múltiplo. Pombos foram submetidos a um múltiplo FI-FR e, em condição subsequente, o estímulo correlacionado ao FI era apresentado durante o componente em que o FR estava em vigor. Os resultados indicaram um padrão comportamental típico de esquemas de FI quando o estímulo correlacionado a este esquema de reforço aparecia durante o FR.

Se o controle de estímulos (cores dos botões) foi um fator determinante da manutenção do comportamento de P4 durante a Fase 4, e da mudança durante a Fase 5, cabe perguntar por quê houve mudança no comportamento de P1, P2 e P3 durante a Fase 4? Por que o comportamento desses participantes não apresentou a persistência comportamental de P4? Uma mudança na taxa de reforço entre as Fases 3 e 4 poderia aumentar a probabilidade de que o comportamento dos participantes se alterasse na Fase 4 (cf. Okouchi, 2003a), mas as análises apresentadas na Figura 2 sugerem que não houve uma relação entre a taxa de reforços nas últimas sessões da Fase 3 e o início da Fase 4 e a probabilidade da mudança comportamental subsequente.

Como a diferença na taxa de reforços, aparentemente, não pode explicar a mudança ou manutenção das taxas de respostas após a mudança de fases, foi realizada uma análise dos IRTs (ver Figura 6). Foram calculadas as mudanças nos IRTs apenas do DRL porque os registros cumulativos da sessão em que mudanças nas taxas de respostas ocorreram (ver Figura 3) sugeriram que as taxas de respostas começaram a mudar no componente FI com botão vermelho (anteriormente correlacionado ao DRL) e depois no componente FI com botão verde (anteriormente correlacionado ao FR). Duas explicações podem ser propostas sobre a relação entre a variação dos IRTs durante o componente DRL na Fase 3 e a probabilidade de mudança no comportamento durante o múltiplo FI-FI. Primeiramente, uma história de variação dos IRTs durante o DRL poderia persistir durante o FI; a variação dos IRTs no FI não implicaria em um "adiamento" na obtenção de pontos, como ocorreria no DRL. Esta diferença entre as duas fases do experimento poderia aumentar a probabilidade de seleção de um novo padrão comportamental na presença de uma nova contingência de reforço. Outra explicação seria que uma história de variação dos IRTs durante a Fase 3 seria "punida" pelo reinício do intervalo (aumento no IRI e atraso da liberação de pontos) e contribuiria para uma diminuição na probabilidade de variações no IRT. No FI, a probabilidade de variar o IRT seria baixa, diminuindo a probabilidade de seleção de um novo padrão comportamental, mas sem ocasionar, necessariamente, a perda de pontos (ou redução do número total de pontos).

O que se observa na Figura 6, todavia, é que não existe uma relação entre maior variação dos IRTs durante a Fase 3 e mudança do comportamento na Fase 4. P1, P2 e P3 mudaram o padrão comportamental quando a contingência mudou de DRL para FI, mas P1 e P2 variaram mais os IRTs durante a Fase 3 em relação a P3. Além disso, como o padrão de variação dos IRTs de P3 foi muito semelhante ao de P4, poder-se-ia esperar que, se a história de variação dos IRTs fosse central, ambos teriam a mesma probabilidade de mudar (ou não) o padrão comportamental com a mudança nos esquemas de reforço. Entretanto, o comportamento de P3 mudou, enquanto o de P4 se manteve.

Tomadas em conjunto, tanto a explicação relativa aos IRIs (taxa de reforços) quanto a relativa aos IRTs parecem ser insuficientes para explicar, no presente experimento, a maior resistência à mudança observada no comportamento de P4. Os resultados desse participante levantam a polêmica questão da duração dos efeitos da história comportamental (cf. Costa, Cirino, Cançado, & Soares, 2009). Alguns autores (por exemplo, Tatham & Wanchisen, 1998; Wanchisen & Tatham, 1991) sugeriram que, em alguns casos, os efeitos da história comportamental poderiam ser permanentes. Todavia, com a exposição continuada ao múltiplo FI-FI, as taxas de respostas nos dois componentes tenderam a se tornar iguais para P1, P2 e P3, sugerindo que os efeitos de história foram transitórios (Cole, 2001; Freeman & Lattal, 1992; Sidman, 1960). Os efeitos da história comportamental sobre o comportamento de P4, por terem sido mais resistentes à mudança, poderiam ser descritos como efeitos de longa duração (em relação àqueles observados para os outros participantes).

Outro aspecto que precisa ser destacado com relação à mudança no comportamento durante o múltiplo FI-FI (na Fase 4 para P1, P2 e P3 e na Fase 5 para P4) diz respeito à proporção dessa mudança em relação à linha de base (Figura 3). Houve maior aumento na taxa de respostas no componente FI com botão vermelho (previamente correlacionado ao DRL) em relação à diminuição na taxa de respostas no componente FI com botão verde (previamente correlacionado ao FR). Ou seja, o comportamento no componente FI com botão verde parece ter sido mais resistente à mudança. Para P4, o componente que apresentou maior resistência à mudança foi o FI com botão preto (que substituiu o botão verde, previamente correlacionado ao FR). Estes resultados são contrários ao dos estudos da área de momentum comportamental. Alguns estudos (Lattal, 1989; Nevin, 1974, Experimento 5, 1979) sugerem que, uma vez controlada a taxa de reforço entre componentes de um esquema múltiplo que selecionam altas e baixas taxa de respostas, a resistência à mudança será maior no componente que gera a menor taxa de respostas. Uma explicação para essa discrepância é a quantidade de pontos obtida durante as Fases 1, 2 e 3 do presente experimento. Alguns autores (Nevin, 1974, Experimentos 1 e 2; Nevin & Grace, 2000; Nevin et al., 1990, Experimento 1) sugerem que quanto maior a quantidade de reforços produzida em um componente em relação ao outro, maior a resistência à mudança neste componente. A Figura 4 mostra que, durante as Fase 1, 2 e 3, o total de pontos obtidos durante o FR foi maior que no DRL para todos os participantes.

Todavia, deve-se destacar que as pesquisas da área de momentum comportamental utilizam durante a fase de teste, esquemas de extinção, alimentação prévia ou liberação de comida independente da resposta em FT ou VT (Lattal, 1989; Nevin, 1974, 1979; Nevin, Mandell, & Atak, 1983; Santos, 2005). Essas manipulações afetam a taxa de respostas reduzindo-a em relação à linha de base. No presente estudo, a fase teste foi realizada com um múltiplo FI-FI, ou seja, um esquema de reforço cujos componentes permitiam variação na taxa de respostas e mantinham a taxa de ganho de pontos relativamente constante em relação à fase anterior. Pesquisas futuras poderiam utilizar o mesmo procedimento do presente estudo na fase de construção da história e, na fase de teste, utilizar um múltiplo extinção-extinção.

Tomados em conjunto, os resultados do presente estudo sugerem também que análises de variáveis do procedimento experimental permitem abordar de maneira eficaz as discrepâncias entre os resultados dos participantes em estudos que utilizam uma mesma espécie e, além disso, as diferenças entre espécies (para estudos experimentais que discutem esta questão, ver, por exemplo, Costa et al., 2008 e Salgado et al., 2011). A este respeito, Skinner (1957/1972) sugeriu que "A reprodutibilidade de espécie para espécie é um produto do método. Escolhendo os estímulos, respostas e reforçadores apropriados para a espécie estudada, eliminamos as fontes de diferenças de muitas espécies" (p. 156). Weiner (1983) apontou para a importância da realização de pesquisas experimentais com humanos e ressaltou o fato de ter conseguido, em suas pesquisas com humanos, dados tão regulares quanto aqueles obtidos com não-humanos. Numa tentativa de refinar o controle de variáveis do procedimento em estudo com humanos, o presente experimento produziu resultados que replicaram aqueles obtidos por Freeman e Lattal (1992), com pombos, e replicaram e ampliaram aqueles obtidos por Okouchi (2003a, 2003b), com humanos.

Referências

Cole, M. R. (2001). The long-term effect of high- and low-responding histories on fixed-interval responding in rats. Journal of the Experimental Analysis of Behavior, 75(1), 43-54.

Costa, C. E., & Banaco, R. A. (2002). ProgRef v3: Sistema computadorizado para a coleta de dados sobre programas de reforço com humanos – Recursos básicos. Revista Brasileira de Terapia Comportamental e Cognitiva, 4(2), 171-172.

Costa, C. E., & Banaco, R. A. (2003). ProgRef v3: Sistema computadorizado para a coleta de dados sobre programas de reforço com humanos – Recursos adicionais. Revista Brasileira de Terapia Comportamental e Cognitiva, 5(2), 219-229.

Costa, C. E., Banaco, R. A., Longarezi, D. M., Martins, E. V., Maciel, E. M., & Sudo, C. H. (2008). Tipo de reforçador como uma variável moduladora dos efeitos de história em humanos. Psicologia: Teoria e Pesquisa, 24(2), 251-262.

Costa, C. E., Cirino, S. D., Cançado, C. R. X., & Soares, P. G. (2009). Polêmicas sobre história comportamental: Identificação de seus efeitos e sua duração. Psicologia: Reflexão e Crítica, 22(3), 317-326.

Cumming, W. W., & Schoenfeld, W. N. (1960). Behavior stability under extended exposure to a time-correlated reinforcement contingency. Journal of the Experimental Analysis of Behavior, 3, 71-82.

Dinsmoor, J. A. (1995). Stimulus control: Part I. The Behavior Analyst, 18(2), 51-68.

Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York: Appleton.

Freeman, T. J., & Lattal, K. A. (1992). Stimulus control of behavioral history. Journal of the Experimental Analysis of Behavior, 57(1), 5-15.

Hayes, S. C., Brownstein, A. J., Haas, J. R., & Greenway, D. E. (1986). Instructions, multiple schedules, and extinction: Distinguishing rule-governed from schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 46, 137-147.

Lattal, K. A. (1989). Contingencies on response rate and resistance to change. Learning and Motivation, 29, 191-203.

Nevin, J. A. (1974). Response strength in multiple schedules. Journal of the Experimental Analysis of Behavior, 21(3), 389-408.

Nevin, J. A. (1979). Reinforcement schedules and response strength. Reinforcement and the organization of behavior. New York: John Wiley & Sons.

Nevin, J. A., & Grace, R. C. (2000). Behavioral momentum and the Law of Effect. Behavioral and Brain Sciences, 23(1), 73-130.

Nevin, J. A., Mandell, C., & Atak, J. R. (1983). The analysis of behavioral momentum. Journal of the Experimental Analysis of Behavior, 39(1), 49-59.

Nevin, J. A., Tota, M. E., Torquato, R. D., & Shull, R. L. (1990). Alternative reinforcement increases resistance to change: Pavlovian or operant contingencies? Journal of the Experimental Analysis of Behavior, 53(3), 359-379.

Okouchi, H. (2003a). Effects of differences in interreinforcer intervals between past and current schedules on fixed-interval responding. Journal of the Experimental Analysis of Behavior, 79(1), 49-64.

Okouchi, H. (2003b). Stimulus generalization of behavioral history. Journal of the Experimental Analysis of Behavior, 80(2), 173-186.

Ono, K., & Iwabuchi, K. (1997). Effects of histories of differential reinforcement of response rate on variable-interval responding. Journal of the Experimental Analysis of Behavior, 67(3), 311-322.

Salgado, R. C., Cançado, C. R. X., & Costa, C. E. (2011). Efeitos do reforçador empregado em história de reforço recente e remota. Psicologia: Teoria e Pesquisa, 27(2), 119-130.

Santos, C. V. (2005). Momento comportamental. In J. Abreu- Rodrigues & M. R. Ribeiro (Eds.), Análise do comportamento: Pesquisa, teoria e aplicação (pp. 63-80). Porto Alegre, RS: Artmed.

Schoenfeld, W. N., Cumming, W. W., & Hearst, E. (1956). On the classification of reinforcement schedules. Proceedings of the National Academy of Sciences, 42, 563-570.

Sidman, M. (1960). Tactics of Scientific Research. New York: Basic Books.

Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57(4), 193-216.

Skinner, B. F. (1972). The experimental analysis of behavior. In Cumulative record (p. 125-157). New York: Appleton Century Crofts. (Original work published 1957)

Tatham, T. A., & Wanchisen, B. (1998). Behavioral history: A definition and some common findings from two areas of research. Behavior Analyst, 21, 241-251.

Wanchisen, B. A., & Tatham, T. A. (1991). Behavioral history: A promising challenge in explaining and controlling human operant behavior. The Behavior Analyst, 14(2), 139-144.

Weiner, H. (1964). Conditioning story and human fixed-interval performance. Journal of The Experimental Analysis of Behavior, 7(5), 383-385.

Weiner, H. (1969). Controling human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 12(3), 349-373.

Weiner, H. (1983). Some thoughts on discrepant human-animal performance under schedules of reinforcement. Psychological Record, 33, 521-532.

Recebido: 03/08/2011

1ª revisão: 22/12/2011

2ª revisão: 07/03/2012

Aceite final: 24/05/2012

Os resultados deste artigo fazem parte da dissertação de mestrado do primeiro autor, defendida no programa de mestrado em Análise do Comportamento da Universidade Estadual de Londrina, sob orientação do segundo autor. O primeiro autor foi bolsista da Fundação Araucária. O presente estudo foi aprovado pelo Comitê de Ética em Pesquisas Envolvendo Seres Humanos da Universidade Estadual de Londrina, com o parecer nº 318/06. Os autores gostariam de agradecer aos Professores Michael Perone e Andy Lattal, da West Virginia University e a Celso A. Athayde Neto pelas sugestões durante a análise dos dados.

  • Cole, M. R. (2001). The long-term effect of high- and low-responding histories on fixed-interval responding in rats. Journal of the Experimental Analysis of Behavior, 75(1), 43-54.
  • Costa, C. E., & Banaco, R. A. (2002). ProgRef v3: Sistema computadorizado para a coleta de dados sobre programas de reforço com humanos Recursos básicos. Revista Brasileira de Terapia Comportamental e Cognitiva, 4(2), 171-172.
  • Costa, C. E., & Banaco, R. A. (2003). ProgRef v3: Sistema computadorizado para a coleta de dados sobre programas de reforço com humanos Recursos adicionais. Revista Brasileira de Terapia Comportamental e Cognitiva, 5(2), 219-229.
  • Costa, C. E., Banaco, R. A., Longarezi, D. M., Martins, E. V., Maciel, E. M., & Sudo, C. H. (2008). Tipo de reforçador como uma variável moduladora dos efeitos de história em humanos. Psicologia: Teoria e Pesquisa, 24(2), 251-262.
  • Costa, C. E., Cirino, S. D., Cançado, C. R. X., & Soares, P. G. (2009). Polêmicas sobre história comportamental: Identificação de seus efeitos e sua duração. Psicologia: Reflexão e Crítica, 22(3), 317-326.
  • Cumming, W. W., & Schoenfeld, W. N. (1960). Behavior stability under extended exposure to a time-correlated reinforcement contingency. Journal of the Experimental Analysis of Behavior, 3, 71-82.
  • Dinsmoor, J. A. (1995). Stimulus control: Part I. The Behavior Analyst, 18(2), 51-68.
  • Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement New York: Appleton.
  • Freeman, T. J., & Lattal, K. A. (1992). Stimulus control of behavioral history. Journal of the Experimental Analysis of Behavior, 57(1), 5-15.
  • Hayes, S. C., Brownstein, A. J., Haas, J. R., & Greenway, D. E. (1986). Instructions, multiple schedules, and extinction: Distinguishing rule-governed from schedule-controlled behavior. Journal of the Experimental Analysis of Behavior, 46, 137-147.
  • Lattal, K. A. (1989). Contingencies on response rate and resistance to change. Learning and Motivation, 29, 191-203.
  • Nevin, J. A. (1974). Response strength in multiple schedules. Journal of the Experimental Analysis of Behavior, 21(3), 389-408.
  • Nevin, J. A. (1979). Reinforcement schedules and response strength. Reinforcement and the organization of behavior New York: John Wiley & Sons.
  • Nevin, J. A., & Grace, R. C. (2000). Behavioral momentum and the Law of Effect. Behavioral and Brain Sciences, 23(1), 73-130.
  • Nevin, J. A., Mandell, C., & Atak, J. R. (1983). The analysis of behavioral momentum. Journal of the Experimental Analysis of Behavior, 39(1), 49-59.
  • Nevin, J. A., Tota, M. E., Torquato, R. D., & Shull, R. L. (1990). Alternative reinforcement increases resistance to change: Pavlovian or operant contingencies? Journal of the Experimental Analysis of Behavior, 53(3), 359-379.
  • Okouchi, H. (2003a). Effects of differences in interreinforcer intervals between past and current schedules on fixed-interval responding. Journal of the Experimental Analysis of Behavior, 79(1), 49-64.
  • Okouchi, H. (2003b). Stimulus generalization of behavioral history. Journal of the Experimental Analysis of Behavior, 80(2), 173-186.
  • Ono, K., & Iwabuchi, K. (1997). Effects of histories of differential reinforcement of response rate on variable-interval responding. Journal of the Experimental Analysis of Behavior, 67(3), 311-322.
  • Salgado, R. C., Cançado, C. R. X., & Costa, C. E. (2011). Efeitos do reforçador empregado em história de reforço recente e remota. Psicologia: Teoria e Pesquisa, 27(2), 119-130.
  • Schoenfeld, W. N., Cumming, W. W., & Hearst, E. (1956). On the classification of reinforcement schedules. Proceedings of the National Academy of Sciences, 42, 563-570.
  • Sidman, M. (1960). Tactics of Scientific Research New York: Basic Books.
  • Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57(4), 193-216.
  • Skinner, B. F. (1972). The experimental analysis of behavior. In Cumulative record (p. 125-157). New York: Appleton Century Crofts. (Original work published 1957)
  • Tatham, T. A., & Wanchisen, B. (1998). Behavioral history: A definition and some common findings from two areas of research. Behavior Analyst, 21, 241-251.
  • Wanchisen, B. A., & Tatham, T. A. (1991). Behavioral history: A promising challenge in explaining and controlling human operant behavior. The Behavior Analyst, 14(2), 139-144.
  • Weiner, H. (1964). Conditioning story and human fixed-interval performance. Journal of The Experimental Analysis of Behavior, 7(5), 383-385.
  • Weiner, H. (1969). Controling human fixed-interval performance. Journal of the Experimental Analysis of Behavior, 12(3), 349-373.
  • Weiner, H. (1983). Some thoughts on discrepant human-animal performance under schedules of reinforcement. Psychological Record, 33, 521-532.
  • Endereço para correspondência:

    Departamento de Psicologia Geral e Análise do Comportamento
    Centro de Ciências Biológicas, Universidade Estadual de Londrina
    Rodovia Celso Garcia Cid, Km 380, Caixa Postal 6001
    Londrina, PR, Brasil, 86051-990.
    E-mail:
  • Datas de Publicação

    • Publicação nesta coleção
      19 Jul 2013
    • Data do Fascículo
      2013

    Histórico

    • Recebido
      03 Ago 2011
    • Aceito
      24 Maio 2012
    • Revisado
      07 Mar 2012
    Curso de Pós-Graduação em Psicologia da Universidade Federal do Rio Grande do Sul Rua Ramiro Barcelos, 2600 - sala 110, 90035-003 Porto Alegre RS - Brazil, Tel.: +55 51 3308-5691 - Porto Alegre - RS - Brazil
    E-mail: prc@springeropen.com