Reforço (positivo e negativo) e punição (positiva e negativa)

por Carlos Eduardo Costa (Caê)


Sugeri um vídeo da série The Big Bang Theory sob o título Reforço negativo e punição: um erro comum. Comentei que reforço negativo e punição são conceitos facilmente confundidos quando se fala de princípios de Análise do Comportamento.

Vou tentar esclarecer as diferenças entre reforço (positivo e negativo) e punição (positiva e negativa) nesse post.

Positivo e negativo não expressam juízo de valor.

Isto é, positivo não é o mesmo que “bom” e negativo não é algo “ruim”. Positivo e negativo referem-se à introdução de “algo” e negativo refere-se a retirada de “algo”. Introdução ou retirada de um evento (estímulo) contingente à emissão de uma resposta.

O reforço e a punição positiva

Por exemplo, quando uso meu celular na sala de aula, o professor fica irritado. A “irritação” (na verdade vários comportamentos que rotulamos de “irritação”) do professor, que não estava no ambiente, agora está. Se o professor irritado diminui a probabilidade de que eu use o celular, eu descrevo a relação como punição positiva. Meu comportamento de usar o celular na sala de aula diminui de frequência.

contingencia-de-reforco-1

Em termos de relação de contingência teriamos algo como a figura ao lado. Na sala de aula (o contexto ou o estímulo discriminativo, SD)1 a resposta de usar o celular (R) produz uma consequência (S??), o professor irritado. Esta consequência será considerada aversiva (Sav) ou reforçadora (Sr) dependendo do efeito que produzir sobre a probabilidade (ou frequência) da resposta no futuro.

Agora, se o professor irritado aumenta a probabilidade de que eu venha a usar o celular novamente na sala de aula, eu descrevo a relação como um caso de reforço positivo.

O “professor irritado” será descrito como um evento reforçador (Sr) ou aversivo (Sav) a depender do efeito que a ocorrência desse fato tem sobre meu comportamento futuro, mas, nestes exemplos, consideramos como positivo porque “a irritação apareceu” em função do meu comportamento de usar o celular na sala de aula.

O reforço e a punição negativa

Vejamos outro exemplo. Eu grito com uma pessoa e ela vira as costas e vaigritando-indo-embora embora. Isso será um caso de reforço negativo se, em situações semelhantes no futuro, a probabilidade de que eu grite com esta pessoa aumente (ou a probabilidade de eu gritar se mantém alta). Por algum motivo a presença dessa pessoa era indesejável e gritar livrou-me daquela situação aversiva. Eu digo que o reforço é “negativo” porque a retirada de algo do ambiente (a pessoa, neste caso) foi o evento que aumentou a probabilidade da resposta no futuro.

Agora, imagine a mesma cena: eu grito com uma pessoa e ela vira as costas e vai embora. Entretanto, isso diminui a probabilidade (ou a frequência) de eu gritar com aquela pessoa. Se a probabilidade do meu comportamento diminui, então a saída da pessoa foi uma punição negativa. Eu descrevo o episódio como um caso de punição negativa porque “algo” (que era reforçador) foi retirado do ambiente.

Os exemplos chamam a atenção para um ponto importante: um mesmo evento será reforçador ou aversivo para uma mesma pessoa (ou para pessoas diferentes) em momentos diferentes. Ver meu professor irritado pode ser reforçador para meu comportamento, mas isso pode ser aversivo para meu colega. Ver o professor X irritado pode ser reforçador para meu comportamento, mas pode ser aversivo ver o professor Y irritado. A função reforçadora ou aversiva dos eventos é adquirida na história dos indivíduos e muda a depender da situação.

Uma maneira esquemática de apresentar as relações de reforço (positivo e negativo) e punição (positiva e negativa).

No diagradiagrama-relacoes-reforcoma estas relações estão descritas em função da resposta. As cores são importantes! Se uma resposta aumenta de frequência, então estamos falando de reforço; se uma resposta diminui de frequência, estamos falando de punição.

Se o aumento ou diminuição da resposta ocorreu devido a apresentação de um evento, chamamos o reforço ou a punição de positiva.

Se o aumento ou diminuição da resposta ocorreu devido a retirada de um evento, chamamos o reforço ou a punição de negativa.

Dizemos que o aumento ou diminuição da resposta é o processo que ocorre em função do procedimento (operação). A relação funcional entre a resposta e a consequência produz aquele processo (ver Catania, 1998/1999, Capítulo 5, para mais detalhes).

A “classificação” do reforço e punição como positivo ou negativo pode ser confusa

Fora do contexto do laboratório pode ser difícil dizer se o que está ocorrendo é um reforço positivo ou negativo. Jack Michael (1975)2 abordou isso em seu artigo e a discussão continua (ver Baron & Galizio, 2005 e os artigos de comentários que vieram depois)3. Por exemplo, você liga o ar condicionado para escapar do calor ou para produzir o frio? Em outras palavras, há a retirada de “algo” (calor) ou a introdução de “algo” (frio) contingente a resposta de ligar o ar condicionado?

Há bons argumentos tanto para se manter a distinção quanto para não mantê-la. Pesquise, leia, reflita e tome sua posição, baseado em bons argumentos e, preferencialmente, em evidências. Seja como for, é bom que você saiba identificar um caso e outro, sempre que for possível.


1. Um estímulo discriminativo, tecnicamente, não é o mesmo que contexto. Entretanto, manterei a frase assim porque acredito que facilite a compreensão.

2. Michael, J. (1975). Positive and Negative Reinforcement, a Distinction That Is No Longer Necessary; Or a Better Way to Talk about Bad Things. Behaviorism, 3(1), 33-44.

3. Baron, A., & Galizio, M. (2005). Positive and negative reinforcement: Should the distinction be preserved? The Behavior Analyst, 28(2), 85–98.

0 respostas

Deixe uma resposta

Want to join the discussion?
Feel free to contribute!

Deixe um comentário