Theorie: Wat is operante conditionering

Operante conditionering is het leerproces waarbij gedrag gevolgd wordt door een bekrachtiger (Engels: reinforcer) of bestraffer (Engels: punisher). Gedrag dat gevolgd wordt door een bekrachtiger zal vaker optreden en kan dus gebruikt worden in de training om iets aan te leren. Gedrag dat door een bestraffer gevolgd wordt zal minder vaak optreden en kan dus gebruikt worden om iets af te leren. Bekrachtigers en bestraffers kunnen ook nog ingedeeld worden in positief en negatief. Posititief en negatief zijn hier geen waarde oordeel maar betekenen simpelweg dat er iets toegevoegd wordt of iets weggenomen wordt. We kunnen dit samenvatten in het volgende schema:

iets aanleren iets afleren
iets toevoegen Positieve bekrachtiging Positief straffen
iets wegnemen Negatieve bekrachtiging Negatief straffen

Om dit te verduidelijken hier een paar voorbeelden:

Positieve bekrachtiging dit gebruiken we bij clickertraining. Je paard gaat achteruit als je dat vraagt en je klikt en geeft een stukje wortel. De wortel is een bekrachtiger voor het gedrag achteruit gaan.
Negatieve bekrachtiging dit gebruiken we vaak bij het rijden. Je geeft been, je paard gaat lopen en je stopt met been geven. Het stoppen met been geven is de negatieve bekrachtiger voor het lopen, je haalt iets weg.
Positief straffen een paard raakt de schrikdraad aan en krijgt een schokje, het schokje is een positieve bestraffer voor het aanraken van de draad. Het paard zal dit waarschijnlijk niet nog een keer doen.
Negatief straffen je paard hapt naar een wortel in je handen en dat wil je niet, je houdt je hand achter je rug zodat de wortel verdwijnt. Je paard stopt met happen.

De volgende punten zijn belangrijk om te weten:

  • Operant conditioneren gebeurt of je het nu wilt of niet. Kijk maar naar het schrikdraad voorbeeld. Maar ook in de interactie met je dier vindt er operante conditionering plaats of je je er nu bewust van bent of niet. Hoe meer je je bewust wordt van dit proces, hoe meer je het in je voordeel kunt laten werken.
  • Het dier bepaalt wat een beloning is niet de trainer! Als je paard bijvoorbeeld tegen de staldeur schopt om aandacht te krijgen en jij gaat op hem mopperen, is hij misschien wel blij met die negatieve aandacht. Hij ziet het als een beloning, een bekrachtiger dus, en zal vaker gaan schoppen.
  • De bekrachten of bestraffen moet direct na het gedrag plaatsvinden anders werkt het niet meer. Omdat het niet altijd mogelijk is om een dier direct te belonen gebruiken we de clicker. Het dier weet dat het gedrag goed was en dat de “echte”  beloning er aan komt.
  • Negatieve bekrachtiging en bestraffen kunnen eerder stress  veroorzaken bij een dier dan positieve bekrachtiging.

Zie ook nl.wikipedia.org/wiki/Operante_conditionering en nl.wikipedia.org/wiki/Bekrachtiging#Positieve_en_negatieve_bekrachtiging