Ervaringsleren, oftewel operante conditionering


Operante conditionering? R+, R-, P+ en P- ? Moeilijk allemaal, hoor!
Nee hoor! Op zich is het allemaal heel logisch! Dit artikel legt uit wat het allemaal inhoudt, geïllustreerd met veel voorbeelden, plaatjes en een leuke quote die je als ezelsbruggetje kunt gebruiken.

Operante conditionering wordt ook wel ervaringsleren genoemd, want je hond leert door ondervinding. Hij legt al heel gauw een verband tussen wat hij doet en wat er vlak daarna gebeurt. Afhankelijk van wat er gebeurt, zal hij zijn gedrag vaker of juist minder vaak gaan vertonen.

  • Gedrag dat je hond iets oplevert of hem een voordeel brengt, zal hij graag herhalen.
  • Andersom zal je hond gedrag dat hem direct nadeel brengt, minder vaak herhalen.

"Iets opleveren" kan op 2 manieren, die beide de hond 'versterken' of 'bekrachtigen' in zijn gedrag, Reinforcement in het Engels. Hij zal het gedrag dat hij deed op dat moment, graag herhalen:

  • Er kan iets leuks gebeuren. Dit wordt aangeduid met R+ (positive Reinforcement, oftewel in het Nederlands: positieve bekrachtiging).
  • Er kan iets akeligs stoppen of weggaan. Dit wordt aangeduid met R- (negative Reinforcement, Nederlands negatieve bekrachtiging).

Zo kan ook "nadeel brengen" op 2 manieren, die beide de hond 'corrigeren' of 'straffen' in zijn gedrag, Punishment in het Engels. Hij zal het gedrag dat hij deed op dat moment, minder vaak herhalen.

  • Er kan iets akeligs gebeuren. Dit wordt aangeduid met P+ (positive Punishment, Nederlands positieve correctie)
  • Er kan iets leuks stoppen of weggaan. Dit wordt aangeduik met P- (negative Punishment, Nederlands negatieve correctie).

 

Positief en negatief

Positief betekent in deze situaties dus niet dat er iets leuks of fijns gebeurt! Het duidt er alleen maar op, dat er iets aan de situatie wordt toegevoegd. Op dezelfde manier betekent negatief hier dat er iets uit de situatie wordt weggehaald.

Het gaat dus om de wiskundige betekenissen van positief en negatief!

 

Waarom is het belangrijk om te weten?

In ieder geval is het nuttig als je weet waarom het gedrag van je hond verandert. Waarom doet hij iets ongewensts steeds vaker (blaffen naar de postbode)? Of waarom doet hij iets dat je graag wilt (hierkomen als je hem roept bijvoorbeeld), steeds minder vaak?

Beloning en straf kennen we allemaal (wat nog niet betekent dat we het correct toepassen). Maar dat het weghalen van iets leuks een correctie kan zijn, of dat het weghalen van iets akeligs belonend kan werken voor de hond... Het ligt niet meteen voor de hand om in deze termen te denken.

 

4 kwadranten: R+, R-, P+, P-

Dit alles levert samen de 4 kwadranten van het operant conditioneren op, zoals in de tabel hieronder weergegeven.

 

Gedrag neemt toe als het iets oplevert
= versterking of bekrachtiging, reinforcement

Gedrag neemt af als het averechts werkt
= straf of correctie, punishment

 

Als hond iets leuks overkomt
(gevoel = blijdschap, plezier)

  • hond gaat zitten, krijgt iets lekkers.
  • hond gooit vuilnisbak om, vindt lekkers.
  • hond piept, wordt uitgelaten.
  • hond gaat voor de televisie zitten, baas moppert (= aandacht).
  • hond gaat zitten, mag in het park los.
  • hond gaat af, wordt uitgebreid geknuffeld door baas.
  • hond komt, baas geeft lekkers en hond mag weer verder spelen met zijn maatjes.
  • hond laat speeltje los, baas geeft lekkers en speelt weer verder.

= positieve versterking, R+

Als hond iets onaangenaams overkomt
(gevoel = schrik, angst)

  • Hond gaat niet zitten, krijgt ruk van slipketting.
  • Vuilnisbak valt om, trekt bezem mee die op hond valt.

 

 

 

 

 

 

= positieve straf, P+

 
P
O
S
I
T
I
E
F

Als iets onaangenaams stopt of verdwijnt
(gevoel = opluchting)

  • Hond gaat zitten, baas laat strakke slipketting los.
  • Hond blaft, enge postbode loopt verder.
  • Hond gromt, kind stopt met in zijn ogen prikken.

 


 

 

 

= negatieve versterking, R-

Als iets leuks stopt of verdwijnt
(gevoel = teleurstelling)

  • Hond gaat niet zitten, baas eet kaasje zelf op.
  • Hond blijft niet zitten, baas zet eten weer weg.
  • Hond blijft niet zitten, baas hangt riem weer op in kast en gaat op bank zitten.
  • Hond blaft, baas draait zich om en verlaat kamer, doet deur dicht.
  • Hond bijt speels in hand of mouw baas, baas roept 'AU', draait zich om en loopt weg.
  • Hond komt, wordt onmiddellijk aangelijnd en mee naar huis genomen (= einde snuffelen, rennen en vrijheid).

= negatieve straf, P-

 

N
E
G
A
T
I
E
F


Binnen clickertraining wordt nagenoeg alleen gebruik gemaakt van R+ en incidenteel van P-.

 

Ervaringsleren bij trekken aan de lijn

Voor het wandelen aan de riem geeft www.doggiedrawings.net de volgende voorbeelden.

Ezelsbruggetje

Een heel andere manier om iemand het principe van R+, R-, P+ en P- uit te leggend? Nou zo:

R = van Reep chocola dus beloning
De P van Pats een klap voor je kop dus een correctie.
+ is optellen dus iets toevoegen
- is aftrekken dus iets weghalen

Deze is van Yvette van Veldhuizen
www.alerthondentraining.nl


In de artikelen Beloning en Straf: vele valkuilen wordt dieper ingegaan op het gebruik in de praktijk bij het opvoeden en trainen van honden.