fredag, september 25, 2009

(U)strategisk levering av forsterker

Når jeg sliter litt med en øvelse med Kira er det en ting som alltid hjelper: Jeg gir tispeskinnet til Cecilie og ber henne lære det inn i stedet. Funker hver gang :-)

Dette var tilfelle med krypøvelsen vår i forrige uke. Etter at det har gått bra framover med Kira på denne øvelsen en stund, var det plutselig ground zero, uten at jeg helt så hvorfor. Bikkja bare reiste seg i et sett... Så i stedet for å fortsette å rive meg i det tynne håret jeg har, ga jeg godbiter og klikker til Cecilie som straks tok utfordringen. På noen få økter har hun nå kommet veldig godt igang med å shape fram en kryp med en og en bakfot (ikke enkelt for Kira som har altfor lange bein og rygg som en dachs).

Cecilie er på mange måter en mye mer "old style klikkertrener" enn meg. Hun klikkertrener i grove trekk akkurat som vi gjorde for 10 år siden. Hun bruker ikke masse energi på belønningsplassering, kvalitetssikring og annet "jåleri". Joda, hun bruker disse teknikkene også rett som det er, men hovedfokus er helt klart på TKFF og ferdig med det. Og i motsetning til meg får hun til absolutt alle bikkjer hun tar i...

Jeg fikk meg ihvertfall en liten aha-opplevelse når jeg så hvordan hun trente når hun overtok Kira. Selv har jeg kjørt veldig gjennomført strategisk belønningsplassering når jeg trente kryp. Godbiten serveres alltid oppover og litt bak (mens hun ligger) for å "presse" bakparten hennes ned, eller på bakken mellom frambeina (mens hun fortsatt ligger) når jeg trenger mer framdrift i atferden. Men likevel fikk jeg etterhvert store problemer med at hun reiste seg hele tiden (spesielt når det var vått på bakken).

Når Cecilie tok over Kira startet hun i stedet med (tilsynelatende) helt totalt usystematisk belønningsplassering. Hun klikket for frivillig ligg, og kastet så godbiten ganske skjødesløst slik at Kira riktignok kunne tatt den hvis hun fortsatt ble liggende, men i starten valgte hun å reise seg for å ta dem i ca. 75% av repetisjonene. De gangene hun valgte å bli liggende å spise belønningen fikk hun ofte et ekstra klikk for dette. Cecilie fortsatte å maskingeværklikke ligg/bli liggende til Kira var som limt til bakken, og man nærmest kunne se at hun tenkte "ånei" hver gang hun måtte reise seg for å få tak i godbiten ("så slitsomt - jeg skal jo snart bare legge meg igjen uansett!").

Deretter økte Cecilie kriteriet til "flytt to forlabber". Så snart det var rimelig bra flyt på framlabbsflyttingen, flyttet hun fokus til baklabbene, og klikket for å flytte en og en baklabb (i stedet for å "hoppe" med to framlabber samtidig). Hun kjørte fortsatt samme "skjødesløse" belønningsplassering, og lot ikke til å bekymre seg for at Kira reiste seg opp for å spise godbitene rett som det var. Kira fikk innimellom et ekstra klikk for å legge seg ned igjen eller for å bli liggende, men stort sett måtte hun både legge seg og flytte to bakføtter for å tjene det neste klikket. Og jo lenger ut i økta de kom, jo sjeldnere og sjeldnere reiste Kira seg - akkurat motsatt av slik mine egne siste treningsøkter hadde forløpt. Når jeg trente med slavisk belønningsplassering i liggende posisjon, lå hun gjerne bra i starten av økta, men reiste seg opp oftere og oftere jo lenger ut i økta vi kom.

Så kommer 1000-kroners spørsmålet: Hvorfor ga "ustrategisk" belønningsplassering så mye bedre resultater i akkurat dette tilfellet?

Jeg klikket for riktig atferd og leverte i tillegg belønningen i liggende posisjon. Cecilie klikket for riktig atferd, men lot ofte hunden reise seg for å ta belønningen. Og likevel er Kira limt til bakken i slutten av Cecilie sine økter, mens hun altfor ofte reiser seg i slutten av øktene når jeg trener.

Min hypotese er at Cecilie sin framgangsmåte i tillegg til å forsterke kryp/bli liggende også ekstingverer å reise seg. Kira erfarer flere ganger at når hun reiser seg koster det mer energi å tjene neste klikk ettersom hun må bruke kreftene på å legge seg ned igjen for å kunne tilby neste kryp-bevegelse. Elementær atferdsøkonomi tilsier derfor at hun etterhvert vil reise seg sjeldnere og sjeldnere (og dette stemmer tydeligvis også i praksis!). Jeg på min side forsterket også å bli liggende, men å reise seg ble ikke ekstingvert på samme måte. Tvert imot er det meget mulig at å reise seg ble (negativt) forsterket ettersom det er slitsomt å ligge & krype lenge om gangen med den lange kroppen hennes, og å reise seg blir en kjærkommen pause. I Cecilie sitt tilfelle blir å reise seg ingen kjærkommen pause, men heller bortkastet tid og energi.

Det kan virke motstridende at Cecilie faktisk ekstingverer å reise seg, ettersom Kira jo faktisk mange ganger reiser seg og spiser godbiten. Man skulle kanskje tro at å reise seg i stedet ville blitt forsterket. Men det viser seg jo tydelig at å reise seg slett ikke blir forsterket i praksis. Hvorfor?

Cecilie hadde selvfølgelig svaret på det også: Hunden lærer mer av klikket enn av godbiten. Det er selve klikket (for å bli liggende eller krype) som gir "ryggmargsinformasjonen". Når hunden reiser seg for å spise godbiten er den så fokusert på å følge etter godbiten at atferden (å reise seg) ikke blir forsterket i særlig grad. Det blir omtrent samme fenomen som med lokking. Ved lokking er hunder som regel så fokuserte på å følge etter godbiten at de ikke "registrerer" hvilken atferd de utfører akkurat da. Klikkene de får når de tilbyr en atferd frivillig går imidlertid "rett i ryggmargen".

En annen måte å se dette på er at når jeg trente kryp med Kira, var det jeg selv som tok ansvaret for at hun skulle bli liggende ved å servere godbiten i posisjon. Ved å belønne konsekvent på denne måten fratok jeg Kira ansvaret for å bli liggende på egen hånd - hun bare ble stort sett liggende likevel fordi godbitene tilfeldigvis ble servert der nede. Når Cecilie trener er det derimot Kira som selv må ta det fulle og hele ansvar for å bli liggende. Cecilie hjelper henne ikke i det hele tatt - hun gjør det tvert imot vanskeligere for henne å bli liggende ved å kaste godbitene "ustrategisk", men er desto mer nøye med å gi Kira informasjon (klikk!) om hva som er riktig atferd.

Dette innlegget må ikke tolkes dithen at strategisk belønningsplassering er unødvendig. Det mener verken Cecilie eller jeg. I svært mange øvelser er det svært nyttig å plassere belønningen på en spesiell måte, spesielt tidlig i innlæringen. I Lydighetstrening i teori og praksis argumenterer vi imidlertid for at man før eller siden bør komme bort fra konsekvent belønningsplassering og i stedet kvalitetssikre atferdene slik at hunden kan utføre atferden riktig uavhengig av hvor belønningen kommer fra.

Det hører også med til historien at etterhvert som Kira ble mer og mer limt til bakken, begynte Cecilie også å belønne mer stragetisk i liggende posisjon, f.eks. for å få bakparten til Kira lavere osv. Men dette begynte hun med først ETTER at Kira selv hadde begynt å ta ansvaret for å bli liggende.

De siste årene har mange klikkertrenere blitt mer og mer opptatt av belønningsplassering, og ofte mindre og mindre opptatt av klikkeren. Kanskje kan det være en god idé for flere enn meg å gå litt mer back to basic, av og til. Klikkertrening er jo egentlig veldig enkelt...

8 kommentarer:

Lone sa...

Fin påminnelse!

Catja sa...

Meget interessant at læse at 2 forskellige vinkler på samme træning, giver så tydelig forskel i resultatet :-)
Tænk at være så heldig at kunne give klikker og godbidder videre til en anden når man kører for meget fast :-) Der har du heldet med dig c",)

Kari Anne sa...

Jeg tror også det er viktig å gå tilbake til basics innimellom. Hundene ser ut til å trives vel så godt med å få informasjon og påvirkning kun gjennom klikket, og tar bedre og mer fornuftige avgjørelser når de kan få direkte tilbakemelding via det.

Belønningsplassering syns jeg har noe for seg i enkelte øvelser, mens i andre skaper det bare MER å tenke på for både hund og eier.
Jeg syns dessuten det er en HJELP man skal ta bort etter veldig få repetisjoner, og la hunden tenke selv i større grad.

Jenny sa...

Väldigt intressant inlägg som gav mig en hel del att fundera över. Tillhör helt klart den typ av tränare som arbetar med belöningsplacering och ofta lägger bort klickern. Men du har så rätt, återigen tar jag ansvar för träningen...vilket är precis det motsatta till det jag strävar efter ;0)

HÅKON GROVEN sa...

En god, men farlig bloggpost!

Min erfaring er at mange (både klikkertrenere og andre) har veldig mye å gå på når det gjelder god belønningsplassering.

I det tilfellet du beskriver er det Cecilie og ikke du som har best belønningsplassering :)

Det er ikke alltid lett å vurdere hva som er god timing/plassering, men resultatene (hva vi forsterker) taler som regel for seg :)

Morten Egtvedt sa...

Enig i at mange klikkertrenere har mye å gå på når det gjelder belønningsplassering. Men det finnes også mange som overdriver, og dermed produserer hunder som egentlig ikke henter noe særlig informasjon fra klikket lenger. Tenkte det var greit å balansere litt :-)

Frode@Zorro sa...

Jeg betrakter belønningsplassering som en nesten "glidende overgang" til lokking og det kan vel bli en unødvendig hjelpebetingelse som må tas bort hvis det overdrives? Men når en tenker på ferdig øvelse, vil en uansett komme til mål selv med lokking.

Forøvrig er jeg fersk i klikkertrening og stoler nesten "blindt" på informasjon jeg gir hunden gjennom klikker`n:) Mulig jeg bør legge bøkene og artiklene på hylla for unngå å tenke for avansert og bli for belønningsplasserings-fokusert:)))

Anniken sa...

Oi. Her fikk jeg mange fine tips :)

Men hva gjorde Cecilie for å ha kontroll på bakbeina til hunden når hun skulle ha dem til å flytte seg? Sto hun bak hunden??