mandag, august 29, 2011

Klikker og belønningsplassering

De siste årene har mange klikkertrenere blitt mer og mer fokusert på belønningsplassering. Noen bruker fortsatt klikkeren, men de er egentlig mer opptatt av at belønningen alltid serveres i riktig posisjon enn når selve klikket kommer. Andre velger å kutte ut klikker eller annen belønningsmarkør helt eller delvis, og serverer i stedet belønningen lynraskt i riktig posisjon. Flere velger også å heller bare bruke stemmen som markør (det er jo så slitsomt å håndtere både leker og klikker samtidig, spesielt når man skal holde leken klar i hånda til enhver tid slik at man kan servere den raskt i riktig posisjon...)

Da vi skrev første versjon av "Klikkertrening for din hund" før 11 år siden, skrev vi noe sånt som dette:

Det viktigste er å klikke presist. Hold belønningen skjult i lomma, og ta den opp først etter klikket. Det er ikke så viktig hva hunden gjør mellom klikket og til den får belønningen. Så lenge du klikker presist vil fortsatt riktig atferd bli forsterket.

Og gjett hva - vi mener fortsatt det samme! (utviklingen går visst ikke så fort her ute på landet :-)

Så når vi holder kurs nå til dags føler vi stadig oftere at vi må slå et slag for god, gammeldags klikkertrening. Ikke misforstå oss - belønningsplassering har absolutt sine fordeler. Men minst like ofte ser vi at det er ingenting som slår et skikkelig vel timet klikk, og mange klikkertrenere trenger å bli påminnet dette av og til.

En øvelse vi har jobbet mye med i kurssammenheng i år er bruksfremmadsendingen. Ettersom hunden her skal bevege seg i en rett linje vekk fra oss, ønsker mange trenere absolutt å servere belønningen mens hunden fortsatt har hodet framover, f.eks. ved å kaste godbit over hodet på hunden osv. For at hunden ikke skal snu seg når de klikker velger de ofte å kutte ut klikkeren og heller bare kaste godbiten over hodet på hunden for å få riktig timing.

Dette kan forsåvidt fungere greit, men vi har brukt mye av året på å fortelle folk at det er mye lettere å klikke presist enn å skaffe seg svart belte i presisjonskasting. Linn har blogget litt om dette tidligere i år.

Når vi f.eks. trener hunden til å gå opp på plattformen (en grunnferdighet som brukes av mange som trener bruksfremmadsendingen) kan man gjøre dette på (minst) to måter. Hvis man har fokus på belønningsplassering kan man kaste godbiten foran hunden idet den går opp på plattformen og fortsatt har hodet framover. Etterhvert vil hunden forvente at godbiten alltid kommer foran den, og vil som regel fortsette å bli stående i fartsretningen.

Hvis man i stedet kjører god, gammeldags klikkertrening og fokuserer på riktig timing av klikket vil man i stedet fokusere på å klikke når hunden har hodet (eller ihvertfall kroppen) i retning framover. Etter klikket vil hunden som regel snu seg mot fører for å få belønningen. Deretter må den selvstendig gå opp på plattformen og snu hodet framover igjen før klikket kommer (dette shapes selvfølgelig i flere trinn).

Etter vår erfaring tar ikke det ene lenger tid enn det andre. Men det er veldig stor forskjell på hvor godt atferden egentlig "sitter" på disse to hundene. Hvilken av hundene kan det best?
Hunden som kikker framover fordi den forventer at det skal komme en godbit flyvende i den retningen, eller en hund som uavhengig av hvor belønningen kommer fra likevel skjønner at den må peke hodet framover for at det skal komme et klikk?

Hvis man kun kjører godbitkasting er det egentlig ikke prinsippielt forskjellig fra å bruke lokking. Hunden "vet" egentlig ikke hvilken atferd som er kriteriet - den bare går etter godbiten.

Hunden som er shapet med klikket kan allerede utføre atferden uavhengig av belønningsplassering. Atferden er doggie-zen kvalitetssikret helt fra starten, og vi har nå en mye bedre generalisert atferd.

Bruk gjerne belønningsplassering i starten hvis det gjør innlæringen raskere. Men kom deg for Guds skyld videre fra dette snarest mulig. Vi anbefaler at man på de fleste atferder alltid varierer både belønningsform og belønningsplassering. Og kjør alltid Doggie-zen kvalitetssikring på atferden til slutt. Å variere belønningen på denne måten er en utmerket måte å generalisere atferden på som virkelig aksellererer flytnivået.




4 kommentarer:

Linda sa...

Dere skriver alltid at hvis man bruker godbit som lokkemiddel, så lærer hunden bare å følge godbiten. Er dette riktig? hunder som følger godbiter - hvor denne fades ut gradvis - lærer jo øvelsen like godt som en som klikkertrenes. Så hvorfor der det ene nødvendigvis så mye bedre enn det andre? Den lærer jo ikke bare å følge godbiten, den lærer jo også hva den må gjøre for å få den servert. Er det generaliseringen som er det avgjørende? Kunne gjerne tenkt meg å høre dine tanker om det. kjenner mange kjempedyktige tradisjonelle trener, som trener belønningsbasert - men med lokking. topp resultater. Så at det funker er det jo ingen tvil om. Kanskje det tar lenger tid? Som sagt så klikkertrener jeg selv, men skjønner ikke helt hvorfor denne lokkingen er så forferdelig - hvis man er flink å fade ut lokkingen fort.

Morten Egtvedt sa...

Hei Linda!

Det er helt riktig. Så lenge lokking fades ut 100% lærer sannsynligvis hunden atferden like godt. Problemet med slik belønningsplassering ofte brukes noen ganger er at man aldri slutter å kaste godbiten eller plassere den på en spesiell måte, og da har egentlig ikke hunden lært atferden stort bedre enn en hund som fortsatt blir lokket (rent innlæringsteknisk er det store likheter mellom stram belønningsplassering og lokking).

Så det jeg ville få fram i denne bloggen er bare at atferden blir bedre generalisert hvis man snarest mulig generaliserer belønningsplassering (inkl. Doggie-zen kvalitetssikring).

Siv sa...

Jeg er helt enig i at man bør sørge for at hunden kan utføre atferden så fort som mulig uansett hvor belønningen ligger eller kommer fra.
Men i de fleste tilfeller, og spesielt med hunder som mister lett fokus syns jeg at å belønne på en slik måte at det er lett å bare spise opp og utføre neste repetisjon med en gang funker mye bedre enn å bare være knakende god på timingen.
Som feks å kaste over hodet på hunden under fremforgående, belønne mens hunden ligger nede når man trener ligg og bli.
Stikkordet her er vel som i all annen trening, kom deg videre.

Morten Egtvedt sa...

Selv om man har fokus på å markere atferden presist med klikkeren (framfor å belønne raskt i en spesiell posisjon), bør man fortsatt avslutte belønningen slik at hunden er i en egnet posisjon til å starte neste repetisjon (som jeg stort sett gjør i filmen).

I "Lydighetstrening i teori og praksis" nevner vi 4 forskjellige typer belønningsplassering:

1. Holde posisjonen etter klikket (dobbeltforsterkning)

2. Belønn slik at hunden er i rett posisjon til neste repetisjon

3. Retningsforventning

4. Belønn slik at det er lettere å sette på neste ledd i kjeden

(ofte belønner man på en måte som er to punkter på en gang).

Det er først og fremst slavisk bruk av retningsforventninsbelønning (og til en viss grad holde posisjonen-belønning) som ofte kommer i konflikt med å ha fokus på å markere ønsket atferd med klikkeren.

Det prinsippielt viktige spørsmålet er: Markerer du atferden med klikkeren eller med levering av belønningen din? Jeg anbefaler helt klart å gjøre mest mulig av det første hvis man skal klikkertrene effektivt. Jeg vil ha en hund som virkelig lytter og henter informasjon fra klikket.