onsdag, mars 17, 2010

Lærer hunden mest av å gjøre rett eller feil?

Jeg leste nettopp en blogg som diskuterer om hunder lærer best av å gjøre feil eller å gjøre rett. Dette er et tema som jeg også er veldig opptatt av. Mine kommentarer til nevnte blogg kan leses nedenfor.


Mitt syn er at hunders atferd kan forandres (= læring) av positiv forsterkning, negativ forsterkning, positiv straff, negativ straff og ekstinksjon. Enkelt og greit.

Begrep som "lykkes/mislykkes" og "kontrast mellom rett og feil" blir fort upresise. Når man diskuterer læring med slike "dagligdagse" begrep blir det naturlig nok veldig mange forskjellige meninger, ettersom folk kan legge mye forskjellig i begrepene. I tillegg diskuterer man da på et nivå der man bare gjetter seg til hva som foregår inne i hodet på hunden. Noe av det jeg liker med klikkertrening er at man har et presist begrepsapparat i bunn, så det burde være unødvendig å blande inn ord som bygger på tolkninger og ikke direkte observasjoner (så lenge det ikke gjøres bevisst for å forklare ting enklere for en spesiell målgruppe).

Det må selvfølgelig være en "kontrast mellom rett og feil" under trening for at hunden skal lære. Men det mener jeg at det må være en viss forutsigbarhet i at bestemte atferder blir forsterket, mens andre atferder ikke blir forsterket. Men dette betyr IKKE at man nødvendigvis må legge opp treningen med veldig høy feilprosent. Selv om man trener med 80-95% suksess (noe høyere enn dette er vanskelig for de fleste) vil det fortsatt være en "kontrast" mellom at forsterkningen ikke er tilstede (mens hunden fortsatt jobber/prøver) og at forsterkeren faktisk er tilstede (etter klikket). At hunden gjør mange "feil" er dermed slett ikke noen forutsetning for læring. Feilfri læring er også demonstrert ved tildels avanserte diskriminasjonsoppgaver.


Noen hunder blir mer intense når belønning uteblir, eller når vi avbryter dem når de gjør en feil. Andre hunder "Klapper sammen" og gir opp veldig fort. Når det gjelder hundens attityd til feil tror jeg det påvirkes av følgende faktorer:

* Forsterkningsfrekvens (hvilken suksess-prosent hunden tidligere er trent med - min hypotese er at hvis du ligger på 80-95% suksess vil hunden tåle feil bedre enn om du generelt ligger lavere).

* Forsterkningskvalitet (hvor "glad" hunden er i belønningen - har man en bra forsterker tåler hunden tildels mye lavere forsterkningsfrekvens før den gir opp. Det er i høy grad denne effekten som gir det vi tolker som "bra attityd ved feil")

* Medfødte egenskaper ("bra brukshunder" tåler generelt mer trening med lite belønning enn "vanlige hunder" før de gir opp)

* Hvordan treneren oppfører seg når hunden gjør feil (hvis trener er "nøytral" vil hunden tåle feil bedre enn om fører (ubevisst) oppfører seg på en måte som hunden finner aversiv. Tidligere læringshistorie vil selvfølgelig påvirke hvordan hunden oppfatter slike situasjoner - crossoverhunder takler generelt feil veldig dårlig...)

Godt trente hunder (og også hunder som er "bra" fra naturens side) vil ofte bli mer intense når belønning uteblir (både i forbindelse med feil, og når man bevisst "strekker" varigheten på en atferd). Jeg tror imidlertid at mange overvurderer "verdien av selve feilen" og forveksler dette med en ekstinksjonsburst (en midlertidig økt intensitet når belønning uteblir). Det blir imidlertid bakvendt å påstå at det er selve feilen som skaper (den ofte ønskede) ekstinksjonsbursten. Det er de mange hundre eller tusen tidligere forsterkningene som gjør at det faktisk blir en ekstinksjonsburst når belønningen uteblir. Jeg tror at hunder som ser ut til å takle endel feil med bra attityd selv om de blir trent på godt under 80% suksess, ville taklet feil enda bedre med høyere suksessrate i treningen. Jeg har ihvertfall sett mange flere eksempler på hunder som trenes med lav suksessprosent, og som "klapper sammen" når de gjør feil...

Mitt helt klare råd til alle som ønsker å basere treningen sin på positiv forsterkning er derfor å fokusere på å legge opp treningen slik at hunden gjør riktig mest mulig av tiden. Med det samme man begynner å fokusere på "verdien av feil", har man fått helt feil fokus i treningen (ihvertfall hvis man ønsker å klikkertrene effektivt). Fokus bør ligge på å

* Lære inn nye atferder med så høy suksessprosent som mulig.

* Deretter bør man bygge så høy grad av flyt som mulig.

* Deretter bør man overtrene/kvalitetssikre atferden (og evt signalet) så bra som mulig (fortsatt med høy suksessprosent).

Dette er en helt safe oppskrift som fungerer på alle hunder og alle andre dyr. Å ligge langt under 80% suksess kan fungere på NOEN hunder (ihvertfall på noen atferder) hvis treneren forøvrig er dyktig, men hvis du f.eks. skulle trene en elefant eller spekkhogger etter samme prinsipper er du med høy sannsynlighet død etter noen få treningsøkter. Man kødder ikke med ekstinksjonsburster...

Les mer i Lydighetstrening i teori og praksis

7 kommentarer:

Nina sa...

Nå står det vel ingen steder i den blogg du sikter til at man skal legge opp treningen med veldig høy feilprosent.

Anna Larsson sa...

Jag hade velat se mer respons på övriga tankegångar (tex den om att "Till exempel är det chansen att uppnå belöning som skapar den största dopminkicken, inte belöningen i sig. Om det inte är en helt oväntad belöning i en ny situation, för då producerar hjärnan dopamin som aldrig förr.") än just antal rätt/fel (jag tolkade inte heller texten som att man ska ha en hög felprocent).

Morten Egtvedt sa...

Nina: Nei, men det fokuseres på "verdien av feil", mens jeg foretrekker å framheve "verdien av rett". :-)

Morten Egtvedt sa...

Anna: Om det er forsterkeren eller "forventningen om forsterkeren" som skaper det største dopamin-kicket har jeg ingen forutsetninger for å mene noe om. I praksis vil det imidlertid ikke forandre så mye - hvis man vil skape "forventning" må man jo uansett forsterke mye.

Om uventede forsterkninger er mer effektive enn forventede, er et interessant spørsmål som kan ha praktiske implikasjoner (f.eks. om hvorvidt man bør basere seg på å baklengskjede mest mulig, eller heller kjøre mange overraskende belønninger midt inne i øvelsene). Jeg har heller ingen forutsetninger for å mene noe som helst om at uventede belønninger er mer eller mindre effektive. Men hvis jeg skal gjette vil en eventuell ekstra "overraskelses-effekt" være såpass marginal, at man enkelt kan kompensere for denne ved å f.eks. kjøre høy forsterkningskvalitet i slutten av lengre kjeder. Og HVIS det "å forvente belønningen" nå skulle vise seg å gi store dopaminkick, vil vel det gjengjeld tale FOR å baklengskjede mye (uten at jeg kommer til å bruke det argumentet i framtiden)

Interessant tema...

Nina sa...

Hei Morten.
Selv mener jeg de to (verdien av rett- og feil) ikke utelukker hverandre på noen måte.
Men selvfølgelig skal fokuset i all hovedsak ligge på det å forsterke.. noe jeg VET MED ALL SIKKERHET også ligger til grunn for de som velger å benytte seg feilsignal som en del av treningen.

anna sa...

Det var i de formerna jag funderade, överraskning kontra förväntan, men särkert svårt att utvärdera effekten av, pluss att det ju bara skulle vara en parameter att ta hänsyn till vid frågeställningen kedjning eller icke kedjning. Men spännande!

Såg att du har de gamla länkarna på mina blogg, nu har jag bara denna adress som jag använder: http://www.3vallare.se/blogg.html

Mvh
Anna

Kari Anne sa...

"Jeg har ihvertfall sett mange flere eksempler på hunder som trenes med lav suksessprosent, og som "klapper sammen" når de gjør feil..."

Og der gikk det opp for meg hvorfor uteblitt belønning ikke får alle hunder til å prøve om igjen. Enda en ting å innprente hos kursdeltakere!