fredag, juni 06, 2008

Hvordan lære inn signaler?

Kathy Sdao har bodd hos oss noen dager mellom seminarene i Oslo og Stockholm. Foruten at hun har fått være med å se på feltsøk og runderingstrening, har hun også fått prøve å gå spor. Pensjonisten Ergo ble overlykkelig når han endelig fikk spore igjen, og brydde seg ikke om at han fikk ny hundefører for anledningen. Kathy er heldigvis overraskende sterk i forhold til størrelsen, så hun greide å håndtere sporline & gal flatcoat riktig så bra, selv om hun ikke er vant til å ta seg fram i trøndersk skogsterreng :-). Det var også moro å se at liggmarkeringen til Ergo var like stødig med en fremmed hundefører selv om han ikke har trent spor på nesten et år (jmf. tidligere poster om flyt).

I løpet av uka hadde jeg noen interessante diskusjoner med Kathy om stimuluskontroll, og hvordan vi introduserer signalet. Omtrent samme diskusjon har gått i Fanny sin blogg tidligere. Hvis du ikke er tilnærmet atferdsnerd trenger du ikke å lese videre, for resten er sannsynligvis kun aktuelt for spesielt interesserte...

Når & hvordan skal man introdusere signalet?
Det Kathy og jeg helt konkret diskuterte var når/hvordan vi legger til signalet på den frivillige adferden. Begge vil selvfølgelig først ha en flytende adferd frivillig før vi begynner å tenke på signalet. Men deretter gjør vi det litt forskjellig. Kathy begynner da å gi signalet like før hun ser at hunden skal til å tilby adferden frivillig. Jeg foretrekker ofte å gi signalet først når hunden allerede har startet å utføre adferden frivillig (jeg kan f.eks. rope på hunden når den har kommet halveis inn mot meg, eller til og med like før den er helt inne hos meg og får belønningen). Dette gjør jeg gjerne en god stund før jeg begynner å flytte signalet gradvis lenger fram i tid til jeg også gir signalet før den frivillige adferden er påbegynt. Det er kanskje verd å huske at på "korte" adferder som sitt og ligg er denne forskjellen ganske minimal i praksis. De øvrige stegene i stimuluskontrolltreningen kjører vi rimelig likt, med unntak av at jeg også (på mange adferder - ikke nødvendigvis alle) veksler tilbake til å klikke for frivillig adferd selv etter at jeg har etablert stimuluskontroll på adferden - dette er et ukjent konsept i USA.

Begge framgangsmåter fungerer utmerket, det var vi begge helt enige om (forståelig nok, ettersom de er nesten identiske). Spørsmålet er imidlertid om det ekstra trinnet jeg legger inn med å gi signalet når adferden allerede er påbegynt er bortkastet, eller kanskje til og med forsinker treningen - eller om det tvert imot har sine fordeler.

Og dette hadde vi en veldig interessant diskusjon om. Vi avsluttet diskusjonen med å være enige om at vi ikke vet hva som er best. Vi har bare våre personlige preferanser ettersom vi begge har gjort det på akkurat denne måten i mange år, og derfor "føles" vår egen måte mest riktig (den har jo fungert for oss så mange ganger). Vi var derfor enige om at vi må diskutere saken med Jesús Rosales-Ruiz snarest slik at han kan sette opp et vitenskaplig forsøk og gi oss "fasiten" :-)

Signalinnlæring: Klassisk og/eller operant læring?
I tidligere diskusjoner har jeg blitt møtt med argumentet om at det er bortkastet å gi kommandoen når adferden er påbegynt ettersom klassisk betinging forutsetter at betinget stimulus blir presentert FØR ubetinget stimulus. Men dette argumentet er enkelt å tilbakevise (noe Kathy også var helt enig i). Klassisk betinging skjer kun mellom to (eller flere) stimuli - ikke mellom stimuli (signal) og adferd. Etableringen av relasjonen signal - adferd er først og fremst en operant læringsprosess der signalet etableres som en diskriminativ stimulus for adferden.

Men det er ikke dermed sagt at klassisk betinging er uinteressant i forbindelse med signalinnlæring (jeg vet ikke nøyaktig hvordan reflekser og operante adferder påvirker hverandre i denne sammenhengen, men jobber med å finne ut mer om det). Men i så fall er det snakk om klassisk betinging mellom signalet (betinget stimulus) og forsterkeren (ubetinget stimulus). Signalet vil etterhvert utløse et utvalg reflekser som f.eks. sikling, økt arousal, muligens orienteringsrefleksen, og andre emosjoner (f.eks. glede). Og denne betingingen skjer i like høy grad når vi gir signalet halveis inn i (den frivillige) adferden (ja, ofte faktisk bedre, ettersom det blir kortere tidsrom mellom signal og forsterker).

Kathys bekymring gikk først og fremst på at signalet ikke gir hunden noe ”informasjon” når det først kommer når adferden er påbegynt. Det kan være et poeng. Jeg er i hvert fall enig i at det ikke er nok informasjon – før eller siden må man nødvendigvis flytte signalet lenger fram i tid. Men hva er egentlig ”informasjon” helt konkret? Mangel på informasjon er ikke noe vitenskaplig argument. Trenger dyret ”informasjon”? Er ikke det eneste spørsmålet som bør være av interesse hvilke operante adferder som blir forsterket, og hvilke reflekser som blir betinget? Dette fant vi ikke noe godt svar på (og ble enige om at vi måtte spørre Jesús om det også :-).

Mine argumenter
1. Den viktigste grunnen til at jeg i alle år har valgt å starte med å legge til signalet når hunden allerede har påbegynt adferden er at du får mindre feil. Når du først gir signalet når adferden er i gang er du sikrere på at hunden vil utføre adferden korrekt etter signalet. Hvis du skal gi signalet FØR adferden tar du en litt større sjanse, og spesielt uerfarne trenere vil oftere gi signalet uten at hunden faktisk utfører adferden etterpå.

2. Det er også min erfaring at den betingingen som skjer i perioden mens du gir signalet samtidig som hunden utfører adferden frivillig gjør jobben vår lettere når vi flytter signalet fram i tid til før adferden. Da er betingingen allerede sterk, og det gjør det mer effektivt å forsterke at hunden venter på signalet – med å gi signalet!

3. Man kan gjerne begynne med å legge til signalet samtidig som adferden utføres (frivillig) før atferden er fullstendig flytende og perfeksjonert - man taper derfor ikke nødvendigvis noe tid på dette ekstra steget. Jeg kan gjerne begynne å kommandere "ligg" selv om adferden bare er ca. 80% så bra som jeg vil ha den. Hvis jeg skulle gitt signalet FØR hunden skulle til å legge seg måtte jeg ventet til jeg hadde hatt en noe bedre adferd (90%??) for å unngå for mange mislykkede repetisjoner. Mislykkede repetisjoner med signal er ikke bra hvis vi forutsetter at klassisk betinging mellom signal og forsterker også er en viktig del av signalinnlæringen. Operante atferder kan gjerne settes på variabel forsterkning, men for mest mulig effektiv klassisk betinging bør det ideelt sett være et 1-til-1 forhold mellom betinget og ubetinget stimulus. Det er derfor jeg alltid maser om å holde signalene "hellige" (og selvfølgelig alltid forsterke etter klikk).

4. Når man gir signalet når atferden allerede er påbegynt beholder man også den frivillige adferden lenger (dette er ikke nødvendigvis "bra" for selve signalinnlæringen, men erfaringsmessig er det ofte bra for atferden - og på sikt vil derfor også signalet som regel bli bedre (dette gjelder spesielt for trenere som ikke er så nøye med å vedlikeholde den frivillige adferden etter at stimuluskontroll er etablert).

"Betydningen" av signalet
Å vente på signalet + utføre adferden på signalet er bare første del av stimuluskontrolltreningen. På mange adferder bør man også lære hunden å ikke utføre adferden på andre signal - den må lære å diskriminere mellom forskjellige stimuli slik at adferden kun utføres når man gir det riktige signalet. Vi kan kalle dette "betydningen" av signalet. Hunden må lære å høre HVA vi sier, ikke bare AT vi sier et signal.

I praksis innebærer dette at hunden må kunne overse "tullekommandoer", signal fra dommer/kommandant, og den må kunne skille mellom og utføre flere forskjellige adferder på signal fra fører i samme treningsøkt. Denne delen av stimuluskontrolltreningen utføres rimelig likt hos de fleste klikkertrenere jeg kjenner. Det som varierer er vel heller hvor flinke trenerne er til å jobbe med dette siste trinnet i stimuluskontrolltreningen... ☺

Tja, hva tror du? Hva er den mest effektive måten å legge inn signalet...? Kommentarer mottas med takk, for jeg vet ikke...

Det jeg kan fastslå rimelig sikkert er imidlertid to ting. For å få et pålitelig og sikkert signal bør du 1) først ha en solid og flytende frivillig adferd, og 2) du må bruke nok tid på stimuluskontrolltreningen. Det siste har sannsynligvis større praktisk betydning for resultatet enn de små detaljene jeg har skrevet om ovenfor. :-)

3 kommentarer:

Famos sa...

Håller absolut med Dig på alla punkter!
Risken är ju, precis som Du säger, att få fel eller ingen respons om vi lägger signalen innan utförandet börjar. Vi vanliga, dödliga klickertränare, har ju dessutom lite bråttom att lägga på kommandot. Kanske t.o.m. på 70% lyckande!

Lene Kristin sa...

Interessant innlegg! Tror definitivt at nybegynnere har best av å legge på kommando mens hunden gjør det i starten. Om det er mest effektivt å legge kommando på før, ellers mens atferden pågår, vet jeg ikke, men av erfaring holder jeg en knapp på å i starten gi kommando samtidig. Allikevel vil det vel være stor forskjell på en godt klikkertrent hund og en fersk hund. Den godt trente vil lettere skjønne sammenhengen mellom signal og atferd, og trenger ikke mange repetisjoner, da vil det kanskje være mest effektivt å legge kommandoen på før med en gang?

Dina sa...

Hm. Ja i udgangspunktet er der vel som du selv siger ikke den helt store forskel på de korte adfærd som stå, sit og dæk. Men jeg er vældig enig med dig (og andre her!)at der er en stor risiko for at få fejl ind - især på adfærd som indkald og andre "længerevarende" adfærd. Jeg vil her nævne et eksempel hvor jeg definitivt ikke ville spille russisk rulette med at give kommandoen uden dit første step.
Det drejer sig om slip af ærme i gruppe C (IPO).
Ganske vist trænes kommandoen slip i andre sammenhænge inden (på bold, apport etc.) Men det er definitivt en anden situation med ærmet som derfor trænes grundig som enhver anden adfærd.
Hunden må lære at give slip på passivitet først.At figuranten bliver passiv er vel både et miljøsignal til at slippe /og en slags svækkelse af forstærkning (manglende kampleg). Imidlertid kan nogle hunde stadig opleve ærmet i munden ( selvom det er passivt) som forstærkning. De ressourceforsvarende modeller som min egen Loke især. Det problematiske i at give "slip-kommandoen" her lige når jeg tror hunden vil slippe, giver næsten sig selv. Hvis hunden alligevel ikke slipper, vil den blive forstærket i den stik modsatte adfærd : at holde fast. Ikke særlig smart. Jeg vælger derfor hele tiden at sige kommandoen når jeg kan se hunden er i færd med at spytte ud (på passivitet). Og det bliver jeg ved med i lang tid. jeg har af og til afprøvet om slippet "virker" når hunden f.eks. har vundet ærmet (ingen "mand" i mere) og det gør det. Men jeg har en enkelt gang også prøvet at det ikke gør.
Når jeg ser på Trojas slip til malle-VM kan man se en hund der trods figurantens passivitet - netop formår at forstærke sig selv i et sekund eller to efter hver kommando og for min hund ville det være den rene glidebane. Så nej jeg følger den gode gamle Canis-way. Jeg tør ikke andet.