Výcvik
psů pomocí klikru
(The
Clicker Training)
Tento materiál vznikl jako doplněk k semináři o metodách pozitivní motivace a používání
klikru při výcviku psů klubu Border Collie Club Czech Republic (BCCCZ) a má
tedy spíše charakter poznámek pro další diskusi a praktické ukázky než
souvislého článku. Byl vytvořen na základě zahraničních pramenů, zejména knihy
Karen Pryor Don’t Shoot The Dog a její brožury A Dog & A Dolphin.
Při studiu metod pozitivní motivace a klikru z dalších zdrojů (např.
Internetu, kde je o klikru spousta článků a několik konferencí) buďte velmi
opatrní. Karen Pryor ví o čem mluví. Léta profesionálně cvičí zvířata a byla
mimo jiné i hlavním trenérem delfinária na Hawaii. Krom toho má doktorát
z psychologie zvířat a několik vědeckých prací a prestižních vědeckých cen
svědčí o jejích kvalitách. Mohu vám zejména doporučit její webové stránky na
adrese www.clickertraining.com/home/.
Klikr však prožívá zhruba od roku 1995 celosvětově nesmírnou konjunkturu a
samozřejmě se této metody „ujalo“ mnoho lidí, kteří vidí, že je to módní a
žádané. Většinou se po čase snaží celý systém „vylepšit“. Jedná se převážně o
profesionální cvičitele psů, kteří si myslí, že jen oni znají práci se psy
dobře a snaží nějak „napasovat“ klikr, a s ním spojenou metodu pozitivní
motivace, na jejich předchozí zaběhnutý systém. Jsou velmi nebezpeční svou
hloupostí a z ní pramenící suverenitou s jakou pronášejí své
definitivní soudy. Často například staví na hlavu celou posloupnost výuky,
která však není samoúčelná, ale je podložena celoživotní prací mnoha odborníků,
počínaje Konradem Lorenzem (Nobelova cena za práce stující chování psů). Oni to
ale přeci vždy dělali jinak a jaké měli výsledky! S takovými lidmi nemá
smysl polemizovat. Diskuse s nimi je bezpředmětná, stejně jako jejich
vlastní inovativní „přínos“ do celé teorie. Velmi dobře si pamatuji, na jaké
nepochopení jsem narážel u kynologů, když jsem v druhé polovině
devadesátých let dostal klikr do České republiky. Dodnes mám schovaný mail od
Karen Pryor, která mi oznamovala, že jsem první z České republiky, kterému
ho posílají a byla zvědavá, jak jsem na metodu pozitivní motivace narazil.
Psala také, že většinou po první objednávce z dosud „klikrem nepostižené“
země obvykle do několika měsíců následuje salva dalších objednávek. To ovšem
neznala českého kynologa, který si přece nenechá někým radit! Klikr k nám
musel přijít až o pět let později přes sousední Německo a to ve značně
modifikované podobě.
Velkou zásluhu na rozšíření práce s pozitivní motivací a klikrem má
zejména britská kynoložka Mary Ray, která ho začala používat nejprve pro výcvik
Obedience a následně pak pro Hellwork to music. Vydala o klikru několik
brožur a také její videokazety věnované Heelwork to music obsahují velmi
podrobný praktický návod na práci s klikrem.
Pomocí klikru jde cvičit i velmi mladá štěňata. Uvádí se příklad anglického
chovatele, který klikal štěňátkům ve chvíli, kdy jim fena při kojení pustila
mléko. Pomocí dalšího nenápadného výcviku dosáhl toho, že štěňata při předávání
novým majitelům znala přivolání, povely sedni a lehni a měla bezproblémově
zvládnuté venčení.
Na základě dlouhodobých pozorování (delfíni a kosatky minimálně 30 let, psi
déle než 15 let) se ukazuje, že výcvik pomocí pozitivní motivace vede obecně
k tomu, že se libovolné takto cvičené zvíře stává hravým, rozvíjí se jeho
intelekt, je zvídavé a projevuje o svého cvičitele mimořádný zájem, vedoucí
k vytvoření velmi silného pouta.
Jedním z hlavních efektů pozitivní motivace je to, že naučené cviky
jsou velmi dobře zakotveny v paměti zvířete a téměř nevyžadují pravidelné
opakování, tak jak je běžně nutné při klasickém výcviku pomocí korekce
(eufemismus pro trestání) chování.
Jakmile jednou zvíře pochopí zásady výcviku pomocí pozitivní motivace, učí
se velmi rychle a toto tempo se s dalším výcvikem zrychluje.
Zvíře se učí rádo a na výcvik se přímo těší. Je pro něj zároveň zábavou i
odměnou. Naprostá absence trestů je jednou z příčin této pozitivní vazby.
V běžném životě je třeba zvíře občas potrestat nebo korigovat silou
jeho jednání, zejména když je třeba jednat rychle (kradení se stolu, vběhnutí
do vozovky, ...). Klikr trénink však
naprosto odmítá trestání jako nástroj výcviku.
Zásadní nevýhodou výcviku pomocí pozitivní motivace je to, že cvičitel musí přemýšlet (a někdy i hodně dopředu), což, jak známo, některé lidi přímo bolí. Z nich se pak rekrutují zavilí odpůrci nebo inovativní modifikovatelé výcviku pomocí klikru.
Patnáct pravidel pro úspěšné
zahájení výcviku pomocí klikru
Nezačínejte tím,
že se budete snažit odnaučit psa nějakému nežádoucímu chování. Začněte
s něčím pozitivním a zábavným. Připravte se na každý výcvik. Napište si do
zápisníku, co chcete psa naučit a doplňujte záznamy o jeho pokroku. Odměňte
sami sebe za jeho dosažené úspěchy.
1.
Krátce
stikněte volný konec péra klikru tak, aby vydal dvoutónový klik. Pak ihned psa
odměňte. Odměna musí být malá (na jedno polknutí) a zejména zpočátku velmi
chutná (kousky kuřecího masa, kousky tvrdého sýru, kvalitní kočičí granule).
2.
Klikejte
během požadovaného chování, ne po něm. Načasování je naprosto stěžejní. Nebuďte
překvapeni, že po kliknutí dojde k ukončení chování. Je to tak správně.
Klik označuje jeho konec. Pak odměňte psa. Na načasování odměny nezáleží.
3.
Zvolte
zpočátku chování, které se vám podaří snadno navodit (pohyb psa k vám,
dotknutí ruky čenichem, zvednutí tlapky, průchod dveřmi, sednutí).
4.
Klikejte
vždy jen jednou! Jestliže chcete nějak zdůraznit své nadšení nad výkonem,
zvětšte odměnu, ne počet kliků.
5.
Cvičte
často, ale krátce. Tři pětiminutové lekce jsou mnohem lepší než jedna hodinová.
6.
Odstraňte
nežádoucí chování tím, že budete klikat na chování, které požadujete. Klikněte,
když se štěně vyčůrá na správném místě. Klikněte, když má pes tlapky na zemi a
ne na vašem hostu. Bojujte proti tahání na vodítku tím, že budete klikat
v těch vzácných chvílích, kdy je uvolněné.
7.
Klikejte
na náhodné pohyby směřující k provedení vámi zamýšleného cviku. Do chtěné
pozice můžete psa nalákat nikdy jej však netahejte za vodítko, nestrkejte ani
netvarujte rukama. Pokud možno se psa vůbec nedotýkejte. Potřebujete-li mít psa
z bezpečnostních důvodů na vodítku, pak si je navlečte na ruku.
Nepoužívejte vodítko jako nástroj výcviku.
8.
Nečekejte,
až vám pes předvede celé chování (cvik) v plné kráse. Klikejte a odměňujte
už za drobné pohyby žádaným směrem.
9.
Neustále
zvyšujte laťku. Jakmile si pes začne spolehlivě sedat, klikejte za rychlost
nebo výdrž (shaping).
10.
Jakmile
se pes naučí dělat něco za kliknutí (a případnou odměnu), začne vám toto
chování nabízet v naději, že si zaslouží kliknutí. To je správný čas pro
připojení povelu k tomuto chování. Skutečně až teď! Tedy nejprve psa
žádanému chování naučíme a až pak přidáme příslušný povel. Začněte klikat pouze
na chování které nastane během nebo po vydání povelu. Ignorujete chování
nabízené bez povelu.
11.
Nekomandujte
příliš psa. Jestliže nereaguje na váš příkaz, není to proto, že je neposlušný,
ale proto, že jste ho ještě tento příkaz dostatečně nenaučili.
12.
Noste
klikr s sebou a odchytávejte zajímavé situace. Můžete klikat za mnoho
různých chování aniž byste psa spletli. Cvičíte-li zároveň více psů, oddělte je
po dobu výcviku.
13.
Jestliže
se během výcviku rozčílíte, odložte klikr! Nezaměňujte klikr trénink se
škubáním vodítkem a výcvikem pomocí korekcí (= trestů). Jediné čeho dosáhnete
bude ztráta důvěry psa ke klikru a možná i k vám.
14.
Jestliže
výcvik nejeví známky pokroku, znamená to, že pravděpodobně klikáte příliš
pozdě. Načasování je velmi důležité. Dohodněte se s někým ať vás pozoruje,
případně nafilmuje.
A hlavně – bavte se a cvičte rádi. Výcvik pomocí klikru je skvělý způsob
jak obohatit a zkvalitnit vztah mezi vámi a vaším
psem.
Stručný výklad základních pojmů, se kterými se můžete setkat při
práci s klikrem
Motivace - reinforcement (upevnění)
Motivace je
libovolná událost, ke které dojde během nějakého chování a která má za následek
zvýšení pravděpodobnosti, že k podobnému jednání dojde i v budoucnu.
Tedy ,
v čase jsou propojeny dvě události:
-
určité
chování vyvolá motivaci
-
k chování
pak díky tomu dochází častěji.
Existují dva
druhy motivace:
-
pozitivní (odměna - něco, co má učící se rád
– potrava, pohlazení, pochvala)
-
negativní (nepříjemnost - něco, čemu se snaží učící
se vyhnout – vynadání, škubnutí obojkem, protivný zvuk). Negativní motivace
často účinkuje jen díky tomu, že její ukončení a následná úleva učícího se je
vlastně motivací pozitivní.
Správná pozitivní
motivace je vždy účinější než negativní. U některých zvířat (např. u koček)
negativní
motivace téměř neúčinkuje.
Velikost
odměny – co nejmenší
(nejkratší), zejména jedná-li se o jídlo. Učící se se s přijmutím odměny
nesmí dlouho zabývat, neboť to narušuje jeho soustředění.
Negativní
motivace není to samé, co potrestání.
Trest přichází většinou až jako
následek nějakého chování a nemá předpověditelný dopad na budoucí jednání (dost
často je dopad právě opačný) nebo má pouze za cíl okamžité ukončení nějakého
chování násilnou cestou opět bez předpověditelného dopadu.
K motivaci musí dojít během chování, které chci posílit nebo
modifikovat. Informace o tom, že k motivaci dojde je pro učícího se velmi
důležitou zprávou, která mu říká, že to, co právě provádí je to, co po něm jeho
učitel chce. Časem se dokonce samotná tato informace stává důležitější, než
konkrétní motivace.
Slouží-li jako pozitivní motivace pochvala, je správné načasování velmi
obtížné. Učíme-li například psa sednout, může se nám stát, že než ho stihnem
pochválit, tak už zase stojí. Chováním, které jsme v tomto případě
motivovali, je místo sednutí stoupnutí.
Mimořádná
odměna (jackpot)
V praxi se velmi osvědčuje odměnit učícího se čas od času mnohem více
než obvykle (10x). Jedná se buď o naprosté překvapení pro učícího se, které
vyvolává zvědavost, kdy zase přijde, nebo o odměnu za mimořádný a náhlý úspěch,
který je tak znatelně více pozitivně motivován.
Podmíněné
motivátory (conditioned reinforcers)
Velmi často, zejména při používání potravy jako motivátoru = odměny, se
stává, že není možné motivovat učícího se během požadovaného chování. Např.
když motivujeme správné chycení frisbee nebo výskok delfína. Motivování, které
přijde až po provedení akce se míjí účinkem nebo může být dokonce zavádějící.
Učící se totiž neví, kterou část jeho předchozího chování jsme vlastně
motivovali (výšku výskoku, natočení těla, šplouchnutí při dopadu, ...).
Podmíněný motivátor je původně naprosto nevýznamný signál (písknutí, pohyb,
záblesk světla, kliknutí, ...), který je pro učícího se upozorněním: teď to
děláš dobře (event marker), odměna je na cestě (bridging stimulus).
Před započetím tréninku je třeba ustanovit vazbu mezi podmíněným
motivátorem a odměnou. Když je vazba pochopena a v průběhu dalšího výcviku
upevněna, může být poskytnutí samotné odměny značně odloženo nebo se dokonce
sám podmíněný motivátor může stát odměnou. Chceme-li být ale úspěšni při
výcviku psů, je třeba v prvních krocích striktně dodržovat zásadu: Jeden
klik = jedna odměna.
Pro lidi jsou klasickým podmíněným motivátorem peníze. Zejména tehdy,
jsou-li placeni za svou práci ihned (odměna dětí za mytí nádobí). Tím, že je
možné peníze vyměnit prakticky za cokoli, stávají se díky této generalizaci
velmi účinným motivátorem.
U psů se obvykle stává, že ihned poté, co pochopí význam podmíněného
motivátoru, začnou sami různé chování nabízet ve snaze „vysloužit si kliknutí“.
Podmíněný motivátor zároveň často označuje konec požadovaného jednání
(job’s done), což je například u cviků na výdrž poněkud v rozporu
s tradičním způsobem výcviku. Časem je možné, zejména při dalším formování
chování psa (shaping), používat kliknutí i jako signál s významem teď jsi
na správné cestě, pokračuj.
Negativní motivátory nejsou doporučovány a měly by být vždy podmíněny.
Například škubnutí řetízkem by vždy mělo předcházet slovní upozornění (= podmíněný
motivátor) třeba slovo „Ne!“, které dá psovi možnost poslechnout a tím se
vyhnout použití skutečného motivátoru (=
škubnutí). Pokud pouze škubáme, je výsledek většinou žalostný.
Základním nedorozuměním je názor, že začneme-li trénink pomocí pozitivní
motivace, musíme pak už vždy při požadovaní příslušného chování používat
motivátor. To není samozřejmě pravda. Motivátory se používají pouze
v průběhu učení.
Začátečník potřebuje samozřejmě mnoho motivace, ale poměrně záhy nastává
fáze, kdy je třeba přistoupit k proměnlivému plánování motivace
(variable schedule of reinforcement). To spočívá v nepravidelném
odměňování požadovaného chování (prostě někdy i správně provedený cvik
neodměníme kliknutím). Nepravidelnost musí být skutečně náhodná a pro učícího
se nepředpověditelná. To v něm vyvolává zvědavost, kdy přijde odměna a
podstatně urychluje jeho reakce.
Proměnlivé plánování nesmí být použito tehdy, když podmíněný motivátor
slouží zároveň jako potvrzení úspěšného vyřešení nějakého problému (nalezení
kapesníku pána mezi jinými kapesníky), protože pes musí být informován o tom,
zda se mu problém podařilo vyřešit.
Motivovat jednání, které se buď čas od času vyskytuje, nebo je možné ho
snadno navodit, není problém. Co ale s chováním, které samo nikdy
nenastane? Formování spočívá v zachycení velmi malé tendence
k požadovanému jednání a v postupném posouvání se v malých
krocích směrem k jeho konečné podobě.
Targeting
(cílení) = upoutání
pozornosti, navedení psa do žádané pozice nebo situace. Obvykle se používá hůlka,
jejíhož konce se pes naučí dotýkat a my ho pak tímto způsobem můžeme vodit.
Mimicry
(napodobování) psi se
obvykle ve srovnání s jinými zvířaty málo „opičí“, funguje to zejména u
ptáků, koček a delfínů.
Modeling
(tvarování rukama). Klasickým přípkladem je učení povelu sedni tím, že
psovi zatlačíme na zadní část těla a přinutíme ho usednout. Tento způsob je
velmi špatný pro učení, neboť
pes si obvykle neuvědomuje, do jaké pozice jsme ho to nacpali. Spíš si pamatuje
svůj marný boj proti nám. Při používání klikru se modelingu zásadně vyhýbáme a
na psa pokud možno vůbec nesaháme.
Podnět (Stimuli)
Cokoli, co způsobí výskyt nějakého chování.
Povel (Cue)
Povelem může být cokoli. Od slovního povelu přes signál rukou až po
písknutí na píšťalku.
Při tradičním výcviku se začíná s povelem a poté je, většinou pomocí
tvarování rukama, pes přinucen povel splnit. Nakonec se naučí, že když nám
vyhoví a například si sedne, vyhne se tomu, že ho budeme postrkovat a
přitlačovat do žádané pozice. Vlastně se jedná o podmíněný negativní motivátor.
Při pozitivním motivování se pes nejprve naučí určité chování (cvik) tak,
že se nám ho buď podaří „zachytit“ kliknutím nebo, že použijeme formování, a
sám nám ho pak aktivně a spolehlivě
nabízí, ve snaze vymámit z nás motivátor. Teprve poté se zavádí slovní
povel ve smyslu jakéhosi semaforu, který psovi říká: „Teď máš zelenou a můžeš
si bezchybným předvedením žádaného chování vysloužit motivátor“. Takovýto povel
se zároveň ihned stává pozitivním podmíněným motivátorem sám o sobě.
Jednou z možností jak zavést povel je vydat ho těsně po začátku
požadovaného chování, motivovat jeho dokončení a poté opakovat tento postup
v různou dobu a na různých místech s tím, že se snažíme posunovat
načasování povelu dopředu tak, že jej nakonec vydáváme před cvikem.
Druhá metoda (která se také používá pro delfíny) spočívá v tom, že
střídavě povel vydáváme a nevydáváme, ale motivujeme jen ten výskyt chování,
který následuje po povelu. Pes sám chování s vysokou frekvencí nabízí.
Řekneme tedy „sedni“ a motivujeme nejbližší sednutí. Pak necháme několik
dalších sednutí bez povšimnutí a bez odměny a opět vydáme povel a motivujeme
následné sednutí.
Třetí metoda spočívá ve formování reakce na povel tak, jako by to byl
samostatný druh chování. Nejprve se po povelu motivuje byť i jen náznak sednutí
a postupně se sednutí prohlubuje a zrychluje.
Panuje obecný omyl: Jestliže si pes po vydání povelu „sedni“ skutečně
sedne, pak tento povel zvládl.
O tom, že byl
nějaký povel zvládnut se však dá hovořit až po splnění následujících podmínek:
„Utlumení“ (blednutí, vymizení) povelu (Fading)
Míra reakce na povel obvykle nezávisí na intenzitě povelu. (Zastavujeme-li
v autě na červenou, neřídí se intenzita brzdění jasem světla semaforu.) Po
zvládnutí povelu je proto možné jeho intenzitu (npř. pohyb ruky) postupně
tlumit tak, že se stane pro nezasvěceného téměř neviditelnou.
Vodění (Targeting)
Pěst, hůlka, světelná stopa nebo cokoli jako cíl, pomocí něhož lze zvíře
snadno vodit nebo přinutit něco dělat.
Posloupnosti chování (Behavior Chain)
Učíme-li psa
nějaké posloupnosti chování je třeba dodržet následující pravidla:
Existuje osm metod:
b) „Manžel má při
příchodu domů pravidelně špatnou náladu“
ad 1)
a) Zastřelte ho, prodejte ho, nechte mu
vyoperovat hlasivky.
b)
Rozveďte se.
ad 2)
a)
Vyběhněte
ven a přetáhněte ho nebo ho postříkejte hadicí. Pes bude pravděpodobně tak rád,
že vás vidí, že vám to potrestání odpustí.
b)
Zmlaťte
ho. Připalte večeři. Naštvěte se, uražte se, rozbrečte se.
ad 3)
a)
Posviťte
psovi do kotce nepříjemně silným světlem a zhasněte ihned poté, co přestane
štěkat.
b)
Při
prvním náznaku špatné nálady ve hlasu partnera odejděte z místnosti a
vraťte se, když bude jeho hlas opět klidný a tichý.
ad 4)
a)
Toto
chování je samomotivující (pes se rád slyší) a je nepravděpodobné, že spontáně
vymizí.
b)
Představte
si, že slova partnera nic neznamenají a doufejte, že se s věkem uklidní.
ad 5)
a) Naučte psa zalehnout na povel. Vleže se mu špatně štěká. Houkněte na něj povel z okna, nebo mu zavolejte do boudy domácím telefonem. Odměňte ho pochvalou.
b) Načasujte na příhod partnera nějakou pro něj příjemnou činnost nebo ho nechte půl hodinky v klidu oddychnout.
ad 6)
a)
Naučte
psa štěkat na povel. Když nedostane povel, nebude mít důvod štěkat.
b)
Vyhraďte
si přesně určený čas pro mrzutou náladu a během něj odměňte každou stížnost
partnera svou pozorností. Ignorujte naopak všechny námitky před vyhrazeným
časem a po něm.
ad 7)
b)
Jděte
ven během noci a odměňte psa vždy, když je po nějakou dobu zticha. Postupem
času odměňujte stále delší intervaly.
c)
Vymyslete
nějaké velmi vhodné motivátory a použijte je vždy, když má partner dobrou
náladu.
ad 8)
a)
Štěkající
pes je osamělý, bojí se nebo se nudí. Zaměstnejte psa přes den tak, že bude rád
celou noc spát. Opatřete mu kamaráda, aby nebyl v noci sám. Vemte ho do
domu.
b)
Doporučte
partnerovi změnu zaměstnání. Mějte při jeho příchodu připravenou večeři nebo ho
uvítejte sklenkou vína.
RNDr.
Michal Krejčí