Teoria

Szkolenie to nic innego jak proces zmiany zachowań, dobrze poznany dzięki tysiącom eksperymentów naukowych. Zebrane w ich trakcie doświadczenia pozwoliły na sformułowanie teorii uczenia się i opracowanie niezwykle skutecznych metod treningu, które dzięki temu, że dokładnie wiadomo JAK i DLACZEGO działają, z sukcesem przeniesiono poza laboratorium

Z czym to się je?

czyli absolutne podstawy w dużym skrócie

Bez motywacji nie ma szkolenia

Pierwszym zadaniem przy szkoleniu każdego zwierzęcia jest odnalezienie tego, co je motywuje.

Kij i marchewka

Wszystkie zwierzęta są zmotywowane przez jedzenie, wodę, seks i unikanie negatywnych bodźców – są to wzmocnienia bezwarunkowe.Wiele zwierząt może być zmotywowanych przez zabawę, poświęcanie im uwagi, możliwość socjalizacji lub dostępu do pewnych pożądanych dóbr.

Możliwe są dwa rodzaje motywacji:

  • Przy szkoleniu z wykorzystaniem nagród motywację tworzy chęć ich zdobycia. Jeśli stosunkowo nietrudno jest je zdobyć, motywacja jeszcze się zwiększa – motywacja rodzi sukces, a sukces rodzi motywację.
  • Przy wykorzystaniu metod awersyjnych motywację tworzy chęć uniknięcia negatywnych bodźców. Zwierzę zrobi tyle, ile wystarczy, żeby uniknąć negatywnie kojarzącej się korekcji. I TYLKO TYLE.

Rodzaj zastosowanej motywacji ma wpływ na szybkość uczenia się. Badania przeprowadzone m.in. na źrebiętach na Uniwersytecie w Rennes (Francja) wskazują wyraźnie na znacznie większą szybkość uczenia się zwierząt nagradzanych jedzeniem w porównaniu z grupą szkoloną przy użyciu bodźców awersyjnych (presji). Dodatkowo zwierzęta szkolone z wykorzystaniem nagród są bardziej ciekawe świata, chętniej przebywają z opiekunem i chętniej eksperymentują.

Jeżeli korzystasz z jedzenia, pies / koń / kurczak robi to dla jedzenia, a nie dla Ciebie.

Szkoleniowcy, którzy twierdzą, że zwierzęta pracują, aby sprawić przyjemność swoim opiekunom zdają się być nieświadomi tego, że jedynym „motywatorem”, z którego korzystają jest ból. Zwierzę szkolone bodźcami awersyjnymi teoretycznie ćwiczy „dla nas”, ponieważ jedynym pozytywnym wzmocnieniem są ew. pochwały. W rzeczywistości pracuje nie „dla nas”, a wyłącznie dla uniknięcia korekcji.

Zachowania są kontrolowane przez swoje konsekwencje

Domino

Zachowanie jest zawsze narzędziem do osiągania pewnych skutków, a więc jest w poważnym stopniu kontrolowane przez swoje konsekwencje.
Konsekwencje to wydarzenia następujące bezpośrednio po zachowaniu i z nim związane (pojawiają się wtedy, gdy pojawia się zachowanie). Chcąc szkolić, czyli modyfikować zachowania, musimy potrafić modyfikować ich konsekwencje.

Konsekwencje zachowania, które są ważne dla zwierzęcia i wpływają na to zachowanie, nazywamy WZMOCNIENIAMI bądź WYGASZENIAMI, w zależności od tego czy wzmacniają, czy wygaszają dane zachowanie.

Jeśli konsekwencje zachowania powodują, że intensyfikuje się ono, to są one dla zwierzęcia wzmocnieniami. Możliwe są dwa rodzaje wzmocnień:

  • Wzmocnienie dodatnie ( R+ , od ang. reinforcement – wzmocnienie )

    Konsekwencją zachowania jest POJAWIENIE ( stąd „+” ) się czegoś (dobrego), co powoduje wzmocnienie zachowania (czyli zwiększenie jego częstotliwości).

    Jeśli możemy zrobić coś, co spowoduje pojawienie się czegoś dobrego dla nas, będziemy robić to częściej.

    W szkoleniu korzystamy głównie z dodatniego wzmocnienia – jest ono najbardziej efektywne i najłatwiejsze do kontroli przez trenera, łatwe do zrozumienia przez zwierzę i buduje najsilniejszą motywację.

  • Wzmocnienie ujemne ( R- )

    Konsekwencją zachowania jest ZNIKNIĘCIE ( stąd „-” ) czegoś (złego), co powoduje wzmocnienie zachowania (czyli zwiększenie jego częstotliwości).

    Jeśli możemy zrobić coś, co spowoduje zniknięcie czegoś dla nas nieprzyjemnego, będziemy robić to częściej.

    Wzmocnienie ujemne to element tradycyjnych systemów szkolenia – coś złego (nacisk obroży, kiełzna, łydek itp.) znika, gdy zwierzę zrobi to, co nas interesuje.

Jeśli konsekwencje powodują, że zachowanie zanika, to są one dla zwierzecia wygaszeniami.Możliwe są dwa rodzaje wygaszeń:

  • Wygaszenie dodatnie ( P+ , od ang. punishment – kara )

    Konsekwencją zachowania jest POJAWIENIE ( stąd „+” ) się czegoś (złego), co powoduje wygaszenie zachowania (czyli zmniejszenie jego częstotliwości). Popularnie nazywane karą.

    Jeśli robimy coś, co powoduje pojawienie się czegoś dla nas nieprzyjemnego, przestaniemy to robić.

    Zdecydowanie niepolecane jako metoda szkolenia – więcej na ten temat w zakładce „kary”.

  • Wygaszenie ujemne ( P- )

    Konsekwencją zachowania jest ZNIKNIĘCIE ( stąd „-” ) czegoś (dobrego), co powoduje wygaszenie zachowania (czyli zmniejszenie jego częstotliwości ).

    Jeśli robimy coś, co powoduje zniknięcie czegoś dobrego dla nas, przestaniemy to robić.

Jeśli zachowanie, które dotąd było zawsze wzmacniane, przestanie być wzmacniane to może wygasnąć.
Jeśli zachowanie jest wzmacniane zmiennie, to jest odporniejsze na wygaszenie (jeśli nie oczekujemy nagrody zawsze, będziemy próbować dopóki jej nie dostaniemy – jednoręki bandyta).

Zanim zachowanie wygaśnie, pojawia się tzw. wybuch przedeliminacyjny – zachowanie pojawia się ze zwiększoną siłą i częstotliwością. Jeśli zostanie wtedy wzmocnione, bardzo silnie się utrwali.

Marker to znacznik zachowania, most pomiędzy nim a rzeczywistym wzmocnieniem

Domino

Żeby konsekwencje miały wpływ na zachowanie, muszą być natychmiastowe – inaczej nie sposób skojarzyć ich z zachowaniem. Ludziom można wytłumaczyć odległe konsekwencje ich działań używając mowy; w przypadkuzwierząt jedyną możliwością jest natychmiastowość wzmocnień lub wygaszeń.

W przypadku prostych, niezbyt szybkich zachowań taka możliwość istnieje – możemy dostarczyć wzmocnienia (np. jedzenia) w trakcie, gdy pies siada, koń się kłania itp. Jednak bardzo wielu zachowań nie możemy wzmocnić natychmiast (tzn. w ich trakcie), bo jest to technicznie niewykonalne – są albo zbyt szybkie (np. dziobnięcie w punkt), albo nie sposób dostarczyć wzmocnienia (np. skaczącemu koniowi).

Z pomocą przychodzi nam marker – neutralny bodziec, który możemy dostarczyć w dowolnym momencie (gwizd, kliknięcie, błysk światła itp.), a który wcześniej skojarzyliśmy silnie z którymś ze wzmocnień. Dzięki markerowi możemy precyzyjnie przekazać zwierzęciu informację o tym, jakie zachowanie jest wzmacniane, a jednocześnie tworzymy most między zachowaniem a rzeczywistym wzmocnieniem (które może być dostarczone nieco później).

ClickerW zasadzie nie ma znaczenia, czy korzystamy z markera dźwiękowego, optycznego czy dotykowego. Niektóre będą oczywiście lepsze niż inne w konkretnym przypadku (np. kliker jako marker dla głuchego psa czy ryby nie ma sensu). Jeśli możemy korzystać z markera dźwiękowego (kliker, gwizdek) to jest on wygodniejszy głównie dzięki temu, że nie musimy mieć kontaktu wzrokowego ze szkolonym zwierzęciem. Najczęściej stosowanym markerem ze względu na wygodę użytkowania i nieskomplikowaną konstrukcję jest kliker występujący na rynku w tysiącu odmian – od najprostszego „pudełka z blaszką” po elektroniczne z możliwością wyboru kilku rodzajów dźwięków.

Teoretycznie markerem może stać się również słowo, np. „dobrze!”. Badania pokazują jednak, że jest ono bardzo niedoskonałym markerem z dwóch powodów. Po pierwsze jest znacznie mniej precyzyjne – spróbujcie powiedzieć „dobrze!” dokładnie w momencie gdy dziób kury uderza w stół. Po drugie – aby marker mógł się stać bodźcem warunkowym, którego przetworzenie nie wymaga udziału kory mózgowej (a więc jest szybsze) musi być zawsze identyczny i neutralny. Ludzka mowa nie jest ani jednym, ani drugim (z samej definicji nie jest neutralna, bo za jej pomocą przekazujemy informacje i używamy jej na co dzień) i zawsze podlega interpretacji przez korę mózgową. Chociaż taki marker działa, to wyniki osiągane przy jego użyciu są znacząco gorsze.

Kształtowanie – źródło nowych zachowań

Nie możemy wzmocnić zachowania, dopóki się ono nie pojawi. Stwarza to problem przy uczeniu zachowań nowych, zwłaszcza takich, które samoistnie nie pojawią się nigdy. Rozwiązaniem jest kształtowanie – proces, w którym wzmacniamy zachowania coraz bliższe zachowaniu docelowemu, zaczynając od tego, które pojawia się spontanicznie.

Zastosowanie kształtowania wymaga umiejętności zaobserwowania małych nieregularności w zachowaniach (np. koń za każdym razem podnosi nogę trochę inaczej) i wzmacniania tych, które prowadzą w pożądanym kierunku, zwiększając stopniowo kryteria (gra w „ciepło-zimno”, tylko że mamy tylko „ciepło”).

Proces możemy prześledzić na filmie obok, na którym kształtujemy ciągnięcie wózeczka przez kurę. Zaczynamy od wzmacniania zachowania, które pojawia się spontanicznie (patrzenie na sznurek), a następnie gdy jest ono oferowane bez wahania, podnosimy kryteria (schylanie głowy w kierunku sznurka, dziobanie w sznurek, przytrzymanie sznurka w dziobie, pociągnięcie)

Ukształtować możemy każde zachowanie, do którego zwierzę jest fizycznie zdolne. Tworząc nowe zachowania powinniśmy mieć na uwadze następujące reguły:

  • Zwiększamy kryteria małymi kroczkami, tak żeby zwierzę miało zawsze realistyczną szansę na otrzymanie wzmocnienia.
  • Kształtujemy jedną rzecz na raz. Możemy pracować nad kilkoma zachowaniami w jednej sesji, ale nie nad kilkoma aspektami jednego zachowania na raz.
  • Kiedy dodajemy nowe kryteria, tymczasowo zmniejszamy oczekiwania.
  • Wyprzedzamy zwierzę planując ćwiczenia, tak żebyśmy zawsze wiedzieli, co mamy zamiar wzmacniać, w którą stronę zmierzamy.
  • Jeżeli wyuczone zachowanie się pogarsza, wracamy do początków.
  • Jeżeli jeden sposób kształtowania zachowania nie daje wyników, szukamy innego. Jest tyle sposobów, ilu jest trenerów.

Karanie jest wzmacniające dla karzącego

Kara

Ludzie mają głęboko zakorzenioną skłonność do karania, chociaż kary rzadko są skuteczne. Dzieje się tak, dlatego że karanie jest zachowaniem zazwyczaj wzmacnianym w trakcie wybuchu przedeliminacyjnego (patrz: ZACHOWANIA I KONSEKWENCJE, eskalujemy karę dopóki nie zadziała; jej zadziałanie jest wzmocnieniem).

Żeby kara była skuteczna, musi być natychmiastowa, adekwatna, pozbawiona emocji i prowadzić do przerwania karanego zachowania. W praktyce rzadko udaje się to osiągnąć.

Stosowanie kar (czyli dodatniego wygaszenia) w szkoleniu prowadzi do szeregu problemów, które znacznie przekraczają korzyści z nich płynące:

  • Kara z reguły nie eliminuje zachowań niepożądanych, tylko je tłumi i zahamowuje na pewien okres. Zachowania mają swój cel, a pojawienie się kary bynajmniej go nie likwiduje.
  • Zastosowanie kary prowadzi do generalizacji hamowania – kara tłumi nie tylko reakcje niepożądane lecz również wiele zachowań pożądanych. Ponieważ zwierzę nie wie, czy za kolejne zachowanie nie
    zostanie ukarane, przestaje przejawiać jakąkolwiek incjatywę.
  • Kary mogą wywołać zaburzenia emocjonalne (lęk, gniew, agresja, unikanie).
  • Mogą także wywołać unikanie źródła karania – osób lub miejsc, które wymierzają kary lub się z nimi łączą.