Forum Szkolenie psów metodami pozytywnymi Strona Główna Szkolenie psów metodami pozytywnymi
Forum o pozytywnym szkoleniu psów
 
 FAQFAQ   SzukajSzukaj   UżytkownicyUżytkownicy   GrupyGrupy   GalerieGalerie   RejestracjaRejestracja 
 ProfilProfil   Zaloguj się, by sprawdzić wiadomościZaloguj się, by sprawdzić wiadomości   ZalogujZaloguj 

Klik + smakołyk a teoria uczenia się
Idź do strony Poprzedni  1, 2
 
Napisz nowy temat   Odpowiedz do tematu    Forum Szkolenie psów metodami pozytywnymi Strona Główna -> Szkolenie klikerowe
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
agata i gofer
Giga Forumowicz



Dołączył: 22 Maj 2012
Posty: 1415
Przeczytał: 11 tematów

Ostrzeżeń: 0/3
Skąd: Czarnów k. Konstancina
Płeć: Kobieta

PostWysłany: Pią 18:24, 30 Paź 2015    Temat postu:

Gosgos, zarówno ekscytacja jak i strach są emocjami czy też reakcjami organizmu na to, co ma się wydarzyć. Ekscytacja nie jest tym samym, co zadowolenie, a strach nie jest tym samym, co ból.

W celu empirycznej weryfikacji hipotezy, iż w wyniku warunkowania klasycznego klikera samo kliknięcie staje się dla psa nagrodą proponuję następujący eksperyment:

Weźmy do eksperymentu psa, np. ze schroniska, który nigdy wcześniej nie był niczego uczony. Uwarunkujmy mu bardzo dobrze kliker. Zaraz po tym, kiedy uwarunkowanie będzie jeszcze świeżutkie i mocne, zacznijmy psa uczyć np. komendy 'siad'. Najpierw naprowadźmy psa na pozycję smakołykiem, a jak już usiądzie, kliknijmy mu w nagrodę. Powtórzmy tę procedurę kilkakrotnie. A następnie zmieńmy procedurę. Naprowadźmy psa na pozycję smakołykiem, kliknijmy, a potem dajmy psu w nagrodę smakołyk. W każdym z przypadków sprawdźmy, jak długo i jak chętnie pies będzie chciał z nami współpracować na takich warunkach. I jak szybko nauczy się pożądanego zachowania.

Powiem szczerze, że ja nie mam żadnych wątpliwości co do rezultatów takiego eksperymentu. Myślę, że stosowanie klikera jako nagrody nie staje się kompletną porażką tylko dlatego, że pies ma za sobą długie doświadczenie tego, że kliknięcie jest zapowiedzią rzeczywistej nagrody. Dlatego, mówiąc nieco (ale tylko nieco) przenośnie, toleruje pewien poziom naszej "niesłowności", bo wie, że i tak od czasu do czasu wychodzi na swoje. Ale to jest psucie klikera jako znacznika zachowania - bo w ten sposób przestaje być stuprocentowym predyktorem nagrody. I jest też korzystaniem z gorszej nagrody zamiast z lepszej. Głos jest naładowany pozytywnymi emocjami opiekuna, a dla psa pozostającego z opiekunem w silnej relacji emocjonalnej to jest cenne i przyjemne samo w sobie. Ponadto, na co zwraca uwagę np. Ian Dunbar, w pochwale głosowej można te emocje stopniować - dzięki czemu można psa nagradzać w różnym stopniu, w zależności od tego, jak bardzo cieszymy się z tego, co pies zrobił. A klik zawsze brzmi tak samo beznamiętnie. Dlatego zupełnie nie widzę powodu, dlaczego by nagradzać psa klikaniem, a nie głosem.


Ostatnio zmieniony przez agata i gofer dnia Pią 18:29, 30 Paź 2015, w całości zmieniany 1 raz
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
Dardamell
Super Forumowicz



Dołączył: 20 Lip 2012
Posty: 738
Przeczytał: 0 tematów

Ostrzeżeń: 0/3
Skąd: Wrocław
Płeć: Kobieta

PostWysłany: Pią 19:17, 30 Paź 2015    Temat postu:

Jeżeli Twój pies zbytnio ekscytuje się Twoim zadowoleniem a pewien poziom ekscytacji kończy się u niego agresją to zdecydowanie lepiej nie używać zbytnio głosu aby nie ekscytować psa jeszcze bardziej w nieodpowiednich momentach. Ale jeżeli musisz pokazać psu, że każde jego dobre zachowanie jest właściwe to nie możesz zrezygnować z zaznaczenia tegoż.

Jeżeli Twój pies nie cierpi rowerzystów a jedzie ich kilku jeden za drugim, to Twoja pochwała, która nie jest tak precyzyjna jak jedno kliknięcie, może spowodować, że "nagrodzisz" przepuszczenie dwóch rowerzystów i atak na trzeciego.

Kolejna rzecz: są momenty, gdy nie możesz użyć swojego głosu jako nagrody dla psa. Spróbuj użyć komendy słownej, gdy akurat masz zapalenie krtani. U niektórych rzadko występuje, a u innych jest regularne.

Zastanawia mnie też dlaczego miałabym używać klikera tylko w sposób w jaki w tym temacie proponujecie jeżeli przynosi to bardzo marne efekty a nie używać go w sposób w jaki go używam, skoro przynosi efekty świetne.


Ostatnio zmieniony przez Dardamell dnia Pią 19:18, 30 Paź 2015, w całości zmieniany 1 raz
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
agata i gofer
Giga Forumowicz



Dołączył: 22 Maj 2012
Posty: 1415
Przeczytał: 11 tematów

Ostrzeżeń: 0/3
Skąd: Czarnów k. Konstancina
Płeć: Kobieta

PostWysłany: Pią 20:44, 30 Paź 2015    Temat postu:

Dardamell, każdy może oczywiście używać narzędzi tak, jak ma na to ochotę. A ja na pewno nie miałam intencji nikogo do niczego namawiać. W kontekście toczącej się tutaj dyskusji teoretycznej można by jedynie zapytać, jak naprawdę działa Twoje klikanie w takich sytuacjach: czy jest rzeczywiście dla psa nagrodą, czy też jedynie zaznaczeniem poprawnego zachowania, przy czym Twoja suka nauczyła się, że czasem takie zachowania są nagradzane, a czasem nie. Myślę też, że rzeczywiście przy niektórych psach nagradzanie w niektórych sytuacjach może być problematyczne - bo pojawienie się dowolnego rodzaju cennej dla psa nagrody za bardzo psa ekscytuje.
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
Jacol123
Administrator



Dołączył: 01 Maj 2006
Posty: 4101
Przeczytał: 2 tematy

Ostrzeżeń: 0/3
Skąd: Gliwice
Płeć: Mężczyzna

PostWysłany: Pią 22:18, 30 Paź 2015    Temat postu:

Myślę, że chodzi o to, że klik oznacza KONIEC zacznowania, po którym następuje nagroda. Jest to więc "terminal bridge". Gdy klikamy i nie nagradzamy - jest to "intermediate bridge" mający znaczenie "staraj się dalej, będzie nagroda". Na zasadzie warunkowania klasycznego sam dźwięk oczywiście wywołuje wyrzut dopaminy w mózgu. Jednak jeśli oczekiwana nagroda (w tym przypadku jej brak) jest większa niż dostarczona - otrzymamy zjawisko "negative prediction error" - czyli zachowanie się pogorszy.
Dodatkowo jeśli po kliknięciu nie podamy smakołyka możemy wywołać efekt warunkowania wstecznego - czyli klik oznacza "ZAKOŃCZENIE" nagrody.
To tak na gorąco parę myśli, żeby się dołożyć do dyskusji Smile
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
agata i gofer
Giga Forumowicz



Dołączył: 22 Maj 2012
Posty: 1415
Przeczytał: 11 tematów

Ostrzeżeń: 0/3
Skąd: Czarnów k. Konstancina
Płeć: Kobieta

PostWysłany: Pią 23:28, 30 Paź 2015    Temat postu:

Taką miałam nadzieję, Jacku, że się odezwiesz w tym temacie i - jako człowiek uczony - mądrze nam tu wszystko wyłożysz.

Taka prośba o doprecyzowanie tylko:

Jacol123 napisał:
Jednak jeśli oczekiwana nagroda (w tym przypadku jej brak) jest większa niż dostarczona - otrzymamy zjawisko "negative prediction error" - czyli zachowanie się pogorszy.


Czy miałeś tu na myśli to, co napisałeś - że w tym przypadku oczekiwana nagroda to jej brak, czy też, że w tym przypadku dostarczona nagroda to jej brak?
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
miki
Forumowicz Ekstraklasa



Dołączył: 17 Paź 2007
Posty: 2149
Przeczytał: 0 tematów

Ostrzeżeń: 0/3
Skąd: Nowa Sól
Płeć: Kobieta

PostWysłany: Pią 23:41, 30 Paź 2015    Temat postu:

Jacol123 napisał:
Myślę, że chodzi o to, że klik oznacza KONIEC zacznowania, po którym następuje nagroda. Jest to więc "terminal bridge". Gdy klikamy i nie nagradzamy - jest to "intermediate bridge" mający znaczenie "staraj się dalej, będzie nagroda".


Nie wiedziałam że to wszystko ma takie ładne angielskie nazwy Wink

no właśnie czyli piszesz o tym że jednak kliknięcie samo w sobie nie jest wystarczającą nagrodą bo: "staraj się dalej będzie nagroda" wiec o ile dobrze rozumiem to nawet z opóźnieniem ale pies spodziewa się po całym tym staraniu nagrody innej niż tylko kliknięcie. Na pewno sam dźwięk jest przyjemny dla psa "miło" się go słyszy ale na dłuższą metę to za mała motywacja.

To pewnie wszystko zależy od psa i przypadku. Ja dziś w czasie lekcji wieczornej popróbowałam: 3 razy klikałam gdy trzymał ładnie przedmiot w pysku, odbierałam go (czyli zakończyła się cała sekwencja i dotychczas po odebraniu zawsze dawałam smakołyk) po czym nie dawałam nagrody, i zaczynałam od nowa czyli dawałam mu do trzymania. Po drugim razie mina mojego psa była bezcenna a po trzecim gdy czwarty raz podawałam mu przedmiot to odmówił jego wzięcia. Cóż akurat ten przypadek szybko się zniechęcił a jest szkolony klikerem dwa lata zaczynając od wieku gdy miał 9 tyg. wiec w sumie powinien mieć mocno zakorzenioną tą przyjemność z słuchania jego dźwięku. Z drugiej strony to też pewnie był dla niego szok bo takie coś jak całkowity brak nagrody w postaci jedzenia po kliknięciu spotkało go pierwszy raz.


Zajrzałam do książki Karen Pryor i jest tam mowa o tym że sam dźwięk klikera może być dla obiektu bardzo przyjemny a nawet jest podany przykład psa który w czasie seminariów wykradał uczestnikom klikery z toreb. Rubin to nawet nie reaguje na widok kilkera więc nie jest aż takim fanem samego urządzenia.
Natomiast pozwolę sobie zacytować jeden fragment co do nagradzania oraz tego sygnału że zadanie nie jest jeszcze skończone o którym pisze Jacol
"W pierwszym wydaniu niniejszej książki przedstawiłam możliwości kilkakrotnego
wykorzystania wzmocnienia warunkowego, przy niestosowaniu
wzmocnienia rzeczywistego aż do samego końca procesu.
Tak właśnie zdarzało nam się robić przy pracy z delfinami w Sea
Life Park, podczas kształtowania zachowań długotrwałych lub łańcuchów
zachowań. Wówczas jednak nie miałam świadomości, że tak
naprawdę stosowaliśmy wtedy dwa (co najmniej dwa) wzmocnienia
warunkowe lub sygnały znacznikowe — pierwszym był gwizdek,
który oznaczał jak wyżej: „pięknie, zaraz będzie nagroda, rybka już
jest, popłyń sobie po nią, zadanie zakończone", natomiast drugim
był gwizdek wyciszony, którego znaczenie miało być odczytywane
następująco: „wszystko idzie dobrze, ale zadanie trwa nadal".
W latach dziewięćdziesiątych często spotykałam się z niedoświadczonymi
„klikaczami", których Morgan Spector zwykł nazywać treserami
„przejściowymi" (tj. doskonale znającymi metody szkolenia
korekcyjnego i podejmującymi próby przechodzenia na kształtowanie
i wzmacnianie pozytywne). Zauważyłam, że osoby te miały
tendencję do nadużywania klikera, przy czym jednocześnie bar
dzo oszczędnie szafowały nagrodami — tak, że w końcu znaczenie
kliknięcia zostało rozmyte. Należy zawsze stosować zasadę: ,jedno
kliknięcie — jedna nagroda".


Ostatnio zmieniony przez miki dnia Pią 23:55, 30 Paź 2015, w całości zmieniany 2 razy
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
Dardamell
Super Forumowicz



Dołączył: 20 Lip 2012
Posty: 738
Przeczytał: 0 tematów

Ostrzeżeń: 0/3
Skąd: Wrocław
Płeć: Kobieta

PostWysłany: Sob 0:02, 31 Paź 2015    Temat postu:

Upraszczając, dla mojej suki dźwięk klikera jest nagrodą oczekiwaną.
Działa to u nas od ponad trzech lat, suka ma cztery z hakiem.
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
miki
Forumowicz Ekstraklasa



Dołączył: 17 Paź 2007
Posty: 2149
Przeczytał: 0 tematów

Ostrzeżeń: 0/3
Skąd: Nowa Sól
Płeć: Kobieta

PostWysłany: Sob 0:08, 31 Paź 2015    Temat postu:

Jacol123 napisał:
Na zasadzie warunkowania klasycznego sam dźwięk oczywiście wywołuje wyrzut dopaminy w mózgu. Jednak jeśli oczekiwana nagroda (w tym przypadku jej brak) jest większa niż dostarczona - otrzymamy zjawisko "negative prediction error" - czyli zachowanie się pogorszy.


Ja zrozumiałam to jeszcze inaczej: że jeśli pies oczekuje większej nagrody a dostanie mniejszą to jego zachowanie się pogorszy, bo chyba nie tak że brak nagrody jest tą wyczekiwaną nagrodą, ale nie wiem czy właściwie zrozumiała
Wink
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
Jacol123
Administrator



Dołączył: 01 Maj 2006
Posty: 4101
Przeczytał: 2 tematy

Ostrzeżeń: 0/3
Skąd: Gliwice
Płeć: Mężczyzna

PostWysłany: Sob 0:31, 31 Paź 2015    Temat postu:

Chodzi o to, że jeśli pies spodziewa się większej nagrody, a dostaje mniejszą od spodziewanej to zachowanie się pogarsza. Dlatego np. niektóre psy pracują coraz gorzej mimo iż trener podaje ciągle taką sama nagrodę.
[link widoczny dla zalogowanych]


Ostatnio zmieniony przez Jacol123 dnia Sob 0:32, 31 Paź 2015, w całości zmieniany 1 raz
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
miki
Forumowicz Ekstraklasa



Dołączył: 17 Paź 2007
Posty: 2149
Przeczytał: 0 tematów

Ostrzeżeń: 0/3
Skąd: Nowa Sól
Płeć: Kobieta

PostWysłany: Sob 0:43, 31 Paź 2015    Temat postu:

Czyli dobrze zrozumiałam. Jeśli np pies po kliknięciu spodziewa sie jedzenia a go nie dostanie to zachowanie się pogorszy bo kliknięcie jest tą mniejszą nagrodą. To tak jak mój żarłok, wystarczyło by 3 razy nie dostał jedzenia po kliknięciu i już odmówił współpracy.
Oczywiście gdy ma już komendę utrwaloną i wycofuję kliker to wprowadzam nagradzanie zmienne i nigdy nie wie czego się spodziewać, natomiast kliknięcie jest zapowiedzią dla niego że pojawi się jedzenie i jak nie otrzyma to jest zawiedziony.
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
gosgos




Dołączył: 29 Paź 2015
Posty: 6
Przeczytał: 0 tematów

Ostrzeżeń: 0/3

PostWysłany: Sob 13:46, 31 Paź 2015    Temat postu:

Z tego co piszecie, wynikałoby, że zmienny schemat nagradzania jest ok, bo pies nie wie czego się spodziewać, ale jednak nie jest ok (kiedy mówimy o klikerze...), bo pies jest zawiedziony kiedy nie dostaje nagrody.
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
miki
Forumowicz Ekstraklasa



Dołączył: 17 Paź 2007
Posty: 2149
Przeczytał: 0 tematów

Ostrzeżeń: 0/3
Skąd: Nowa Sól
Płeć: Kobieta

PostWysłany: Sob 14:52, 31 Paź 2015    Temat postu:

Dla mnie różnica polega na tym że co innego jest czas gdy pies uczy się dopiero danej komendy a co innego jak ją już dobrze umie. Wtedy wycofuję kliker a wprowadzam zmienny schemat. Natomiast w czasie samej początkowej nauki nagradzam każde dobre wykonanie po kliknięciu. Chyba że potem chcę poprawić jakiś szczegół np. szybkość to klikam tylko szybkie siadanie, czasami sięgam po kliker gdy pies zna świetnie komendę ale chcę coś udoskonalić jakiś drobiazg albo innowację i wtedy znowu wracam do nagradzania za każdym razem czyli zawsze wtedy gdy kliknę. Np. dla mojego psa co innego jest cofanie się z stania a co innego z leżenia i choć świetnie cofa sie stojąc to nie może załapać o że chodzi o to samo gdy leży lub siedzi i będę musiała nad tym popracować właśnie klikerem.

Ja tak to rozumiem i tak sobie stosuję, czy sie mylę nie wiem ale najważniejsze że u nas działa, pies robi postępy a nie wiem czy by tak było gdybym na samym początku nauki nowej komendy od razu wprowadziła zmienny schemat. W sumie było by to nie sprawiedliwe bo jak pies jeszcze nie wie o co chodzi dopiero to odkrywa i mimo że zrobi dobrze np w czasie naprowadzania a nie dostanie nagrody...bo akurat mój pies nie traktuje samego kliknięcia jako super nagrody.

edit. zapomniałam dodać że nie wszystkiego uczę klikerem ale zasadę zawsze stosuję taką samą czyli na początku nauki nagradzam każde poprawne wykonanie. Potem jeśli w danej komendzie wprowadzam nowe ćwiczenie, podnoszę poprzeczkę np praca w większym rozproszeniu to też wracam do częstszego nagradzania.


Ostatnio zmieniony przez miki dnia Sob 18:50, 31 Paź 2015, w całości zmieniany 2 razy
Powrót do góry
Zobacz profil autora
Wyświetl posty z ostatnich:   
Napisz nowy temat   Odpowiedz do tematu    Forum Szkolenie psów metodami pozytywnymi Strona Główna -> Szkolenie klikerowe Wszystkie czasy w strefie EET (Europa)
Idź do strony Poprzedni  1, 2
Strona 2 z 2

 
Skocz do:  
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach

fora.pl - załóż własne forum dyskusyjne za darmo
Powered by phpBB © 2001, 2005 phpBB Group
Regulamin