Що таке дресирування собак?
Освіта та навчання

Що таке дресирування собак?

Що таке дресирування собак?

Від класичного умовного рефлексу імені І. П. Павлова цей рефлекс відрізняється тим, що в його основі лежить активна цілеспрямована діяльність тварини, викликана якоюсь потребою. І підкріплення в той же час є результатом цієї дуже активної і цілеспрямованої діяльності. У той час як при класичному умовному рефлексі підкріпленням є безумовний або просто другий подразник.

Що таке дресирування собак?

Оперантне навчання було відкрито американським вченим Е. Л. Торндайком завдяки інтелекту кішок і собак. Справа в тому, що Торндайк, з'ясовуючи здатність тварин до навчання, сконструював спеціальну клітку, оснащену дверцятами з простим замком. Закриваючи в цій клітці котів і собак, він зі здоровим злорадством вченого спостерігав, як його менші брати вчаться відкривати ці двері. А молодші брати і сестри вчилися відчиняти двері, роблячи різні спроби, деякі з яких були вдалими, а деякі ні. Тому Торндайк назвав форму навчання, яку він відкрив, «методом проб і помилок».

Рефлексом цю форму навчання назвав набагато пізніше інший відомий американський вчений Б. Ф. Скіннер, який присвятив їй усе своє наукове життя. Ось чому серед кількох батьків оперантного рефлексу Скіннер вважається головним батьком. Але, справедливості заради, відзначимо, що вперше в світі навчання на основі оперантного навчання описав наш чудовий дресирувальник Володимир Дуров у своїй книзі «Дресирування тварин. Психологічні спостереження за тваринами, навченими за моєю методикою. 40 років досвіду». Так, про російський варіант оперантного навчання ви можете прочитати в книзі Володимира Дурова, а американський варіант оперантного навчання добре описаний в книзі «Не гарчи на собаку!». психолога і тренера Карен Прайор, яку, до речі, теж раджу прочитати.

Загальний метод оперантного навчання Скіннера можна описати наступними етапами:

  1. стадія депривації. Так назвав цю стадію Скіннер у 30-х роках. Однак зараз цей етап варто назвати «стадією вибору та створення базової потреби».

    При формуванні оперантного умовного рефлексу можна використовувати практично всі відомі собакам потреби, але Скіннер частіше використовував харчову потребу. А сенс етапу депривації полягав у тому, що Скіннер або недогодовував тварин на деякий час, або морив їх голодом. Вважалося, що харчове підживлення стає значущим для тварини та ефективним для навчання тільки тоді, коли ця тварина втрачає близько 20% своєї живої ваги. О часи, о звичаї!

    Що таке дресирування собак?
  2. Етап формування умовного харчового підкріплення. У своїх дослідженнях Скіннер використовував автоматичні годівниці, звук яких повинен був бути сигналом для тварин про появу кормової гранули. І це потребувало часу. Етап вважався завершеним, коли у відповідь на звук годівниці щур відразу ж бігла до годівниці.

    Що таке дресирування собак?

    Фактично цей етап є формуванням класичного умовного звукового рефлексу з харчовим підкріпленням. Це також служить основою для так званого клікер-тренінгу – методу навчання з використанням умовного позитивного підкріплення здоровою їжею.

    І треба визнати, що школу оперантного навчання вигідно відрізняє від вітчизняного традиційного навчання та увага, яку оперантне навчання приділяє питанням підкріплення. Особливо позитивне та ймовірнісне підкріплення.

  3. Стадія формування реакції. Як модель поведінки Скіннер навчив своїх щурів натискати на педаль, а голубів — клювати ключ. Формування реакції натискання на педаль здійснювали одним із трьох способів: методом проб і помилок (спонтанне формування), спрямованим або послідовним формуванням та цільовим методом.

    Спонтанне утворення полягало в тому, що тварина, подорожуючи по боксу Скіннера, випадково натискала на педаль і поступово пов'язувала її натискання з включенням автоматичної годівниці.

    Що таке дресирування собак?

    Під час формування напрямку дослідник вмикав автоматичну подачу, спочатку посилюючи будь-яку орієнтацію на педаль, потім наближаючись до неї і, нарешті, натискаючи. Чому б не тренуватися клікерам!

    А цільовий метод полягав у тому, що на клавішу була приклеєна крупинка їжі, спроби її відірвати призводили до натискання на важіль.

    Сучасний метод оперантного навчання ініціації бажаної поведінки дозволяє використовувати практично всі відомі способи впливу на тварину. Однак застосування аверсивних (що призводять до болю або дискомфорту) впливів вважається неефективним.

  4. Взяття поведінки під контроль стимулу або введення диференціюючого стимулу. Іншими словами, введення умовного подразника або наказу.

    Скіннер і його прихильники вважали, що формування дії і одночасний паралельний розвиток його зв'язку з умовним подразником (командою) - це два різні процеси. А одночасне засвоєння двох різних речей ускладнює навчання. Тому традиційні операнти спочатку формують поведінку, а потім вводять команду.

    Що таке дресирування собак?

    Слід підкреслити, що в оперантному навчанні диференціюючий стимул загалом не є командою в нашому розумінні. Команда як наказ, чи не так? Зазвичай ми трактуємо це так. Диференціюючий стимул - це інформація про те, що саме зараз виконання певної поведінки є найбільш ефективним і загалом можливим. Таким чином, «команда» в оперантному навчанні має функцію дозволу та дозволу на виконання поведінки.

    Щоб було зрозуміліше, розберемо введення в експеримент лампочки в якості диференціюючого стимулу. Отже, щур навчилася тиснути на педаль і тисне на неї, коли хоче їсти. Дослідник включає світло на пару секунд і створює умови, при яких натискання на педаль тільки при включеному світлі призводить до подачі корму. А коли світло вимкнеться, скільки не натискай, у тебе буде комбінація з трьох пальців! Тобто включення лампочки створює, розділяє, розрізняє, диференціює різні умови. І щур незабаром починає розуміти. А так як їй дуже хочеться їсти (її треба!), то, побачивши, що лампочка горить, відразу біжить до педалі і, ну, тисне! З боку здається, що включена лампочка змушує щура, наказує їй тиснути на педаль. Але тепер ви розумієте, що це не так. Коли загоряється індикатор, він говорить: тепер ви можете натиснути на педаль. Але лише!

  5. Підкріплююча поведінка. Закріплення сформованої поведінки до навички здійснюється шляхом повторення з використанням імовірнісного підкріплення. Для цього також корисно використовувати різні потреби і, відповідно, застосовувати різні підкріплення.

    Вітчизняний варіант оперантного методу навчання, що бере свій початок від Володимира Дурова, відрізняється лише тим, що дозволяє відразу вводити виконавчий подразник (наказ, диференційний подразник, умовний подразник). Практика показує, що навик формується не повільніше, ніж з імпортною технікою. А оскільки це дозволяє виключити цілий крок, це економить час. Тож є сенс підтримати вітчизняного виробника тренувальних методик!

Що таке дресирування собак?

24 вересня 2019

Оновлено: 26 березня 2020 року

залишити коментар