ГЛАВА ПЕРВАЯ. Краткий экскурс в науку о дрессировке. Научение собак это

1.3. Общая методика дрессировки. Формы научения и способы дрессировки собак для поиска взрывчатых веществ, взрывных устройств, оружия и боеприпасов

1.3. Общая методика дрессировки

По сути дела, дрессировка заключается в том, что человек сознательно или бессознательно создает у животного какую-либо потребность и предлагает удовлетворить ее при помощи нужного ему поведения.

Процесс дрессировки можно представить в виде последовательных стадий.

1. Стадия выбора и создания целесообразной (базовой, начальной) потребности, выступающей как причина необходимого поведения.

При выборе целесообразной потребности учитывают особенности навыка, который необходимо сформировать, породу собаки, ее психофизиологические особенности, пол, возраст и даже время, отпущенное на дрессировку.

Чаще всего необходимые потребности создается путем депривации — лишения животного чего-либо. Например, чтобы создать пищевую потребность, нужно какое-то время не кормить собаку. Оборонительную потребность создают путем непосредственного болевого (аверсивного) или неприятного воздействия на собаку. Для создания выраженной игровой потребности необходимо, что называется, разыграть собаку, а для этого требуется определенное время.

2. Стадия удовлетворения базовой потребности: животному при помощи специфических способов дрессировки предлагается или навязывается выполнение какого-либо действия, которое приводит к удовлетворению имеющейся потребности.

Во время этой стадии происходит несколько процессов, связанных с научением. На этой стадии формируются знания и умения. По мере повторения действие, приводящее к удовлетворению потребности, включается в репертуар поведения, связанного с данной потребностью, т. е. условием удовлетворения данной потребности становится выполнение этого поведения. Факт удовлетворения потребности становится подкреплением предшествующего ему поведения. Формируются связи команды с потребностью и команды с выполняемым действием.

3. Стадия снижения значимости базовой потребности. В результате многократного повторения действие приобретает свойства навыка, что делает его достаточно автономным по отношению к базовой потребности. Кроме того, во время дрессировочного процесса дрессировщик сознательно или бессознательно использует и другие потребности: социальную (дрессировка — это форма общения человека с собакой, она является одним из способов удовлетворения социальной потребности), потребность в положительных ощущениях (ласковая интонация, оглаживание и т. п.), пищевую, игровую, потребность в двигательной активности и даже оборонительную. В связи с этим автономность навыка от базовой потребности увеличивается.

4. Стадия автоматизации действия до навыка. При многократном повторении (в результате тренировки) действие приобретает свойства подкрепления: правильно выполненное, оно вызывает положительные эмоциональные ощущения. При этом первоначальная потребность перестает играть ведущую роль в воспроизведении данного поведенческого акта. Однако если продолжительное время животное не достигает результата, который бы служил подкреплением какой-либо актуальной потребности, поведение затухает.

Основными категориями (понятиями) дрессировки, помимо рассмотренных выше, являются: метод дрессировки, способ дрессировки, методика дрессировки и подкрепление, знание, умение и навык.

Пытаясь научить чему-либо собаку — выдрессировать ее, человек создает условия, способствующие реализации той или иной формы научения: импринтинга, классических условных рефлексов, оперантных условных рефлексов и т. п. Таким образом, метод дрессировки можно определить как совокупность теоретических и практических положений по формированию поведения, отражающих закономерности конкретной формы научения.

Основным методом дрессировки при подготовке поисковых собак является оперантный метод.

Под способом дрессировки подразумеваются такие непосредственные или опосредованные воздействия на животное, которые приводят к воспроизведению (появлению) нужных дрессировщику действий или сохранению необходимых поз.

В настоящее время различают следующие способы дрессировки:

— наведения;

— наталкивания;

— пассивной флексии;

— отбора поведения;

— альтернативного поведения;

— игрового поведения;

— имитационный;

— оборонительного поведения;

— агрессивно-оборонительного поведения.

При подготовке поисковых собак обычно используют способ наведения, способ отбора поведения и способ игрового поведения.

Дрессировка как научение происходит во времени и может характеризоваться сменой методов и способов. Организацией и регламентацией процесса дрессировки вообще и в каждом конкретном случае занимается методика дрессировки, которая определяет выбор и последовательность методов и способов, потребностей, их выраженность и приемы их формирования, вид и режим подкрепления, продолжительность и периодичность занятий, этапность отработки навыка, организацию тренировочного процесса и т. д.

Можно выделить общую методику дрессировки, которая регламентирует более или менее продолжительный этап дрессировочного процесса. Например, методику освоения дисциплинарного курса или методику миннорозыскной службы. И частную методику дрессировки, регламентирующую отработку конкретного навыка. Например, методику формирования навыка посадки. То есть методика отражает алгоритм практических действий дрессировщика по формированию поведения. Это наиболее динамичная категория дрессировки и может существовать во множестве вариантов.

То, что влияет на запоминание и воспроизведение элементов поведения, называется подкреплением. То есть подкреплением может быть любое событие, влияющее на частоту повторения в будущем связанного с ним поведения. Событие, которое увеличивает частоту повторения в будущем связанного с ним поведения, является положительным подкреплением. Событие, которое уменьшает частоту повторения в будущем связанного с ним поведения, является отрицательным подкреплением.

С точки зрения мотивированного поведения положительным подкреплением может быть любое событие, сигнализирующее об удовлетворении потребности или увеличивающее вероятность ее удовлетворения. Отрицательное подкрепление исключает удовлетворение потребности или уменьшает вероятность ее удовлетворения.

Различают также натуральное (первичное) и условное (вторичное) подкрепление. Натуральным подкреплением обычно называют событие, связанное непосредственно с физиологическими процессами организма, или непосредственное воздействие на животное. Условное подкрепление является условнорефлекторным эквивалентом натурального подкрепления. Например, если вы постоянно перед дачей пищи повторяете слово «Хорошо!», со временем по законам классического условного рефлекса это слово становится сигналом предъявления пищи и приобретает свойства натурального подкрепления.

Выделяют также аверсивное подкрепление, под которым подразумевают воздействия, приводящие к болевым или неприятным ощущениям у животного. Аверсивное подкрепление может быть положительным, отрицательным и условным. Поскольку аверсивное подкрепление всегда связано с отрицательным эмоциональным состоянием, использование его в дрессировочном процессе должно быть крайне ограниченным.

Различают постоянное и вариабельное (вероятностное) подкрепление. При постоянном режиме подкрепление предъявляется в связи с каждой единицей поведения (подкрепляется каждый навык). При вариабельном режиме подкрепление может предъявляться через определенные промежутки времени, после определенного количества воспроизведенных навыков или случайно (подкрепляется не каждый навык). Постоянный режим подкрепления обычно используют на начальных этапах дрессировки. Вариабельный режим подкрепления позволяет отобрать и закрепить лучшие варианты навыков и способствует их более быстрому и лучшему закреплению.

С точки зрения процесса научения дрессировка представляет собой последовательный процесс от формирования знания к умению и от умения к формированию навыка (рис. 1.3).

Рис. 1.3. Соотношение знаний, умений и навыков в поведенческом репертуаре и количество повторения ситуаций, необходимого для их формирования

Под знанием подразумевается информация о чем-либо. Знание существует в виде следов памяти и может быть декларативным и процедурным. Под декларативной памятью подразумевается информация о свойствах каких-либо объектов, о событиях и ситуациях. Под процедурной памятью (двигательной памятью) подразумевается информация о каком-либо действии (поведении).

Мы знаем очень многое. Для того чтобы узнать что-либо, достаточно прочитать книгу, посмотреть видеофильм или выслушать другого человека. У животных аналогичным образом знание формируется только в результате наблюдения (имитационная форма научения). Во всех остальных случаях, при всех других формах научения знание формируется в результате первых нескольких повторений сочетания причины и следствия или встреч какого-либо объекта: от нескольких раз до нескольких десятков раз.

Обладание знанием еще не гарантирует воспроизведения, а тем более качественного воспроизведения его на уровне поведения. Например, прочитав один раз стихотворный текст, мы узнаем его и через месяц, подтвердив, что знакомы с ним. Однако чтобы воспроизвести стихотворение — рассказать его наизусть, нам потребуется не раз повторить его. Начав воспроизведение знания на поведенческом уровне, мы приступаем к формированию умения. Умением называют действие, поведение, не достигшее уровня автоматизации. Для формирования умения необходимо повторить действие от нескольких десятков до нескольких сотен раз.

Мы умеем также очень многое (хотя меньше, чем знаем). Например, мы умеем сколотить табурет, однако столяр-краснодеревщик делает табуреты гораздо быстрее нас и более качественно. Это потому, что мы обладаем умением, а профессионал обладает навыком.

Навыком может быть любое действие, в том числе и невидимое (недоступное для непосредственного наблюдения), сформированное путем повторения, характеризующееся высокой степенью освоения и отсутствием поэтапной сознательной регуляции и контроля. То есть навык — это такое действие, которое воспроизводится эффективно с точки зрения выполняемой деятельности, безотказно, быстро, однообразно и независимо от внешнего влияния. Различают навыки двигательные, перцептивные и интеллектуальные. Во время дрессировки у животного формируются все виды навыков.

На скорость формирования навыка влияют мотивация или лежащая в ее основе потребность, способность к научению вообще, особенности подкрепления, режим тренировки, методика формирования и опыт животного по освоению других умений и навыков.

Основные положения

1. Главной причиной поведения является потребность.

2. Потребность, достигая определенного уровня, изменяет характер восприятия внешней информации и определяет последующее поведение.

3. Первым этапом дрессировки является выбор потребности и создание условий, обеспечивающих ее доминирование.

4. Навык, формируемый в процессе дрессировки, представляет собой типичный поведенческий акт.

5. Подкреплением в дрессировке может быть любое событие, влияющее на вероятность повторения связанного с ним поведения.

6. Положительное подкрепление увеличивает частоту повторения в будущем связанного с ним поведения, отрицательное подкрепление — уменьшает.

7. Дрессировка представляет собой процесс формирования знаний, умений и навыков.

8. Навыком может быть любое действие, сформированное путем повторения.

Поделитесь на страничке

Следующая глава >

bio.wikireading.ru

Негативное научение собаки, привыкание животного условные рефлексы, ориентировочная реакция воспитания собаки, раздражающим действиям, дрессировка собаки

Негативным научением, или привыканием, называют снижение выраженности или отсутствие поведенческих реакций при повторяемых или продолжительно действующих раздражителях, которые не имеют серьезных последствий и не несут в данный момент сколько-нибудь важной информации для организма. Привыкание считается наиболее распространенной формой научения.

Отличительной особенностью такой формы приобретения опыта является не освоение новых поведенческих реакций, а утрата или ослабление уже имеющихся.

Биологическое значение привыкания заключается в том, что для выживания или улучшения условий существования организм должен уметь различать существенные и несущественные для его жизнедеятельности раздражители и подавлять реакции на несущественные, а также правильно реагировать на полезные или опасные раздражители.

Животное может привыкнуть к любым раздражающим воздействиям, с которыми ежедневно встречается, и не отвечать на них ориентировочной или оборонительной реакциями, приспособиться к товарищам по стае или стаду и ограничивать свои реакции, возникающие в их присутствии, лишь действительно необходимыми. Благодаря привыканию происходит стабилизация общественного поведения любого сообщества животных. Привыкание наблюдается по отношению ко всем видам раздражителей или воздействий: световым (зрительным), слуховым, температурным, тактильным, вкусовым, запаховым и даже болевым.

Считают, что негативное научение характеризуется рядом особенностей, которые можно рассматривать и как правила использования привыкания в воспитании и дрессировке: 1. Повторяющиеся раздражители приводят к снижению величины исходной реакции (появление безразличия). 2. Прекращение применения данных раздражителей приводит к постепенному восстановлению ответной реакции. 3. Привыкание развивается быстрее и имеет большую прочность после повторяющихся серий применения раздражителей и прекращения их применения до восстановления ответной реакции. 4. Скорость развития и степень выраженности привыкания находятся в прямой зависимости от частоты предъявления раздражителя. 5. Привыкание наступает быстрее при меньшей силе раздражителя. Сильные раздражители могут либо совсем не вызывать привыкания, либо приводить к извращению реакции. 6. Привыкание к одному раздражителю может облегчить его по отношенную к другим, близким по характеру, раздражителям. 7. Предъявление другого раздражителя может приводить к отмене привыкания. 8. Повторное предъявление раздражителей, восстанавливающих ответную реакцию (отменяющих привыкание) менее эффективны, так как и к этим раздражителям постепенно развивается привыкание.

Однако после выработки привыкания раздражитель продолжает восприниматься животным. В этом легко убедиться, если несколько усилить или ослабить раздражитель, он сейчас же вызовет реакцию.

Привыкание очень близко к процессу угашения условных рефлексов. Вполне вероятно, что в основе этих процессов лежат одни и те же физиологические механизмы, но пока термин привыкание употребляют в отношении врожденных реакций, угашение - приобретенных.

В этом случае уместно привести еще одно определение привыкания: это процесс постепенного ослабления врожденной реакции в результате повторных применений раздражителя, не сопровождаемых подкреплением. Следовательно, для ускорения привыкания следует найти, что подкрепляет поведенческую реакцию и устранить его или не допустить, особенно если это отрицательное подкрепление.

Одним из примеров привыкания может служить угашение ориентировочной реакции у животных на любое изменение окружающей среды. Как правило, раздражители внешнего мира вызывают ряд сложных реакций, направленных на лучшее их восприятие, необходимое для анализа биологического значения этих раздражителей для организма, что и называют ориентировочной реакцией.

Ориентировочная реакция для воспитания и дрессировки - палка о двух концах. С одной стороны для того, чтобы команда (раздражитель, сигнал, событие) было воспринято, нужно, чтобы оно могло вызвать ориентировочную реакцию (ориентированная ориентировочная реакция), которая позволяет "настроить" на него органы чувств. Без внимания восприятие невозможно и чем больше внимание будет привлечено новизной, сложностью или интенсивностью стимула (события или объекта), тем больше вероятность того, что стимул будет воспринят. Образование любого условного ответа начинается с ориентировочной реакции. Но с другой стороны, если ориентировочная реакция не исчезает или поведение переходит в оборонительное, научение становится невозможным. Вспомните наличие стоп-реакции, которая выражается в отмене текущей деятельности. Тем более, если ориентировочная реакция вызвана не относящимися к делу раздражителями.

Оцените статью:

Всего голосов 0, средний балл 0

zooclub.ru

ГЛАВА ПЕРВАЯ. Краткий экскурс в науку о дрессировке

Считается только то, что ты понял из того, что узнал. Тренер Джон Вуден.

Когда наблюдаешь за работой хорошего тренера, вырабатывающего у собаки нужное поведение, кажется, что видишь некий танец. Дрессировщик вовремя и правильно подкрепляет действия собаки, плавно двигается, помогая ей натолкнуться на правильные движения. Собака делает, что хочет, но благодаря мастерству дрессировщика она делает именно то, что нужно ему. Собака работает увлеченно, внимательно и уверенно, потому что ее реакция на команду – ее собственный выбор. Правильный выбор приносит ей хорошее поощрение, так что она старается заслужить еще. Собаку никогда ни к чему не принуждали, и в то же время она четко выполняет то, что хочет от нее тренер. Это не фокус. Этот процесс направляется определенным набором принципов. «Отбор поведения» кардинально отличается от того, что многие считают «основной» или «традиционной» дрессировкой. Ниже приводится краткое введение в науку о дрессировке.

Два типа научения.

Две теории определяют научные принципы научения для всех животных (включая человека): обучение через выработку классического условного рефлекса (иногда также называемого павловским, или респондентным), и через выработку оперантного условного рефлекса (также называемого скиннеровским, или инструментальным).

Классический условный рефлекс.

Вы невольно испытываете действие классического условного рефлекса, когда у вас усиливается слюноотделение при виде шоколада или вы волнуетесь при звуке бормашины. Вы не контролируете эти реакции. Ваш прошлый опыт с шоколадом или бормашиной диктует эти условные реакции, даже если вы больше ни один из этих объектов в рот не возьмете. При действии классических условных рефлексов поведение автономно, отвечает на раздражитель, часто эмоционально зависимо, и неконтролируемо.

Павлов и его истекающие слюной собаки.

Классический условный рефлекс был впервые описан в начале 1900-х гг. русским ученым Иваном Павловым, который наткнулся на следующее открытие: когда он звонил в звонок, а потом показывал собаке пищу, через несколько повторений собака начинала выделять слюну при звуке звонка. Собака не контролировала этот рефлекс; он был вызван сочетанием ничего не значащего стимула с чем-то, на что у собаки была эмоциональная реакция, в данном случае с пищей.

Классический условный рефлекс также вступает в свою силу, когда некоторые собаки начинают испытывать стресс при звуке дождя или падении атмосферного давления. Собака, которая боится грома, быстро связывает этот страшный звук с его предвестниками (дождь и/или падение давления). Ученые доказали, что неприятные события гораздо быстрее выучиваются, чем приятные, так что собака может научиться пугаться после всего одного предъявления неприятного стимула. Однако выработка радостной реакции на более приятный стимул (напрмер, звон ключей от машины) может занять гораздо больше времени. После достаточного числа повторений собака будет радоваться предстоящей поездке в машине. Если же она боится машины, то может убежать и спрятаться.

Важно помнить, что собака не может контролировать эти реакции. Они становятся условными рефлексами.

Оперантное научение.

По контрасту, оперантное научение основывается на принципе, что животное склонно повторять то поведение, которое получило подкрепление, и подавлять поведение, вызвавшее неприятные последствия. Животное подвергается простейшему оперантному научению, когда оно поощряется за правильный выбор действий при наличии альтернативы. Собака, которая сидит при встрече с гостями, например, получает подкрепление социальным контактом. Собака, которая прыгает на гостей, получает наказание в виде запирания в дальней комнате. Оперантное научение отличается от классического тем, что животное сознательно предлагает реакции, за которое его поощряют или наказывают. Животное учится на последствиях своих действий. В результате, при оперантном методе обучения, поведение намеренно, контролируемо и является продуктом сознания.

В начале 1900-х гг. американец Эдвард Торндайк в том, что было позже названо «Торндайковский закон эффекта», первым описал тот принцип, что поведение стимулируется его последствиями [стимульно-реактивная ассоциация или связь усиливается, когда за реакцией следует удовлетворитель].

Он указал, что поведение, которое поощряется, возрастает по частоте; поведение, приносящее неприятности, будет избегаться животным в будущем. Его идея, что поведение движимо последствиями, была подхвачена «дедушкой» оперантного научения Б.Ф.Скиннером. Известный тем, что с помощью поощрения он учил лабораторных крыс проходить сложные лабиринты, Скиннер существенно продвинул концепцию, что поощрение создает поведение. Наказание, напротив, не может построить поведение; оно может только подавить его. Это абсолютно логично. Животные, включая человека, повторяют то, что им выгодно – в своих интересах. Они обычно не склонны повторять то поведение, которое не дает им ничего хорошего. В конце концов, зачем тратить свое время впустую? В частности, зачем повторять поведение, которое приносит неприятные последствия (наказание)? Автолюбители предлагают доказательство. Если вас останавливает дорожная полиция и выписывает штраф за превышение скорости, наказание подавит ваше стремление гонять, но не изживет его. Часто вы опять жмете на газ, как только полицейская машина скроется из вида. Если бы однако, вы ехали по правилам, и полицейский остановил вас, чтобы дать премию в 10 000 долларов за примерное поведение, думаю, гораздо больше людей соблюдали бы скоростной режим.

Когда правят классические условные рефлексы.

Что происходит, если сталкиваются реакция, диктуемая классическим условным рефлексом, и реакция, выученная оперантным путем? Практически в любой ситуации классический условный рефлекс победит. Это означает, что как бы хорошо ни была выдрессирована ваша собака, в стрессовой ситуации, при страхе или возбуждении, классический условный рефлекс будет иметь большее влияние на ее поведение, чем все, что было выучено оперантным способом.

Представьте собаку, которая боится грома. Независимо от того, насколько вкусное лакомство вы предлагаете или насколько хорошо выдрессирована собака, если она действительно напугана, выученная реакция страха будет сильнее любой ранее закрепленной оперантной реакции. Парализованная страхом, она будет неспособна думать. Эта собака не в том состоянии, чтобы чему-то учиться.Это же справедливо и для собак, слишком сильно стимулируемых окружающей средой. Возьмите ретривера, любящего купаться. Приведите его к пруду и попросите выполнить простейшую и хорошо освоенную команду – сесть или дать лапу. Если собака действительно помешана на плавании, вряд ли она сможет выполнить хоть одну самую простую команду. Вы можете сто раз повторить команду, все громче и громче, но ваша собака будет вести себя так, как будто вы с ней незнакомы. Классический условный рефлекс вынуждает собаку ассоциировать близость воды с чем-то, что она любит – плавать. Она не «упрямая» или «своенравная». С ней не происходит ничего странного или неправильного. Она не контролирует свои реакции, поскольку классический рефлекс взаимодействует с ее способностью выполнять ранее выученные команды. Понимание того, что это работает классический условный рефлекс, поможет вам разработать план выработки противоположной реакции.

С Павловым на плечах.

В период взросления Баз тоже очень часто бывал так сверхстимулирован, что не мог выполнять команды, выученные ранее с помощью оперантного метода. Как многие щенки бордер-колли, Баз был очень рад людям, другим щенкам, движению... список продолжите сами. Он часто просто не мог думать достаточно ясно, чтобы реагировать на меня. Знаменитый дрессировщик и эксперт по оперантному научению Боб Бэйли говорит: «Павлов сидит у него на плечах». В такой ситуации моей целью было снизить уровень возбуждения База перед тем, как начинать учить его чему-либо (например, посмотрите летопись нашей борьбы в группе воспитания щенков, глава 6).

Стресс блокирует – или по крайней мере, ослабляет – способность учиться. Поэтому вы не всегда можете предсказать, как ваш щенок поведет себя в новой обстановке. Он может быть возбужден видом остальных щенков в группе или напуган детьми в парке. Независимо от причины, стресс может парализовать вашу собаку до того, что она становится неспособна отвечать на команды, которые она раньше «знала». Вы должны сначала уменьшить или снять стресс от окружения, прежде чем пытаться учить собаку. Пока вы не уменьшите или не снимете беспокойство собаки, любые попытки тренировать ее будут безуспешны.

Выработка противоположных условных рефлексов: борьба огня с огнем.

Есть два доступных варианта, с помощью которых можно попытаться преодолеть негативные эффекты классических условных рефлексов. Первый – погружение. Например, щенок боится плавать. Если вы возьмете этого зверька с выпученными от страха глазами и бросите в воду, он может быстро понять, что плавать – не так уж и страшно. Погружение, если оно имеет успех, может быть очень быстрым способом преодолеть боязнь. Оборотная сторона метода погружения в том, что если животное не смогло справиться со страхом, то, вместо того, чтобы уменьшиться, боязнь усилится. Щенок, который просто осторожничал при общении с водой, будет теперь впадать в панику при виде ее.

Менее рискованный, но и потенциально более продолжительный метод – десенситизация и выработка противоположного условного рефлекса. Десенситизация включает предъявление раздражителя или пугающей/возбуждающей среды на таком низком уровне, на котором собака его выдерживает и ведет себя как обычно. Постепенно вы можете увеличивать продолжительность или интенсивность раздражителя, по мере того, как собака привыкает к нему. Более активный процесс, чем десенситизация – выработка противоположного условного рефлекса, где используется поощрение для создания нового, более желательной реакции на возбуждающую или пугающую среду или раздражитель. Во время этого процесса вы наносите встречный удар страху или перевозбуждению, вырабатывая еще более сильную реакцию на приятный или успокаивающий раздражитель.

"Создавая успех" проведет вас через все этапы, которые я прошла, чтобы десенситизировать и перенаправить возбуждение и страхи База. Во время этих занятий я использовала условные рефлексы, чтобы победить эффекты ранее закрепленных реакций. Например, если во время прогулки на поводке Баз видел детей, он вопил и лаял, пытаясь подойти к ним, чтобы поздороваться и поиграть. Чтобы переучить его, я использовала помощь нескольких детей. Я просила одного из них пройти мимо открытой двери комнаты, в которой находился Баз. Каждый раз, когда ребенок проходил, я позволяла Базу поиграть в перетягивание игрушки. Он скоро выучил, что когда он видит детей, вместо того, чтобы скулить, он может рассчитывать на веселую игру со мной.

Как научиться учиться.

Все нормальные животные рождаются со способностью учиться на последствиях своего поведения; то есть, животное будет экспериментировать с предлагаемыми вариантами поведения, которые приносят ему желаемые результаты, чтобы увеличить количество получаемого поощрения. В общей практике мы называем такое животное «оперантным». Новорожденный щенок старается держаться поближе к матери или однопометникам, чтобы было теплее. Тепло их тел поощряет щенка за движение. По мере развития щенок становится все сообразительнее насчет потенциального поощрения от окружающей среды. Собаки могут научиться переворачивать мусорное ведро, чтобы получить поощрение от его содержимого. Животное методом проб и ошибок выясняет, что работает, а что нет.

Заблуждение о «неоперантной» собаке.

Многие верят, что собака должна научиться быть «оперантной» (в неправильном, но популярном выражении). При этом они имеют в виду, что собака должна быть выдрессирована свободно предлагать варианты поведения, без подсказки хозяина. Это не так. Правда в том, что это хозяева собак должны научиться сопротивляться искушению думать за собаку. Традиционно люди наталкивают собаку на нужные действия с помощью лакомства или нажатия на круп, чтобы собака села или легла. Если бы все владельцы понимали законы, по которым обучаются все животные, они бы умели позволить собаке предлагать варианты, из которых владелец мог бы выбирать, какие подкреплять, а какие нет. Если собака обучалась за кусочек лакомства выполнять все действия, что поощрялось? Пассивность: животное получало награду за безделье. Собака учится ждать и понимает, что отсутствие действий с ее стороны вызовет кусочек еды. Поскольку поощрение создает поведение, неудивительно, что собака не предлагает своих реакций, если вы пытаетесь дрессировать ее, позволяя ей проявить инициативу, а не просто следовать за куском. С чего бы она это стала делать? Она научилась, что сидеть и ждать, пока куском покажут, что сделать - самое поощряемое поведение, которое она может предложить. Хотя некоторые могут обвинить эту собаку в том, что она не «оперантна», правда в том, что она просто продолжает предлагать самое поощряемое поведение – не делать ничего!

«Оперантная» собака, таким образом, осознает потенциальное наличие награды за предложение поведения во время дрессировки. Ее ум участвует в процессе; она готова учиться; она охотно экспериментирует, предлагая варианты поведения. Такое животное поистине дрессируемо и являет собой именно то, о чем мечтает каждый дрессировщик. Успех дрессировки такого животного зависит от способности дрессировщика контролировать то, что является поощрением для собаки. Он должен постепенно усложнять задачу животного, в то же время сохраняя уровень поощрения, при котором животное продолжает попытки «заработать» его. Любой дрессировщик может создать такого внимательного студента, «подготовив почву» и «поднимая ставки».

Готовим почву.

Дрессировщики собак используют и классические, и оперантные условные рефлексы, формируя поведение собаки. Обычный пример классического условного рефлекса – сочетание звука кликера с поощрением, которое нравится собаке, т.е. лакомством или игрушкой (см. главу 4). Для начала, дрессировщик обычно кликает, потом кормит собаку, снова кликает и кормит (всегда в этом порядке). Клик должен идти первым, поскольку вы вырабатываете у собаки условную реакцию выжидания на звук кликера. Через несколько повторений (от 15 до 25 кликов и поощрений) у собаки появляется позитивная ассоциация между звуком щелчка и ценным поощрением. Когда эта связь установилась, собака будет радоваться щелчку, поскольку он предвещает любимое лакомство. Кликер (как и звонок Павлова) становится условным или вторичным подкреплением. Тем же способом можно сделать любое слово условным подкреплением, если вы свяжете для собаки это слово с чем-то, что нравится собаке (лакомством или игрушкой). Когда собака поймет, что ее поведение контролирует поощрение, вы можете использовать этот принцип для обучения.

Поднимаем ставки: механика создания поведения.

Когда собака свяжет свое поведение с вторичным подкреплением и всякими хорошими вещами, вы можете использовать оперантное научение, поощряя любые желательные действия собаки. Этот процесс называется «создание поведения». Если у вас реалистичные ожидания, и вы примените принципы Торндайка и Скиннера, вы можете добиться от собаки любого поведения, на которое она физически вообще способна. Потребуется некоторое терпение, пока вы сами не научитесь действовать правильно, но самому созданию поведения можно научиться очень быстро. Это результат ожидания от собаки чего-то большего или отличного от того, что она только что предложила.Например, если ваш новый щенок смотрит на вас, кликните и поощрите его. Здесь клик одновременно и «отмечает», что щенок предложил правильное поведение, и предсказывает награду. Через несколько поощрений за это, задержите чуть-чуть щелчок (поднимите ставку). Вы больше не поощряете щенка просто за то, что он взглянул на вас; он должен постараться больше. Подождите, потом щелкните (отметьте) и наградите за следующее желательное действие, которое предложит щенок – сядет, ляжет, попятится. Если следующий вариант нежелателен (лай, прыжки или царапание), замрите и ничего не делайте. Нежелательное поведение, которое не поощряется, исчезнет само. Вы отбираете предлагаемые собакой варианты поведения. Вы дрессируете собаку, подкрепляя нужные действия и игнорируя нежелательные.Обратный порядок предъявления раздражителей работает редко.

Для выработки классического условного рефлекса на нейтральный раздражитель, подкрепление (еда или игрушка) должны поступить после нейтрального раздражителя (звонка).

Звонок(щелчок) + пища = условный рефлексна звонок или щелчок

Многие ученые пытались поменять последовательность действий, сначала предъявляя первичное подкрепление (пищу), а затем звоня в звонок. Но эти эксперименты с обратным порядком предъявления нейтрального раздражителя и приятного поощрения не имели успеха. Поэтому поймите, насколько важно сначала кликать, а потом поощрять собаку во время дрессировки. Когда некоторые тренеры используют еду или игрушку, чтобы провести собаку по трассе аджилити, это тоже в какой-то степени обратный порядок предъявления раздражителей. Если вы ведете собаку через препятствие, маня ее кусочком, вы теряете возможность выработать у собаки условный рефлекс на препятствие как на нечто приятное. Во время начального обучения База снарядам я предлагала ему поощрение после того, как он выполнял мое задание, например, проносился сквозь туннель, и таким образом вырабатывала условный рефлекс на сами препятствия. Дрессировка таким образом позволяет собаке связать поощрение с работой и перенести ценность. Возбуждение, которое собака испытывает от награды, переносится на само препятствие как таковое. В результате, только один вид снарядов аджилити волновал База, так как обещал возможность заслужить поощрение.

Препятствие аджилити + Подкрепление = Условная реакция на препятствие аджилити

Последствия поведения.

В оперантном научении каждое поведение влечет за собой один из четырех вариантов последствий, которые и влияют на обучение. Заметьте, что слова положительный и отрицательный, которые обычно ассоциируют с хорошим или плохим, просто описывают, что что-то прибавилось (положительный) или убавилось (отрицательный). Поощрение всегда увеличивает вероятность поведения, в то время как наказание подавляет поведение. Знание этих фактов поможет вам понять, что «положительная» дрессировка далеко не всегда хороша.

Положительное подкреплениеСобака получает что-то желаемое, что в дальнейшем увеличивает частоту данного поведения. Пример: дача собаке лакомства за выполнение команды «Сидеть»

Положительное наказаниеДобавление чего-то нежелательного, чтобы подавить реакцию собаки. Пример: одергивание поводком собаки, которая тянет

Отрицательное подкреплениеИзъятие чего-то нежелательного и таким образом, подкрепление поведения. Пример: дрессировщик, который щиплет собаку за ухо, пока она не откроет пасть, чтобы взять гантель (собака находит избавление от боли поощряющим)

Отрицательное наказаниеЛишение чего-то желаемого, чтобы подавить реакцию собаки. Пример: закрыть собаку, которая прыгает на гостя

Могучее сочетание.

Использование сочетания классических и оперантных условных рефлексов дает дрессировщику гибкие и надежные инструменты для обучения любого животного. Вы можете использовать классические условные рефлексы, чтобы связать любое ранее нейтральное поведение (слалом, выдержка сидя) с тем, что любит ваша собака (игра, мясо, плавание), чтобы создать драйв и возбуждение при выполнении этих действий.

Перенесение ценности: превращаем кротовый холмик в гору.

Эта книга описывает много примеров выработки классических условных рефлексов. Например, когда Баз впервые увидел короткий туннель, это был нейтральный раздражитель – он ничего не значил для него. Я кликала и поощряла его игрушкой, пока он не начал пробегать сквозь туннель. Используя положительное подкрепление, я вскоре выработала у База условную связь с туннелем, такую же, как и с поощрением, которое он получал за него. Мастерство в дрессировке требует понимания этого процесса. В этом случае высокая ценность подкрепления игрой перешла и на туннель. Поскольку туннель давал возможность поиграть, Баз очень скоро начал радоваться и заводиться, как только он его видел. Таким образом я использовала драйв, который был у База относительно игры, чтобы создать драйв к работе.

Принцип Примака.

Когда Баз выучил вид снарядов аджилити, он быстро стал одержим «бегать аджилити». Ценность препятствий стала огромной для него, так что он не мог дождаться тренировки. Он тянул и рыл землю лапами, идя на поводке к полю со снарядами.Мне пришлось искать способ контролировать его при подходе к полю, так что я использовала принцип Примака. Дэвид Примак заметил, что доступ к высоковероятному поведению (в данном случае, преодоление препятствий) может поощрять низковероятное поведение (спокойный подход к полю со снарядами на провисшем поводке), или, простыми словами, чтобы получить то, что ты хочешь, сделай сначала то, что я хочу.

В сущности, то, что я делала, было просто еще одной задачей по перенесению ценности. Для База подход на провисшем поводке и спокойное ожидание того, пока я открою ворота на поле со снарядами, изначально не имели той притягательности, какой обладало аджилити. Если бы я физически или голосом корректировала База, то я бы подавила реакцию выхода из-под контроля, но не исключила бы ее окончательно; его пришлось бы попр

dogschool.ru

Часть 4: основы теории научения.

Теперь давайте немного отвлечемся от поведенческих цепочек, чтобы познакомиться с оперантным и классическим обусловливанием. Мы объединим эти понятия позже, когда будем рассматривать более сложные сценарии.

Оперантное обусловливание (оперантное обучение, условный рефлекс) – это один из путей, которым животные учатся чему-то новому. Оно заключает в себя простое утверждение «если/то». Животное осознанно понимает, что «если я делаю Х, то ты делаешь Y». Так, если собака садится, собака получает лакомство. Осознанность играет здесь очень большую роль. Животное должно понимать, как его поведение влияет (или не влияет) на результат. В предыдущих частях мы обсуждали поведенческие цепочки, и все они были основаны на оперантном обучении.

Классическое обусловливание (безусловный рефлекс) – это еще один способ, которым животные учатся. Это простая ассоциация между двумя вещами. Она может включать эмоции (радость, грусть, нервозность), физические реакции (больше или меньше движений) или непроизвольные реакции (слюнотечение, гормональный выброс и т.д.) С точки зрения собаки цепочка поведения на классическом обусловливании может выглядеть так: «Хозяйка готовит мою еду. Когда еда будет готова, я буду есть. Я люблю есть! Слюни образуются у меня во рту, потому что готовка еды происходит всегда перед тем как я ем. Процесс еды делает меня счастливым. Ощущения счастья делает меня взволнованным и заставляет мое тело двигаться активней. Когда я вижу еду, я чувствую себя настолько возбужденным, что я начинаю прыгать по кухне!»

Теперь перед вами цепочка поведения на безусловном рефлексе – собаке не надо «обдумывать» что либо, чтобы запустить эту цепочку. Собаке достаточно несколько раз поприсутствовать при приготовлении еды, чтобы цепочка сформировалась. И в оперантном и в классическом обусловливании был процесс научения. Но в первом случае это было сознательное событие, а во втором – нет.

Процесс научения был? Да. Научение вызвало ожидаемые изменения в собачьем поведении? Да. Было ли это сознательное решение – пускать слюни, чувствовать возбуждение и прыгать вокруг? Нет. Это безусловный рефлекс на процесс еды и ее приготовления как противоположность осознанному выбору. Но конечный результат одинаковый – поведенческая цепочка сформировалась. На самом деле, большинство примеров научения имеют в себе оба компонента: классический и оперантный, но для простоты, мы пока что не будем это рассматривать.

Люди так же испытывают на себе оперантное и классическое научение.

Мне недавно пришлось испытать на себе реакцию на классическое обусловливание. Мои новые друзья присоединились ко мне на тренировке, и мы решили потренировать работу в ринге. Один из друзей взял на себя роль судьи и вызвал меня в ринг. И я почувствовала, как начинаю нервничать! И хотя я отлично знала, что это не состязания, меня все равно захлестнули эмоции, которые я испытываю на настоящих состязаниях, когда судья вызывает меня в ринг. Я начала проявлять усиленные требования к поведению моей собаки, а мое сердце стало биться чаще. Логично ли? Нет. Я знала, что это не состязания. Но классическое обусловливание не должно быть логичным. Оно просто есть.

Итак, теперь, когда мы понимаем, что классическое обусловливание «просто случается», какое отношение это имеет к тренировкам? Когда вы учите собаку ходить рядом, имеет ли это какое-то отношение к классическому научению?

Да, потому что собака начинает ассоциировать вас со всем процессом обучения. Какие бы эмоции собака не испытывала во время тренировки, они будут так же распространяться и на ваше присутствие как тренера. Это называется условно-рефлекторная эмоциональная реакция (Conditioned Emotional Response), и она образуется через классическое обусловливание. Ваша собака не выбирает быть счастливой, когда вы готовите еду; это происходит само. Собака не сама решает стать счастливой в начале тренировочной сессии с тренером, который использует большое количество вкусного лакомства; это происходит само. Это отличная новость для тех из нас, кто соревнуется в таких мероприятиях, где нельзя использовать лакомство. Мы не можем принести игрушки и лакомство в ринг, но мы всегда приносим с собой условно-рефлекторную эмоциональную реакцию собаки. Если реакция положительная, то наше присутствие дает собаке отличную эмоциональную поддержку, потому что одно наше присутствие уже делает собаку «счастливой».

И оперантное и классическое обусловливание приводят к обучению чему-то новому, и оба требуют понимания, когда вы решаете, как отреагировать на поведение собаки в определенный момент времени.

Чтобы оперантная поведенческая цепочка сформировалась, собака должна знать, что это поведение имеет последствия. «Каждый раз, когда я смотрю на хозяйку в положении рядом, я получаю лакомство». Собака пробует другие варианты поведения (нюханье, взгляд в сторону и т.д.), но находит, что они не работают и вскоре собака понимает, что единственный путь к лакомству – это смотреть на хозяйку постоянно.

Это очень отличается от собаки, которая кружится и прыгает, пока готовится ее еда.

Но что если хозяину не нравится, что собака вертится все это время? Тогда хозяин может сделать так, что еда будет исчезать каждый раз, когда собака начинает крутиться. Это приведет к тому, что собака переключится в режим оперантного научения. Собака будет стараться понять, почему еда исчезает. Собака начнет объединять свое поведение (которое до этого времени, вероятно, было бессознательным) беспокойства с тем, что еда исчезает. Тогда она попробует другие варианты, чтобы проверить работают ли они лучше. Например, «если я тихо сижу, то еда продолжает накладываться в миску, а когда я начинаю крутиться, еда исчезает».

В вышеприведенном примере, вы переключили с безусловного рефлекса на условный, чтобы повлиять на поведенческую цепочку. Время подачи сигнала очень важно в данной ситуации. Если еда исчезает на первой же секунде, как собака начинает кружиться, то собака быстро поймет связь. Но если владелец непоследователен (иногда кружение собаки заставляет еду исчезнуть, иногда нет) или если владелец реагирует слишком медленно (собака вертится уже 5 секунд, а хозяин только начал убирать еду), собаке будет гораздо сложней понять, что же заставляет еду появляться и исчезать. Так же, чем дольше игнорировался выработавшийся безусловный рефлекс, тем сложнее собаке осознать, каких изменений хочет хозяин.

Поведем итог. Классическое и оперантное обусловливание различаются, но они связаны. ВСЕ оперантное научение включает в себя и классическое научение, потому что собака бессознательно вырабатывает эмоциональную реакцию на процесс тренировки. Будем верить, что это только радость, позитив и энтузиазм, потому что эта безусловная реакция влияет на чувства собаки к тренеру. В то время как все оператное научение включает в себя классическое, обратное утверждение было бы неверно. Не все классическое научение является оперантным.

Вы смогли прочитать это все… Почему вас должна волновать эта тема? Потому что понимание классического научения – это единственный путь понять, почему я так часто даю собаке лакомство или игрушку, даже если поведение меня не устраивает. В этих ситуациях, я выбираю поставить на первое место эмоциональное состояние собаки. А это тема следующей статьи.

Смотрите так же:

Часть 3: работаем с обобщениями.

Часть 5: щенячий подзыв

justdogs.ru

ИМИТАЦИОННОЕ НАУЧЕНИЕ. Теоретические основания дрессировки

ИМИТАЦИОННОЕ НАУЧЕНИЕ

Имитационным научением или подражанием называют особую форму научения у животных в условиях общения, когда одно животное следует примеру другого.

Различают инстинктивное подражание у животных (взаимную стимуляцию), например, присоединение животных к кормящимся особям, бегство, реакцию следования и т. п. У собак инстинктивное подражание можно наблюдать при групповых занятиях по развитию злобы и недоверчивости к посторонним, исполнению команды «ГУЛЯЙ!». Таким же образом одна собака может научить другую подбирать пищу с земли или играть с предметом.

Настоящее имитационное научение происходит тогда, когда расширяется и обогащается врожденный репертуар поведения путем заимствования чужого опыта, чаще всего подражания детенышей действиям взрослых особей.

Установлено, что животные с первых дней рождения копируют поведение матери по отношению к животным своей стаи, животным другого вида и человеку. Позднее происходит подражание пищедобывательному поведению и оборонительным реакциям.

Значение имитационного научения в ранний период жизни огромно. Лишение возможности подражания животным своего вида приводит к необратимым изменениям поведения, так как подражание у животных является «социальным» способом передачи информации.

Ч. Дарвин считал, что подражание играет огромную роль в формировании поведения. В качестве примера он приводил собственную собаку, которая, воспитываясь вместе с котятами научилась кошачьей привычке умываться. Эту привычку она сохранила в течение последующих тринадцати лет жизни. И.П. Павлов постоянно подчеркивал, что рефлекс подражания управляет поведением человека и животных. Подражая, молодые животные совершенствуют свои врожденные безусловнорефлекторные поведенческие акты. Ученые давно обратили внимание на эту форму научения. Еще в школе Павлова В.Я. Кряжев (1935) впервые наблюдал условное слюноотделение у собак, после того как они многократно видели, как по сигналу кормят других собак. Сравнивая подражательные условные рефлексы у павианов и собак, М.П. Штодин (1941) обнаружил, что внешнее торможение этих рефлексов менее выражено у собак, а у павианов больше случаев подражательного угашения рефлексов. По его мнению подкреплением подражательных условных рефлексов служит вид натурального подкрепления другой особи и кинестезия от движения собственных мышц. У детенышей обезьян подражание развито лучше, чем у взрослых. По данным Л.Г. Воронина и Г.И. Ширковой (1948), детеныш лапундер-макаки начиная с семинедельного возраста стал перенимать у матери «побежку» к кормушке по сигналу, а к 10-й неделе он уже тормошил мать и тянул ее к кормушке, если она задерживалась. При этом детеныш не получал пищевого подкрепления.

Лучше всего развито подражание у антропоидных обезьян. Они могут перенимать довольно сложные цепи условных рефлексов, состоящие из 8—10 движения, и переделку положительных реакций в отрицательные и наоборот (Ширкова, 1965).

По наблюдениям израильских ученых ха крысами в естественной среде, взрослые крысы неспособны научиться открывать шишки методом проб и ошибок, они лишь грызут шишки случайным образом, Детеныши способны обучаться наблюдая за опытной крысой. Опыты по перекрестному выращиванию детенышей от матерей не владеющих техникой открывания показывают, что речь идет не о генетическом, а о культурном процессе передаче навыка. В последнем эксперименте взрослым неопытным крысам предлагали шишки с последовательно увеличивающимся количеством снятых чешуек. Большинство таких крыс обучилось обдирать шишки.

Высшим проявлением имитационного научения является имитационное решение задач, которое происходит путем лишь одного наблюдения за действием другой особи. Считается, что такое научение происходит крайне редко. Классическим примером этому является обучение синиц лазоревок Англии протыкать клювом крышки молочных бутылок и выпивать сливки.

Чаще всего имитационное научение используют для натаски охотничьих собак. Такой способ считается наиболее легким, но замечено: хотя молодые собаки способны копировать все поведение, они легче усваивают отрицательные, с точки зрения человека, навыки. Хотя по свидетельству И.И. Шидловского (он пишет об этом в своей книге «Cобака-ищейка и розыск с ней» Ленинград, Издание Леноблохотсоюза, 1931) в Саратове и служебных собак милиции «учили по способу «перенимания», заключающегося в том, то все упражнения сначала показывали на работе уже вполне обученных, образцовых собак и в течение недолгого времени обучавшиеся собаки, подражая уже ранее выдрессированным, усваивали первоначальные упражнения по общему послушанию». Далее он приводит в качестве примера имитационный способ обучения собаки навыку подачи голоса, ссылаясь на известного немецкого дрессировщика того времени Р. Герсбаха: «на глазах своей собаки подавать команду «голос» другой, уже выдрессированной и после каждой подачи ее хвалить и ласкать». «Инстинкт подражания и самолюбия, говорит Р. Гресбах, очень скоро заставят вашу собаку дать голос». Способ хороший, верный, но мы добавим на основании своей практики, что еще лучше и вернее будет, если мы на глазах дрессируемой собаки будем дрессированную за каждую подачу голоса награждать не похвалами и ласками, а какими-либо вкусными кусочками».

Для обучения методом подражания используют хорошо отдрессированную послушную собаку. Лучшие результаты достигаются при использовании собаки более старшего возраста, живущей совместно с молодой, что связано с доминированием. Например, у обезьян подражание более вероятно, если инициатива исходит от доминирующих особей. Однако у животных всегда есть исключения. Так японские этологи наблюдали над стадами обезьян в их естественной среде. Когда ученые смогли подходить близко к самым молодым животным, они стали в их присутствии мыть в воде бататы перед едой, Исследователи быстро убедились в том, что молодые обезьянки начали подражать такому поведению, а через некоторое время оно появилось и у их матерей. Вскоре этот навык усвоили все особи стада, за исключением самых старых, которые оказались к этому совершенно неспособны.

Применяя имитационное научение можно отработать у щенка исполнительные команды «КО МНЕ!», «ГУЛЯЙ!», информационную команду «ЧУЖОЙ!» и преследование нарушителя, легче отработать команду «МЕСТО!», навыки аппортировки предмета, плавания и преодоления препятствий.

Используя эту форму научения при воспитании и дрессировке, в качестве примера подражания желательно использовать знакомую для щенка собаку, спокойную и доброжелательную по отношению к нему. Лучше, если щенок будет демонстрировать по отношению к ней позу подчинения. Так, например, дрессировщики лосей считают, что для ускорения выработки у лосят желательных навыков и управляемого поведения следует начинать работать именно с лосятами-доминантами, используя рефлекс подражания остальных лосят группы.

Нельзя использовать приемы воздействия на показательную собаку и щенка, вызывающие болевые ощущения и оборонительную реакцию. Показательная собака (собака-актер), не должна демонстрировать страх при выполнении приемов. Замечено, если «актер» за свой поступок получила поощрение, то ей подражают охотнее, чем в этом случае, если она была наказана. Особенно важно проводить занятия без отвлекающих раздражителей, мешающих наблюдению за показательной собакой и отвлекающих щенка. Необходимо также, чтобы особь-зритель наблюдала не только последовательность действий, но и их результат (подкрепление), а потребность в получении такого же подкрепления должна быть очень выражена.

Поделитесь на страничке

Следующая глава >

bio.wikireading.ru

Владимир Гриценко - Теоретические основания дрессировки

2. Отмена положительного подкрепления несет информацию отрицательного подкрепления.

3. Вариабельный режим подкрепления способствует более быстрому закреплению действия и более медленному его угашению.

Многократное повторения действия, связанное с изменением режима подкрепления и сменой мотивации, обеспечивает автоматизацию поведенческого акта до навыка.

ИМИТАЦИОННОЕ НАУЧЕНИЕ

Различают инстинктивное подражание у животных (взаимную стимуляцию), например, присоединение животных к кормящимся особям, бегство, реакцию следования и т. п. У собак инстинктивное подражание можно наблюдать при групповых занятиях по развитию злобы и недоверчивости к посторонним, исполнению команды "ГУЛЯЙ!". Таким же образом одна собака может научить другую подбирать пищу с земли или играть с предметом.

Значение имитационного научения в ранний период жизни огромно. Лишение возможности подражания животным своего вида приводит к необратимым изменениям поведения, так как подражание у животных является "социальным" способом передачи информации.

Ч. Дарвин считал, что подражание играет огромную роль в формировании поведения. В качестве примера он приводил собственную собаку, которая, воспитываясь вместе с котятами научилась кошачьей привычке умываться. Эту привычку она сохранила в течение последующих тринадцати лет жизни. И.П. Павлов постоянно подчеркивал, что рефлекс подражания управляет поведением человека и животных. Подражая, молодые животные совершенствуют свои врожденные безусловнорефлекторные поведенческие акты. Ученые давно обратили внимание на эту форму научения. Еще в школе Павлова В.Я. Кряжев (1935) впервые наблюдал условное слюноотделение у собак, после того как они многократно видели, как по сигналу кормят других собак. Сравнивая подражательные условные рефлексы у павианов и собак, М.П. Штодин (1941) обнаружил, что внешнее торможение этих рефлексов менее выражено у собак, а у павианов больше случаев подражательного угашения рефлексов. По его мнению подкреплением подражательных условных рефлексов служит вид натурального подкрепления другой особи и кинестезия от движения собственных мышц. У детенышей обезьян подражание развито лучше, чем у взрослых. По данным Л.Г. Воронина и Г.И. Ширковой (1948), детеныш лапундер-макаки начиная с семинедельного возраста стал перенимать у матери "побежку" к кормушке по сигналу, а к 10-й неделе он уже тормошил мать и тянул ее к кормушке, если она задерживалась. При этом детеныш не получал пищевого подкрепления.

Лучше всего развито подражание у антропоидных обезьян. Они могут перенимать довольно сложные цепи условных рефлексов, состоящие из 8-10 движения, и переделку положительных реакций в отрицательные и наоборот (Ширкова, 1965).

Чаще всего имитационное научение используют для натаски охотничьих собак. Такой способ считается наиболее легким, но замечено: хотя молодые собаки способны копировать все поведение, они легче усваивают отрицательные, с точки зрения человека, навыки. Хотя по свидетельству И.И. Шидловского (он пишет об этом в своей книге "Cобака-ищейка и розыск с ней" Ленинград, Издание Леноблохотсоюза, 1931) в Саратове и служебных собак милиции "учили по способу "перенимания", заключающегося в том, то все упражнения сначала показывали на работе уже вполне обученных, образцовых собак и в течение недолгого времени обучавшиеся собаки, подражая уже ранее выдрессированным, усваивали первоначальные упражнения по общему послушанию". Далее он приводит в качестве примера имитационный способ обучения собаки навыку подачи голоса, ссылаясь на известного немецкого дрессировщика того времени Р. Герсбаха: "на глазах своей собаки подавать команду "голос" другой, уже выдрессированной и после каждой подачи ее хвалить и ласкать". "Инстинкт подражания и самолюбия, говорит Р. Гресбах, очень скоро заставят вашу собаку дать голос". Способ хороший, верный, но мы добавим на основании своей практики, что еще лучше и вернее будет, если мы на глазах дрессируемой собаки будем дрессированную за каждую подачу голоса награждать не похвалами и ласками, а какими-либо вкусными кусочками".

Применяя имитационное научение можно отработать у щенка исполнительные команды "КО МНЕ!", "ГУЛЯЙ!", информационную команду "ЧУЖОЙ!" и преследование нарушителя, легче отработать команду "МЕСТО!", навыки аппортировки предмета, плавания и преодоления препятствий.

Нельзя использовать приемы воздействия на показательную собаку и щенка, вызывающие болевые ощущения и оборонительную реакцию. Показательная собака (собака-актер), не должна демонстрировать страх при выполнении приемов. Замечено, если "актер" за свой поступок получила поощрение, то ей подражают охотнее, чем в этом случае, если она была наказана. Особенно важно проводить занятия без отвлекающих раздражителей, мешающих наблюдению за показательной собакой и отвлекающих щенка. Необходимо также, чтобы особь-зритель наблюдала не только последовательность действий, но и их результат (подкрепление), а потребность в получении такого же подкрепления должна быть очень выражена.

ФОРМА НАУЧЕНИЯ НА ОСНОВЕ ДОМИНАНТЫ

К этой форме научения относятся случаи чрезвычайно быстрого образования условнорефлекторной реакции (1-2 сочетания стимула и подкрепления), на базе гипертрофированной, господствующей потребности (доминанты).

Явление доминанты было открыто А.А. Ухтомским и определено им как "достаточно стойкое возбуждение, протекающее в центрах (мозга) в данный момент, имеющее значение господствующего фактора в работе прочих центров: накапливающее возбуждение из отдаленных источников, но тормозящее способность других центров реагировать на импульсы, имеющие к ним прямое отношение".

Развитие доминанты основывается на тех же закономерностях что и мотивации и, вероятно, отличается только величиной лежащей в ее основе потребности. При доминанте величина потребности становится критической, неудовлетворение ее в данный момент может привести к опасным последствиям для организма, а то и смерти.

Внешне доминанта характеризуется полным подчинением всех прочих реакций организма, которые ведут или могут привести к снятию (удовлетворению доминантной потребности) или снижению состояния доминанты. Наиболее ярким примером доминанты является половая, знакомая многим владельцам половозрелых кобелей. Хотя считается, что кроме основных, пищевой, половой, оборонительной - доминант, любая потребность может привести к формированию доминанты.

Состояние доминанты можно вызвать путем длительного лишения (депривации) животного чего-либо, например, пищи или воды. Или воздействием чрезвычайно сильного (сверхпорогового) раздражителя, например, болевого, или раздражителя вызывающего сильные эмоциональные реакции (страх). В лабораторных условиях удается вызвать состояние доминанты путем многократного воздействия слабых стимулов или непосредственным воздействием на соответствующие центры коры головного мозга.

profilib.org

Научение без подкрепления

И. П. Павлов посвятил изучению условных рефлексов многие годы своей творческой жизни.

Тем не менее он признавал, что рефлекторная теория не в состоянии объяснить многие поведенческие явления животных. В отдельных ситуациях животные приобретают личный опыт, используя механизмы, которые лежат за пределами схемы образования классического или инструментального условного рефлекса.

В ряде случаев животные приобретают сложные индивидуальные адаптации, не получая при этом положительного или отрицательного подкрепления. Сюда можно отнести такие явления, как латентное научение, условно-рефлекторное избегание стимулов, имитационное поведение, инсайт, отсроченные реакции, игровое самообучение.

Латентное научение. Этот тип научения был обнаружен при изучении поведения животных в лабиринте. Оказалось, что крысы исследуют лабиринт без всякого подкрепления: из любопытства. Предварительно ознакомившиеся с лабиринтом животные быстрее научаются решать задачи с подкреплением. Данный тип научения имеет широкое распространение среди животных с развитым чувством «хоуминга». Под этим термином подразумевают способность животных находить путь к своему дому. Хоуминг характерен для многих насекомых (пчел, муравьев, ос, шмелей), птиц (например, почтовых голубей) и млекопитающих (лошадей, собак, в меньшей мере кошек). Все эти животные, попав в незнакомую среду, изучают обстановки без всякого подкрепления. Они создают в голове своеобразные схемы местности — когнитивные карты, — на основании которых оптимизируют свое поведение при возвращении домой.

Условно-рефлекторное избегание неблагоприятных стимулов. У всех видов животных можно наблюдать врожденное свойство избегать контактов с отрицательными стимулами. Но чтобы оно возникло, животному требуется некоторый опыт (личный или коллективный). Так, синантропные животные после первого же знакомства с отравленными приманками тщательным образом избегают контакта с ними и даже мест, в которых отрава была разложена, а для крыс личный опыт контактирования с неблагоприятным фактором необязателен. Им достаточно иметь контакт с животными, пострадавшими от этого стимула.

Условно-рефлекторное избегание неблагоприятных факторов можно наблюдать у многих животных. Например, собака автора миттелыпнауцер до конца жизни (до 15-летнего возраста) проявляла реакцию избегания жаб, ос и пчел, хотя имела единичный опыт контактирования с этими животными в щенячьем возрасте.

Между классическим условным рефлексом и реакцией избегания существует большая разница. В случае с избеганием приманки условный раздражитель (приманка) и отрицательное подкрепление (признаки токсикоза, включающие плохое самочувствие) разобщены во времени и пространстве. Другой характерной чертой условно-рефлекторного избегания является то, что условно-рефлекторное избегание не нуждается в периодическом подкреплении и не подвержено угасательному торможению.

Явление условно-рефлекторного избегания без подкрепления широко распространено в природе. Но оно часто остается незамеченным, поскольку реакция избегания проявляется в форме кажущегося отсутствия внимания к потенциальному источнику опасности.

Имитационное научение. Данный тип научения включает два вида приобретения новых поведенческих паттернов. В раннем онтогенезе широкое распространение получило явление подражания, о чем уже упоминалось выше. Особо развиты способности к подражанию у певчих птиц, врановых, а также у попугаев.

Не лишены этого свойства и млекопитающие. Однако помимо подражания, у представителей класса млекопитающих проявляется другая форма имитационного научения. Она получила название викарного научения. Под этим термином принято понимать копирование животными сложных поведенческих явлений, которые обеспечивают достижение определенной цели. Причем зачастую викарное научение представляет собой самый эффективный способ решения задачи в конкретной обстановке. Типичным и наиболее ярким примером викарного научения можно считать имитацию орудийной деятельности у высших приматов. Скажем, если один шимпанзе освоил использование палки для добывания бананов, то другая обезьяна наверняка начнет повторять действия более смышленого соплеменника.

Не лишены способностей к викарному научению и собаки. Эту способность используют дрессировщики для научения животных сложным формам поведения. Молодую собаку посылают выполнять задачу следом за более опытной. Так быстро научают собак преодолевать полосу препятствий. Некоторые собаки научаются следовой работе по этой схеме.

Отсроченные реакции. При наличии хорошей памяти и сильной мотивации животные решают сложные задачи без немедленного подкрепления. Особенно успешно этим способом решаются задачи, связанные с поиском спрятанного на виду у животного лакомства. Животное видит, куда прячут приманку, но не имеет возможности сразу же ее отыскать. Животному позволяют это сделать спустя некоторое время. Животные хорошо помнят, где прятали приманку, и при первой же возможности направляются именно в это место. Если в отсутствие животного приманку перепрятать, то у обезьян это вызывает недовольство и протест.

Собаки в такой ситуации ведут себя более уравновешенно. Они начинают искать лакомство в других местах. Все эти опыты свидетельствуют о том, что у животных длительное время сохраняется представление о лакомстве и месте, в котором оно было спрятано.

Собаки обладают долгосрочной, длящейся годами памятью на захороненные приманки. Автор со своей собакой некоторое время жил в деревне. Собака принесла домой со скотомогильника телячью бедренную кость. Кость испускала сильный неприятный запах, поэтому была отобрана у собаки и закопана в огороде. За процедурой захоронения лакомой находки с тоской через оконное стекло наблюдала собака. Затем собаку увезли в город. На следующее лето собаку вновь привезли в деревню. Первым делом, которое сделал миттелыннауцер по приезде спустя 12 месяцев, был поход в огород за закопанной костью.

Игровое самообучение. У всех животных заложены программы научения за счет самообучения. Эти программы позволяют интегрировать в единые биологически целенаправленные поведенческие акты врожденные способности и приобретаемые навыки. Игра, в которой многократно повторяются одни и те же действия животного, приводит к оптимизации локомоций молодняка. Котенок, играя с полуживой мышью, научается правильным приемам захвата и умерщвления жертвы. Молодые обезьяны через игры с предметами научаются орудийным навыкам. Молодые петушки периодически совершают движения, характерные для взрослых петухов: подскакивают на месте, принимают угрожающие позы, атакуют воображаемого противника шпорами. Во всех этих случаях животные самообучаются в игре. Процесс научения протекает без подкрепления.

У животных со сложной перцептивной психикой исследователи наблюдают и такое явление, как инсайт, или озарение. Под этим явлением понимают способ решения сложной задачи без запускающего рефлекс раздражителя. Инсайт — внезапное решение задачи без предварительных проб и ошибок.

В проблемной ситуации животные некоторое время не совершают никаких действий, однако вскоре демонстрируют поведенческие адаптации на основе своего прошлого опыта, который они никогда в создавшейся проблемной ситуации еще не применяли. Так, шимпанзе в опытах Келера доставали банан при помощи соединенных вместе палок. Собаки также могут демонстрировать озарение в проблемных ситуациях.

Литературные свидетельства инсайта немногочисленны и относятся исключительно к высшим позвоночным с тонкой психикой — приматам, в меньшей степени к собакам, китообразным. Нейрофизиологические механизмы инсайта остаются неясными. Не исключено, что научение типа инсайт сопряжено с условно-рефлекторной деятельностью высокого порядка. Однако проследить эти связи очень сложно: экспериментальное моделирование этого сложного процесса пока невозможно.

На определенной стадии своего развития животные становятся способными улавливать причинно-следственные отношения между явлениями окружающей среды, т. е. для животных характерна рассудочная деятельность. От условного рефлекса рассудочная деятельность отличается тем, что животное не только отвечает на действие раздражителя, но и предвидит несколько вариантов ответа. Причем реакции могут иметь отсроченный или даже упреждающий характер.

Одним из первых исследователей, кто не просто осмелился заявить о зачатках разума у животных, но попытался представить экспериментальные доказательства его наличия у животных, был профессор Московского Государственного университета Л. В. Крушинский. Изучая поведение служебных собак, он пришел к заключению, что по мере развития личного опыта в процессе онтогенеза у многих собак возникают поведенческие реакции, которые не укладываются в рамки инстинктивного поведения и не поддаются объяснению с традиционных позиций научения. Поведение животных лишь для удобства изучения подразделяют на врожденное и приобретенное. На уровне системной организации поведенческого акта эти разные по происхождению адаптации тесно переплетаются, а на их основе возникает нечто новое.

Норма реакции — это степень изменчивости той или иной составляющей элементарного поведенческого акта, которая задается генотипом животного.

Величина нормы реакции (ее пределы) зависит от уровня эволюционной организации животного, особенностей среды обитания и от генотипа особи.

Л. В. Крушинский считал, что свидетельством зачатков рассудочной деятельности может быть способность животных к экстраполяции своих действий в связи с движением корма. Л. В. Крушинский исходил из того, что так называемые экстраполяционные рефлексы отражают способности животных к выявлению причинно-следственных отношений между отдельными стимулами, а также стимулами и внешней средой, т. е. служат доказательством элементарной рассудочной деятельности.

В экспериментах использовались животные с разным уровнем развития психики: голуби, утки, куры, вороны, сороки, кролики. Все эти животные демонстрировали разный уровень способностей предугадывать (экстраполировать) наступление события. Эта способность отсутствовала у голубей и была хорошо развита у врановых птиц. Кролики демонстрировали одинаковые с курами способности к экстраполяции событий.

Ученый заключил, что «при помощи экстраполяционных рефлексов, осуществляющихся в результате быстро образующихся ассоциаций между раздражителями и внешней средой, достигается возможность элементарного предусмотрения наступления события будущего не только в относительно стабильных, «привычных» для животного условиях, но и в среде с многообразными изменениями отношений между раздражителями».

До Л. В. Крушинского предположения о наличии элементов рассудочной деятельности высказывали и другие исследователи. Так, Н. Н. Ладыгина-Котс воспитывала в своей семье вместе с собственным ребенком детеныша шимпанзе того же возраста. Она констатировала у обезьяны наличие поведенческих явлений, необъяснимых с позиции рефлекторной теории. Обезьяна проявляла способности к анализу информации и принятию решений на основе рассудочной деятельности. Эти выводы подтверждались в экспериментах на обезьянах, которые проводил и W. Н. Thorpe.

Рассудочную деятельность у животных допускал и такой авторитетный исследователь поведения и психики животных, как J. Konorski.

При анализе орудийной деятельности обезьян И. П. Павлов писал: «когда обезьяна строит свою вышку, чтобы достать плод, то это условным рефлексом назвать нельзя. Это есть случай образования знания, уловления постоянной связи между вещами… то, что лежит в основе всей научной деятельности, законов причинности и т. д.».

Таким образом, абсолютно нет оснований говорить о том, что рассудочная деятельность — привилегия только лишь вида Homo sapiens. Животные с тонкой психикой имеют высокоадаптивные поведенческие проявления не в последнюю очередь благодаря наличию элементов рассудочной деятельности.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Welcome to Wehelper

Thanks for Bringing this to Our Attention

Find articles , help , and advice
for getting the most out of Wehelper

always availabl
for our customers

ГЛАВА ПЕРВАЯ. Краткий экскурс в науку о дрессировке. Научение собак это

1.3. Общая методика дрессировки. Формы научения и способы дрессировки собак для поиска взрывчатых веществ, взрывных устройств, оружия и боеприпасов

Негативное научение собаки, привыкание животного условные рефлексы, ориентировочная реакция воспитания собаки, раздражающим действиям, дрессировка собаки

ГЛАВА ПЕРВАЯ. Краткий экскурс в науку о дрессировке

Два типа научения.

Классический условный рефлекс.

Павлов и его истекающие слюной собаки.

Оперантное научение.

Когда правят классические условные рефлексы.

С Павловым на плечах.

Выработка противоположных условных рефлексов: борьба огня с огнем.

Как научиться учиться.

Заблуждение о «неоперантной» собаке.

Готовим почву.

Поднимаем ставки: механика создания поведения.

Последствия поведения.

Могучее сочетание.

Перенесение ценности: превращаем кротовый холмик в гору.

Принцип Примака.

Часть 4: основы теории научения.

ИМИТАЦИОННОЕ НАУЧЕНИЕ. Теоретические основания дрессировки

Владимир Гриценко - Теоретические основания дрессировки

ИМИТАЦИОННОЕ НАУЧЕНИЕ

ФОРМА НАУЧЕНИЯ НА ОСНОВЕ ДОМИНАНТЫ

Научение без подкрепления

Welcome to Wehelper

Thanks for Bringing this to Our Attention

Find articles , help , and advice for getting the most out of Wehelper

always availabl for our customers

ГЛАВА ПЕРВАЯ. Краткий экскурс в науку о дрессировке. Научение собак это

1.3. Общая методика дрессировки. Формы научения и способы дрессировки собак для поиска взрывчатых веществ, взрывных устройств, оружия и боеприпасов

Негативное научение собаки, привыкание животного условные рефлексы, ориентировочная реакция воспитания собаки, раздражающим действиям, дрессировка собаки

ГЛАВА ПЕРВАЯ. Краткий экскурс в науку о дрессировке

Два типа научения.

Классический условный рефлекс.

Павлов и его истекающие слюной собаки.

Оперантное научение.

Когда правят классические условные рефлексы.

С Павловым на плечах.

Выработка противоположных условных рефлексов: борьба огня с огнем.

Как научиться учиться.

Заблуждение о «неоперантной» собаке.

Готовим почву.

Поднимаем ставки: механика создания поведения.

Последствия поведения.

Могучее сочетание.

Перенесение ценности: превращаем кротовый холмик в гору.

Принцип Примака.

Часть 4: основы теории научения.

ИМИТАЦИОННОЕ НАУЧЕНИЕ. Теоретические основания дрессировки

Владимир Гриценко - Теоретические основания дрессировки

ИМИТАЦИОННОЕ НАУЧЕНИЕ

ФОРМА НАУЧЕНИЯ НА ОСНОВЕ ДОМИНАНТЫ

Научение без подкрепления

Find articles , help , and advice
for getting the most out of Wehelper

always availabl
for our customers