006 - page 203 of 574

203 of 574

Однако научение методом проб и ошибок само по себе не очень эффективно. Если бы новые

формы поведения удавалось «изобрести» лишь случайным образом, было бы трудно объяснить быстрое

приобретение новых навыков людьми и домашними животными. Без сомнения, вполне вероятно, что на

протяжении миллионов лет именно такой процесс приводил к выработке различных навыков у наших

предков. Но не менее очевидно, что по мере совершенствования этих навыков и упрочения власти

человека над окружающей средой постепенно складывались новые способы формирования и передачи

новых типов поведения.

Скиннер — признанный вождь американских бихевиористов в последние 30 лет —

систематизировал теорию Торндайка, пытаясь объяснить, каким образом в структурированной среде

формируется множество различных типов поведения. При этом Скиннер вскрыл принципы

оперантного обусловливания и формирования реакций путем последовательных приближений.

Формирование реакций

С точки зрения Скиннера, поведение не всегда возникает чисто случайным образом — нередко

оно формируется в результате отбора под действием подкрепляющего фактора. Таким фактором может

быть любой стимул, появляющийся или исчезающий после той или иной поведенческой реакции и

повышающий вероятность того, что эта реакция будет повторена с целью получить подкрепление. Это

позволяет объяснить формирование очень сложных поведенческих реакций поэтапно, каждый этап при

этом будет подкрепляться.

Исходя из этих соображений, Скиннер разработал способ формирования поведения путем

последовательных приближений,

составляющий основу оперантного обусловливания. Этот способ

состоит в том, что весь путь от исходного поведения (еще до начала обучения) до конечной реакции,

которую исследователь стремится выработать у животного, разбивается на несколько этапов. В

дальнейшем остается лишь последовательно и систематически подкреплять каждый из этих этапов и

таким образом подводить животное к нужной форме поведения. При таком способе обучения животное

вознаграждают за каждое действие, приближающее его к конечной цели, и у него постепенно

вырабатывается заданное поведение.

Допустим, что нам нужно обучить голубя ударять клювом по маленькому светящемуся кружку,

когда он захочет получить вознаграждение в виде зернышка (рис. 7.5). Вначале мы будем давать ему

зернышко каждый раз, когда он зайдет в ту половину клетки, где находится светящийся кружок. Далее

мы будем вознаграждать его лишь в том случае, если он не только зашел в эту половину клетки, но еще

и повернулся головой к стенке, на которой находится кружок. На третьем этапе можно, например,

давать зернышко при сочетании этих двух условий, если вдобавок еще клюв животного направлен в

сторону кружка. Затем постепенно можно заставить голубя касаться клювом кружка и, наконец, ударять

по нему с целью получить вознаграждение. Как мы видим, при таком методе обучения к очередному

этапу переходят лишь тогда, когда уже сформировалась поведенческая реакция, необходимая на

предыдущем этапе (рис. 7.6).

Рис. 7.5. Голубь в клетке Скиннера реагирует на световой сигнал, появляющийся перед ним на

стенке при освещении пластмассового диска с другой стороны. В ответ на такой сигнал голубь ударяет

по диску клювом, чтобы в кормушке появилось зерно.