Navigation bar
  Print document Start Previous page
 253 of 700 
Next page End  

соседскую.
Дифференцировочная тренировка будет эффективна в той степени, в какой присутствует
дифференцируемый стимул (или набор стимулов), позволяющий четко отличать случаи, где реакция
должна иметь место, от случаев, где ее нужно подавить. Вышеупомянутому маленькому ребенку будет
легче научиться, какую собаку ласкать, если его родители смогут указать на признак собаки,
сигнализирующий о ее дружественности (виляние хвостом, например). Вообще, дифференцировочный
стимул будет полезен в той степени, в какой его присутствие предсказывает, что за реакцией последует
подкрепление, а его отсутствие предсказывает, что за реакцией подкрепления не последует (или
наоборот). Так же, как и в классическом обусловливании, предсказательная сила стимула имеет
решающее значение для обусловливания.
Режимы подкрепления. В реальной жизни отдельные эпизоды поведения подкрепляются редко;
иногда за усердную работу хвалят, но часто она остается непризнанной. Если бы оперантное
обусловливание происходило только при постоянном подкреплении, его роль в нашей жизни была бы
ограниченной. Оказывается, однако, что после того как поведение возникло, оно может
поддерживаться, если его подкреплять только часть всего времени. Это явление известно как частичное
подкрепление, и его можно проиллюстрировать в лаборатории на примере голубя, который научается
клевать ключ, чтобы получать пищу. После того как эта операнта сформировалась, голубь продолжает
клевать ключ с высокой частотой, даже если он получает подкрепление только от случая к случаю.
Иногда голуби, вознаграждавшиеся пищей в среднем один раз за 5 минут (12 раз в час), клевали ключ
6000 раз в час! Кроме того, угасание, следующее за поддержанием реакции на частичное подкрепление
пищей, идет гораздо медленнее, чем угасание, следующее за поддержанием реакции на непрерывное
подкрепление. Это явление известно как эффект частичного подкрепления. Данный эффект понятен на
чисто интуитивном уровне, поскольку если подкрепление для поддержания реакции является лишь
частичным, случаи угасания и поддержания реакции труднее отличить друг от друга.
Когда подкрепление осуществляется только часть всего времени, нам нужно знать, каков в
точности его распорядок: после каждой третьей реакции? или каждые пять секунд? Оказывается, что
режим подкрепления определяет схему реагирования. Некоторые расписания подкрепления называют
пропорциональным режимом, потому что при этом подкрепление зависит от числа совершенных
реакций. Это как на заводе, когда рабочему платят за определенный объем работы. Коэффициент
пропорциональности может быть фиксированным или переменным. При режиме с фиксированной
пропорцией (его называют режимом ФП) число реакций, которые должны совершиться, равно
определенной величине. Если это число составляет 5 (ФП 5), то это значит, что подкрепление последует
по совершении 5 реакций, если оно равно 50 (ФП 50), потребуется совершить 50 реакций, и т. д.
Вообще, чем выше пропорция, тем с большей частотой организм реагирует, особенно если его
первоначально тренировали при относительно низком коэффициенте (скажем, ФП 5), а затем
непрерывно увеличивали коэффициент до величины, скажем, ФП 100. Это как если бы на заводе
рабочему сначала платили по 5 долларов за каждые 5 зашитых швов, но потом настали тяжелые
времена, и ему пришлось за те же 5 долларов делать 100 швов. Но, пожалуй, самая примечательная
особенность поведения при режиме с ФП состоит в том, что сразу после очередного подкрепления в
росте реакций наступает пауза (см. левую часть рис. 7.8). Заводскому рабочему трудно начать новую
серию швов сразу после того, как он сделал их достаточно, чтобы получить вознаграждение.
Рис. 7.8. Типичные схемы реакций на четыре основные режима подкрепления. Каждая
кривая отображает совокупное число реакций животного в зависимости от времени; наклон кривой
отражает частоту его реакций. Кривые слева относятся к пропорциональному режиму. Обратите
внимание на горизонтальные участки кривой для режима с ФП: они соответствуют паузам (нет
роста совокупного числа реакций). Кривые справа отображают условия интервального режима.
Кривая для режима с фиксированным интервалом (ФИ) опять содержит горизонтальные участки,
соответствующие паузам (по: Schwartz, 1989). ФП — фиксированная пропорция; ПП — переменная
Hosted by uCoz