Бихевиоризм стимул реакция: Недопустимое название — Циклопедия

Содержание

Бихевиоризм

Бихевиоризм

В самом начале XX века возникло мощное направление, утвердившее в качестве предмета психологии поведение как совокупность реакций организма, обусловленную общением со стимулами среды, к которой он адаптируется. Кредо этого направления запечатлел термин поведение (англ. «бихевиор»), а само оно было названо бихевиоризмом. Его «отцом» принято считать Джона Уотсона (1878-1958), статья которого «Психология, каковой ее видит бихевиорист» (1913) стала манифестом новой школы. Уотсон требовал «выбросить за борт» как пережиток алхимии и астрологии все понятия субъективной психологии сознания и перевести их на язык объективно наблюдаемых реакций живых существ на раздражители.

Ни Павлов, ни Бехтерев, на концепции которых опирался Уотсон, не придерживались столь радикальной точки зрения. Они надеялись, что объективное изучение поведения, в конце концов, как говорил Павлов, прольет свет на «муки сознания». Бихевиоризм стали называть «психологией без психики». Этот оборот предполагал, что психика идентична сознанию. Между тем, требуя устранить сознание, бихевиористы вовсе не превращали организм в лишенное психических качеств устройство; они лишь изменяли представление об этих качествах. Реальный вклад нового направления заключался в резком расширении изучаемой психологией области. Отныне она включала доступные внешнему объективному наблюдению, независимые от сознания «стимул-реактивные» отношения.

Изменились и психологические эксперименты. Они ставились преимущественно на животных — белых крысах. В качестве экспериментальных устройств, взамен прежних физиологических аппаратов, были изобретены различные типы лабиринтов и «проблемных ящиков». Запускаемые в них животные научались находить из них выход. Тема научения, приобретения навыков путем проб и ошибок стала центральной для этой школы, собравшей огромный экспериментальный материал о фактоpax, определяющих модификацию поведения. Материал подвергался дотошной статистической обработке. Ведь реакции животных носили не жестко предопределенный, а статистический характер.

Изменялось воззрение на законы, правящие поведением живых существ, в том числе человека, представшего в этих опытах как «большая белая крыса», ищущая свой путь в «лабиринте жизни», где вероятность успеха не предопределена и царит Его Величество Случай. Исключив сознание, бихевиоризм неизбежно оказался односторонним направлением. Вместе с тем он ввел в научный аппарат психологии категорию действия в качестве не только внутренней духовной (как в прежние времена), но и внешней, телесной реальности. Бихевиоризм изменил общий строй психологического познания, предмет которого охватывал отныне построение и изменение реальных телесных действий в ответ на широкий спектр внешних вызовов. Сторонники этого направления рассчитывали, опираясь на данные экспериментов, объяснить законами научения любые естественные формы поведения людей, такие, например, как строительство небоскреба или игру в теннис.

Необихевиоризм

Формула бихевиоризма была четкой и однозначной: стимул-реакция. Вопрос о тех процессах, которые происходят в организме, о его психическом устройстве между стимулом и реакцией снимался с повестки дня. Такая позиция следовала из философии позитивизма: убеждения в том, что научный факт должен быть непосредственно наблюдаем. Как внешний стимул, так и реакция (ответное движение) открыты для наблюдения каждому, независимо от его теоретической позиции. Поэтому связка «стимул-реакция» служит, согласно радикальному бихевиоризму, незыблемой опорой психологии как точной науки. Между тем, в кругу бихевиористов появились выдающиеся психологи, поставившие этот постулат под сомнение. Первым из них был американец

Эдвард Толмен (1886-1959), согласно которому формула поведения должна состоять не из двух, а из трех членов, и выглядеть следующим образом: стимул (независимая переменная)-промежуточные переменныезависимая переменная (реакция). Среднее звено (промежуточные переменные) есть не что иное как недоступные прямому наблюдению психические моменты: ожидания, установки, знания. Следуя бихевиористской традиции, Толмен ставил опыты над крысами, ищущими выход из лабиринта. Главный вывод из этих опытов сводился к следующему: опираясь на строго контролируемое и объективно наблюдаемое экспериментатором поведение животных, можно достоверно установить, что поведением управляют не те стимулы, которые действуют на подопытных в данный момент, а особые внутренние регуляторы. Поведение предваряют своего рода ожидания, гипотезы, познавательные (когнитивные) «карты». Эти карты животное само строит, по ним ориентируется в лабиринте узнает, «что ведет к чему». Положение о том, что психические образы служат регулятором действия, было обосновано гештальттеорией. Учтя ее уроки, Толмен разработал собственную теорию
когнитивного бихевиоризма.
Другой вариант необихевиоризма связан со школой Кларка Халла (1884-1952). Он ввел в формулу «стимул – реакция» другое среднее звено, а именно потребность организма (пищевую, сексуальную, во сне и др.), придающую поведению энергию и создающую незримый потенциал реакции. Этот потенциал разряжается при подкреплении (понятие, которое Халл заимствовал у И.П. Павлова), и тогда реакция закрепляется, а организм чему-то научается. В защиту ортодоксального бихевиоризма с его игнорированием любых внутренних факторов выступил Бурхус Скиннер (1904-1990). Условный рефлекс он назвал оперантной реакцией. Если у Павлова новая реакция вырабатывалась в ответ на условный сигнал при его подкреплении (например, когда перед кормлением раздавался стук метронома и т. п.), то у Скиннера организм сначала производит движение, затем получает (или не получает) подкрепление. Скиннер сконструировал экспериментальный ящик, в котором белая крыса (голубь) могла нажимать на рычажок (кнопку). Перед подопытным животным была кормушка и набор раздражителей, из которых Скиннер составлял множество различных «планов подкрепления» (например, перед крысой закреплялись два рычага, и она оказывалась в ситуации выбора; или крыса получала пищу только при загорании лампочки после нажатия на рычаг; или пища выдавалась только при нажиме с определенной силой, частотой и т. д.). Последователи Скиннера применяли технику выработки оперантных реакций при обучении и воспитании детей, при лечении невротиков.

Во время второй мировой войны Скиннер работал над проектом использования голубей для управления стрельбой по самолетам. Позже, посетив как-то урок арифметики в школе, где занималась его дочь, Скиннер был поражен, увидев, сколь мало используются данные психологии. Для улучшения преподавания он изобрел серию обучающих машин и концепцию программированного обучения. Он надеялся, опираясь на теорию онерантных реакции, создать программу «изготовление» полей для нового общества.

Работы Скиннера, как и других бихевиористов, обогатили знание об общих правилах выработки навыков, о роли подкрепления (которое служит непременным мотивом этих навыков), о динамике перехода от одних форм поведения к другим и т. п.

Однако интересы бихевиористов не ограничивались проблемой научения у животных. Открыть общие, научно выверенные объективные законы построения любого поведения, в том числе человека,- такова была сверхзадача всего бихевиористского движения. «Человек или робот?» — этот вопрос задавали бихевиористам их противники, справедливо указывая, что, устранив внутреннюю психическую жизнь человека из сферы точного причинного анализа, бихевиоризм трактует личность как машинообразно работающее устройство. Строгость объективного анализа реакций организма достигалась дорогой ценой: сознание переставало быть внутренним регулятором поведения.

Бихевиористы полагали, что, опираясь на формулу «стимул-реакция», удается вывести новую породу людей. Утопичность этого плана явно прослеживается в концепциях типа скиннеровской. Даже применительно к животным Скиннер, как заметили его друзья, имел дело с «пустым организмом», не имевшим ничего, кроме оперантных реакций. Ни для деятельности нервной системы, ни для психических функции в скиннеровской модели места не оставалось. Проблема развития также снималась с повестки дня, будучи подменена описанием того, как из одних навыков возникают другие. Огромные пласты высших проявлений психической жизни, открытых и изученных многими школами, выпадали из предметной области бихевиористской психологии.

Бихевиоризм | Психологическая энциклопедия 1vc0

Бихевиоризм (от англ. behaviour — поведение) — одно из основных направлений американской прагматической психологии, рассматривающее психику лишь как совокупность поведенческих проявлений, реакций на внешние воздействия — стимулы. Бихевиоризм возник в 1913 г. благодаря декларациям Д. Уотсона (1878 — 1958 гг.), изложенным в его статье «Психология с точки зрения бихевиориста». Использовав учение Павлова и исследование поведения животных, осуществленное Э. Торндайком, бихевиористы полагали, что законы научения, приобретения опыта у человека и животных одни и те же. Исключив сознание из сферы своих интересов, бихевиористы интересовались только закономерностями выработки поведенческих навыков.

В 20-х гг. бихевиоризм распался на ряд направлений, а в 30-х гг. возник необихевиоризм (Толмен, Халл). Он подправил первоначальный бихевиоризм, признав промежуточное звено между стимулом и реакцией — введя понятие «промежуточные переменные», к которым были отнесены мотивы, цели и другие «внутренние» компоненты поведения.

Методики исследования формирования навыков, разработанные в бихевиоризме, широко используются в поведенческой психологии.

Задачи бихевиоризма

  • выявить и описать типы реакций. Дж. Уотсон выделяет, прежде всего, врождённые и приобретённые типы. Концепция условных рефлексов принимается в качестве естественнонаучной базы психологической теории.
  • исследовать процесс их образования. Схема образования условного рефлекса: безусловный стимул вызывает безусловную реакцию. Если безусловному стимулу предшествует действие нейтрального условного стимула, то через некоторое количество сочетаний нейтрального и безусловного стимулов действие безусловного стимула оказывается ненужным, безусловную реакцию начинает вызывать условный стимул.
  • изучить законы их комбинаций, т. е. образования сложного поведения. Сложные реакции образуются путём комплексов простых реакций. В итоге ставилась задача прийти к тому, чтобы по ситуации (стимулу) предсказать поведение (реакцию) человека и, наоборот, по реакции заключать о вызвавшем её стимуле, т.е. по S предсказывать R, а по R заключать об S.

Поведение анализировалось с точки зрения мышечных и гормональных реакций как непосредственно наблюдаемых. Реакция – это изменение в организме, которое может быть зафиксировано объективными методами. Реакции следовало изучать в их связи с изменением стимулов. Стимулы могли возникать как в самом организме, так и во внешней среде. Конечная цель – в объяснении механизмов зависимости поведения человека от внешних факторов, а также в целенаправленном его формировании.

Большинство экспериментов бихевиористы проводили на животных, а затем устанавливали закономерности реакций в ответ на воздействие окружающей среды и переносили это на человека.

Манипулируя внешними стимулами, можно создавать у человека разные поведенческие механизмы. Бихевиористы выдвигают формулу, которой, согласно их теории, подчинено всё поведение человека:

S → R

Бихевиористы верно определили зависимость поведения от воздействия среды, но не учитывали обусловленности ответной реакции не только стимулами, но и внутренними явлениями. Можно было подойти к изучению психики человека, изучая психику животных, но необходимо было учитывать и принципиальные различия между ними. Обнаружена чрезвычайная ограниченность схемы S-R. Как правило, S и R находятся в чрезвычайно сложных отношениях, часто связь между ними выявить почти невозможно.

На Уотсона оказала большое влияние концепция рефлекса, достигшая своего расцвета в работах Сеченова, Павлова, Шеррингтона, Бехтерева. Формирование человеческого поведения от непроизвольных движений и крика новорожденного до сложных речевых реакций взрослого Уотсон объяснял Павловскими условными рефлексами.

Знание бихевиористической методологии важно для изучения проблем агрессии. В США большинство ученых, изучающих проблемы агрессии – бихевиористы. Агрессивность – приобретенная форма поведения, определяющаяся тем, что человек стремится добиться максимального преимущества.

Бихевиористы в целом придерживаются принципа: объект научного наблюдения – действие, а не действующий человек. Поэтому они не придают серьёзного значения открытиям З. Фрейда, что поведение человека могут определять сила бессознательного. Поведение нельзя рассматривать в отрыве от действующей личности.

Появление бихевиоризма привело психологию к развитию дальнейших взглядов на организацию психики. Бихевиористы обогатили науку объективными методами и фактами. В 30-е годы XX столетия стало ясно, что невозможно сбросить со счетов роль социальной среды и отношений человека с ней. Идеи бихевиоризма потерпели крах, так как оказалось, что психические явления и поведение не определяются только физиологическими процессами.

Необихевиоризм. Исследователи, развивавшие идеи Уотсона, предлагали ввести в рассуждения ещё одну инстанцию, обозначаемую понятием «промежуточной переменной». Это ответ организма, который не является в строгом смысле реакцией, так как его нельзя конкретно зафиксировать, но он определяет собственно реакцию. Эта промежуточная переменная – опыт человека.

S – O → R

Необихевиористы стали обсуждать проблемы цели, образа. Последователи бихевиоризма:

  • Э. Толмен (предложил промежуточную переменную), экспериментально показал, что крысы, просто бегавшие по лабиринту, быстрее учатся проходить по нему, чем те, у которых не было опыта. Этот опыт он назвал «когнитивными картами».
  • Б. Скиннер. Предположил, что поведение может не определяться стимулом, предшествующим реакции, а вероятными последствиями поведения. Это не означает свободу поведения, но в рамках его подхода и обсуждается программа саморегулирования человека. Не субъект выбирает поведение, но вероятные последствия определяют поведение субъекта.

Бихевиоризм — направления, стимулы, заблуждения

В двадцатом веке на смену эмпирической приходит психология практическая. Американцы ставят науку на материалистическую основу. Вместо внутренних переживаний и сомнений на первом плане в психологии оказывается действие. Появляется новое направление, бихевиоризм, которое в переводе на русский язык означает «поведение». Сторонники нового направления полагали, что предметом изучения в психологии должны быть только те поведенческие реакции, которые можно увидеть и расценить. Наука должна быть только объективной. Когда действия человека доступны с помощью органов чувств внешнему наблюдению психолога, становится ясной мотивация исследуемой личности.

Теория бихевиоризма гласит, что поведение людей диктуется не их мыслями, а обычным механическим воздействием внешней среды. Все очень просто: появившийся стимул порождает определенную реакцию. Под реакцией в бихевиоризме подразумевается такие движения человека, которые он совершает, выполняя то или иное действие; под стимулом – раздражения, идущие из внешнего мира, доступные наблюдателю.

Поскольку между стимулами и реакциями существует закономерная связь, бихевиоризм учит, что, познав принципы такой взаимосвязи, можно добиться от человека и общества необходимого поведения в различных ситуациях. При этом вовсе нет необходимости исследовать внутренние психические переживания.

Теория бихевиоризма

Такие понятия, как «осознание» и «переживание» нового направления психологии утратили всякую значимость. Теория бихевиоризма признает только конкретное действие и не менее конкретный стимул, который виден для всех окружающих. Все внутренние эмоции считаются субъективными. Один человек переживает «за разбитую чашку», другой – считает, что подошло время замены посуды. Так или иначе, оба идут и покупают новую чашку. В этом основной принцип, лежащий в основе теории бихевиоризма, стимул порождает реакцию, все остальное является временным и наносным.

Кроме того, бихевиоризм полагает, что все стимулы должны подлежать документальному подтверждению, фиксироваться вешними объективными средствами. Полагаться на самонаблюдение психологу не следует ни в коем случае. Основоположник учения бихевиоризма Джон Уотсон вывел формулу: стимул – реакция. Только стимул побуждает человека к какому-либо действию и определяет его характер. Вывод: нужно делать как можно больше опытов с регистрацией данных и дальнейшим глубоким анализом полученной информации.

Безевиоризм, как учение о поведении, также распространяется на животный мир. Поэтому бихевиористы приветствовали учение Павлова и пользовались его результатами.

Новое направление бихевиоризма приобрело популярность, так как отличалось простотой и доступностью понимания. Но, вскоре, оказалось, что не все так просто. Некоторые стимулы вызывают не одну, а сразу несколько реакций. Учение нуждалось в обновлении.

Направления бихевиоризма

Кризис бихевиоризма был разрешен введением в классическую формулу дополнительной переменной. Теперь стало считаться, что не всё возможно зафиксировать объективными методами. Стимул срабатывает только с промежуточной переменной.

Бихевиоризм, как и всякое учение, подвергался модификациям. Так появились новые течения:

  • Необихевиоризм;
  • Соцбихевиоризм.

Основоположником необихевиоризма был Сканнер. Ученый полагал, что исследования, не имеющие объективного подтверждения, ненаучны, и проводить их не следует. Новый бихевиоризм не ставит задачу воспитания личности, но направляет усилия на «программирование» поведения индивидуума для достижения максимально эффективного результата для заказчика. Практика «метода пряника» в исследованиях подтвердила важность положительного стимула, при котором достигаются наилучшие результаты. Сканнер, проводя исследования, неоднократно попадал впросак, но ученый полагал, что если бихевиоризм не может найти ответа на какой-либо вопрос, то такого ответа вовсе не существует в природе.

Основное направление бихевиоризма в социальном плане изучает агрессию человека. Приверженцы соцбихевиоризма полагают, что человек прикладывает все усилия для того, чтобы добиться определенного положения в обществе. Новое слово бихевиоризм в этом течении – это механизм социализации, который предусматривает не только приобретение опыта на собственных ошибках, но и на чужих промахах. На основе этого механизма сформированы основы агрессивного и кооперативного поведения. В этом отношении примечателен опыт бихевиоризма в психологии канадского психолога Альберта Бандуры, который взял три группы детей и представил им один и тот же художественный фильм. В нем показывали, как мальчик избивает тряпичную куклу. Однако для каждой группы были сняты разные концовки:

  • Положительное отношение к действиям мальчика;
  • Наказание мальчика за «плохой поступок»;
  • Полное безразличие к действиям главного героя.

После просмотра фильма детей приводили в комнату, где находилась точно такая же кукла. Дети, которые видели, что за избиение куклы наказывают, не тронули её. Малыши из двух других групп проявили агрессивные качества. Это доказывает, с точки зрения бихевиоризма, что на человека активно влияет общество, в котором он находится. В результате опыта Альберт Бандура предложил запретить все сцены насилия в фильмах и средствах массовой информации.

Основные заблуждения бихевиоризма

Главные ошибки приверженцев бихевиоризма заключаются в полном игнорировании личности:

  • Непонимание того, что изучение любого действия невозможно без привязки к конкретной личности;
  • Непонимание того, что в одинаковых условиях у разных личностей могут возникнуть несколько реакций, и выбор оптимальной всегда остается за человеком.

Как утверждают сторонники бихевиоризма в психологии, «уважение» строится исключительно на страхе. Подобное утверждение не может считаться истинным.

Бихевиоризм | Имидж | Наша Психология

Слово произошло от анлг. behaviour – «поведение». Бихевиоризм – это одно из основных направлений современной академической психологии. Как и представители других направлений, бихевиористы занимаются исследованием психики человека и животных, но анализируют они ее именно через поведение.

Бихевиористы предлагают изучать психику на основании объективных фактов и приходят к выводу, что именно поведение человека можно исследовать, «измерять» объективно, в отличие от сферы чувств, мышления, памяти и восприятия (мы никогда не сможем быть точны при исследовании этих процессов, поскольку любой анализ здесь будет основан на самонаблюдении, а значит, он недостаточно объективен).

В основу бихевиоризма положены эксперименты русского ученого И.П. Павлова с его знаменитыми экспериментами, которые он проводил на собаках. Павлов показал существование определенной закономерности между стимулом и реакцией. Собаке дают еду или что-то, что означает еду – и у нее выделяется желудочный сок. Зарождение бихевиоризма также связано с исследованиями таких американских исследователей начала XX в., как Э. Торндайк и Дж. Уотсон. Окончательное оформление в качестве самостоятельной концепции бихевиоризм получил в трудах Б. Скиннера. Согласно его представлениям, человек представляет собой «черный ящик», внутреннее содержание которого почти недоступно объективному научному исследованию. Поэтому, по мнению бихевиористов, следует отказаться от стремлений постигнуть внутреннюю мотивацию поведения и сконцентрировать свои усилия на изучении внешних факторов. В соответствии с представлениями Скиннера, объяснить поведение (а значит, в некоторой мере опосредованно понять устройство самого «черного ящика») можно, подвергая анализу связь между наблюдаемым стимулом и его последствием – реакцией психики на этот стимул.

В соответствии с этим бихевиоризме была предложена следующая схема:

Стимул => Реакция

Это и есть элементарная единица поведения.

Бихевиористы поставили перед собой две основные задачи:
1. наблюдая стимул, прогнозировать, какой будет реакция человека;
2. наблюдая реакцию, научиться определять, каким стимулом она была вызвана.

Однако основная проблема данного подхода заключается в том, что эти задачи заведомо неразрешимы: два разных человека могут реагировать на один и тот же стимул по-разному. А одна и та же реакция для двух разных людей также может быть порождена действием двух разных стимулов.

Позднее это направление получило большую поддержку в американской научной психологии и оказало большое влияние на психотерапию. Существует так называемая бихевиоральная психотерапия, где человека учат менять свои реакции на какие-то стимулы или ситуации, вызывающие у него невротические реакции. О бихевиоральной психотерапии написано немало книг и статей, и в некоторых странах она успешно конкурирует с психоанализом.

Бихевиоральные психотерапевты смогли предложить немало эффективных методик для работы с психологическими проблемами: техника десенсибилизации, техника внешнего воздействия, приемы с использованием положительного и отрицательного подкрепления и многие другие. Для примера рассмотрим лишь одну их техник, предложенных бихевиористами, – методику десенсибилизации, которая применима для работы со страхами и некоторыми другими психологическими проблемами. Рассмотрим действие этой техники на примере работы со страхом высоты. Представьте себе человека, которому страшно стоять на высоком мосту, выходить на балкон или смотреть с обрыва. А может быть, это как раз вы? Тогда тем более будет полезно прочитать, как можно эффективно использовать десенсибилизацию.

Итак, у нас есть человек, который боится высоты. Сначала мы попросим его отойти от обрыва на такое расстояние, где впервые исчезает его страх – в то место, где ему комфортно. После этого попросим его сделать шаг вперед. В этой новой точке уже возникает легкий дискомфорт. Но дискомфорт настолько небольшой, что наша психика способна справиться с ним – и через определенное время человек уже не будет испытывать неприятных ощущений здесь. Наша психика приспосабливается к небольшим изменениям, человек выводит себя из зоны комфорта в зону легкого дискомфорта – и эта зона неизбежно станет комфортной зоной, потому что организм использует свои возможности адаптации. Если только мы не попросим нашего испытуемого сделать сразу 10 шагов вперед. Запомните: ни в коем случае нельзя пропускать этапы и делать сразу слишком много шагов: это приведет к «срыву» – придется начинать все сначала.

Так, постепенно, шаг за шагом наш борец со страхом высоты будет приближаться к обрыву. Придерживаясь главного правила: следующий шаг делать только тогда, когда на предыдущем ощущается полный комфорт. В начале выполнения техники десенсибилизации можно установить себе точку, в которой все же имеет смысл начать испытывать страх высоты (ведь страх нас защищает, и если его не будет совсем – мы спрыгнем вниз). Это может быть 20, 30, 40 см от обрыва – каждый определяет для себя сам.

В своей практике я нередко применяю этот метод не только для работы со страхами (высоты, темноты, самых разных животных и т.д.), но и для коррекции химической зависимости от курения. Представьте себе, выбирать количество выкуриваемых в день сигарет тоже можно – и не испытывать при этом неприятных ощущений. Главное в этом случае помнить, что полностью избавиться от курения с помощью десенсибилизации в большинстве случаев невозможно, поскольку курение – это еще и психологическая зависимость (а значит, необходимо проработать ее психологическую причину).

Автор статьи: Мария МИНАКОВА

Похожее

БИХЕВИОРИЗМ И НЕОБИХЕВИОРИЗМ О СУЩНОСТИ КОММУНИКАЦИИ — Мегаобучалка

Психологические теории бихевиоризма появились в начале XX в. в России и в США. В теориях бихевиоризма психика людей сводилась к различным формам их поведения (от англ. behaviour – поведение). Его теоретиками в США были Джон Уотсон, Беррес Скиннер, Эдвард Торндайк, а в России – физиологи и психологи И.П. Павлов, В.М. Бехтерев, социологи неопозитивизма А.С. Звоницкая, Г.П. Зеленый. Отрицая сознание как предмет научного исследования, бихевиористы «переносили» методы изучения психики животных на объяснение причин и механизмов поведения человека, которое они пытались объяснить по схеме: стимул – реакция (S – R). Психику они трактовали как совокупность ответов-реакций, т.е. ожидаемое поведение на стимулы внешней среды. В качестве стимула может выступать информация, при многократном повторении которой можно сформировать, «изготовить» человека с любыми «константными» «репертуарами» поведения. В конечном счете теории бихевиоризма на практике использовались для управления установками (аттитюдами), мотивами, влияющими на поведение человека, которого можно «дрессировать» с помощью стимулов. По мнению бихевиористов, основой коммуникации является не язык как система знаков, а непосредственные речевые сигналы, манипулируя которыми коммуникатор в соответствии со своими целями может воспитать человека с любыми установками. Формула S – R, которая широко использовалась в массовых коммуникационных процессах (шоу-бизнесе, рекламе, в техниках «психопрограммирования» аудитории при помощи СМИ, в процессах научения и обучения), обретала следующий вид: стимул (коммуникатор, сообщение, канал, социальная ситуация) – реакция реципиентов на эти стимулы в виде соответствующих изменений аттитюдов. При этом коммуникатору отводилась роль активного побудителя ожидаемого поведения (Уотсон Лж.Б.Бихевиоризм//Хрестоматия по истории психологии. Период открытого кризиса (начало 10-х годов – середина 30-х годов XX в.). М., 1980. С. 34-44). По мнению российских психологов, изучающих психологические эффекты воздействия СМК на массовую аудиторию, многие телепередачи («Контрольная закупка», «Модный приговор», «Малахов плюс») построены по схеме бихевиоризма (стимул-реакция).



На принципах необихевиоризма основаны концепции убеждающей коммуникации, разработанные представителями Йельской школы убеждающей коммуникации Карлом Ховландом, Ирвингом Джа-нисом, Гарольдом Келли, Уолтором Вассом и др., а также теория социального научения А. Бандуры.

Карл Ховланд (1912–1961) – экспериментальный психолог, изучал во время Второй мировой войны по программе Пентагона процессы убеждения и отношение массовой аудитории к источникам достоверной и недостоверной информации. На основании обобщения большого массива экспериментальных данных психологи Йельской школы трактовали убеждающее сообщение как стимул, а происходящее под его воздействием изменение социальных установок как приобретенную реакцию. С их точки зрения, убеждение– это «процесс получения от людей согласия действовать определенным образом или защищать позиции с помощью рациональных или эмоциональных апелляций. Убеждение можно рассматривать как один из способов уменьшения несоответствия между когнициями и связанного с ним напряжения». Ховланд и его последователи доказали, что повторение сообщения приводит к возрастанию степени его воздействия; что использование большого количества разнообразных и конкретных аргументов, ярких эпитетов, а также быстрый темп речи способствуют большей убедительности сообщения; что чем более значима для людей та или иная тема, тем тяжелее изменить их аттитюды по отношению к ней. Изучая убеждаемость как личностную характеристику, Ховланд и Джанис доказали, что она связана с интеллектом, самооценкой, вовлеченностью в проблему и осведомленностью в ней, потребностью в осмыслении информации, настроением, наличием определенных побуждений, сходством позиций коммуникатора и аудитории, опытом взаимодействия с объектом аттитюда и полом (Гулевич О.А.Убеждающая коммуникация: реферативный обзор: учеб. пособие. М., 1999. С. 5, 9, 39, 41, 44). На практике все эти рекомендации теоретиков Йельской школы способствуют убеждающей речи и критическому осмыслению полученной информации. В соответствии с теорией формирования и изменения установок Ховланда было установлено, что установки приобретаются таким же образом, как и другие привычки.

По существу, схема убеждающей коммуникации Йельской школы – это расширенный вариант пятичленной модели СМИ Г. Лассуэлла за счет включения в нее психологических переменных. Ключевыми понятиями теории социального научения, которую разработал Альберт Бандура в 1960-е гг., являются научение путем наблюдения и моделирования (подражания): наблюдая поведение других и последствия этого поведения, индивиды могут подражать и тем самым обучаться моделям определенного поведения, т.е. моделировать свое поведение (Богомолова Н.Н.Социальная психология массовой коммуникации. М., 2008. С. 38, 39).

 

Классический бихевиоризм Уотсона

Зарождение бихевиоризма и его основные постулаты

Определение 1

Бихевиоризм – это психологическая доктрина, представляющая собой ученье о поведенческом реагировании индивидов.

Датой «рождения» бихевиоризма считается 1913 год, когда вышла в свет статья Джона Уотсона «Психология с точки зрения бихевиориста». С этого момента бихевиоризм вошел в психологию как одно из течений, а Джон Уотсон был признан его основоположником.

В процессе своего развития бихевиоризм прошел три последовательных этапа:

  1. С 1913 года по 1930 год – «Классический бихевиоризм», занимающийся изучением поведения индивида как реакции на определенный внешний стимул. В основу положены исследования Джона Уотсона.
  2. С 1930 года по 1960 год – «Небихевиоризм». Разработана и введена в обиход классическая схема «S – R» (стимул – реакции), постепенно она видоизменилась до «S – О — R», где «О» подразумевала наличие определенных факторов, таких как цели, знания, подкрепления и потребности. Основными исследованиями в данном направлении, можно назвать работы Б.Ф, Скиннера, Э. Толмена и других.
  3. С 1960-х годов – «Социальный бихевиоризм». В данный промежуток развития бихевиоризма промежуточная «О», представляется в ином свете, она приобретает социальное значение (детский опыт, локус-контроля, поведении референтных групп и т.д.). В основу положены исследования Д. Долларда, А. Бандура, Дж. Мида и ряда других психологов.

Основной идей классического бихевиоризма является выступление против субъективизма в психологии сознания. В своих исследованиях и научных работах, посвященных бихевиоризму, Джон Уотсон доказывал, что психология представляет собой науку, которая должна использовать исключительно объективный научный метод, то есть стать естественно-научной дисциплиной.

По мнению Джона Уотсона, сознание не должно быть предметом психологии, ввиду того, что оно не может быть подвергнуто объективному наблюдению. В ходе проведенных в дальнейшем исследований Джон Уотсон пришел к выводу, что объективному наблюдению может быть вполне успешно подвергнуто поведение индивида. В этой связи именно оно должно выступать в качестве предмета психологии.

Определение 2

Поведение – это всякая реакция индивида в ответ на определенный внешний стимул, за счет которой он в последующем приспосабливается к внешней среде.

В свою очередь реакции Джон Уотсон классифицирует по следующим основаниям:

Готовые работы на аналогичную тему

  1. Врожденные и приобретенные реакции.
  2. Внутренние и внешние.

Например, в качестве внешней приобретенной реакции можно назвать приветствие (вставание) учеников, когда преподаватель входит в аудиторию; внешняя врожденная реакция – глотание; внутренняя врожденна реакция – выделение желудочного сока; внутренняя приобретенная реакция – мышление.

К основным методам бихевиоризма Джон Уотсон относил эксперимент и наблюдение. В качестве его основного экспериментального объекта выступает крыса в лабиринте.

Замечание 1

Главная задача классического бихевиоризма Уотсона — накопление наблюдений за поведением человека.

Наблюдения осуществляют с расчетом на то, что исследователь знает внешний стимул и на основании данных знаний предсказывает реакцию индивида на него. И, напротив, видя реакцию (поведение) определить каким стимулом она вызвана. Данные знания в последующем будут положены исследователем в основу управления поведением испытуемого.

В качестве центрального исследуемого процесса в бихевиоризме выступает процесс научения. Важно отметить, что Джон Уотсон не открывал какого-либо нового вида научения, все его исследования опирались исключительно на старые методы. Например, «классическое «обуславливание», метод проб и ошибок».

Специфика классического бихевиоризма Уотсона

Специфика классического бихевиоризма Джона Уотсона заключается в исследовании процесса научения. В 1932 году Эдвардом Томеном была разработана когнитивная теория научения, в соответствии с которой поведение индивида определено не его рефлекторными движениями, а конкретной когнитивной картой.

Определение 3

Когнитивная карта поведения – это образ знакомого индивиду пространства.

Основой данной теории являются исследования, проведенные на крысах. Животных поделили на две группы. Их задачей было найти пищу в лабиринте. Для первой группы пищевую приманку постоянно перемещали в одно и то же место, но добираться до нее нужно было с разных точек лабиринта. Для второй группы разработали иные условия, приманку разложили в разные части лабиринта, для ее нахождения движения должны были постоянно повторяться. То есть, крысы могли найти и получить пищу в случае, если они постоянно поворачивали направо. Таким образом, результаты эксперимента показали, что первая группа крыс стали в итоге лучше ориентироваться в лабиринте, чем крысы второй группы.

Исследования на крысах в последующем были перенесены на людей, в ходе чего установили, что люди, которые знают карту местности, находят нужный им объект значительно лучше тех, кто не знает местно и вне зависимости от исходного местонахождения.

Еще одним объектом исследования являлось изучение стимула на организм. Стимул понуждает организм вести себя определенным образом и, соответственно, за этим следует какая-то определенная реакция. В классическом бихевиоризме считалось, что только стимул может предопределять характер реакции, которая наступит в будущем. Отсюда можно сделать вывод — надо проводить как можно больше тестов, экспериментов, регистрировать полученные данные, анализировать их. С помощью анализа можно было бы вывести и понять соответствующие закономерности. Бихевиористы полагали, что такая схема стимулов и реакций распространяется не только на человека, но и на весь остальной животный мир.

Замечание 2

Таким образом, классический бихевиоризм Джона Уотсона представляет собой одно из самых влиятельных и актуальных направлений в психологии в начале ХХ века. Обусловлено это тем, что бихевиоризм изучает поведение и активность индивида.

БИХЕВИОРИЗМ И ПРОБЛЕМА ПОВЕДЕНИЯ

В начале XX в. возникает мощное направление, утвердившее в качестве предмета психологии поведение, понятое как совокупность реакций организма, обусловленная его общением со стимулами среды, к которой он адаптируется. Кредо направления запечатлел термин «поведение» (англ. «behavior»), а само оно было названо бихевиоризмом.

Его «отцом» принято считать Дж. Уотсона, в статье которого «Психология, каковой ее видит бихевиорист» (1913) излагался манифест новой школы. В нем требовалось «выбросить за борта как пережиток алхимии и астрологии все понятия субъективной психологии сознания и перевести их на язык объективно наблюдаемых реакций живых существ на раздражители». Ни Павлов, ни Бехтерев, на концепции которых опирался Уотсон, не придерживались столь радикальной точки зрения. Они надеялись, что объективное изучение поведения в конце концов, как говорил Павлов, прольет свет на «муки сознания».

Бихевиоризм стали называть «психологией без психики». Этот оборот предполагал, что психика идентична сознанию. Между тем, требуя устранить сознание, бихевиористы вовсе не превращали организм в лишенное психических качеств устройство. Они изменили представление об этих качествах. Реальный вклад нового направления заключался в резком расширении изучаемой психологией области. Она отныне включала доступный внешнему объективному наблюдению не зависимый от сознания стимул – реактивные отношения.

Изменились схемы психологических экспериментов. Они ставились преимущественно на животных – белых крысах. В качестве экспериментальных устройств, взамен прежних физиологических аппаратов, были изобретены различные типы лабиринтов и «проблемных ящиков». Запускаемые в них животные научались находить из них выход.

Тема научения, приобретения навыков путем проб и ошибок стала центральной для этой школы, собравшей огромный экспериментальный материал о факторах, определяющих модификацию поведения. Материал подвергался тщательной статистической обработке. Ведь реакции животных носили не жестко предопределенный, а статистический характер.

Изменялось воззрение на законы, правящие поведением живых существ, в том числе и человека, который предстал в этих опытах как «большая белая крыса», ищущая свой путь в «лабиринте жизни», где вероятность успеха не предопределена и царит его величество случай.

Исключив сознание, бихевиоризм неизбежно оказался односторонним направлением. Вместе с тем он ввел в научный аппарат психологии категорию действия в качестве не только внутренней духовной (как в прежние времена), но и внешней, телесной реальности. Бихевиоризм изменил общий строй психологического познания, его предмет охватывал отныне построение и изменение реальных телесных действий в ответ на широкий спектр внешних вызовов.

Сторонники этого направления рассчитывали, что, опираясь на данные экспериментов, удастся объяснить любые естественные формы поведения людей, такие, например, как строительство небоскреба или игру в теннис. Основа же всего – законы научения.

Формула бихевиоризма была четкой и однозначной: «стимул – реакция». Вопрос о тех процессах, которые происходят в организме, и его психическом устройстве между стимулом и реакцией снимался с повестки дня.

Такая позиция следовала из философии позитивизма:убеждения в том, что научный факт отличается своей непосредственной
наблюдаемостью. Как внешний стимул, так и реакция (ответное движение) открыты для наблюдения каждому независимо от его теоретической позиции. Поэтому связка «стимул – реакция» служит, согласно радикальному бихевиоризму, незыблемой опорой психологии как точной науки.

Между тем в кругу бихевиористов появились выдающиеся психологи, поставившие этот постулат под сомнение.

Первым из них был американец Эдвард Толмен (1886–1959), согласно которому формула поведения должна состоять не из двух, а из трех членов, и поэтому выглядеть следующим образом: стимул (независимая переменная) – промежуточные переменные – зависимая переменная (реакция).

Среднее звено (промежуточные переменные) – не что иное, как недоступные прямому наблюдению психические моменты: ожидания, установки, знания.

Следуя бихевиористской традиции, Толмен ставил опыты над крысами, ищущими выход из лабиринта.

Главный же вывод из этих опытов свелся к тому, что, опираясь па строго контролируемое экспериментатором и объективно им наблюдаемое поведение животных, можно достоверно установить, что этим поведением управляют не те стимулы, которые действуют на них в данный момент, а особые внутренние регуляторы. Поведение предваряют своего рода ожидания, гипотезы, познавательные (когнитивные) «карты».

Эти карты животное само строит. Они и ориентируют его в лабиринте. По ним оно, будучи запущено в лабиринт, узнает, «что ведет к чему». Положение о том, что психические образы служат регулятором действия, было обосновано гештальт-теорией. Учтя ее уроки, Толмен разработал собственную теорию, названную когнитивным бихевиоризмом.

Другой вариант необихевиоризма принадлежал Кларку Холлу (1884–1952) и его школе.

Он ввел в формулу «стимул – реакция» другое среднее звено, а именно потребность организма (пищевую, сексуальную, потребность во сне и др.).

Она придает поведению энергию, создает незримый потенциал реакции. Этот потенциал разряжается при подкреплении (понятие, которое Холл заимствовал у И.П. Павлова), и тогда реакция закрепляется и организм чему-то научается.

В защиту ортодоксального бихевиоризма, отвергая любые внутренние факторы, выступил Бурхус Скиннер (1904–1990). Условный рефлекс он назвал оперантной реакцией.

По Павлову, новая реакция вырабатывалась в ответ на условный сигнал при его подкреплении (например, когда перед кормлением раздавался стук метронома и т.п.). По Скиннеру, организм сначала производит движение, затем получает (или не получает) подкрепление.

Скиннер сконструировал экспериментальный ящик, в котором белая крыса (или голубь) могла нажимать на рычажок (или кнопку). Перед ними была кормушка и набор раздражителей. Из этих простых элементов Скиннер составлял множество различных «планов подкрепления» (например, перед крысой находятся два рычага, и она оказывается в ситуации выбора: или крыса получает пищу только тогда, когда вслед за нажатием на рычаг загорается лампочка, или пища выдается только при нажиме с определенной силой, частотой и т.д.).

Техника выработки «оперантных реакций» была применена последователями Скиннера при обучении детей, их воспитании, при лечении невротиков.

Во время Второй мировой войны Скиннер работал над проектом использования голубей для управления стрельбой по самолетам. Посетив однажды урок арифметики в колледже, где занималась его дочь, Скиннер ужаснулся, сколь мало используются данные психологии.

В целях улучшения преподавания он изобрел серию обучающих машин и разработал концепцию программированного обучения. Он надеялся, основываясь на теории оперантных реакций, создать программу «изготовления» людей для нового общества.

Работы Скиннера, как и других бихевиористов, обогатили знание об общих правилах выработки навыков, о роли подкрепления (которое служит непременным мотивом этих навыков), динамике перехода от одних форм поведения к другим и т.п. Но вопросами, касающимися научения у животных, интересы бихевиористов не ограничивались.

Открыть общие, выверенные точной объективной наукой законы построения любого поведения, в т.ч. у человека, – такова была сверхзадача всего бихевиористского движения. «Человек или робот?» – такой вопрос задавали бихевиористам их противники. Они справедливо указывали, что, устраняя внутреннюю психическую жизнь человека из сферы точного причинного анализа, бихевиоризм трактует личность как машинообразно работающее устройство. Строгость объективного анализа реакций организма достигалась дорогой ценой. Устранялось сознание как внутренний регулятор поведения. Надеясь придать психологии точность обобщений, не уступающую физике, бихевиористы полагали, что, опираясь на формулу «стимул – реакция», удастся вывести новую породу людей. Утопичность этого плана обнаруживается в концепциях типа скиннеровской. Ибо даже применительно к животным Скиннер, как заметили его друзья, имел дело с «пустым организмом», от которого ничего не оставалось, кроме оперантных реакций. Ведь ни для деятельности нервной системы, ни для психических функций в скиннеровской модели места не было. Снималась с повестки дня и проблема развития. Она подменялась описанием того, как из одних навыков возникают другие. Огромные пласты высших проявлений жизни, открытых и изученных многими школами, выпадали из предметной области психологии.

Лекция 3

Теория обучения Торндайка «стимул-реакция» (определение + примеры)

На протяжении многих лет психологи задавали много вопросов о том, как мы принимаем решения. Они также попытались ответить на эти вопросы с помощью теорий и школ мысли, которые могут сильно отличаться от теорий, появившихся раньше. Психология — это постоянно развивающаяся наука, но уроки прошлого по-прежнему считаются важными для усвоения.

Что такое теория стимул-реакции Торндайка для обучения?

Теория стимул-реакция была предложена Эдвардом Торндайком, который считал, что обучение сводится к двум вещам: стимул и реакция.В знаменитом опыте Павлова «раздражителем» была пища, а «реакцией» — слюноотделение. Он считал, что все обучение зависит от силы связи между стимулом и реакцией.

Если эта взаимосвязь была сильной, ответ, вероятно, возникал при предъявлении стимула. Чтобы вызвать конкретную реакцию на конкретный стимул, вам нужно было усилить его связь одним из нескольких способов. Вот тут-то и появляется эксперимент Павлова. 

Когда вы думаете о бихевиоризме, вы можете думать о собаке Павлова.Этот эксперимент является одним из самых известных экспериментов в истории психологии. Это также одно из самых убедительных доказательств теории, подпадающей под более широкую категорию теории стимул-реакции (S-R). Теории стимул-реакции пытаются объяснить, как ведут себя люди. Хотя эти теории и бихевиоризм в целом не являются авангардом современной психологии, они по-прежнему служат важным уроком о том, почему мы верим в то, во что верим, о принятии решений, поведении и человеческой природе.

Давайте рассмотрим три концепции, разработанные Торндайком при объяснении теории обучения «стимул-реакция»: закон следствия, закон упражнения и закон готовности.

Закон Эффекта

До того, как Павлов работал с собаками, Торндайк работал с кошками.

Он положит их в коробку. Вне коробки был кусок рыбы. Когда кошки искали способы добраться до рыбы, они пытались выбраться из ящика. Убежать было так же просто, как потянуть за рычаг. Когда кошка потянула за рычаг, они смогли уйти и насладиться рыбой.

Торндайк наблюдал, как кошек помещали в этот ящик снова и снова в одних и тех же условиях. Он увидел, что время, необходимое для того, чтобы потянуть за рычаг, уменьшалось по мере того, как кошки ассоциировали рычаг с рыбой. Это помогло ему разработать Закон Эффекта.

Закон Эффекта гласит, что если реакции на стимулы производят удовлетворительный эффект, они, вероятно, будут повторяться. Если ответы производят неудовлетворительный эффект, их, скорее всего, будут избегать. Кошкам нравился кусок рыбы, к которому они могли получить доступ, потянув за рычаг.Если разъяренная собака заменила рыбный лом, Закон Эффекта гласит, что эти кошки не будут дергать за рычаги.

Мы ищем ответы с положительным эффектом, усиливая связь между стимулом и реакцией.

Закон упражнений

Закон упражнений — это элемент работы Торндайка, который он позже модифицировал. Первоначально Торндайк считал, что частые связи стимула и реакции усиливают эту связь. Например, чем чаще кошке давали возможность потянуть за рычаг и получить рыбу, тем сильнее была бы эта связь и тем больше вероятность того, что она потянет за рычаг.Но, продолжая свою работу, Торндайк понял, что это не обязательно верно. Если реакция приводит к неудовлетворительному эффекту или наказанию, связь между стимулом и реакцией не будет усиливаться. Но Торндайк заметил, что связь может не ослабевать каждый раз, когда субъект «наказывается».

Закон Готовности 

Быть объектом непрерывных испытаний по натяжению рычагов и побегу из ящиков звучит утомительно. Если кошка, человек или любое другое существо слишком устали, чтобы что-то попробовать, они могут просто вздремнуть и оставить ответ в подвешенном состоянии.Эта идея соответствует закону готовности Торндайка.

Закон готовности гласит, что связь между стимулом и реакцией усиливается в зависимости от готовности субъекта к обучению. Если субъект, будь то кошка или человек, не заинтересован или не готов учиться, он не будет связывать стимул и реакцию так сильно, как тот, кто нетерпелив и взволнован.

Эти три закона легли в основу многих других теорий бихевиоризма. Более поздние бихевиористы, в том числе Б.Ф. Скиннер, Эдвин Гатри и Иван Павлов предложили теории, которые связаны с работами Эдварда Торндайка или вдохновлены ими.

Другие теории реакции на стимул

Теория смежности

Одна из таких теорий включает теорию смежности Эдвина Гатри. Как и другие бихевиористы, Гатри считал, что обучение происходит, когда устанавливаются связи между стимулом и реакцией. Но его идеи выходили за рамки упражнений и готовности. Теория смежности включала закон смежности, который предполагал, что время играет роль фактора силы между стимулом и реакцией.Если бы реакция не появлялась сразу после стимула, испытуемый с меньшей вероятностью связывал бы стимул с реакцией. Если вечером у вас болит живот, вы можете связать реакцию своего тела с тем, что вы ели утром, но гораздо более вероятно, что вы свяжете реакцию с тем, что вы съели на обед или ужин. Время имеет значение.

Теория снижения влечения 

Еще одна теория, подпадающая под определение «стимул-реакция», — это Теория снижения влечения Халла.Эта теория, разработанная в 40-х и 50-х годах Кларком Халлом, а затем Кеннетом Спенсом, стремилась «уменьшить масштаб» бихевиоризма и объяснить движущую силу всего человеческого поведения. Стимул и реакция по-прежнему имеют решающее значение для этого влечения.

Драйв, по словам Халла и Спенса, — это состояние, которое испытывают люди, когда у них возникает потребность удовлетворить свои потребности. Если вы голодны, вы находитесь в состоянии драйва. Если вы жаждете секса, комфорта или безопасности, вы находитесь в состоянии драйва. Как люди, мы хотим уменьшить драйв и вернуться к состоянию спокойного гомеостаза.

Что вы делаете, когда голодны? Вы едите пищу и чувствуете себя сытым. Теория снижения влечения утверждает, что, когда результатом реакции является снижение влечения, субъект, скорее всего, будет реагировать на этот стимул таким же образом.

Мы не могли закончить эти теории, не говоря о собаках Павлова. Павлов использовал теорию стимул-реакция, чтобы продемонстрировать, как собаки (или люди) могут учиться с помощью классического обусловливания. Это процесс, в котором «нейтральный» стимул связывается со стимулом, который уже вызывает реакцию.Как только эта связь установлена, ранее нейтральный стимул вызывает реакцию.

Когнитивная психология стала более актуальной

Теории реакции на стимул, говоря прямо, могут быть довольно простыми. Они также носят детерминированный характер. Никто не хочет верить, что его решения являются результатом какой-либо обусловленности. Дополнительные факторы, такие как ваш мыслительный процесс или опыт, сформировавший вас как личность, также могут влиять на принимаемые вами решения. Принятие решения или поведение часто кажется более сложным, чем просто реакция на раздражитель перед вами.

Хотя бихевиоризм и теория стимул-реакции десятилетиями находились в центре внимания психологии, они подвергались критике со стороны многих экспертов в этой области. Были ли все действия обусловлены бессознательным, или сознательный разум делал больше, чем мы предполагали? Является ли человеческое поведение и принятие решений более сложными, чем просто реакция на стимул? По мере того как эти вопросы поднимались все чаще и чаще, родились такие школы мысли, как гуманизм, позитивная психология и когнитивная психология.

Эти школы мысли также не застрахованы от критики. Таким образом, полная замена обучения бихевиоризму информацией по когнитивной психологии не обязательно является лучшим подходом. Хотя психологи рассматривают поведение как нечто большее, чем просто стимул и реакцию, мы не можем забывать теории, которые заложили фундамент того, что мы знаем сегодня.

Бихевиоризм — обзор | ScienceDirect Topics

6.2 Структуры обучения

Бихевиоризм — это теория стимулов и реакций.Акцент здесь делается на изменении поведения; а внутренние психические состояния или состояния сознания считаются маловажными. Они не считаются относящимися к идее или практике обучения. Учащийся пассивен, и поведение понимается как вызванное внешними стимулами как оперантными условиями. Б. Ф. Скиннер, ведущий сторонник, утверждал следующее. Приятный опыт — это позитивное подкрепление. Если их испытывает учащийся, они устанавливают связь между стимулами и реакцией.С другой стороны, неприятные переживания являются негативным подкреплением. Они заставляют учащихся избегать нежелательных реакций на стимулы. Если обучение постоянно подкрепляется, это увеличивает скорость и глубину этого обучения. Как положительное, так и отрицательное подкрепление могут формировать поведение сразу и в долгосрочной перспективе. Если учащийся не получает никакого подкрепления, это также может формировать поведение. Если учащиеся не получают никакой реакции на свое поведение, они могут изменить свое поведение, чтобы вызвать или поощрить какое-либо внешнее подкрепление.

Примером программы обучения, основанной на бихевиористской метатеории, является метод Келлера. Этот метод, или, точнее, подход к преподаванию и обучению, оказал влияние, если не имел решающего успеха, на образование профессий в Бразилии (Mota, 2013). План Келлера (Keller, 1968) был запущен в начале 1960-х годов и представляет собой раннюю попытку использовать новые технологии в преподавании и обучении. План, также называемый Персонализированной системой обучения (PSI), был разработан Фредом С.Келлер с Дж. Гилмором Шерманом, Каролиной Бори и Родольфо Ацци, среди прочих, в середине 1960-х годов в качестве новаторского метода обучения для тогда еще нового Университета Бразилиа. Когда план Келлера был запущен, новые цифровые технологии находились в зачаточном состоянии, а это означало, что доставка контента, разработка учебных сред и их возможности для обеспечения опыта глубокого обучения были ограничены. Кроме того, его опора на бихевиористский подход означала, что он работал с строго ограниченной педагогикой, и, следовательно, его влияние на обучение было меньше, чем первоначально предполагалось.Тем не менее, его стоит изучить, поскольку он представляет собой раннюю попытку использовать новые технологии для создания продуктивной среды обучения.

План Келлера — это тип индивидуального обучения, в котором учебные материалы представлены небольшими блоками. Когда учащийся чувствует себя готовым, он сдает тест перед завершением модуля и, если он проходит на соответствующем уровне, ему разрешается продолжить изучение модуля. Этот тест также является диагностическим в том смысле, что дает описание возможностей ученика, что позволяет скорректировать последующую программу под нужды ученика.Именно в этом смысле программу можно охарактеризовать как персонализированную. Студент завершает каждый из последующих блоков в своем собственном темпе. Это указывает на одно из преимуществ этой формы обучения: способность системы приспосабливаться как к учащимся, желающим быстро пройти программу, так и к тем, кто хочет не торопиться. Это один из элементов гибкости, присущей этим типам подходов к преподаванию и обучению. В соответствии с планом Келлера инструкторы (или учителя, как мы их знаем) выступают только в качестве фасилитаторов, не применяют наказаний ни на одном этапе обучения и выставляют только оценки «зачет» или «неудовлетворительно».

План Келлера основан на бихевиористской философии (Zimmerman, 2002). Первичное представление нового содержания было через письменные тексты. Учитывая формы средств массовой информации, доступные в то время, когда был разработан план Келлера (например, лекции, фильмы, аудиозаписи, телевидение, радио, бумажный текст и т. д.), бумажные тексты давали студентам наибольшую свободу; книги и тексты переносимы, их можно читать в своем собственном темпе, их можно начинать и останавливать в любое время, их легко пересматривать, и читатель может писать по ним.Как приложение бихевиоризма план Келлера был разработан, чтобы максимизировать количество оперантных действий, которые можно было подкрепить; лучше всего это можно сделать с письменными материалами, а не с пассивными наблюдателями других средств массовой информации.

Материал темы был разбит на отдельные значимые блоки. Эти единицы могут иметь различные виды отношений; например, один модуль может обеспечить обучение, которое является предпосылкой для понимания другого, или более поздний модуль может быть развитием более раннего.Действительно, эти формы обучения, поскольку они допускают гибкость, могут приспосабливаться к различным режимам развития. Ряд этих режимов прогрессии был идентифицирован. Первое – предварительное условие. Для приобретения определенных знаний, навыков и элементов диспозиции в процессе обучения существуют предпосылки. Примером может быть математика, где знание сложения является необходимым условием умножения. Вторая форма – созревание. Зрелая форма прогрессии относится к развитию ума учащегося.Есть некоторые умственные операции, которые учащийся не может выполнять, потому что мозг слишком незрел, чтобы их обрабатывать. Третья форма является экстенсиональной. Экстенсиональная форма прогрессии понимается как увеличение количества или диапазона операции. Более широкий охват материала является формой прогресса, поэтому учащийся теперь понимает больше примеров конструкции или больше применений конструкции и может работать с более широким диапазоном идей.

Четвертая форма — интенсификация.С идеей расширения связано углубление или усиление конструкции или навыка. В то время как расширение относится к количеству или диапазону развития, интенсификация относится к степени, в которой сложное понимание заменило поверхностное понимание концепции. Тогда есть понятие сложности. Что касается конструктов знаний, навыков и предрасположенностей, заложенных в среде обучения, существует четыре формы сложности, которые позволяют проводить различие между единицами.Это: поведенческая сложность, символическая сложность, аффективная сложность и перцептивная сложность. Существует также тип прогрессии, абстрагирование, которое включает в себя переход от конкретного понимания концепции к более абстрактной версии. Еще одним показателем прогресса является повышенная способность формулировать, объяснять или дополнять идею или конструкцию (т. е. учащиеся сохраняют способность использовать навык и, кроме того, теперь они могут формулировать, объяснять или дополнять то, что они могут делать и что делать). они сделали).Последней формой прогресса является педагогическая, и это относится к тому, как на обучение влияют средства его доставки. Примером может быть переход от исполнения с участием к самостоятельному. Учащимся разрешается продвигаться по материалам курса в своем собственном темпе и в порядке, наиболее подходящем для них. Затем учащиеся проходят программу так быстро или медленно, как они выбирают, при условии, что они завершают всю программу в течение определенного периода времени.

Учащиеся должны выполнить требования мастерства в одном разделе, прежде чем переходить к следующему. Как правило, модуль в программе будет иметь более одной эквивалентной формы оценки; например, три теста одинаковой сложности или три первичных источника или набора данных для анализа. Учащиеся должны продемонстрировать мастерство в решении задач подразделения на определенном уровне. Если учащийся не достигает порога, он или она перенаправляется к материалам модуля (или дополнениям, если они предоставлены), а затем может пройти эквивалентную форму оценивания модуля.С бихевиористской точки зрения демонстрация мастерства и возможность перейти к следующему разделу считались подкреплением.

Помощники преподавателей или прокторы были важным элементом плана Келлера. Они могли быть внешними по отношению к программе (взрослые или сверстники, набранные из внешних источников) или внутренними (продвинутые студенты программы, которые преуспевали, завершили все разделы на сегодняшний день и имели хорошие навыки межличностного общения). Они выступали в качестве арбитров мастерства юнитов; они подтверждали мастерство, определяли слабые места и направляли учащихся к следующим разделам.План Келлера широко использовался в бразильской системе высшего образования, особенно как более персонализированная форма обучения, но в формулировке Келлера нет ничего, что ограничивало бы его применение определенными уровнями обучения, содержанием или типами программ. Было проведено некоторое исследование эффективности метода Келлера, которое предполагает, что он оказывает значительное положительное влияние на обучение по сравнению с более традиционными форматами, основанными на лекциях (Pear and Crone-Todd, 1999).

План Келлера, как мы предположили, опирается на бихевиористскую метатеорию, и это, возможно, способствовало его относительной неудаче. Бихевиоризм можно противопоставить двум альтернативным метатеориям, на которые мы уже ссылались: когнитивизму или обработке символов и конструктивизму . В центре внимания когнитивизма находится роль внутренней психической деятельности. Обучаемый рассматривается как обработчик информации, пассивно получающий информацию из внешнего источника.Когнитивистские взгляды на обучение представляют собой парадигмальный пример философии обучения, основанной на обработке символов.

С другой стороны, конструктивизм влечет за собой активный процесс обучения и обычно ассоциируется с работами русского психолога Льва Выготского. Мур (2012:18–19) резюмирует взгляды Выготского на развитие, обучение и сознание. Когнитивное развитие наиболее эффективно достигается путем разработки идей и понимания в ходе обсуждения с учителями или педагогическими экспертами и сверстниками.Учащиеся работают и развиваются лучше с помощью, чем без помощи, и им даются задания, которые проверят то, что в них развивается, а не то, что уже развилось (идея напрягать не только «способных» учеников, но и тех, кто может восприниматься как несовершеннолетний). достижение по сравнению с какой-либо принятой нормой развития или положения). Учащиеся стремятся развивать «сознательное мастерство» над тем, что они узнали, а не просто повторять факты, которые могут иметь для них мало значения. Развитие такого опыта не зависит от конкретного предмета, и однажды приобретенное становится инструментом, с помощью которого все обучение облегчается и улучшается.Таким образом, отношения между учеником и учителем носят диалогический, а не монологический характер, предполагают совместное обучение как со сверстниками, так и с учителем, признают обучение активным и интерактивным процессом, связанным с предварительным характером знаний ученика, и подчеркивают артикуляцию и метапроцессы обучения.

Когнитивные теории обучения против стимул-реакции

Abstract

В своем обращении в 1948 году к Отделу теоретико-экспериментальной психологии Американской психологической ассоциации Кеннет У.Спенс обсудил шесть различий между когнитивной теорией и теорией обучения, основанной на стимуле-реакции (SR). В этой статье я сначала рассмотрю эти шесть различий, а затем сосредоточусь на двух из них в контексте моего собственного исследования. Это исследование касается спецификации ассоциаций стимул-стимул при ассоциативном обучении и характеристики нейронных систем, лежащих в основе этих ассоциаций. В ходе описания взглядов Спенса и моего исследования я надеюсь рассказать о богатстве SR-психологии Спенса и ее актуальности в рамках современного научного анализа поведения.

Спенс (1950, стр. 161) охарактеризовал когнитивные теории обучения как те, которые «подчеркивают формирование и модификацию когнитивных паттернов, представляющих отношения в окружающей среде». По большей части в рамках этих теорий, таких как теории Коффки (1935), Колера (1940), Левина (1936) и Толмена (1932), обучение рассматривалось как часть более широкой проблемы перцептивной организации и реорганизации с опытом. . Напротив, теории стимул-реакция (СР), такие как теории Гатри (1935), Халла (1943), Спенса (1936) и Торндайка (1898), подчеркивали такие конструкции, как привычки и связи СР, которые относились к гипотетическим состояниям обучения. или промежуточные переменные.Теории S-R предоставили правила, связывающие стимулирующие факторы, такие как величина вознаграждения, количество и время, с силой этих промежуточных переменных, а также правила, связывающие эти переменные с эмпирическими мерами реагирования. В целом Спенс видел мало точек разногласий между этими двумя теоретическими позициями и объяснял большую часть разногласий между лагерями неправильным толкованием теории СР теоретиками познания. С моей точки зрения, тон, переданный в его статье, был тоном терпеливого учителя, указывающего на ошибки благонамеренных, но заблудших студентов, изучающих познание, но не щадя несколько менее распространенных (в его глазах) ошибок теоретиков СР.

I. Шесть различий между когнитивными и SR-теориями

Метафоры: картографические диспетчерские и телефонные коммутаторы

Возможно, поскольку задачи пространственного обучения представляли собой важную испытательную арену для ранних когнитивных и SR-психологов, когнитивные теории обучения стали ассоциироваться с метафорой «комнат управления картой», в которых пространственные представления и отношения приобретались, вычислялись и использовались. Напротив, теории S-R стали привязаны к аналогии с «телефонными коммутаторами», с помощью которых вводимые стимулы посредством обучения соединялись с выводами новых ответов (Tolman, 1948).Спенс (1950, стр. 161) утверждал, что «ни один научно ориентированный человек в психологии, однако, никогда не воспримет такие аналогии, будь то телефонные коммутаторы или диспетчерские карты, как серьезные попытки теоретического представления изменений в обучении». Например, значение конструкции привычки Халла «задается математической функцией, связывающей ее с предшествующими экспериментальными переменными», и, таким образом, «любое сравнение распределительных щитов с диспетчерскими картами совершенно неуместно» (Spence, 1950, p.163). Более актуальным был вопрос о том, было ли обучение пространственным задачам более «похожим на карту» или «похожим на привычку», то есть какая часть пространственной информации, содержащейся в этих задачах, была закодирована в процессе обучения и может использоваться для управления производительностью. позже, когда, например, обычные пути блокировались или открывались короткие пути (Tolman, Richie & Kalish, 1946a, b). Интересно, что большая часть этих дебатов в конечном итоге сводилась к проблеме места и реакции, которую можно было бы так же легко сформулировать полностью в терминах S-R, как «приблизиться к реплике X» или «повернуть направо».

Нейрофизиологическая основа обучения: поля мозга или рецепторно-эффекторные связи Эффекторные связи. Спенс отметил, что эти различия не имели большого значения для теории обучения, поскольку эти нейрофизиологические модели были не чем иным, как аналогиями и не играли никакой роли в выводах или заключениях обоих лагерей.Свойства «мозговых полей» были выведены из интроспекции, а не из физиологических исследований, и, за немногими исключениями, знание или даже предположения о физиологических основах рефлексов не служили основой для построения S-R теорий. Действительно, Спенс (1950, стр. 164) заявил, что «изображение нейрофизиологических процессов без уточнения гипотетических отношений, которые связывают их с экспериментальными переменными и мерой отклика, является почти пустой тратой времени, поскольку продвижение нашего понимания явлений обучения обеспокоенный.В разделе 3 этой статьи я приведу примеры прогресса в установлении связи между мозгом и поведением, которые оказались более полезными для характеристики природы обучения.

Ассоциации стимул-стимул (S-S) или стимул-реакция (S-R)

Когнитивные теоретики того времени ясно понимали, что обучение включает ассоциации или реорганизацию сенсорно-перцептивных процессов. Напротив, Гатри, Торндайк, Халл и другие утверждали, что научение связано с S-R-ассоциациями между стимулами и «сокращением мышц и секрецией желез» (Guthrie, 1946, p.7). Однако Спенс (1950) указал, что акцент Халла на ассоциациях S-R проистекал из его нейрофизиологизации, а не из его математического определения привычки. С точки зрения Спенса, в привычке не было ничего по существу S-R или S-S в привычке, как это определено в системе Халла, хотя, как и Халл, он явно считал, что обучение в основном связано с формированием ассоциаций между стимулами и реакциями.

«Мне нетрудно представить себе оба типа организаций или ассоциаций, созданных в сфере обучения.Очевидно, что простые типы перцептивного научения могут включать межсенсорные ассоциации. Я серьезно сомневаюсь, однако, в том, относится ли обучение исключительно к этому типу или даже в том, что оно в большинстве своем. В самом деле, … доказательства, по-видимому, сильнее поддерживают концепцию S-R, чем концепцию S-S» (Spence, 1950, стр. 164-165.)

Большая часть этой статьи (раздел 2) будет посвящена этому вопросу.

Содержание и условия обучения

Спенс отметил, что теоретики познания, как правило, подчеркивают «внутренние» свойства своих конструктов, тогда как теоретики S-R, как правило, интересуются эмпирическими отношениями между экспериментальными переменными, которые определяют их конструкты.В терминологии Рескорлы (1975) теоретики познания концентрировались на содержании обучения, тогда как теоретики SR сосредоточивались на условиях, при которых происходило обучение. Критикуя когнитивных теоретиков за то, что они слишком сильно полагаются на самоанализ, чтобы делать выводы о содержании обучения, Спенс признавал, что такое содержание все же можно строго определить с точки зрения переменных окружающей среды, восхваляя психологию знакового гештальта Толмена. Таким образом, он пришел к выводу, что эти опасения отражают «весьма реальное различие между двумя теоретическими лагерями, но… различие скорее в акценте, чем в конфликте» (Spence, 1950, p.166).

Стимульные переменные: внутренние и внешние -основные отношения, отношения часть-целое, принадлежность, множество). Напротив, большинство исследований поведения в рамках традиции SR были сосредоточены на временных переменных и тех, которые связаны с мотивацией, такими как величина вознаграждения и состояние депривации.Но отношение Спенса (1950, стр. 167) заключалось в том, что «такие различия в акцентах…. не обязательно связаны с конфликтом», и отметил, что озабоченность теоретиков SR временем и мотивацией не исключает интереса к получению стимула и организационным переменным. Действительно, за последние 25 лет многие исследования в области обучения, вытекающие из традиции СР, были посвящены этим более поздним проблемам, например интересам к ориентации и вниманию (Holland, 1997; Mackintosh, 1975; Pearce & Hall, 1980) и к перцептивным. организации (Кук, Райли и Браун, 1992; Рескорла, 1986).

Организм как активный или пассивный обработчик информации

Во время выступления Спенса велась активная дискуссия о «роли организма» в обработке информации, о том, являются ли животные «просто пассивно воспринимающими и реагирующими на все стимулы, которые физически присутствуют» (Tolman, 1948, стр. 189), или активно обрабатывали эту информацию, выбирая и собирая элементы ассоциации до того, как сформировать сами ассоциации. Опять же, Спенс чувствовал, что теоретики познания исказили позицию S-R:

«Трудно точно знать, что именно Толмен и другие, выразившие это понятие, имеют в виду под такого рода утверждениями.…Большая часть теории S-R связана с классической ситуацией обусловливания, в которой условия стимуляции чрезвычайно просты. Никакого «активного поиска» сигнала… или специальной ориентации рецепторов не требуется… Но даже в случае этой простой ситуации обучения теоретик обучения SR не предполагал, что организмы пассивно получают и реагируют на все стимулы, которые физически присутствуют» (Spence, 1950, стр. 168.)

Таким образом, Спенс подготовил почву для последующего включения переменных, которые теперь описываются как «внимание» в теорию СТО.Например, можно разумно ожидать, что непредвиденные обстоятельства подкрепления будут распространяться как на явную обработку внимания, такую ​​как движения глаз и ориентировочное поведение (например, Siegel, 1967), так и на более неявную обработку, предполагаемую более поздними теориями обучения, например изменения параметров скорости обучения. Все это могло повлиять на последующую рецепцию и использование тех или иных раздражителей при формировании ассоциации в дальнейшем.

II. Обучение S-S или S-R?

Как заметил Спенс, в привычке нет ничего по существу СС или СР.Например, воспроизведите диаграммы Спенса (1950) и Холланда (1990), различающие потенциальные связи СС и СР в простом эксперименте Павлова. Если второй член ассоциации запаздывает в потоке обработки, мы описываем ассоциацию как S-R, а если он ранний, мы описываем ее как S-S. С этой точки зрения, насколько поздно это поздно и насколько рано это рано, определяют вопрос о том, является ли ассоциация или привычка S-R или S-S.

A: Диаграмма Спенса (1950), на которой показаны ассоциации стимул-стимул (СС) и стимул-реакция (СР).Sc и Su относятся к условному и безусловному раздражителям соответственно, A1 и A2 относятся к афферентным процессам, продуцируемым Sc и Su, E1 и E2 относятся к эфферентным процессам, продуцируемым A1 и A2, а Ro и Ru относятся к ориентировочным и безусловным реакциям. B: Диаграмма Холланда (1990), противопоставляющая ассоциации SS и SR. CS, US и UR относятся к условному раздражителю, безусловному раздражителю и ориентировочной реакции соответственно. Буквы a-d относятся к гипотетическим этапам обработки.

Поскольку в простейшем случае такие взгляды предполагают линейную цепочку обработки событий от получения стимула до двигательной активности, маловероятно, чтобы дихотомическая категоризация усвоенного поведения могла быть реально проведена в рамках психологических или нейрофизиологических теорий путем указания на различия в стимул по сравнению с обработкой ответа или сенсорные по сравнению с двигательными областями мозга.Тем не менее, вероятно, будет достигнуто значительное согласие в отношении того, что одни события являются «более стимулирующими», а другие — «более реакцией». Возможно, самыми ранними тестовыми аренами для постановки вопросов S-S или S-R были те, в которых были минимизированы либо стимульные, либо ответные аспекты второго, «подкрепляющего» события в ассоциативном событии.

Ответы без стимулов

Loucks (1935) исследовал обучение, когда сгибание передней ноги в присутствии зуммера индуцировалось электрической стимуляцией соответствующей области моторной коры, а не обычным ультразвуковым током передних ног.В этой процедуре предполагалось, что электрическая стимуляция вызывает реакцию без предварительного ввода стимула. Таким образом, обучение S-S должно быть невозможным, а обучение S-R не затронуто в этой подготовке. Действительно, Лоукс не нашел доказательств приобретения реакции сгибания ноги, предполагая, что смежность стимула и реакции недостаточна для обучения. Спенс (1950) согласился с этим мнением, но затем отметил, что во втором эксперименте Лоукс (1935) обнаружил, что если после стимуляции моторной коры зуммером следует прием пищи, сгибание ног приобретается.Спенс утверждал, что эту пару результатов можно легко интерпретировать в рамках основанной на вознаграждении теории СР: в отличие от удара ногой, стимуляция моторной коры вызывает реакцию сгибания, но не вызывает драйв (боль), снижение которой может усилить формирование привычки, в то время как добавление пищи добавляет такую ​​реакцию. источник вознаграждения. Хотя другие исследователи обнаружили успешное сгибание конечностей при помощи стимуляции моторной коры (например, Doty & Giurgea, 1961), более поздние эксперименты (например, Thomas, 1971; Wagner, Thomas, & Norton, 1967) поставили под сомнение, обнаруживают ли такие исследования прямое павловское обусловливание. реакции на сгибание ног или инструментальное обусловливание реакций, которые уменьшали негативные постуральные последствия внезапных неконтролируемых движений ног, вызванных стимуляцией моторной коры.И помимо этих опасений, можно легко задаться вопросом, обеспечит ли массивная, бессистемная стимуляция моторной коры подходящую основу для пластичности, необходимой для S-R обучения в этой точке системы. Примечательно, что в некоторых системах, таких как кондиционирование век, как КС, так и УЗИ могут быть заменены прямой стимуляцией нервных путей (например, Steinmetz, Lavond & Thompson, 1989; Thompson et al., 1998; см. раздел 3 этой статьи).

Стимулы без ответов

По той же логике, блокирование ответов на УЗ или выбор УЗ с минимальными ответами должны существенно ухудшить обучение, если обучение является S-R, но иметь небольшой эффект, если обучение является S-S.Ранние исследования периферической блокады ответов во время тренировки обычно выявляли значительную реакцию после снятия блокады (например, Finch, 1938). Однако снова легко утверждать, что никто на самом деле не ожидает, что обучение S-R будет локализовано в нервно-мышечном соединении или симпатическом нейроне. Такие исследования оказались более полезными в рассмотрении утверждений о том, что случайное инструментальное усиление двигательных реакций было ответственно за появление предположительно павловских CR.

Более плодотворным направлением исследований было сенсорное предварительное обусловливание, в котором относительно нейтральные стимулы, такие как свет и звук, сочетались друг с другом.Хотя обычно такие пары CS1-CS2 сами по себе не вызывали легко наблюдаемых изменений в поведении, последующее сочетание одного из них (CS2) с более значимым событием, таким как еда или шок, обычно приводило к обучению в ответ на другой сигнал (CS1). (). Как правило, считалось, что CR на нетренированный сигнал CS1 опосредуется цепочкой двух отдельно приобретенных ассоциаций во время исполнения. На начальном этапе СС-ассоциации формировались между событиями преимущественно сенсорного характера.Затем на втором этапе были сформированы ассоциации между CS2 и US. Наконец, когда CS1 будет представлен в тесте, он вызовет CS2, который, в свою очередь, вызовет CR (). Разумеется, изобретательные теоретики СР быстро предложили альтернативные решения проблемы сенсорной предварительной подготовки. Например (), на первой фазе между CS1 и ориентировочными ответами на CS2 могут формироваться связи S-R, а затем ассоциации между сенсорной обратной связью от этих ответов и реакцией на УЗИ во второй фазе.Наконец, в тесте S1 будет вызывать условный OR, первоначально вызванный CS2, а обратная связь от этих условных OR, в свою очередь, вызовет UR-подобный CR, обусловленный этими стимулами обратной связи во второй фазе (Osgood, 1953, стр. 461-462) . Поскольку такие ответы часто было нелегко наблюдать, эти версии часто было трудно подтвердить или опровергнуть. Тем не менее, сотни экспериментов по сенсорному предварительному обусловливанию дали доказательства обучения при отсутствии очевидных реакций (например, Thompson, 1972).Я подозреваю, что Спенс удовлетворился бы описанием этих результатов как примеров сенсорно-сенсорных привычек.

Процедуры и результаты эксперимента по сенсорной предварительной подготовке. A: Экспериментальные процедуры. B: Счет производительности, опосредованный стимулом. C: Счет производительности, опосредованный стимулом-реакцией. D: учетная запись обучения, опосредованная стимулом. CS1, CS2 и US относятся к двум условным раздражителям и безусловному раздражителю. OR2 и OR2-s относятся к ориентировочной реакции, первоначально вызванной CS2, и к стимульной обратной связи от OR2.Черточки (—) означают организованные отношения; стрелки (→) обозначают заученные ассоциации; двунаправленные стрелки ( ← → ) обозначают двунаправленные ассоциации; линии (—) обозначают безусловные отношения.

Как приведенные выше учетные записи S-S, так и S-R предполагают, что выполнение CR по отношению к CS1 опосредовано во время тестовых презентаций путем объединения отдельных ассоциаций, ранее установленных между CS1 и CS2, а также между CS2 и США. Прямых ассоциаций между CS1 и США не образуется. Альтернативная версия состоит в том, что прямые ассоциации формируются между CS1 и США на второй фазе.Согласно этому «опосредованному обучению» (Holland, 1981a) или «обратной сенсорной предварительной подготовке» (Ward-Robinson & Hall, 1996), на второй фазе CS2 ассоциативно активирует репрезентацию CS1, за которой затем следует US. Таким образом, ассоциации могут образовываться непосредственно между CS1 и УЗ, которые затем выявляются в финальном тесте только CS1 (). Обычно бывает трудно различить эти альтернативы, хотя примечательно, что в одном из первых экспериментов по сенсорному прекондиционированию человека Брогден (1947) проводил различие между испытуемыми, которые приписывали свою реакцию на CS1 в тесте тому, что он напоминает им о CS2, и испытуемыми, которые утверждали, что на Фазе 2 CS1 фактически работал в паре с США.Субъектов можно поощрять к использованию стратегии «опосредованного обучения», используя параметры кондиционирования, которые препятствуют использованию ассоциаций CS1-CS2, требуемых учетной записью опосредованной производительности, и вместо этого поощряют использование ассоциаций CS2-CS1, требуемых учетной записью опосредованного обучения. Например, Уорд-Робинсон и Холл (1996) представили два нейтральных стимула в порядке CS2-CS1 на первой фазе эксперимента по сенсорной предварительной подготовке и обнаружили существенную реакцию на CS1 в тесте.

Оценки характера обучения после обучения

В обсуждавшихся выше экспериментах логика заключалась в том, чтобы исследовать последствия изменения условий обучения таким образом, чтобы они способствовали (или не способствовали) обучению S-S или S-R.Однако, хотя такие исследования были полезны для демонстрации того, что обучение может быть S-S или S-R, они не дали информации о том, является ли обучение в любой типичной процедуре обусловливания S-S или S-R. Использование разного рода посттренировочных тестов часто позволяло собрать такую ​​информацию.

Тесты на перенос

Возможно, наиболее распространенным использованием тестов на перенос после обучения было определение того, усваивают ли крысы в ​​простых лабиринтах пространственные атрибуты среды лабиринта или реакции поворота.Например, в эксперименте Толмена «солнечные лучи» (Tolman et al., 1946a) крыс обучали в аппарате, в котором крысы сначала бежали прямо по переулку, затем должны были сделать левый и два правых поворота, прежде чем найти пищу справа. сторона комнаты. В тесте переноса крысам предъявляли аллеи, ведущие в виде веера под углами от стартовой зоны. Если бы крысы научились реакциям «повернуть налево» или «повернуть направо», можно было бы ожидать, что они выберут левый (0 градусов) или правый (180 градусов) переулок, если бы они научились «идти прямо, затем делать повороты», они выбирали прямолинейный (90°) переулок, но если бы они знали приблизительное расположение еды в комнате, они могли выбрать переулок, указывающий на это место (135°).Хотя Толмен и соавт. (1946a) обнаружили значительные индивидуальные различия в поведении крыс при выборе, большая часть данных подтверждает утверждение, что крысы узнают приблизительное местонахождение пищи (или что они соответствующим образом интегрируют прямой и правильный векторы реакции). Вариант этого эксперимента, который длился дольше, следует за тренировкой в ​​Т-лабиринте с тестом в лабиринте, когда он повернут на 180 градусов (Packard & McGaugh, 1996; Poldrack and Packard, 2003; Tolman, Richie, & Kalish, 1946b).Таким образом, в тесте стратегии «ответ» и «место» противопоставлены друг другу. Если крыса делает тот же поворот (например, вправо), что и при обучении, идентифицируется ответное обучение, тогда как если она приближается к той же стороне комнаты, что и при обучении, предполагается обучение на месте.

Изменения вознаграждения после обучения

Другой способ формулировки вопроса S-R vs S-S заключался в том, способствовало ли вознаграждение формированию ассоциаций или участвовало ли оно в них. То есть, вознаграждение просто формировало (Thorndike, 1898) или катализировало (Colwill & Rescorla, 1986; Rescorla, 1988) ассоциации стимул-реакция, или животные формировали ассоциации между стимулами и сенсорными и другими свойствами вознаграждения? Первоначальный подход к этому вопросу заключался в том, чтобы установить стабильное состояние производительности с помощью определенного вознаграждения, а затем заменить его другим вознаграждением.Если бы подкрепление просто закрепляло ассоциации, то нельзя было бы ожидать нарушения производительности (при условии, что замененное подкрепление имело сравнимую ценность), тогда как если бы животные ожидали определенного вознаграждения, то некоторые аспекты производительности могли бы быть чувствительны к изменению. Ранние эксперименты с отсроченной реакцией показали, что обезьяны могут сохранять в памяти представления об определенных пищевых продуктах в течение относительно длительных интервалов времени. Например, работая с Колером, Тинкельпау (1928) обучал обезьян выполнению задания, в котором экспериментатор с учетом испытуемого клал пищу под одну чашку, а не под другую, такую ​​же чашку.После задержки, во время которой чашки были скрыты от глаз обезьяны, экран убрали, и обезьяне сказали взять еду. На разных сеансах использовалось несколько разных продуктов. Обычно обезьяна выбирала правильную чашку и быстро съедала награду. Однако, если экспериментатор спрятал банан, но затем подставил под чашку салат, пока она была скрыта от глаз обезьяны, обезьяна рассматривала, но не трогала салат, тщательно исследовала чашку и иногда кричала на экспериментатора.Напротив, в последующем испытании, в котором салат был спрятан и сохранен под чашкой, обезьяна съела салат быстро и без происшествий. Таким образом, исходя из этих реакций на замещающее вознаграждение, обезьяны должны были представлять в памяти определенные аспекты вознаграждения. К сожалению, поскольку ожидание вознаграждения было вызвано представлением самого вознаграждения, а не соучастником вознаграждения, такие эксперименты проливают мало света на то, представлены ли свойства вознаграждения в ассоциативном обучении.Ближе к истине был эксперимент, проведенный в лаборатории Толмена Эллиотом (1928), в котором разные группы крыс обучались бегать по сложному лабиринту либо за семенами подсолнуха, либо за предпочтительным пюре из отрубей. После серьезной подготовки в группе отрубей награда в виде отрубей была заменена менее предпочтительными семечками подсолнуха. Хотя крысы охотно ели семена подсолнечника без каких-либо признаков беспокойства, результаты последующих испытаний были значительно нарушены, так что они были хуже, чем результаты крыс, которых с самого начала обучали семечками подсолнечника.Это нарушение предполагало, что крысы ожидали определенного вознаграждения. Однако Эллиот не проводил аналогичную замену подсолнечника на отруби, поэтому сбой мог отражать только последствия снижения величины вознаграждения.

В более поздних экспериментах более симметрично изучались эффекты замещения США в павловском обусловливании. Например, Холланд и Форбс (1982) обнаружили, что любой из двух УЗ (гранулы сахарозы с разным вкусом) лучше сохранялся в памяти (по оценке с помощью процедуры предварительного высвобождения, т.г. Terry & Wagner, 1976), если им предшествовала неконгруэнтная павловская CSI (т. е. для других US), чем конгруэнтная CS. Точно так же в моей лаборатории Александр Джонсон (неопубликованные данные) недавно обнаружил, что у мышей наблюдалось нарушение потребления каждой пары жидкостей US (лецитин и сахароза), когда каждое из них сопровождалось звуковым сигналом для другой жидкости. Таким образом, по крайней мере некоторые свойства поощрения, по-видимому, кодируются CS после простых процедур кондиционирования.

Переоценка подкрепления

Процедура переоценки подкрепления после обучения (формально описанная Rozeboom, 1958) стала золотым стандартом для анализа наличия или отсутствия SS (Павловской) или RS (инструментальной) ассоциаций (Pickens & Holland, 2004) .Сначала животные получают павловское или инструментальное обучение с одним или несколькими подкреплениями. Затем значение подкрепления изменяется при отсутствии сигналов или реакций обучения. Наконец, реакция оценивается при отсутствии какого-либо подкрепления. Часто уровень реакции, наблюдаемый в тесте, спонтанно изменяется, отражая изменения ценности поощрения, с которым он ранее сочетался. Основные преимущества этой парадигмы включают ее полезность практически после любой процедуры обучения и доступность широкого спектра методов изменения стоимости вознаграждения в сторону увеличения («инфляция») или уменьшения («девальвация»).Например, мотивационные состояния, связанные с подкреплением, могут быть вызваны химическим путем (например, увеличение или уменьшение баланса натрия после тренировки с вознаграждением в виде солевого раствора) или путем изменения их воздействия (например, выборочное насыщение одним из двух пищевых вознаграждений). Точно так же определенные аспекты вознаграждения могут быть ассоциативно изменены путем их сочетания с различными агентами, которые увеличивают или уменьшают их привлекательность. Даже неассоциативные манипуляции, такие как простое воздействие самого поощрения или более слабых или более сильных вариантов поощрения, могут быть эффективными (т.г. Рескорла, 1973, 1974).

Одним из первых применений этого метода было исследование Зенера и Маккарди (1939). Собаки, лишенные еды, получали два сигнала в сочетании с собачьим печеньем с разным вкусом. Затем собак бережно насыщали одним из вкусов собачьего печенья. Наконец, были отмечены реакции собак на каждый сигнал. Гораздо менее энергично они реагировали на намек на печенье, которым насытились. Хотя по нынешним стандартам исследование было несколько ошибочным, поскольку печенье по-прежнему предъявлялось в тесте (и, таким образом, снижение реакции могло отражать более низкую ценность подкрепления сытым печеньем, а не спонтанную корректировку реакции на основе ее измененной ценности), эти и другие результаты воодушевили Зинера (1937, с.386) описывать обусловливание как «реорганизацию в некое функциональное целое систем восприятия, соответствующих условным и безусловным раздражителям; и в функциональном отношении этой организованной системы к системе побуждения или напряжения, первоначально возбуждаемой безусловным стимулом», а не в обучении S-R-ассоциациям.

Аналогичная логика мотивировала ранние исследования различительного поведения в лабиринтах или переулках Толменом (1933), Миллером (1935) и Толменом и Глейтманом (1949).Tolman (1933) первоначально обучал крыс в ящике для различения с двумя вариантами выбора с двумя отличительными стимулами, черными или белыми занавесками. Прохождение (скажем) через черные занавески привело к ящику с едой, тогда как прохождение через белые занавески привело к тупику без еды. После тщательного обучения выполнению этой задачи крыс помещали прямо в коробку с едой и били электрическим током. Наконец, крыс возвращали в стартовый бокс и позволяли им бегать. Если бы крысы действительно усвоили ассоциации «реакция-коробка с едой» или «ожидание знака-гештальта», то даже при первом испытании они не смогли бы бежать.Однако каждая крыса «сразу же весело и как обычно промчалась через весь дискриминационный аппарат и с треском врезалась в отделение для еды, в котором ее только что потрясли током» (Tolman, 1933, с. 250).

1933), Миллер (1935) пошел еще дальше, описав SR-объяснение того, как крысы могут проявлять гибкое поведение в такой ситуации, и продолжил демонстрировать это. В своем отчете Миллер использовал концепцию дробных упреждающих целевых реакций. Крысы могут давать мощные целевые реакции (Rg, e.g., жевание), части которых (rg) могут быть обусловлены аллегорическими сигналами, которые предшествуют самой цели. Когда крысу впоследствии помещали в коробку с мишенью и били током, реакции прыжков или замирания на шок могли быть обусловлены стимулирующей обратной связью от предыдущих целевых реакций, основанных на еде (например, Rg-Sg→Rshock). Затем, когда крысу поместят обратно в переулок, выполнение условного rg приведет к ответному сигналу sg, который, в свою очередь, вызовет условную дробную часть реакции на шок, препятствующую бегу.Миллер предположил, что все, что потребуется для получения ожидаемых данных Толмена, — это придать ячейкам с целями характерные ответы на цели. Он сделал это, используя две награды (еда и вода) и две отличительные цели, одна из которых требовала подъема и резкого поворота направо, а другая требовала прямого входа, за которым следовал резкий левый поворот. В отличие от аппарата Толмена, который требовал различения одновременного выбора, Миллер использовал один проход с одним полем для ворот, но подвергал крыс воздействию другого поля для ворот в отсутствие прохода.Когда позже крыс помещали непосредственно в вход в одну из ворот и били током, реакция на шок зависела от определенного Sg, возникающего из характерного Rg в этом боксе. Если крысу подвергали электрошоку в том же воротном поле, которое всегда находилось в конце дорожки, помещение этой крысы обратно в начальное поле аллеи для теста вызвало бы РГ, чья обратная связь СР была связана с частичной реакцией на шок, и, следовательно, мешать бегу. Напротив, если бы крысу били током в другой клетке, обратная связь sg rg, вызванная переулком, не была бы связана с реакцией на шок, и такого вмешательства не ожидалось бы.Миллер (1935) действительно нашел этот результат. Таким образом, отчет Миллера S-R не только объяснял такое поведение девальвации, но и предлагал условия, при которых она будет и не будет наблюдаться.

Интересно, что в классическом исследовании Т-образного лабиринта Толмана и Глейтмана (1949), в котором Толмен, наконец, преуспел в обнаружении спонтанной девальвации, две ячейки цели также были сконструированы таким образом, что они требовали различных целевых ответов (хотя Толмен и Глейтман вместо этого подчеркнул разницу в восприятии между коробками).Наконец, в одном из наиболее причудливых поворотов логики rg-sg-опосредования эффектов девальвации, используя вариант процедуры Миллера (1935), Фаулер и Миллер (1963) обнаружили, что удары по воротам могут либо снизить, либо улучшить результаты теста. в зависимости от того, наносились ли удары током на передние или задние лапы крыс. Если бы удары наносились на передние ноги, R-шок отскакивал бы назад, но если бы они наносились на задние ноги, R-шок прыгал бы вперед.Когда их заменяли в переулках, крысы, получившие удары током по передним лапам, отпрыгивали назад, что замедляло их работу, но те, кто получал удары током от ворот по задним лапам, прыгали вперед, повышая свою производительность. Таким образом, еще раз, система посредничества rg-sg не только обеспечивала S-R учет эффектов «девальвации», но также предсказывала характер результата на основе характеристик условной фракционной предвосхищающей реакции.

Современный эксперимент по девальвации

Современный эксперимент по девальвации связан с использованием Рескорла процедуры для изучения содержания павловской защитной (Rescorla, 1973, 1974) и аппетитной (Holland & Rescorla, 1975) обусловленности, а затем с использованием процедура Дикинсона, Рескорла и их коллег по изучению инструментального обусловливания вознаграждения (например,г., Адамс и Дикинсон, 1981; Баллейн и Дикинсон, 1991; Колвилл и Рескорла, 1985b, 1986; Рескорла, 1987). В каждом из этих исследований наблюдался умеренный эффект девальвации США после объединения CS-US. Например, Холланд и Рескорла (1975) сочетали тон с пищевыми гранулами, а затем обесценивали пищу, либо насыщая крыс этими гранулами, либо комбинируя их с высокоскоростным вращением, вызывая укачивание. Они обнаружили, что крысы, получившие такую ​​девальвацию, показали меньшую реакцию, чем те, которые не получали сытости или получали непарные презентации еды и вращения.В то же время у крыс, которые подвергались условному рефлексу второго порядка того же тона, не было обнаружено такого влияния любой девальвационной обработки на CR второго порядка, что исключает множество простых основанных на характеристиках объяснений снижения реакции после девальвации.

Результаты, подобные этим, побудили авторов текстов по обучению и вводной психологии утверждать, что обусловливание является преимущественно СС. Но такой вывод не обязательно хорошо обоснован. Во-первых, эффекты девальвации обычно невелики и, возможно, ограничиваются ограниченным набором параметров обучения.Я получил много сообщений с запросами информации «как сделать» от исследователей, которым не удалось обнаружить эффекты девальвации. Хотя обычно мне удавалось направить их на путь успеха в получении этого феномена, примечательно, насколько малы многие эффекты девальвации в абсолютном выражении. Например, показаны эффекты девальвации в последней дюжине экспериментов, опубликованных сотрудниками моей лаборатории. Большинство этих исследований было проведено на интактных животных, хотя некоторые из них представляют эффекты девальвации у крыс с ложным поражением различных областей мозга, которые, как известно, важны для девальвации.Примечательной особенностью этих данных является то, насколько малы различия между контрольными условиями и условиями девальвации, а также то, сколько остается реагирующих после девальвации. В большинстве случаев девальвация самих США была полной, то есть крысы почти ничего не потребляли из самой пищи. Colwill и Rescorla (1990) широко обсуждали этот вопрос в контексте инструментальной девальвации, указывая на важность таких переменных, как сходство между моделями подачи США на стадиях обучения и девальвации.Тем не менее, в большинстве случаев остаток достаточно велик (но см. Colwill & Rescorla, 1990; Kerfoot et al., 2007).

Результаты 12 экспериментов по девальвации в моей лаборатории. В каждом эксперименте слуховой или зрительный условный раздражитель (УС) сначала сочетался с едой, затем пища либо обесценивалась путем сочетания ее с хлоридом лития (LiCl), либо поддерживалась путем предъявления пищи и LiCl непарно, и, наконец, УС предъявлялся отдельно. контрольная работа.

Во-вторых, результаты экспериментов по девальвации могут существенно различаться в зависимости от выбранного агента девальвации.Например, Холланд и Штрауб (1979) и Холланд (1981b) исследовали влияние обесценивания пищи за счет насыщения или сочетания ее с хлоридом лития или высокоскоростным вращением. показывает потребление пищи и эффективность упреждающих реакций входа в чашку с едой на сигналы в сочетании с едой после обесценивания каждым из этих трех методов. В этих исследованиях было обнадеживающе, что степень снижения потребления была положительно коррелирована со степенью снижения реакции чашки с едой во время CS.В то же время бросается в глаза и отсутствие такой корреляции. Например, Galarce, Crombag и Holland (2007) обучали крыс двум слуховым сигналам, сигнализирующим о двух продуктах (сахароза и мальтодекстрин). Один продукт сочетался с LiCl, а другой — нет. Наконец, крыс тестировали в присутствии двух тонов. Необычной особенностью этого эксперимента было то, что в разных тестовых сессиях либо предотвращенные, либо непредотвращенные США были представлены в чашке с едой во время теста на девальвацию.Интересно, что постоянное присутствие любого из этих продуктов в чашках для еды мало влияло на реакцию на CS. Хотя неудивительно, что крысы проводили больше времени в чашке с едой, когда она содержала непредотвращенную пищу, чем когда она содержала непредотвращенную пищу, CS для непредотвращенной пищи усиливал реакцию чашки с едой, чем сигнал для избегаемой пищи, независимо от того, какая пища была съедена. физически присутствует. Таким образом, ответ, основанный на ожидаемой цели, может иметь место, несмотря на явно опровергающие доказательства цели.

Левые столбцы: Показатели условных реакций чашки с едой (CR) только на условный раздражитель (CS) в тестовом сеансе после того, как пища была обесценена путем сочетания ее с хлоридом лития (LiCl) или высокоскоростным вращением, или путем насыщения этой пищей. . Правые столбцы: количество пищевых гранул, потребленных за 10 минут после того, как 50 пищевых гранул были помещены в чашку для еды в экспериментальных камерах. Реакция в состоянии поддержания представляет собой совокупность реакций на тест CS, который предъявлялся после непарных предъявлений еды и LiCl или вращения, или в отсутствие пищевого насыщения.Данные взяты из Holland (1981b) и Holland and Straub (1979).

Еще одной проблемой в экспериментах по девальвации является показатель, выбранный для отражения ожидаемого результата. Во-первых, некоторые показатели более чувствительны к девальвации, чем другие. Холланд и Штрауб (1979) обнаружили, что поведение более поздних цепей (например, контакт и взятие гранулы) проявляет большую чувствительность к обесцениванию пищи в сочетании с LiCl, чем поведение ранних цепочек (приближение к чашке с едой). Интересно, что некоторые более косвенные показатели обучения, которые, как часто считают, отражают мотивационные свойства условного стимула, кажутся особенно нечувствительными к обесцениванию.Например, Holland (2004) и Rescorla (1994) не нашли доказательств того, что на павловско-инструментальный перенос повлияла девальвация подкрепления. В исследовании Холланда (2004) после тренировки с двумя CS, двумя УЗ и двумя инструментальными реакциями сочетание одного УЗ с LiCl снижало базовые уровни инструментальных ответов для этого УЗ и уменьшало реакции чашки с едой на CS, которые предсказывали это УЗ, но не повлияло на степень, в которой этот CS усилил инструментальную реакцию, которая обычно заслуживала этого УЗИ.Точно так же Паркинсон и соавт. (2005) обнаружили, что хотя после повторного тестирования девальвация США полностью устранила реакцию, вызванную CS, эта CS не утратила своей способности служить вторичным или условным подкреплением.

Во-вторых, меры реагирования и методы девальвации могут взаимодействовать. Например, несмотря на то, что Холланд и Штрауб (1979) обнаружили, что обесценивание пищи под действием LiCl снижает вход в чашку с едой в большей степени, чем обесценивание при высокоскоростном вращении, вставание на задние лапы при зрительных сигналах и реакция вздрагивания на слуховые сигналы в большей степени зависели от вращения с большим расходом, чем от вращения. пары еда-LiCl.Напротив, насыщение снижало оба класса ответов на промежуточную степень. Ясно, что «ценность США» не является одномерной по отношению к системам поведения. Различные поведенческие реакции могут быть опосредованы различными сенсорными свойствами репрезентаций США, которые, в свою очередь, могут быть по-разному чувствительны к различным методам девальвации. Я кратко вернусь к этому вопросу в разделе 3.

В-третьих, аппетивные и завершающие КО могут реагировать на обесценивание подкрепления совершенно по-разному.Хотя, как было отмечено в работе, реакции на чашку с едой часто проявляют относительно небольшую чувствительность к обесцениванию подкрепления, консумирующие CR, такие как облизывание и различные так называемые вкусовые реакции (TR; Berridge, 2000; Grill & Norgren, 1978), считаются отражающими гедонистические реакции. или вкусовые аспекты вознаграждения часто более полностью исключаются. Используя крыс с постоянными внутриротовыми канюлями, Kerfoot et al. (2007) соединили тональное КС с внутриротовой доставкой раствора сахарозы за один сеанс в двух группах крыс и представили эти события непарными у других крыс.Крысы в ​​группе Devalue затем заболевали инъекцией LiCl после однократного сеанса внутриротовой доставки сахарозы при отсутствии тонуса, в то время как крысы в ​​группе поддержания получали сахарозу и LiCl в отдельные дни. Контрольные крысы, обученные с непарным тоном и сахарозой, также получали сахарозу и LiCl, либо парные, либо непарные на этой фазе. Наконец, все крысы были протестированы с сочетанием тона с настоями простой воды. Крысы в ​​группе поддержания показали высокие уровни показателей TR положительного (гедонистического) аффекта в тестовых испытаниях ().Хотя эти ответы были особенно очевидны в присутствии воды, которая служила субстратом для их проявления, они также возникали во время одного тона, до вливания воды в каждом испытании. Напротив, крысы в ​​группе Devalue показали не больше облизывания или положительных ТУ, чем крысы из контрольной группы. Таким образом, девальвация была полной. Кроме того, эти крысы показали значительно больше отрицательных TR, таких как зияние и сокращенное облизывание, которые обычно проявляются в ответ на сами предотвращенные вкусы, чем крысы контрольной или поддерживающей группы (10).Возникновение этих отрицательных ТУ особенно важно, потому что крысы Devalue никогда ранее не выполняли отрицательные ТУ ни на тон, ни на сахарозу. Во время сочетания тон-сахароза и во время введения одной сахарозы перед инъекцией LiCl сахароза вызывала только положительные TR, и сахароза не презентировалась снова после однократной инъекции LiCl. Таким образом, демонстрация отрицательных ответов TR крысами Paired-Devalue в тесте не могла отражать обучение S-R, даже через механизмы опосредования S-R (Osgood, 1953) или rg-sg (Miller, 1935), описанные ранее.

Положительные (панель А) и отрицательные (панель Б) вкусовые реактивные реакции (ВР) при тестовых предъявлениях тонового условного раздражителя (УС) и простой воды в девальвационном тесте. Крысы сначала получали пары тон → сахароза, за которыми следовали либо пары сахароза-хлорид лития (LiCl) (Devalue), либо непарные представления этих событий (поддержание). Контрольные крысы получали тон и сахарозу без пары во время обучения, а затем сахарозу и LiCl в паре или без пары. Все жидкости вводились интраорально.Данные взяты из Kerfoot et al., 2007.

На основании результатов Kerfoot et al. (2007) заманчиво предположить, что заученные завершающие или ТР ответы особенно чувствительны к обесцениванию. Однако более простая возможность заключается в том, что внутриротовая доставка подкрепления и использование этого метода доставки как на этапах обучения, так и на этапах девальвации являются более важными факторами. В соответствии с этой возможностью Colwill и Rescorla (1990) обнаружили почти полную девальвацию нажатия на оперантный рычаг после обучения и девальвацию при внутриротовом подкреплении.Совсем недавно Холланд, Лассетер и Агарвал (2008) исследовали завершающие и ТР ответы в экспериментах по девальвации с внутриротовой или обычной (в утопленную чашку) доставкой сахарозных усилителей. Пищевые чашки были оснащены камерами, позволяющими измерять ответы TR в условиях чашки, а также в условиях внутриротовой доставки. Положительные ответы TR показали одинаковую картину независимо от метода введения сахарозы. Как при интраоральном, так и при чашечном методе доставки крысы в ​​состоянии Devalue показали почти полную потерю положительных TR после девальвации сахарозы по сравнению с крысами в состоянии поддержания, и только крысы в ​​состоянии Devalue показали отрицательные ответы TR (12).В то же время вход в пищевую чашку показал лишь частичную чувствительность к девальвации сахарозы. Кроме того, в обоих условиях родов простые реакции лизания, охарактеризованные Berridge (2000) как завершающие, но негедонические, показали умеренную, но не полную чувствительность к девальвации. Таким образом, результаты исследования Holland et al. (2008) показывают, что, независимо от метода подачи подкрепления, оценочные ответы ТР особенно чувствительны к обесцениванию по сравнению с неоценочными консуматорными реакциями (простое облизывание) и (при обычном подкреплении) к девальвации. аппетитные реакции (вход чашки с едой).

A: Пищевая чашка и положительная вкусовая реактивность (TR), реагирующая во время тестовых презентаций на тон и простую воду после минимального количества пар тон-сахароза, за которыми следуют либо пары (Devalue) сахарозы с хлоридом лития (LiCl), либо непарные презентации этих событий (поддерживать). B: То же, что и панель A, за исключением того, что после интенсивной тренировки с сахарозой. C: Простое (неоценочное) облизывание, положительная ТР и отрицательная реакция ТР во время тестовых представлений тона и простой воды, после минимального количества пар тон-сахара, за которыми следуют либо пары (девальвация) сахарозы с LiCl, либо непарные презентации этих событий ( Поддерживать).D: То же, что и панель C, за исключением того, что после интенсивной тренировки с сахарозой. Все жидкости подавались в утопленную пищевую чашку (панели A и B; Holland et al., 2008, Эксперимент 1) или внутриротовые (панели C и D; Holland et al., 2008, Эксперимент 2).

Вторая цель исследования Holland et al. (2008) состояла в том, чтобы изучить влияние объема обучения на эффективность девальвации с учетом всех этих показателей. В контексте инструментального обучения часто утверждается (например, Adams, 1982; Kimble & Perlmuter, 1970; но см. Colwill & Rescorla, 1985a; Colwill & Triola, 2002; Holland, 2004), что выученная реакция становится все более невосприимчивой к подкреплению. девальвация с расширенным обучением.Действительно, одно из алиби Толмена (1933) (его слова) для отсутствия эффекта девальвации заключалось в том, что его крысы были перетренированы и «зациклились» на беге. Мы никогда не наблюдали такого эффекта в павловском обусловливании; то есть павловские CR, по крайней мере, так же чувствительны к обесцениванию пищи в сочетании с LiCl после расширенного обучения, как и после минимального обучения (например, Holland, 1998; 2004, 2005). Тем не менее, мы часто наблюдали резкую потерю способности павловского CS участвовать в «опосредованном обучении» по мере продолжения обучения.

Holland (1981a, 1990) обнаружил, что опосредованное обучение отвращению к еде может быть установлено, когда ассоциативно-активированное представление о еде сочетается с болезнью (см. Holland & Wheeler, в печати, для недавнего обзора). Например, в одном эксперименте (Holland, 1981a) крысам сначала давали пары двух слуховых CS с двумя пищевыми подкрепителями, которые различались только по вкусу (например, тон → сахароза со вкусом грушанки и шум → сахароза со вкусом мяты перечной), чтобы дать эти CSs способность избирательно активировать представления того или иного из этих подкреплений.Затем предъявление одного из слуховых CS в одиночку сочеталось с инъекцией токсина хлорида лития (LiCl) в отсутствие каких-либо ароматизаторов. Последующие тесты потребления показали установление легкого отвращения к еде, чей партнер CS был связан с болезнью, как если бы активация CS репрезентации еды непосредственно перед индукцией болезни позволяла формировать ассоциации пищевого заболевания. Позже Холланд (1990, 1998, 2005) обнаружил, что, хотя пары CS-LiCl вызывали значительное опосредованное отвращение к пище после 16-24 пар CS-пища, крысы, обученные с 40 или более парами CS-пища, не показали признаков такого опосредованного отвращения к пище.В то же время другие крысы, тренированные с 160 парами CS-US, продолжали демонстрировать признаки обучения S-S тон-пища, на что указывали процедуры девальвации подкрепления. Эти результаты привели Холланда (Holland, 1990, 1998, 2005) к предположению, что в начале обучения CS активируют широкий спектр процессов обработки, обычно активируемых самими США, включая процессы восприятия на ранней стадии, но по мере продолжения обучения этот доступ сужается до более ограниченного уровня. наборы систем обработки. Таким образом, с этой точки зрения опосредованное обучение отвращению к вкусу не наблюдалось позже в ходе обучения, потому что CS больше не активировал перцептивную обработку отсутствующего вкуса, которая могла бы ассоциироваться с болезнью.

Логика исследований Holland et al. (2008) заключалась в том, что если обусловленность реакций TR на сигналы в сочетании с сахарозой отражает активацию сигналов перцептивной обработки отсутствующей сахарозы, и что такая активация происходит только в начале обучения , то только минимально обученный CS будет контролировать эти положительные оценочные ответы, а более тщательно обученный CS — нет. В каждом из своих экспериментов Holland et al. (2008) тренировали каждую крысу с двумя КС, одна из которых 16 раз применялась в паре с сахарозой, а другая — 112 раз.показать ответ на минимально обученный CS (описанный ранее), тогда как показать ответ на экстенсивно обученный CS. Как и предполагалось, проявление условных реакций ТР наблюдалось только после минимальной тренировки. В то же время аппетитные и неоценочные завершающие реакции (простые облизывания) были чувствительны к обесцениванию сахарозы как после минимальной, так и после экстенсивной тренировки.

Эти данные, как и данные исследований опосредованного обучения, согласуются с точкой зрения (Holland, 1990) о том, что на ранних этапах обучения CS активирует процессы восприятия, обычно активируемые самой пищей.С этой точки зрения любая функция, обычно контролируемая вкусом США, должна быть доступна CS. Таким образом, можно ожидать опосредованного обучения отвращению к этому подкреплению, если CS сочетается с инъекцией LiCl, потому что крыса заболеет после того, как попробует отсутствующий US. Точно так же этот CS должен контролировать оценочные ответы TR, соответствующие этому вкусу, как заметили Holland et al. (2008) и Керфут и др. (2007). Поскольку CS будет активировать предоценочную перцептивную обработку США пищи, наблюдаемый TR будет соответствовать текущей оценке вкуса этой пищи и, таким образом, будет чувствителен к посттренировочным изменениям ценности подкрепления, как это наблюдалось в этих экспериментах. исследования.Напротив, по мере продолжения обучения CS теряет доступ к этой низкоуровневой перцептивной обработке США и вместо этого активирует аспекты обработки подкрепления, которые не включают сам перцептивный опыт или способность контролировать оценочные реакции, соответствующие текущей оценке этого состояния. перцептивный опыт. Эти более концептуальные аспекты США, тем не менее, должны включать как сенсорную, так и некоторую мотивационную информацию, потому что эффекты девальвации подкрепления остаются в высокой степени специфичными для США даже после того, как CS теряют свою способность контролировать ответы TR или опосредовать обучение отвращению к новому вкусу (Holland, 1998). .

Очевидно, что в этой истории есть нечто большее, чем ассоциации S-S и S-R. Репрезентации, активируемые CS после минимального и расширенного обучения, можно отличить по их способности участвовать в новом (опосредованном) обучении и по их способности контролировать соответствующие оценочные ответы TR. Тем не менее, даже после длительного обучения CS могут активировать репрезентации подкрепления, которые включают в себя богатую сенсорную информацию, которая может поддерживать эффекты обесценивания подкрепления. Это различие похоже на то, которое было предложено Конорским (1967, e.г., стр. 170-181), который различал ассоциативную активацию «галлюцинации» и «образа» КС. В первом случае считалось, что КС вызывает активность сенсорных «проективных» единиц, которая может напоминать активность этих единиц при их активации самим УЗ. Напротив, в последнем случае CS активировала только «гностические» единицы, которые кодировали информацию о США, но которые обычно не генерировали перцептивную обработку. Проще говоря, галлюцинация включает в себя сенсорное переживание отсутствующего объекта, тогда как можно представить этот объект и его сенсорные свойства, не испытывая их.

III. Может ли анализ нейронных систем помочь нам понять содержание обучения?

В разделе I я отметил, что Спенс пренебрежительно относился к физиологии, даже предложенной Халлом, как к вводящей в заблуждение, а не полезной при описании математических и поведенческих аспектов обучения привычкам. Однако результаты описанных мной задач на девальвацию подразумевают, что ассоциативное обучение может задействовать различные уровни нейронной обработки. Пластичность не уникальна ни для одной из окружностей в . Например, исследования нейронной пластичности при кондиционировании век (e.г., Медина и др., 2000; Steinmetz и др., 1989; Thompson et al., 1998) идентифицировали участки пластичности мозжечка, которые можно охарактеризовать как находящиеся в пределах «выходных» путей и, следовательно, более «S-R», а также другие участки, расположенные ранее в потоке обработки. Разумная исследовательская программа могла бы представить себе обстоятельства, при которых сигналы управляют обработкой информации в различных системах мозга, которые предпочтительно контролируют разные аспекты поведения. Понимание потока информации в мозге может помочь нам понять, почему, например, некоторые продукты обучения, такие как контроль ответов TR и способность поддерживать опосредованное обучение, связаны своими быстрыми битоническими функциями приобретения, почему другие, по-видимому, сохраняют чувствительность к обесцениванию из-за интенсивного обучения, а третьи, кажется, теряют эту чувствительность из-за обучения.

Различные нейробиологические методы были использованы для получения информации, необходимой для понимания содержания обучения. Методы стимуляции мозга вышли далеко за рамки грубой стимуляции моторной коры, как в опытах Лоукса (1935). Например, в анализе нейронных систем для кондиционирования век замена реальных событий, таких как CS и УЗИ (или оба, например, Steinmetz et al., 1989) стимуляцией мозга выявила события, критические для кондиционирования век.Точно так же паттернированная стимуляция миндалевидного тела помогла выяснить механизмы приобретения и угасания условного рефлекса страха (Vidal-Gonzalez et al., 2006).

Точные, фармакологически избирательные поражения и обратимая инактивация различных групп клеток могут избирательно изменять чувствительность крыс к девальвации, не влияя на другие аспекты деятельности. Например, повреждение компонентов схемы, включая базолатеральную миндалевидное тело (БЛА), орбитофронтальную кору (ОФК), субрегионы медиально-префронтальной коры и, в некоторых случаях, медиодорсальный таламус, нарушает павловскую девальвацию крыс, не влияя на приобретение пищи. чашка CR или отвращение к вкусу (Gallagher et al., 1999; Хэтфилд и др., 1996; Мэддакс и Холланд, 2007 г .; Пикенс, 2008 г.; Пикенс и др., 2003). Более того, эти исследования показывают, что разные части этой схемы выполняют специализированные функции в рамках задачи девальвации. Например, для того чтобы крысы демонстрировали эффекты обесценивания при процедурах с одним подкреплением, функция BLA необходима во время начальных сочетаний CS-пища, но не после этого. То есть, если крысы приобрели ассоциации CS-пища при сохранной функции BLA, то последующие поражения не ухудшают показатели этой формы девальвации, как если бы функция BLA нужна крысам для приобретения ассоциаций SS, а не SR, но не для использования ранее -установленные ассоциации SS для управления поведением (Pickens et al., 2003). Напротив, функция OFC, по-видимому, имеет решающее значение для выражения, а также для приобретения таких ассоциаций в задачах девальвации. Поражения OFC нарушают выполнение девальвации (то есть крысы не могут спонтанно снизить реакцию на CS после девальвации США), независимо от того, выполняются ли они до CS-пищи, отвращения к пище или заключительных фаз теста (Pickens et al., 2003, 2005) . Наконец, вовлечение этих областей мозга может варьироваться в зависимости от требований задачи. Например, хотя при использовании одной комбинации сигнал-поощрение функция BLA не требуется после установления ассоциации сигнал-поощрение, при использовании двух или более сигналов и поощрений функция BLA также должна быть неповрежденной во время тренировки отвращения к вкусу. и/или тестирование на девальвацию (Johnson et al., 2007). Точно так же Пикенс (2008) обнаружил, что функция медиодорсального таламуса была важна для выполнения задачи павловской девальвации только в том случае, если эта задача требовала смены стратегии по сравнению с предыдущей задачей.

Результаты недавних исследований электрофизиологических записей также предполагают, что процедуры кондиционирования могут устанавливать различные типы ассоциаций как внутри, так и между взаимосвязанными областями мозга. Например, используя задачу распознавания запаха, Шенбаум, Чиба и Галлахер (1998) обнаружили нейроны в BLA и OFC, которые можно охарактеризовать как отражающие ассоциации SS и ответ-стимул (RS).Эти нейроны сначала избирательно реагировали на одно из двух подкреплений, используемых в задании, но в ходе обучения их активность перешла под контроль либо определенного запаха, либо определенной реакции. Более поздние исследования показали, что характер нейронного кодирования информации о результатах стимула или реакции в этих двух областях мозга зависит от связи между ними (например, Saddoris, Gallagher, & Schoenbaum, 2005; Schoenbaum, et al., 2003). Совсем недавно Furuyashiki, Holland и Gallagher (2008) также сравнили активность нейронов OFC, которые кодируют информацию о результатах, с теми, которые кодируют информацию об ответах.Эти последние нейроны специфически реагировали на определенные ответы, но не на определенные подкрепления. Хотя эти последние нейроны нельзя рассматривать как субстрат для S-R-ассоциаций, поскольку они повышали свою активность только после выполнения закодированного ответа, их существование показывает, что, по крайней мере, в некоторых областях мозга отдельные нейроны могут кодировать различные виды информации о задачах.

Наконец, мы использовали методы немедленной и ранней экспрессии генов, чтобы связать функцию мозга с производительностью в простых задачах девальвации (и других).Наша цель состоит в том, чтобы связать различия в производительности в разных условиях с различиями в системах мозга, задействованных в этих условиях. Посмертный анализ ткани может дать подробную информацию об отдельных нейронах, которые были активны (Lee et al., 2005) или претерпевали пластические изменения (Guzowski & Worley, 2001; Petrovich et al., 2005) в течение довольно ограниченных интервалов времени, таких как конкретный эпизод поведенческого теста перед жертвоприношением. Например, после оценки ответов ТР на минимально тренированный тон CS в отсутствие сахарозы Kerfoot et al.(2007; ) умертвили своих крыс для изучения экспрессии FOS, белкового продукта зависимого от активности гена немедленного раннего развития c-fos . Они обнаружили, что экспрессия FOS, зависящая от обучения и девальвации, в ряде областей мозга, известных из экспериментов с повреждениями (только что описанных), имеет решающее значение для обучения, чувствительного к девальвации результата (базолатеральная миндалина и орбитофронтальная кора; Holland & Gallagher, 2004). области, связанные с отображением ответов TR (прилежащая оболочка; Reynolds & Berridge, 2002), и области, связанные с обработкой вкусовой информации (вкусовая кора; Kiefer & Orr, 1992).Эти последние наблюдения особенно интересны в связи с нашим более ранним предположением о том, что обусловливание может наделять CS способностью активировать перцептивную обработку отсутствующих US. Если в результате сочетаний тон-сахара тон вызывал восприятие сладости, делая вкус простой воды сладким, можно было бы ожидать, что крысы в ​​условиях девальвации и поддержания продемонстрируют повышенную активность ФОС в вкусовой коре, что они и сделали. Более того, поскольку крысы в ​​поддерживающем состоянии реагировали бы на сладкое аппетитными вкусовыми реакциями, сам по себе тон также вызывал бы эти реакции, а активность ФОС в части прилежащей оболочки коррелировала с такими реакциями.Напротив, поскольку крысы в ​​состоянии девальвации будут реагировать на сладкое аверсивными реакциями, тон будет провоцировать аверсивные реакции, а ФОС в другом субрегионе прилежащей оболочки коррелирует с аверсивными реакциями TR. Все эти результаты наблюдались. Учитывая выводы Холланда и др. (2008), было бы интересно определить, является ли более интенсивно тренируемый CS, который не может вызвать аппетитные ответы TR во время обучения или вызывает отрицательные ответы TR после девальвации и который не поддерживает опосредованное вкусовое -обучение с отвращением также не может индуцировать ФОС в прилежащей оболочке или вкусовой коре.

Интересно, что хотя Kerfoot et al. (2007) обнаружили зависимую от кондиционирования экспрессию ФОС в центральном ядре миндалевидного тела (CeA), на эту экспрессию не влияли условия девальвации (девальвация или сохранение). Это наблюдение примечательно по трем причинам. Во-первых, это предполагает, что ассоциативно активируемые вкусовые воспоминания не полностью взаимозаменяемы с самими вкусами. Информация о вкусе и болезни сходятся в этой области (Bernstein & Koh, 2007; Yamamoto, 2007), и известно, что CeA играет важную роль во многих аспектах обучения и выражения вкусовых отвращений (Lamprecht and Dudai, 2000; Yamamoto, 2007).Однако, если бы ассоциативно активируемая вкусовая память инициировала эти аспекты обработки вкуса, мы бы наблюдали различную активность СЕА в условиях поддержания и девальвации. Во-вторых, поражение СеА не влияет на характеристики девальвации (Hatfield et al., 1996). В-третьих, функция СеА имеет решающее значение для приобретения условных ОР, которые в других обстоятельствах Холланд и Штрауб (1979) обнаружили, что они относительно нечувствительны к девальвации в парах пища-LiCl. Взятые вместе, эти два последних наблюдения предполагают сходящиеся доказательства, которые связывают различия в чувствительности условных OR и связанных с пищей CR к процедурам девальвации на основе LiCl (Holland & Straub, 1979) с различиями в схемах мозга, поддерживающих эти усвоенные реакции.Различия в рабочих характеристиках этих систем могут определять различную чувствительность различных поведенческих систем к параметрам девальвации.

Эти исследования нейронных систем девальвации и связанных с ней явлений ясно показывают, что вопросы содержания обучения сложны. Даже в кажущихся простыми поведенческих системах, таких как рефлекс моргания, в обслуживающих их нейронных системах имеется множество возможностей для пластических изменений. Последствия экспериментального манипулирования стимулами окружающей среды для обучения могут значительно варьироваться в зависимости от этих систем и их компонентов.Становится все труднее различать ассоциации SS и SR с какой-либо уверенностью на основе какого-либо отдельного поведенческого анализа или аспекта нейронной обработки. Характеристика множественных поведенческих и нейронных последствий вариаций в ассоциативных процедурах обучения должна привести к более богатым, хотя, возможно, и менее постижимым описаниям природы обучения.

Выводы

В контексте ассоциаций S-S и S-R в обучении маятник решительно качнулся в сторону познания со времен Спенса.В настоящее время существует множество демонстраций кодирования подробных сенсорных аспектов подкрепления с помощью CS из ряда поведенческих парадигм, включая сенсорное предварительное обусловливание, обесценивание подкрепления, опосредованное обучение и другие. Возможно, из-за этих многочисленных примеров приобретение S-R ассоциаций редко исследуется напрямую. Ассоциация SS стала стандартной, и отсутствие ее доказательств больше не принимается в качестве доказательства ассоциации SR, как это было раньше. Например, хотя эффекты девальвации часто невелики, по-видимому, преобладает мнение, что остаточная реакция после девальвации отражает неадекватность процедуры девальвации, а не обучение S-R.Это мнение может быть необоснованным. Существует много примеров провала девальвации, и примечательно, что немногие из многих поражений головного мозга, которые ухудшают эффективность девальвации, приводят к общему снижению измеренных CR. Вместо этого животные с такими поражениями функционируют на нормальном уровне до девальвации, но не могут скорректировать свою реакцию в сторону понижения после девальвации. Таким образом, эти поражения, по-видимому, изменяют то, что узнают от ассоциаций S-S к S-R, не затрагивая наиболее очевидные аспекты формы CR.Кроме того, из исследований нейронных систем ясно, что имеет место пластичность реакции и что благодаря ассоциативному обучению нейроны могут кодировать аспекты поведения, а также стимулы.

Как насчет других 5 характеристик Спенса «Когнитивных и стимул-реакторных теорий обучения»? С точки зрения метафор , и телефонные коммутаторы, и диспетчерские карты стали анахронизмами. Как и во времена Спенса, большинство современных количественных моделей обучения и поведения делают акцент на ассоциативных структурах, которые могут быть истолкованы так же, как S-S или S-R.Широко распространено мнение, что богатое представление задач и результатов обучения и гибкость их использования в производительности являются правилом, но, вероятно, они не лучше определены в рамках формальных моделей, чем карты прошлых лет.

Спенс, вероятно, поступил мудро, проигнорировав нейрофизиологизацию своего времени, потому что она мало основывалась на изучении нервной системы. Нейрофизиологические характеристики обучения сегодня находятся на гораздо более прочной основе, чем в 1950 году, и гораздо более вероятно, что они будут основаны на данных, а не на предположениях.Электрофизиологические методы записи могут характеризовать нейронное кодирование различных видов информации, а функциональные анатомические методы могут использоваться для изучения основ изначально гипотетических сетей мозга, лежащих в основе аспектов ассоциативного обучения. Хотя многие современные редукционистские анализы обучения подчеркивают клеточные и молекулярные изменения, лежащие в основе обучения, эти анализы редко используются в качестве замены поведенческого анализа. Хотя я считаю, что лучший способ углубить наше понимание поведения — это изучить поведение, нейронный анализ часто может дать нам подсказки и подсказки о поведенческих процессах и организации.Возможно, не менее важно и то, что изучение нейронной основы обучения может связать изучение обучения с гораздо более широкой научной базой и сообществом.

В современных исследованиях обучения наш выбор стимульных переменных гораздо более эклектичен, чем во времена Спенса, когда одни и те же лаборатории часто исследуют перцептивные, мотивационные и другие переменные и в равной степени углубляются в определение содержания и условий обучение. Мы, по крайней мере, более восприимчивы к идее о том, что условия и содержание обучения не являются независимыми, и с большей вероятностью будем следовать программам, которые исследуют, например, условия, благоприятствующие формированию обучения SS или SR, чем просто спрашивать: учится SS или SR?

Говоря о состоянии теоретизирования в изучении обучения, Спенс (1950, с.171) сетовал на то, что

«создается почти такое впечатление, что главная цель состоит в том, чтобы доказать ошибочность другой концепции, чем пытаться прийти к более всесторонней интерпретации явлений. Психологи, заинтересованные и ценящие роль теории в развитии научной совокупности знаний, должны сопротивляться таким искушениям… устранение всего теоретизирования, безусловно, не поможет ускорить приобретение научной совокупности знаний об обучении».

Я думаю, справедливо будет сказать, что конфликт между когнитивной теорией и теорией обучения, основанной на стимуле-реакции, в конце концов вышел за рамки этой ранней конкурентной фазы и стимулировал большой прогресс в нашем понимании ассоциативного обучения.

Стимул — реакция, энергия, чувство и теории

Термин «стимул» имеет много значений; в общем случае это любое событие (будь то внешнее событие или что-то воспринятое или мысль), которое вызывает обнаруживаемую реакцию. Стимул часто используется с уточняющими терминами для дальнейшего уточнения его значения, например, условный раздражитель и нейтральный раздражитель.

В различных областях исследования термин «стимул» используется по-разному. В психологии чаще всего используется для описания энергетических форм, достигающих органов чувств и вызывающих ответную реакцию.Например, зрительное восприятие с помощью глаз реагирует на световое излучение или свет . Поскольку органы чувств человека реагируют на ограниченное количество форм энергии, да и то лишь на ограниченное количество этой энергии, некоторая энергия, достигающая органов чувств, не обнаруживается и не вызывает отклика. Энергия, достигающая органов чувств, но не вызывающая реакции, может считаться стимулом для физиолога, но для психолога она не будет считаться стимулом, если на нее не ответил или не обнаружил организм .Стимул также может быть внутренним психическим событием, вызывающим реакцию.

Стимул — это основной термин в теории стимул-реакция, который относится к ряду обучающих теорий, которые теоретически основаны на условных связях или ассоциациях между стимулом и реакцией. Ассоциативные связи образуются за счет повторного сочетания определенных стимулов и определенных реакций. Большинство этих теорий также являются бихевиористскими в том смысле, что они сосредоточены на поведении и не рассматривают психические процессы, и они рассматривают окружающую среду как наиболее важную детерминанту человеческого поведения .Действительно, эти теории рассматривают связь между стимулом и реакцией как основу поведения и полагают, что основной целью психологии должно быть открытие правил, регулирующих взаимодействие стимулов и реакций. Двумя доминирующими теориями стимул-реакция являются классические и оперантные теории, обуславливающие .

Книги

Аткинсон Р.Л., Р.К. Аткинсон, Э.Э. Смит и Д.Дж. Бем. Введение в психологию. 10-е изд. Нью-Йорк: Харкорт Брейс Йованович, 1990.

Масин С.С., изд. Основы теории восприятия. Нью-Йорк: Elvesier Science, 1993.

Оперативное кондиционирование | Безграничная психология

Основные принципы оперантного обусловливания: закон эффекта Торндайка

Закон эффекта Торндайка гласит, что поведение модифицируется его положительными или отрицательными последствиями.

Цели обучения

Свяжите закон эффекта Торндайка с принципами оперантного обусловливания

Ключевые выводы

Ключевые моменты
  • Закон эффекта гласит, что реакции, которые производят удовлетворительный эффект в конкретной ситуации, с большей вероятностью повторятся, в то время как реакции, вызывающие дискомфорт, с меньшей вероятностью повторятся.
  • Эдвард Л. Торндайк впервые изучил закон эффекта, поместив голодных кошек в коробки с головоломками и наблюдая за их действиями. Он быстро понял, что кошки могут усвоить эффективность определенных действий и будут повторять те действия, которые позволят им быстрее убежать.
  • Закон следствия действует и в каждом человеческом поведении. С юных лет мы узнаем, какие действия полезны, а какие вредны, посредством аналогичного процесса проб и ошибок.
  • Хотя закон эффекта объясняет поведение с внешней, наблюдаемой точки зрения, он не учитывает внутренние, ненаблюдаемые процессы, которые также влияют на модели поведения людей.
Основные термины
  • Закон эффекта : Закон, разработанный Эдвардом Л. Торндайком, который гласит, что «реакции, которые производят удовлетворительный эффект в конкретной ситуации, с большей вероятностью повторятся в этой ситуации, а реакции, которые вызывают дискомфорт, становятся менее вероятными. повториться в этой ситуации».
  • модификация поведения : Акт изменения действий и реакций на раздражители посредством положительного и отрицательного подкрепления или наказания.
  • проб и ошибок : процесс поиска решения проблемы путем перебора множества возможных решений и обучения на ошибках до тех пор, пока не будет найден способ.

Оперантное обусловливание — это теория обучения, которая фокусируется на изменениях в наблюдаемом поведении человека. При оперантном обусловливании на новое или продолжающееся поведение влияют новые или продолжающиеся последствия. Исследования этого принципа обучения впервые начались в конце 19 века Эдвардом Л.Торндайк, установивший закон действия года года.

Эксперименты Торндайка

Самая известная работа Торндайка о кошках, пытающихся перемещаться по различным коробкам-головоломкам. В этом эксперименте он поместил голодных кошек в самодельные коробки и зафиксировал время, которое им потребовалось, чтобы выполнить необходимые действия, чтобы сбежать и получить свою награду. Торндайк обнаружил, что при последовательных испытаниях кошки учатся на предыдущем поведении, ограничивают неэффективные действия и быстрее убегают из коробки.Он заметил, что кошки, казалось, научились путем запутанного процесса проб и ошибок, какие действия следует продолжать, а от каких следует отказаться; хорошо обученная кошка могла быстро запомнить и повторно использовать действия, которые привели к побегу к еде.

Коробка-головоломка Торндайка : На этом изображении показан пример коробки-головоломки Торндайка, а также график, демонстрирующий обучение кота внутри коробки. По мере того, как число испытаний увеличивалось, кошки могли быстрее убегать, обучаясь.

Закон Эффекта

Торндайк понял, что не только стимулы и реакции связаны между собой, но и то, что поведение может быть изменено последствиями. Он использовал эти открытия, чтобы опубликовать свою ныне известную теорию «закона эффекта». Согласно закону эффекта, поведение, за которым следуют удовлетворяющие организм последствия, с большей вероятностью будет повторяться, а поведение, за которым следуют неприятные последствия, повторится с меньшей вероятностью. По сути, если организм делает что-то, что приводит к желаемому результату, он, скорее всего, сделает это снова.Если организм делает что-то, что не приводит к желаемому результату, он с меньшей вероятностью сделает это снова.

Закон эффекта : Изначально кошки в коробке демонстрировали различные варианты поведения. В последовательных испытаниях действия, которые помогли сбежать из ящика и получить награду в виде еды, воспроизводились и повторялись с большей частотой.

Закон эффекта Торндайка в настоящее время дает большую часть того, что мы знаем об оперантном обусловливании и бихевиоризме. Согласно этому закону, поведение модифицируется его последствиями, и оперантный человек или животное может усвоить эту базовую связь между стимулом и реакцией.Как только установлена ​​связь между поведением и последствиями, реакция усиливается, и эта ассоциация несет исключительную ответственность за возникновение такого поведения. Торндайк утверждал, что обучение — это просто изменение поведения в результате следствия, и что если действие приносит вознаграждение, оно отпечатывается в уме и доступно для последующего припоминания.

С раннего возраста мы узнаем, какие действия полезны, а какие вредны, путем проб и ошибок.Например, маленький ребенок играет со своим другом на детской площадке и игриво сталкивает своего друга с качелей. Ее подруга падает на землю и начинает плакать, а затем отказывается играть с ней до конца дня. Действия ребенка (толкание друга) зависят от их последствий (отказ друга играть с ним), и он учится не повторять это действие, если хочет продолжать играть со своим другом.

Закон эффекта был расширен до различных форм модификации поведения.Поскольку закон следствия является ключевым компонентом бихевиоризма, он не включает никаких ссылок на ненаблюдаемые или внутренние состояния; вместо этого он опирается исключительно на то, что можно наблюдать в человеческом поведении. Хотя эта теория не объясняет все человеческое поведение в целом, она применяется почти ко всем областям человеческой жизни, но особенно к образованию и психологии.

Основные принципы оперантного обусловливания: Скиннер

Б. Ф. Скиннер был психологом-бихевиористом, который расширил область своей деятельности, определив и разработав оперантное обусловливание.

Цели обучения

Обобщить исследования Скиннера по оперантному обусловливанию

Ключевые выводы

Ключевые моменты
  • Б. Ф. Скиннер, психолог-бихевиорист и ученик Э. Л. Торндайка, внес свой вклад в наш взгляд на обучение, расширив наше понимание обусловливания, включив в него оперантное обусловливание.
  • Скиннер предположил, что если за поведением следует поощрение, оно с большей вероятностью будет повторяться, но если за ним следует наказание, оно повторится с меньшей вероятностью.
  • Скиннер провел свое исследование на крысах и голубях, предоставив им положительное подкрепление, отрицательное подкрепление или наказание в различных режимах, которые были разработаны для того, чтобы вызывать или подавлять определенные целевые виды поведения.
  • Скиннер не включил в свое исследование место для таких идей, как свобода воли или индивидуальный выбор; вместо этого он утверждал, что любое поведение можно объяснить с помощью изученных физических аспектов мира, включая историю жизни и эволюцию.
Основные термины
  • наказание : действие или процесс наложения и/или применения санкции за нежелательное поведение при формировании условий для желаемого поведения.
  • отталкивающий : Тенденция к отталкиванию, вызывающая избегание (ситуации, поведения, предмета и т. д.).
  • суеверие : Убеждение, не основанное на разуме или научных знаниях, что будущие события могут зависеть от поведения человека каким-то магическим или мистическим образом.

Оперантное обусловливание — это теория бихевиоризма, которая фокусируется на изменениях в наблюдаемом поведении человека. При оперантном обусловливании на новое или продолжающееся поведение влияют новые или продолжающиеся последствия.Исследование этого принципа обучения было впервые проведено Эдвардом Л. Торндайком в конце 1800-х годов, а затем стало популярным благодаря Б. Ф. Скиннеру в середине 1900-х годов. Большая часть этих исследований информирует о современных практиках человеческого поведения и взаимодействия.

Теории оперантного обусловливания Скиннера

Спустя почти полвека после первой публикации Торндайком принципов оперантного обусловливания и закона эффекта Скиннер попытался доказать расширение этой теории — что любое поведение в той или иной мере является результатом оперантного обусловливания.Скиннер предположил, что если за поведением следует подкрепление, оно с большей вероятностью будет повторяться, но если за ним следуют какие-то аверсивные стимулы или наказание, оно повторится с меньшей вероятностью. Он также считал, что эта выученная ассоциация может закончиться или исчезнуть, если убрать подкрепление или наказание.

Б. Ф. Скиннер : Скиннер отвечал за определение сегмента бихевиоризма, известного как оперантное обусловливание — процесс, посредством которого организм учится в своей физической среде.

Эксперименты Скиннера

Самыми известными исследованиями Скиннера были простые эксперименты с подкреплением, проведенные на лабораторных крысах и домашних голубях, которые продемонстрировали самые основные принципы оперантного обусловливания. Большую часть своих исследований он проводил в специальном накопительном регистраторе, который сейчас называют «ящиком Скиннера», который использовался для анализа поведенческих реакций испытуемых. В этих коробках он предъявлял испытуемым положительное подкрепление, отрицательное подкрепление или аверсивные стимулы в различные временные интервалы (или «расписания»), которые были разработаны для того, чтобы вызвать или подавить определенное целевое поведение.

В своей первой работе с крысами Скиннер помещал крыс в ящик Скиннера с рычагом, прикрепленным к трубке для кормления. Всякий раз, когда крыса нажимала на рычаг, выбрасывалась пища. После многократных испытаний крысы усвоили связь между рычагом и едой и стали проводить больше времени в ящике, добывая пищу, чем выполняя какие-либо другие действия. Именно благодаря этой ранней работе Скиннер начал понимать влияние поведенческих непредвиденных обстоятельств на действия.Он обнаружил, что скорость реакции, а также изменения характеристик реакции зависели от того, что происходило после того, как было выполнено поведение, а не до него. Скиннер назвал эти действия оперантным поведением , потому что они воздействовали на окружающую среду для получения результата. Процесс, с помощью которого можно было упорядочить непредвиденные обстоятельства подкрепления, ответственные за формирование определенного поведения, впоследствии стал называться оперантным обусловливанием.

Чтобы доказать свою идею о том, что за всеми действиями стоит бихевиоризм, он позже создал «суеверного голубя».Он кормил голубя с непрерывными интервалами (каждые 15 секунд) и наблюдал за поведением голубя. Он обнаружил, что действия голубя будут меняться в зависимости от того, что он делал в моменты, предшествующие раздаче еды, независимо от того факта, что эти действия не имели никакого отношения к раздаче еды. Таким образом, он понял, что голубь сфабриковал причинно-следственную связь между своими действиями и вручением награды. Именно это развитие «суеверия» привело Скиннера к мысли, что любое поведение можно объяснить как выученную реакцию на определенные последствия.

В своих экспериментах с оперантным обусловливанием Скиннер часто использовал подход, называемый формированием . Вместо того, чтобы вознаграждать только целевое или желаемое поведение, процесс формирования включает в себя подкрепление последовательных приближений к целевому поведению. Поведенческие аппроксимации — это поведение, которое со временем становится все ближе к действительно желаемой реакции.

Скиннер считал, что любое поведение предопределено прошлыми и настоящими событиями в объективном мире.Он не учитывал в своем исследовании такие идеи, как свобода воли или индивидуальный выбор; вместо этого он утверждал, что любое поведение можно объяснить с помощью изученных физических аспектов мира, включая историю жизни и эволюцию. Его работы остаются чрезвычайно влиятельными в области психологии, бихевиоризма и образования.

Формование

Формирование — это метод оперантного обусловливания, с помощью которого подкрепляются последовательные приближения к целевому поведению.

Цели обучения

Опишите, как формирование используется для изменения поведения

Ключевые выводы

Ключевые моменты
  • Б.Ф. Скиннер использовал шейпинг — метод обучения, с помощью которого подкрепляются последовательные приближения к целевому поведению, — для проверки своих теорий поведенческой психологии.
  • Формирование включает рассчитанное подкрепление «целевого поведения»: оно использует принципы оперантного обусловливания для обучения субъекта, поощряя правильное поведение и препятствуя неправильному поведению.
  • Метод требует, чтобы субъект продемонстрировал поведение, которое сначала просто напоминает целевое поведение; посредством подкрепления это поведение постепенно изменяется или «формируется», чтобы поощрять само целевое поведение.
  • Ранние эксперименты Скиннера по оперантному обусловливанию включали формирование поведения крыс, чтобы они научились нажимать на рычаг и получать пищевое вознаграждение.
  • Шейпинг обычно используется для обучения животных, например собак, выполнению сложных задач; это также полезный обучающий инструмент для изменения человеческого поведения.
Основные термины
  • последовательное приближение : Все более точная оценка желаемой тренером реакции.
  • парадигма : пример, служащий моделью или образцом; шаблон, как для эксперимента.
  • формирование : Метод положительного подкрепления поведенческих паттернов при оперантном обусловливании.

В своих экспериментах по оперантному обусловливанию Скиннер часто использовал подход, называемый формированием. Вместо того, чтобы вознаграждать только целевое или желаемое поведение, процесс формирования включает в себя подкрепление последовательных приближений к целевому поведению. Этот метод требует, чтобы субъект выполнял действия, которые сначала просто напоминают целевое поведение; посредством подкрепления это поведение постепенно изменяется, или формируется , чтобы стимулировать выполнение самого целевого поведения.Формирование полезно, потому что часто маловероятно, что организм будет спонтанно демонстрировать что-либо, кроме простейшего поведения. Это очень полезный инструмент для обучения животных, таких как собаки, выполнению сложных задач.

Выставка собак : Дрессировка собак часто использует формирующий метод оперантного обусловливания.

Как работает формирование

При формировании поведение разбивается на множество маленьких достижимых шагов. Чтобы проверить этот метод, Б. Ф. Скиннер провел эксперименты по формированию крыс, которых он поместил в устройство (известное как ящик Скиннера), которое следило за их поведением.Целевое поведение крысы состояло в том, чтобы нажать на рычаг, который выпускал пищу. Первоначально вознаграждение дается даже за грубое приближение к целевому поведению — другими словами, даже за шаг в правильном направлении. Затем тренер вознаграждает поведение, которое на один шаг или на одно последовательное приближение ближе к целевому поведению. Например, Скиннер вознаграждал крысу за то, что она сделала шаг к рычагу, встала на задние лапы и коснулась рычага — все это было последовательным приближением к целевому поведению нажатия на рычаг.

По мере того, как субъект проходит каждое испытание поведения, награды за старые, менее приблизительные действия прекращаются, чтобы стимулировать продвижение к желаемому поведению. Например, как только крыса коснулась рычага, Скиннер мог перестать награждать ее за то, что она просто сделала шаг к рычагу. В эксперименте Скиннера каждое вознаграждение приближало крысу к целевому поведению, что в конечном итоге приводило к тому, что крыса нажимала на рычаг и получала пищу. Таким образом, формирование использует принципы оперантного обусловливания для обучения субъекта, поощряя правильное поведение и препятствуя неправильному поведению.

Таким образом, процесс формирования включает следующие этапы:

  • Подкрепляйте любую реакцию, напоминающую целевое поведение.
  • Затем подкрепите реакцию, которая больше похожа на целевое поведение. Вы больше не будете усиливать ранее усиленную реакцию.
  • Затем начните подкреплять реакцию, которая еще больше напоминает целевое поведение. Продолжайте укреплять все более и более близкие приближения к целевому поведению.
  • Наконец, подкрепляйте только целевое поведение.

Применение формовки

Этот процесс был воспроизведен с другими животными, включая людей, и теперь является обычной практикой во многих методах дрессировки и обучения. Он обычно используется для обучения собак выполнять словесные команды или ворваться в дом: хотя щенки редко могут автоматически выполнять целевое поведение, их можно сформировать в соответствии с этим поведением, последовательно вознаграждая поведение, которое приближается.

Формирование также является полезным методом обучения человека.Например, если отец хочет, чтобы его дочь научилась убираться в своей комнате, он может использовать шейпинг, чтобы помочь ее хозяину двигаться к цели. Сначала она убирает одну игрушку и получает вознаграждение. Во-вторых, она убирает пять игрушек; затем выбирает, взять ли десять игрушек или убрать книги и одежду; затем убирает все, кроме двух игрушек. Благодаря серии наград она, наконец, учится убирать всю свою комнату.

Подкрепление и наказание

Подкрепление и наказание — это принципы оперантного обусловливания, которые увеличивают или уменьшают вероятность поведения.

Цели обучения

Различать первичные, вторичные, условные и безусловные подкрепления

Ключевые выводы

Ключевые моменты
  • «Подкрепление» относится к любому последствию, которое увеличивает вероятность конкретной поведенческой реакции; «наказание» относится к последствиям, которые уменьшают вероятность такой реакции.
  • Как поощрение, так и наказание могут быть положительными или отрицательными. В оперантном обусловливании положительное означает, что вы что-то добавляете, а отрицательное означает, что вы что-то убираете.
  • Поощрения могут быть как первичными (безоговорочно связанными с поведением), так и вторичными (требующими преднамеренной или обусловленной связи с определенным поведением).
  • Первичные, или безусловные, подкрепляющие факторы, такие как вода, еда, сон, кров, секс, прикосновение и удовольствие, обладают врожденными подкрепляющими свойствами.
  • Вторичные, или условные, подкрепления (например, деньги) не имеют внутренней ценности, пока они не связаны или не соединены с первичным подкреплением.
Основные термины
  • латентность : Задержка между стимулом и реакцией, которую он вызывает в организме.

Подкрепление и наказание — это принципы, используемые в оперантном обусловливании. Подкрепление означает, что вы усиливаете поведение: это любое последствие или результат, который увеличивает вероятность конкретной поведенческой реакции (и, следовательно, подкрепляет поведение). Усиливающий эффект на поведение может проявляться по-разному, включая более высокую частоту, большую продолжительность, большую величину и короткую латентность реакции. Наказание означает, что вы уменьшаете поведение: это любое последствие или результат, который снижает вероятность поведенческой реакции.

Угасание , в оперантном обусловливании относится к полному угасанию подкрепляемого поведения. Это происходит в какой-то момент после прекращения подкрепления; скорость, с которой это происходит, зависит от графика подкрепления, который более подробно обсуждается в другом разделе.

Положительное и отрицательное подкрепление и наказание

Как поощрение, так и наказание могут быть положительными или отрицательными. В оперантном обусловливании положительное и отрицательное не означает хорошее или плохое.Вместо этого положительный означает, что вы что-то добавляете, а отрицательный означает, что вы что-то убираете. Все эти методы могут манипулировать поведением субъекта, но каждый работает по-своему.

Оперантное обусловливание : В контексте оперантного обусловливания, подкрепляете ли вы поведение или наказываете его, «положительный» всегда означает, что вы добавляете стимул (не обязательно хороший), а «отрицательный» всегда означает, что вы удаление раздражителя (не обязательно плохого.См. синий текст и желтый текст выше, которые обозначают положительное и отрицательное значение соответственно. Точно так же подкрепление всегда означает, что вы повышаете (или поддерживаете) уровень поведения, а наказание всегда означает, что вы снижаете уровень поведения. См. зеленый и красный фон выше, которые обозначают подкрепление и наказание соответственно.

  • Положительные подкрепления добавляют желаемый или приятный стимул для увеличения или поддержания частоты поведения.Например, ребенок убирает свою комнату и получает в награду печенье.
  • Отрицательные подкрепления удаляют неприятный или неприятный стимул, чтобы увеличить или сохранить частоту поведения. Например, ребенок убирает свою комнату и получает вознаграждение за то, что ему не нужно мыть посуду в тот вечер.
  • Положительные наказания добавляют неприятный стимул, чтобы уменьшить поведение или реакцию. Например, ребенок отказывается убирать свою комнату, поэтому родители заставляют его мыть посуду в течение недели.
  • Отрицательные наказания удаляют приятный стимул, чтобы уменьшить поведение или реакцию.Например, ребенок отказывается убираться в своей комнате, поэтому ее родители не разрешают ей сегодня днем ​​играть с подругой.

Первичные и вторичные усилители

Стимул, используемый для подкрепления определенного поведения, может быть как первичным, так и вторичным. Первичное подкрепление, также называемое безусловным подкреплением, — это стимул, обладающий врожденными подкрепляющими свойствами. Эти виды подкрепления не изучаются. Вода, еда, сон, кров, секс, прикосновение и удовольствие — все это примеры первичных подкреплений: организмы не теряют тяги к этим вещам.Некоторые первичные подкрепления, такие как наркотики и алкоголь, просто имитируют эффекты других подкреплений. Для большинства людей прыжок в прохладное озеро в очень жаркий день будет подкрепляющим действием, а прохладное озеро будет естественным подкрепляющим действием — вода охлаждает человека (физическая потребность), а также доставляет удовольствие.

Вторичное подкрепление, также называемое условным подкреплением, не имеет внутренней ценности и обладает подкрепляющими свойствами только в сочетании или в паре с первичным подкреплением.До образования пары вторичное подкрепление не оказывает значимого влияния на субъекта. Деньги — один из лучших примеров вторичного подкрепления: они чего-то стоят только потому, что вы можете использовать их для покупки других вещей — либо вещей, удовлетворяющих базовые потребности (еда, вода, кров — все первичные подкрепления), либо других вторичных подкреплений.

Графики подкрепления

Графики подкрепления определяют, как и когда поведение будет сопровождаться подкреплением.

Цели обучения

Сравните и сопоставьте различные типы графиков подкрепления

Ключевые выводы

Ключевые моменты
  • График подкрепления — это инструмент оперантного обусловливания, который позволяет тренеру контролировать время и частоту подкрепления, чтобы вызвать целевое поведение.
  • Непрерывные расписания вознаграждают поведение после каждого выполнения желаемого поведения; прерывистые (или частичные) графики вознаграждают поведение только после определенных соотношений или интервалов ответов.
  • Прерывистые расписания могут быть либо фиксированными (когда подкрепление происходит после определенного периода времени или ответов), либо переменными (когда подкрепление происходит после различного и непредсказуемого количества времени или ответов).
  • Прерывистые графики также описываются либо как интервал (в зависимости от времени между подкреплениями), либо как соотношение (в зависимости от количества ответов).
  • Различные графики (с фиксированным интервалом, с переменным интервалом, с фиксированным соотношением и с переменным соотношением) имеют разные преимущества и по-разному реагируют на угасание.
  • Составные графики подкрепления объединяют два или более простых графика с использованием одного и того же подкрепления и сосредоточением внимания на одном и том же целевом поведении.
Основные термины
  • угасание : Когда поведение прекращается, потому что оно больше не подкрепляется.
  • интервал : Период времени.
  • отношение : Число, представляющее сравнение между двумя вещами.

График подкрепления — это тактика, используемая в оперантном обусловливании, которая влияет на то, как усваивается и поддерживается оперантная реакция. Каждый тип расписания налагает правило или программу, которая пытается определить, как и когда происходит желаемое поведение. Поведение поощряется с помощью подкрепления, обескураживает с помощью наказаний и исчезает при полном устранении стимула.Расписания варьируются от простых расписаний, основанных на соотношениях и интервалах, до более сложных составных расписаний, которые сочетают в себе одну или несколько простых стратегий для управления поведением.

Непрерывное и прерывистое расписание

Непрерывные графики вознаграждают поведение после каждого выполнения желаемого поведения. Этот график подкрепления — самый быстрый способ научить кого-то поведению, и он особенно эффективен при обучении новому поведению. С другой стороны, простые прерывистые (иногда называемые частичными) расписания поощряют поведение только после определенных соотношений или интервалов ответов.

Типы прерывистых графиков

Существует несколько различных типов графиков прерывистого подкрепления. Эти графики описываются либо как фиксированные, либо как переменные, а также как интервальные или пропорциональные.

Фиксированный и переменный, соотношение и интервал

Фиксированный означает, что количество ответов между подкреплениями или время между подкреплениями установлено и остается неизменным. Переменная относится к тому, когда количество ответов или количество времени между подкреплениями варьируется или изменяется. Интервал означает, что расписание основано на времени между подкреплениями, а соотношение означает, что расписание основано на количестве ответов между подкреплениями. Простые прерывистые расписания представляют собой комбинацию этих терминов, создающих следующие четыре типа расписаний:

  • Расписание с фиксированным интервалом — это когда поведение вознаграждается через определенное количество времени. Такой тип графика существует в платежных системах, когда кому-то платят почасово: сколько бы человек ни сделал за час работы (поведение), ему заплатят столько же (поощрение).
  • С графиком с переменным интервалом, субъект получает подкрепление на основе переменного и непредсказуемого количества времени. Люди, которые любят ловить рыбу, испытывают такой тип графика подкрепления: в среднем в одном и том же месте вы, вероятно, поймаете примерно одинаковое количество рыбы за определенный период времени. Однако вы не знаете точно, когда эти уловы произойдут (подкрепление) в течение периода времени, проведенного на рыбалке (поведение).
  • В расписании с фиксированным соотношением существует определенное количество ответов, которые должны произойти, прежде чем поведение будет вознаграждено.Это можно увидеть в оплате такой работы, как сбор фруктов: сборщикам платят определенную сумму (поощрение) в зависимости от суммы, которую они собирают (поведение), что побуждает их собирать быстрее, чтобы заработать больше денег. В другом примере Карла получает комиссию за каждую пару очков, которые она продает в магазине очков. Качество того, что продает Карла, не имеет значения, потому что ее комиссионные не основаны на качестве; это основано только на количестве проданных пар. Это различие в качестве выполнения может помочь определить, какой метод подкрепления наиболее подходит для конкретной ситуации: фиксированные коэффициенты лучше подходят для оптимизации количества выпуска, тогда как фиксированный интервал может привести к более высокому качеству выпуска.
  • В расписании с переменным соотношением количество ответов, необходимых для вознаграждения, варьируется. Это самый мощный тип прерывистого графика подкрепления. На людях этот тип графика используется казино для привлечения игроков: игровой автомат выплачивает среднее соотношение выигрыша — скажем, пять к одному — но не гарантирует, что каждая пятая ставка (поведение) будет вознаграждена (подкреплением) выигрышем. .

Все эти расписания имеют разные преимущества. В целом, пропорциональные графики неизменно вызывают более высокую частоту ответов, чем интервальные графики, из-за их предсказуемости.Например, если вы фабричный рабочий, которому платят за единицу продукции, которую вы производите, у вас будет мотивация производить эти товары быстро и последовательно. Переменные графики категорически менее предсказуемы, поэтому они, как правило, сопротивляются исчезновению и поощряют постоянное поведение. И игроки, и рыбаки могут понять чувство, что еще одно нажатие на рычаг игрового автомата или еще один час на озере изменит их удачу и принесет соответствующие награды. Таким образом, они продолжают играть и ловить рыбу, несмотря на ранее неудачную обратную связь.

Реакции простого графика подкрепления : Четыре графика подкрепления дают разные модели реагирования. График с переменным соотношением непредсказуем и дает высокую и устойчивую скорость реакции с небольшой паузой, если она вообще есть, после подкрепления (например, азартной игры). График с фиксированным соотношением предсказуем и дает высокую скорость реакции с короткой паузой после подкрепления (например, продажи очков). График с переменным интервалом непредсказуем и обеспечивает умеренную, устойчивую скорость реакции (т.г., рыбалка). График с фиксированным интервалом дает гребешковый паттерн реакции, отражающий значительную паузу после подкрепления (например, почасовая занятость).

Угасание подкрепляемого поведения происходит в какой-то момент после прекращения подкрепления, и скорость, с которой это происходит, зависит от графика подкрепления. Среди графиков подкрепления переменное соотношение наиболее устойчиво к угасанию, в то время как с фиксированным интервалом его легче всего погасить.

Простые и составные расписания

Все примеры, описанные выше, относятся к простым расписаниям. Составные графики объединяют как минимум два простых графика и используют одно и то же поощрение для одного и того же поведения. Составные графики часто встречаются на рабочем месте: например, если вы получаете почасовую оплату (фиксированный интервал), но у вас также есть стимул получать небольшую комиссию за определенные продажи (фиксированный коэффициент), вы подкрепляетесь составной график. Кроме того, если есть бонус в конце года, предоставляемый только трем сотрудникам на основе лотерейной системы, вас будет мотивировать переменный график.

Существует много возможностей для составных расписаний: например, наложенные расписания используют как минимум два простых расписания одновременно. Параллельные расписания, , с другой стороны, предоставляют два возможных простых расписания одновременно, но позволяют участнику отвечать по любому расписанию по желанию. Все комбинации и виды схем подкрепления предназначены для того, чтобы вызвать определенное целевое поведение.

Кондиционирование респондентов – Принципы обучения и поведения

 

Обзор модуля

Мы начинаем рассмотрение моделей обучения с обсуждения обусловливания респондентов, основанного на работе Ивана Павлова.В этой форме обучения формируется ассоциация между двумя событиями — предъявлением нейтрального раздражителя (НС) и предъявлением безусловного раздражителя (БС). Как вы увидите, хотя реакция на США похожа на реакцию на НС, они не идентичны, а в некоторых случаях реакция сильно отличается или даже противоположна. Мы поговорим о более сложных формах обусловливания, таких как обусловливание более высокого порядка и о том, как обусловливание может быть аппетитным или отталкивающим, возбуждающим или тормозящим.Будут описаны четыре варианта парадигмы обусловливания нормального респондента, сосредоточенные на том, когда во времени возникают УЗ и НС. К ним относятся задержка, трассировка, одновременное и обратное кондиционирование. Затем мы обсудим свойства, управляющие обусловливанием респондента, включая угасание, спонтанное восстановление, генерализацию и различение. Будут обсуждаться сенсорное предварительное обусловливание, латентное торможение, затенение, блокирование и установка повода, а также их влияние на то, насколько легко происходит обусловливание.Наконец, мы обсудим пять теорий обусловливания.

 

Внешний вид модуля

 

Результаты обучения модуля

  • Опишите, как происходит обусловливание респондента у людей и животных.
  • Опишите и объясните свойства, связанные с обусловливанием респондента.
  • Опишите теории, связанные с обусловливанием респондентов.

4.1. Основы кондиционирования респондентов

 

Раздел Цели обучения

  • Опишите случайное открытие Павлова.
  • Определить обусловливание респондента.
  • Распознайте другие термины, используемые для кондиционирования респондентов.
  • Опишите три этапа кондиционирования респондентов. Дайте определение всем терминам.
  • Опишите и проиллюстрируйте обусловливание более высокого порядка.
  • Противопоставьте обусловливание аппетита и отвращения.
  • Контрастное возбуждающее и тормозное обусловливание.
  • Обозначьте и опишите четыре временных проявления УЗИ и НС при обусловливании респондентов.
  • Опишите явления псевдообусловливания.

 

4.1.1. Павлов и его собаки

Вы наверняка слышали о Павлове и его собаках, но можете не знать, что это открытие было сделано случайно. Иван Петрович Павлов (1849-1936; 1927), русский физиолог, интересовался изучением процессов пищеварения у собак в ответ на кормление мясным порошком. Он обнаружил, что у собак выделялась слюна даже за до того, как был представлен мясной порошок. У них выделялась слюна при звуке звонка, шагах в холле, камертоне или присутствии лаборанта.Павлов понял, что существуют стимулы, автоматически вызывающие реакцию (например, выделение слюны на мясной порошок), и те, которые должны быть связаны с этими автоматическими ассоциациями, чтобы животное или человек реагировали на них (например, выделение слюны на звонок). Вооружившись этим ошеломляющим открытием, Павлов провел остаток своей карьеры, исследуя феномен обучения, и в 1904 году получил за свою работу Нобелевскую премию.

Важно понимать, что не все виды поведения происходят из-за подкрепления и наказания, как говорит оперантное обусловливание.В случае обусловливания респондента предшествующие стимулы полностью и автоматически контролируют некоторые виды поведения. Мы видели это на примере рефлексов. Когда врач ударяет вас по колену этим маленьким молоточком, он автоматически вытягивается. Вам не нужно ничего делать, кроме как смотреть. Младенцы будут искать источник пищи, если грудь матери находится рядом с их ртом. Если им в рот поместить соску, они также автоматически будут сосать в соответствии с сосательным рефлексом. У людей есть несколько таких рефлексов, хотя и не так много, как у других животных, из-за нашей более сложной нервной системы.

 

4.1.2. Обусловливание респондента Описано

Респондентное обусловливание происходит, когда мы связываем или соединяем ранее нейтральный стимул со стимулом, который является невыученным или врожденным, называемым безусловным стимулом. Обратите внимание, что эта форма обучения также называется классической обусловленностью или павловской обусловленностью в честь Ивана Павлова.

Кондиционирование респондента лучше всего описать как протекающее в три этапа: предварительное кондиционирование, кондиционирование и посткондиционирование.На рис. 4.1 представлен обзор классического эксперимента Павлова.

Давайте сначала определимся с терминами. Термин обусловливание означает обучение. Таким образом, до — обусловливание происходит до того, как происходит обучение, обусловливание происходит во время обучения или установления связи между двумя стимулами, а после — обусловливание происходит после обучения. Если мы говорим, что что-то является и -обусловленным, это не выучивается. Возвращаясь к нашему более раннему философскому обсуждению, это обучение, которое является врожденным или присутствует при рождении.Также имейте в виду, что стимул — это то, что ощущается в мире через зрение, слух, обоняние, вкус или осязание. Ответ — это поведение, которое сделано. Убедившись, что вы правильно понимаете термины, вы сможете легче понять обусловливание респондента.

4.1.2.1. Предварительное кондиционирование. Обратите внимание, что предварительная подготовка имеет панели A и B. Все, что означает эта стадия обучения, это то, что некоторое знание уже присутствует. На панели А вкус пищи вызывает у собаки слюноотделение.Этому не нужно обучаться, и это отношение безусловного стимула (US), вызывающего безусловную реакцию (UR). Ассоциация возникает естественным образом. На панели B мы видим, что нейтральный стимул (NS) ничего не дает. Собаки не входят в мир, зная, что нужно реагировать на звон колокольчика (который они слышат).

4.1.2.2. Кондиционирование. Обусловливание — это когда происходит обучение. Путем сочетания нейтрального и безусловного раздражителей (звонок и еда соответственно) собака узнает, что звон колокольчика (NS) сигнализирует о появлении еды (US) и слюноотделении (UR).Суть в том, что NS представлен непосредственно перед US, что дает UR (в большинстве случаев; подробнее об этом чуть позже).

4.1.2.3. Посткондиционирование. Постобусловливание, или после обучения, устанавливает новую и не встречающуюся в природе взаимосвязь условного стимула (CS; ранее NS) и условной реакции (CR; та же самая реакция). Итак, у собаки теперь надежно выделяется слюна при звуке колокольчика, потому что она ожидает, что за ней последует еда, и она это делает.Если это не так, ответ обрывается или гаснет, как вы увидите позже.

Рисунок 4.1. Классический эксперимент Павлова

Давайте теперь четко определим наши термины:

  • Безусловный раздражитель — Раздражитель, который естественным образом вызывает реакцию.
  • Безусловная реакция — Реакция, возникающая естественным образом при наличии США.
  • Нейтральный раздражитель — Раздражитель, не вызывающий реакции.
  • Условный раздражитель — Первоначально нейтральный раздражитель, который был связан с естественным раздражителем, чтобы вызвать реакцию.
  • Условный ответ — Ответ, вызванный CS, хотя он и не совпадает с UR. Эта реакция обычно слабее, чем УР (собака выделяет слюну на звонок, хотя и не так сильно, как на вид/запах/вкус еды).

Примечание для учащихся: убедитесь, что вы понимаете не только эти термины, но и аббревиатуры, используемые для их обозначения. Я буду использовать стенографию до конца этого модуля и в других местах книги.

Чтобы полностью понять обусловливание респондентов, знайте, что каждая пара NS и US представляет собой одно испытание, называемое испытанием обусловливания . Период между испытаниями кондиционирования называется межпробным интервалом . Период между предъявлением НС и затем УЗИ (панель C) в рамках пробы на тренировку называется межстимульным интервалом .

Весь процесс кондиционирования, включая момент, когда мы впервые создаем ассоциацию между NS и US и ее усиление с течением времени посредством повторяющихся пар, называется приобретением .Вероятно, неудивительно, что кондиционирование происходит быстрее, если УЗИ более интенсивное. У нас будет больше мотивации научиться ассоциировать неправильную реакцию с ударом, если мы получим 150 вольт, а не 25 вольт.

Кондиционирование также более эффективно, когда испытания разнесены, а не массированы (Menzel et al., 2001). Например, интервал между испытаниями 5 минут более эффективен, чем интервал между ними 25 секунд. Одно из объяснений этого заключается в том, что у нас есть время для репетиции CS и УЗИ в памяти во время интервала между пробами, и если новая попытка происходит слишком рано, это может помешать репетиции (Wagner, Rudy, & Whitlow, 1973).

И мы можем определить, насколько хорош процесс обучения, если мы добавим тестовое испытание , в котором NS предъявляется отдельно, чтобы увидеть, вызывает ли оно реакцию (UR/CR; позвоните в колокольчик в одиночестве и посмотрите, происходит ли слюноотделение). Мы также можем подождать, чтобы увидеть, появляется ли после предъявления NS (звонок) и до появления УЗИ (вид еды) UR/CR сам по себе (слюнотечение). Другими словами, происходит ли ответ в межстимульный интервал?

 

4.1.3. Кондиционирование и его различные формы

Стоит отметить, что процедура обусловливания, описанная в предыдущем разделе о Павлове, — не единственная форма, которую она может принимать. В этом разделе мы обсудим тип многоуровневого обусловливания, обусловливание, основанное на том, что событие является чем-то, чего мы желаем или хотим избежать, обусловливание, основанное на представлении или удалении УЗИ, и, наконец, временные факторы, которые могут привести к уникальным процедурам обусловливания.

4.1.3.1.Кондиционирование высшего порядка. Иногда стимул, связанный с CS (ранее NS), сам становится CS и вызывает CR. Мы называем это обусловливанием более высокого порядка, , и каждый уровень обусловливания называется обусловливанием первого, второго, третьего и т. д. порядка. Итак, как это может работать?

Нападение (США) вызовет страх (UR). Человек в лыжной маске сам по себе не вызовет никакой реакции (это NS1). Однако если вы соедините человека в лыжной маске (NS1) с нападением (US), которое вызывает страх (UR), то вид человека в лыжной маске (CS1) вызовет страх (CR).Имейте в виду, что с помощью стимулов вы видите человека в лыжной маске и ощущаете последствия нападения (будут активированы тактильные или болевые рецепторы на коже). Это кондиционирования первого порядка (не путать с обучением штурмовиков Первого ордена в «Звездных войнах»), и в этом примере человек ассоциируется со страхом.

Но что, если нападение произошло в переулке в вашем районе? Теперь переулок (NS2) соединен с человеком в лыжной маске (CS1), что вызывает страх (CR), а постобработка показывает, что переулок (CS2) вызывает страх (CR).Это условность второго порядка, в которой место ассоциируется со страхом.

Может ли время дня быть фактором? А если ограбление произошло ночью? Если ночь (NS3) сочетается с переулком (CS2), который вызывает страх (CR), то пребывание на улице ночью (CS3) может вызвать страх (или, по крайней мере, некоторую тревогу; CR). Это было бы обусловливанием третьего порядка, и теперь оно включает в себя время дня, связанное со страхом.

Страх изначально был вызван нападением. Через обусловливание более высокого порядка это также было вызвано видом лыжной маски, нахождением в переулке и нахождением на улице ночью.Реакция страха становится слабее из-за обусловленности этих дополнительных НС, так что нашу реакцию на пребывание на улице ночью можно было бы лучше классифицировать как тревогу, а не как искренний страх, который ощущался во время нападения (и, вероятно, какое-то время после него), что предполагает что реакция сильнее всего на США и становится слабее на CS1, CS2 и CS3.

4.1.3.2. Аппетитивная и аверсивная обусловленность. Напомним из раздела 2.1.3, что стимулы аппетита — это те, которые организм желает и ищет, в то время как аверсивные стимулы легко избегаются.При обусловливании респондента США могут быть стимулом аппетита или отвращения. Например, в обусловливание аппетита США будет что-то желанное, например конфеты, которые делают нас счастливыми. Другие примеры могут включать воду, еду, секс или наркотики. В аверсивном обусловливании раздражитель неприятен и может включать в себя экстремальные температуры, болезненный укус осы или укуса собаки, поражение электрическим током или что-то неприятно пахнущее. Неудивительно узнать, что обусловливание происходит относительно быстро, когда задействованы аверсивные США.Поскольку эти стимулы могут навредить или убить нас, умение избегать их является адаптивным и помогает нашему выживанию.

4.1.3.3. Возбуждающая и тормозная обусловленность. До сих пор наше обсуждение включало примеры, в которых НС связан с представлением США, называемым возбуждающим кондиционированием . У собак Палова они связывали звон колокольчика (НС) с подачей пищи (УЗ), вызвавшей у них слюноотделение (СР). В конце концов, слюноотделение (CR) происходило только при звонке в колокольчик (CS).

Достаточно интересно, что отсутствие УЗ также может быть связано с НС, в процессе, называемом ингибирующим кондиционированием . Вернитесь к нашему примеру для более высокой обусловленности. Человек в лыжной маске вызывает возбуждение от страха, но вид человека в такой маске в дневное время приводит к торможению страха. День указывает на безопасный интервал, и мы не будем слишком беспокоиться о лыжных масках. На нас нападали только ночью. Возбуждающий CS выражается как CS+, а тормозной CS — как CS-.

4.1.3.4. Временные факторы, влияющие на кондиционирование. В предыдущем разделе мы видели, что, как правило, США представлены после NS, хотя за NS может следовать отсутствие УЗИ. Эти примеры также всегда представляли НС перед США, но это не обязательно во всех случаях.

Во-первых, задержка кондиционирования включает в себя представление NS перед УЗИ, но NS перекрывается с США в течение короткого периода времени. В случае эксперимента Павлова звонок звонил, скажем, 10 секунд, затем в комнату поступала еда, а через 5 секунд звонок прекращался.ISI (интервал между стимулами) должен быть относительно коротким, чтобы использовать эту процедуру.

Что, если мы представим NS намного раньше США по времени? Допустим, мы звоним в звонок в течение 10 секунд, а затем есть 5-секундный перерыв, прежде чем еда попадает в комнату. NS и US не пересекаются. Это основа обработки трассировки , а трассировка — это память, к которой у нас есть доступ. Организм должен будет помнить, что НС произошел до США, чтобы создать ассоциацию, или что звонок прозвенел до того, как поступила пища.Период времени между окончанием NS и началом US называется интервалом трассировки и в идеале должен быть коротким или составлять несколько секунд.

НС и УЗИ могут происходить одновременно, например, при одновременном кондиционировании . Как и следовало ожидать, кондиционирование в этой процедуре плохое, поскольку NS не предсказывает появление УЗИ. Они происходят одновременно. Звонок звонит, когда еда входит в комнату. Колокольный звон не вызывает ожидания скорой доставки еды, что помогает выучить ассоциацию.

Наконец, США могут опередить NS в процедуре, называемой обратным кондиционированием . США будет происходить первым и длиться несколько секунд, а NS начнется ближе к концу этого времени. Следовательно, НС и УЗ встречаются одновременно в течение короткого периода времени. Из четырех методов обратное обусловливание наименее эффективно для возбуждающего кондиционирования, хотя оно может привести к тормозному обусловливанию. Рассмотрим парадигму шока, в которой крысу бьют током (УЗ), а затем ближе к концу удара включают свет (НС).Свет (NS) сигнализирует об окончании разряда (US) и служит сигналом безопасности. Следовательно, NS станет CS-.

 

4.1.4. Как узнать, произошло ли обучение?

Главной особенностью науки является проверка того, что любое изменение интересующей вас переменной (DV) вызвано лечением или манипуляцией (IV). Возможно, вызванная реакция на самом деле не была вызвана NS/CS и, следовательно, продуктом обучения или кондиционирования, а вместо этого была вызвана сенсибилизацией, называемой псевдообусловливанием .

Допустим, вы работали с черепахами и подали им звуковой сигнал (NS), а затем постучали по панцирю (US), в результате чего черепахи втянулись в свои панцири (UR). При наличии нескольких таких пар тон (CS) привел бы к уходу в раковины (CR). Итак, тон был связан с постукиванием, верно? Возможно, но допустим помимо тона мы еще и мигалкой. Черепахи также прячутся в свои панцири при предъявлении этого раздражителя. В случае сенсибилизации повторное предъявление раздражителя приводит к увеличению силы реакции.Это также может привести к тому, что другие стимулы вызывают ту же реакцию, что и в случае яркого света и тона, вызывающих реакцию ухода в раковину.

Чтобы узнать, связано ли воздействие на поведение, которое вы видите, с обусловливанием, а не с сенсибилизацией, можно сделать простую корректировку — включить контрольную группу. В экспериментальной группе тон и постукивание будут совмещены, что приведет к реакции отстранения. Контрольная группа должна была воспроизвести тон, а затем постучать с большим интервалом во времени.Теперь, когда тон предъявляется каждой группе отдельно, у экспериментальной группы будет сильная реакция ухода в раковину, в то время как у контрольной группы может быть такая же реакция, но она будет слабой. Интенсивность реакции или, в данном случае, ее более сильная реакция в экспериментальных условиях, а не в контрольных, указывает на то, что обусловливание действительно имело место. Другими словами, нет никакой псевдообусловленности.

 


4.2. Свойства, регулирующие подготовку респондентов

 

Раздел Цели обучения

  • Дайте определение исчезновению.
  • Опишите спонтанное восстановление по отношению к угасанию.
  • Дифференцировать генерализацию и различение стимулов.
  • Опишите сенсорное прекондиционирования.
  • Опишите скрытое торможение.
  • Задайте затенение.
  • Определить блокировку.
  • Объясните использование установщиков событий.

 

4.2.1. Угасание и спонтанное восстановление

После установления связи между NS и US, в результате которой NS становится CS, есть ли способ разорвать эту связь? Ответ положительный, и исчезновение респондента связано с тем, что CS больше не сочетается с US, что приводит к отсутствию ответа при повторном предъявлении CS.Например, звук звонка колокольчика (CS) не сопровождается едой (US), как животное привыкло ожидать и предсказывать, и поэтому в конце концов у собаки прекращается слюноотделение (CR), когда звучит колокольчик.

Это свойство заставляет нас задаться вопросом, является ли нарушенная ассоциация CS и US постоянной. Ответ — нет, и в конце концов прозвенит звонок, из-за чего у собаки потечет слюна. Если еда не приходит, поведение не будет продолжаться. Организм может дать ответ еще несколько раз, причем сила ответа с каждым разом ослабевает, пока, в конце концов, он не прекратится.Если приходит пища, реакция слюноотделения восстанавливается. Это свойство называется спонтанным восстановлением и возникает, когда CS вызывает CR после того, как произошло угасание. Связь между CS и US восстанавливается относительно быстро после повторного спаривания.

 

4.2.2. Обобщение стимулов и различение

Когда несколько похожих CS или широкий диапазон CS вызывают один и тот же CR, говорят, что произошла генерализация стимула .Примером может служить звук свистка, вызывающий слюноотделение так же, как и звук колокольчика, оба обнаруживаются с помощью прослушивания. Как и следовало ожидать, чем больше новый стимул похож на исходный CS, тем сильнее будет реакция. Если бы ребенок был приучен бояться белых крыс, мы ожидали бы, что реакция будет сильнее, если бы она была сделана в присутствии белой мыши, а не немецкой овчарки.

Когда CR вызывается одним CS или узким диапазоном CS, говорят, что различение стимулов произошло.Примером может служить обучение собаки не реагировать на свист, а только на звонок, и только на такой звонок. За другими колокольчиками не следовала еда, что в конечном итоге привело к исчезновению ошибочной ассоциации. Обучение организма такому различению называется обучением различению .


4.2.3. Сенсорное предварительное кондиционирование

Бывают ситуации, когда стимул становится CS, в результате чего другие стимулы, с которыми он связан, могут стать вероятными кандидатами на то, чтобы стать CS в будущем.Это называется сенсорным предварительным кондиционированием . Много лет назад я работал в Национальном институте здоровья, где проводил эксперименты по обучению и запоминанию на крысах и мышах. Хотя когда я начинал, крысы особо меня не пугали, в один роковой мартовский день я уколол крысу не в то место, причинил ей боль (неумышленно, конечно), и она тут же развернулась и забрала с собой кусок моей руки. Укус, конечно, вызывает страх в соответствии с отношениями США и СР, и для меня крыса была НС. Благодаря этому опыту, а также нескольким близким контактам после этого, я пришел к выводу, что крысы (CS) ассоциируются со страхом (CR) при введении им инъекций.До всего этого я связывал крыс (NS1) с их домашней клеткой, в которой они жили (NS2), из которой выводил их на руки. После укуса я стал бояться (CR) обращаться с крысами при повторном введении им инъекций (CS1) и при обращении с ними в домашних клетках (CS2). Животные могут обнаруживать страх, так что это не было хорошим шагом, но и моя уверенность пошла на убыль.

Что в итоге получилось? Через несколько месяцев я больше не работал с крысами. Это произошло не из-за инцидента с укусом. В соответствии с тем, что мы узнали о вымирании выше, в конечном итоге, имея многочисленные попытки ввести крысам инъекции и не быть укушенными, страх должен был исчезнуть.Вот что произошло. К сожалению, когда крыса укусила меня, он усилил мою аллергию, о которой я не знал, что она была на крыс и мышей, с которыми я работал. Я считал, что это обычная сезонная аллергия, и в том году она была хуже, чем в прошлые годы, что время от времени случалось. Я занялся своими делами, не подозревая, насколько я действительно был близок к анафилактическому шоку. Так что выходите из мышей и крыс. Включите плодовых мушек в качестве объекта моего исследования для экспериментов с обучением и памятью с этого момента.Я делал это около года, и, наконец, мне хватило.

 

4.2.4. Скрытое торможение

Свойство латентного торможения гласит, что легче обусловить новый раздражитель, чем знакомый (Lublow, 1973). Если вы используете музыку в качестве NS, используйте песню, с которой вы не знакомы (или ваши испытуемые), например, песню Барри Манилоу, а не ту, которую они знают и которую они часто слушают, например Леди Гага или Тейлор Свифт. Итак, в вашем эксперименте за песней (NS) следует еда (US), которая вызывает слюноотделение (UR) у человека (как у одной из собак Павлова).Если вы используете эту песню Тейлор Свифт в качестве NS, слюноотделение вряд ли произойдет, если участники уже слышали ее много раз. Если вы используете песню Барри Манилоу (CS), они, скорее всего, произведут реакцию слюны, как и ожидалось (CR). Преимущество латентного торможения заключается в том, что мы не формируем ассоциации между CR и повторяющимися стимулами в нашем окружении, которые связаны по ошибке или случайно.

Дополнением к латентному ингибированию является концепция эффекта предварительного воздействия УЗ или воздействие УЗ до того, как произойдет обусловливание, которое может затруднить последующее обусловливание (Randich & LoLordo, 1979).Следовательно, чем больше организм подвергается предварительному воздействию США, тем хуже обучаемость в дальнейшем, и в этом может быть виновато привыкание. Подвергаясь многократному воздействию США перед кондиционированием, организм может привыкнуть к нему, по крайней мере, до некоторой степени, что затруднит кондиционирование.

 

4.2.5. Затенение и блокировка

Бывают случаи, когда нам предъявляют два или более стимула одновременно, что называется составным стимулом . Например, нам могут быть представлены свет и звук одновременно.В том, что называется , затмевающим (Павлов, 1927), одновременно предъявляются два нейтральных стимула, и более заметный из них становится CS. Допустим, зеленый свет и высокий тон были представлены одновременно и в сочетании с УЗИ пищи, вызывающей слюноотделение (СР). Какая часть соединения станет CS и вызовет слюноотделение? Похоже, что высокий тон будет выделяться больше, чем просто зеленый свет. Но что, если этот зеленый свет был неоново-зеленым или мигающим, а тон был относительно слабым и монотонным? Теперь свет будет более актуальным или заметным стимулом и станет обусловленным как CS.Более заметная часть составного стимула приводит к тому, что менее заметная часть практически не вызывает реакции или остается в виде NS.

В , блокирующем (Камин, 1969; 1968), составной стимул состоит из НС и КС, и установленный КС мешает обучению новому соотношению КС. Это отличается от затенения, в котором два НС входят в состав сложного стимула, различающихся только с точки зрения заметности. Давайте воспользуемся примером выше. Скажем, вы представили собаке тон (NS) и корм (US), вызывающие слюноотделение (UR).Собака поймет, что, когда она услышит звуковой сигнал (CS), появится еда, и у нее будет выделяться слюна (CR). Что, если теперь вы предъявляете тон (CS) с зеленым светом несколько раз (NS; обратите внимание, что тон и свет являются составным стимулом и предъявляются одновременно) и сочетаете их с едой (US), которая вызывает слюноотделение (UR). Делая это, вы пытаетесь научить собаку выделять слюну на зеленый свет, но когда стимулы предъявляются отдельно, тон (CS) вызывает слюноотделение (CR), а зеленый свет (NS) не вызывает никакой реакции.Прежнее обучение заблокировало новое обучение.

 

4.2.6. Настройка события

Контекст, в котором происходит обучение, также важен. Установщики событий — это стимулы, помогающие организму определить, последует ли за CS УЗ, ведущее к CR. Другими словами, CS вызывает CR только тогда, когда признак присутствует, называемый установщиком положительного события признака. Эта функция может также указывать, когда за CS будет , а не следовать США, называемая установщиком отрицательных событий функции (Palmatier, 2014).Рассмотрим пример звонка (NS), за которым следует еда (US), вызывающая слюноотделение (UR). Что, если еда выходит только в том случае, если прозвенит звонок, когда загорится белый свет над ним (ОС или установщик событий). Если свет горит (OS), когда звонит звонок (NS), пища выходит (US), что приводит к слюноотделению (UR). Если свет выключен, когда звонит звонок (NS), пища не выходит, что не вызовет поведения слюноотделения. Мы можем проверить, была ли сделана дискриминация, включив свет (OS) при звонке в звонок (CS), что приводит к слюноотделению (CR; и правильный ответ), а затем не включив свет, когда звонит звонок, что должно не вызывают реакции в организме.Если это правда, то обусловливанию и различению научились. Животное теперь знает, что еда выйдет только при включении света во время звонка колокольчика и слюноотделения.


4.3. Теории кондиционирования

 

Раздел Цели обучения

  • Описать теорию замещения стимула Павлова.
  • Опишите теорию подготовительного реагирования.
  • Опишите теорию компенсаторной реакции.
  • Опишите модель Рескорла-Вагнера.
  • Опишите модель внимания Макинтоша.

 

В этом заключительном разделе Модуля 4 мы рассмотрим пять теорий обусловливания, которые определяют процессы, лежащие в основе обусловливания респондента. Они включают теорию замещения стимула, теорию подготовительной реакции, теорию компенсаторной реакции, модель Рескорла-Вагнера и модель внимания.

 

4.3.1. Теория замены стимула

Согласно Павлову (1927), обусловливание респондента заключается в замене одного стимула другим, или CS действует как заменитель США.В мозгу устанавливается связь или ассоциация между CS и УЗИ, и когда CS активируется отдельно, после приобретения, он автоматически активирует УЗ часть коры. Таким образом, CR идентичен или почти идентичен UR, поскольку связь между US и UR является жесткой или врожденной.

Таким образом, презентация корма (УЗ) собаке активирует пищевой центр в коре головного мозга. Это, в свою очередь, активирует центр слюноотделения в головном мозге, что приводит к поведению слюноотделения (UR).Затем, если мы вводим NS, такой как звон колокольчика, он активирует область мозга, ответственную за обработку звука, а затем следует US и UR, как описано выше. Это происходит в течение нескольких испытаний (фаза кондиционирования). Обучение произошло, если после предъявления звонка (КС) область мозга, обрабатывающая звук звонка, активирует область, ответственную за переработку пищи, которая активирует область, отвечающую за слюноотделение, и затем происходит слюноотделение (СР).Это одновременная активация областей мозга, ответственных за CS, а затем за US, вызывает образование нового функционального нервного пути между активными областями.

Следует отметить, что Павлов был неправ и процесс сложнее, чем он представлял. Тимберлейк и Грант (1975) проверили теорию Павлова, приучив крыс ожидать кормовой гранулы через короткий промежуток времени в двух ситуациях, отличающихся тем, какой тип CS использовался. В одном случае деревянный брусок был прикреплен к платформе и был CS для еды, а в другой ситуации живая крыса была прикреплена к платформе и была CS для еды.Используя теорию замены стимула, они предсказали, что крысы будут приближаться и кусать CS, которые были соединены с пищей. Результаты показали, что крысы в ​​состоянии деревянного бруска кусали блок CS, как и предполагалось, но этого не происходило, когда живая крыса была CS. Вместо этого крысы ухаживали за живой крысой CS. Они пришли к выводу, что природа CS влияет на топографию CR, что противоречит теории замещения стимула. Конкретный ответ, который отображался, был связан с формой, которую принял CS.

Напомним, что в теории замещения стимула CR идентичен или почти идентичен UR. Мы знаем, что это не всегда так. Рассмотрим человека, у которого панические атаки (US), которые могут вызывать сильный страх (UR). Полет — это НС, не дающий ответа. Если человек летит на самолете (НС) и у него паническая атака (УС), которая вызывает у него страх (СР), то в дальнейшем одна только мысль о полете на самолете (СС) будет вызывать не обязательно страх, а определенно тревога (CR). Следовательно, в этом примере CR — это не то же самое, что UR, и даже не близко.Страх и тревога — разные физиологические и эмоциональные реакции. Следовательно, совпадение UR и CR, или даже близкое, не всегда так, как предполагает теория Павлова.

 

4.3.2. Подготовительно-ответная теория

Возможно, CR существует для подготовки организма к представлению УЗ, например, у собаки выделяется слюна (ОК), когда она слышит звон колокольчика (КС), чтобы подготовиться к прибытию еды (УЗ). Это называется теорией подготовительной реакции (Kimble, 1967; 1961), и она компенсирует недостаток теории замещения стимула в терминах UR и CR, которые не обязательно должны быть идентичными (или близкими).В только что приведенном примере CR и UR практически одинаковы. Но представьте крысу, которая потрясена (США) и демонстрирует страх (UR). Если свет (NS) сигнализирует о наличии шока (US), вызывающего страх (UR), то крыса будет демонстрировать поведение замирания (CR) при включении света (CS), поскольку она ожидает, что последует шок.

 

4.3.3. Модель компенсаторной реакции

Мало того, что UR и CR могут быть разными, CR может быть прямой противоположностью UR.В модели компенсаторной реакции и построении на основе теории эмоций оппонентного процесса (Solomon & Corbit, 1974) CS, который неоднократно ассоциировался с а-процессом или первичной реакцией на США, будет со временем , вызывают компенсаторную реакцию или b-процесс. Доказательства этого процесса получены от Siegel (1972), который многократно вводил крысам инсулин, снижающий уровень глюкозы в крови. Он проверил CR, дав крысам инъекцию физиологического раствора вместо инсулина.Результаты показали, что сильная ПР действительно имела место, но она была противоположна реакции на инсулин. У крыс наблюдалось повышение уровня глюкозы в крови (гипергликемия CR). CR и UR не были одинаковыми, и CR был компенсаторным.

Рассмотреть лекарственную устойчивость. Морфин, как и УЗ, вызывает УР обезболивания или снижение чувствительности к боли. Сигель и др. (1978) обнаружили, что CR на стимулы в сочетании с морфином, такие как световые или звуковые сигналы, представляет собой гипералгезию , или повышенную чувствительность к боли.В ходе исследования Сигел поместил лапу крысы на горячую тарелку и измерил задержку по времени, которое потребовалось крысе, чтобы оторвать лапу от тарелки. Он обнаружил, что крысам, которым вводили морфин, требовалось больше времени, чтобы убрать лапы, чем крысам, которым инъекцию не вводили. Крысы, у которых был стимул, такой как тон в сочетании с морфином, убрали лапы быстрее, чем крысы, у которых был стимул, не связанный с морфином (США).

 

4.3.4. Рескорла-Вагнер Модель

Роберт Рескорла и Аллан Вагнер (1972) разработали ассоциативную модель обусловливания респондентов, основанную на идее, что данное УЗ может поддерживать только определенное обусловливание и должно быть распределено среди присутствующих КС.В этой модели отражены четыре основные идеи.

  1. Существует максимальная ассоциативная сила, которая может развиться между US и CS. Это определяется США, и разные США поддерживают различные максимальные уровни кондиционирования. Таким образом, более сильные стимулы поддерживают большее обусловливание, так что, если США является любимой пищей, такой как курица, она вызовет больше слюноотделения в организме, чем менее предпочтительная пища, такая как брюссельская капуста.
  2. Ассоциативная сила увеличивается с каждым испытанием, хотя величина ассоциативной силы, приобретаемой в ходе испытания, зависит от уровня предшествующей подготовки.В целом, более ассоциативная сила приобретается в ранних испытаниях.
  3. Ассоциативная сила будет накапливаться быстро для одних стимулов и медленно для других, и некоторые УЗ будут производить более быстрое обучение по сравнению с другими.
  4. Конкретное УЗИ может поддерживать только определенную степень кондиционирования, даже если оно сочетается с более чем одним стимулом. Добавление каждого стимула помимо первого означает, что США должны иметь общую ассоциативную силу для всех стимулов. Допустим, в США 15 единиц максимальной ассоциативной силы.Если 11 из этих единиц распределяются на стимул A, то только 4 могут быть разделены со стимулом B. Это особенно верно в случае составного стимула. A, очевидно, будет более заметным, чем B, или, если вспомнить из более раннего, A затмевает B.

Модель Рескорла-Вагнера также хорошо объясняет, что блокирует . Вспомните наш более ранний пример с собакой, у которой был тон (NS) и пища (US), приводящие к слюноотделению (UR). Приобретение завершается, когда тон (CS) вызывает слюноотделение (CR).УЗ еды имеет максимальную ассоциативную силу 8 единиц, которая полностью переносится в тон (ТС) при освоении. Если мы теперь введем НС зеленого света, предъявляемого одновременно с тоном (CS), чтобы сформировать составной стимул, за которым следует пища (US), вызывающая слюноотделение (UR), то при раздельном тестировании тона и зеленого света тон будет вызвать слюноотделение, так как ему присвоена ассоциативная сила в 8 единиц, а свет не вызовет никакой реакции, поскольку ему не осталось ассоциативной силы, которую можно было бы присвоить.

 

4.3.5. Модель Mackintosh Attentional

Николас Макинтош (1975) представил очень простую теорию обусловливания, основанную на концепции внимания. Модель внимания утверждает, что то, сколько внимания организм будет уделять CS, зависит от того, насколько хорошо CS предсказывает США. Если это хороший предиктор, мы будем обращать внимание на CS. Если это не хороший предсказатель, наше внимание будет снижаться. Когда внимание высокое, обучение также будет высоким.Организмы будут обращать больше внимания на лучший предиктор США и меньше внимания на более слабые предикторы во время кондиционирования. Теория объясняет блокировку тем, что, хотя США смогли научить как свету, так и тону, животное уделяло меньше внимания зеленому свету, чем тону.

 


Краткое описание модуля

После завершения этого модуля у вас должно быть четкое представление о том, как работает обусловливание респондентов.Вы будете использовать эти знания для обсуждения приложений обусловливания респондентов в Модуле 5, а затем увидите, как парадигма обучения соотносится с оперантным обусловливанием, второй ассоциативной моделью. Затем мы обсудим обучение через наблюдение, и с помощью упражнения вы увидите, что три модели обучения дополняют друг друга, а не конкурируют. Надеюсь, вам понравился этот модуль и его описание обусловливания респондентов. Если что-то было непонятно, спросите об этом у инструктора.


2-е издание

Классическое обусловливание или стимул-организм-реакция (SOR)

Стимул-реакция (S-R) — это классическая модель психологии человеческого поведения, широко известная как Classical Conditioning

Было бы разумно кратко описать «обусловливание», прежде чем можно будет объяснить классическое обусловливание.

Обучение через обусловливание также называется обучением через ассоциации. В этом процессе происходит большая часть обучения. Оно состоит в связывании одного опыта с другим, уже знакомым нам опытом.

Что такое кондиционирование?

Обусловливание — это просто процесс восприятия какого-то нового стимула, на который у нас уже есть какая-то реакция.

Например, наша остановка при виде красного сигнала светофора является примером условной реакции.

Обусловливание включает формирование ассоциации между событиями в окружающей среде (стимулы) и нашим поведением (реакцией).

Типы кондиционирования:

Существует два вида кондиционирования; Классика и оперант.

Здесь мы сосредоточимся на классическом обусловливании, которое составляет основу процесса НЛП/гипнотерапии, известного как «Якорение».

Классический кондиционер

Согласно теории S-R (классическое обусловливание), определенный стимул вызывает определенную реакцию.

Это основа эксперимента Павлова с собакой, в котором он использует безусловный стимул пищи, чтобы вызвать безусловную реакцию слюноотделения у собаки. Затем он связывает условный стимул звонка в колокольчик с едой, звоня в колокольчик каждый раз перед тем, как поставить еду перед собакой.

Таким образом, собака ассоциирует, что каждый раз, когда звонит звонок, она получает еду, а еда вызывает слюноотделение. Это приводит к ассоциации между звонком, едой и слюноотделением таким образом, что у собаки выделяется слюна, когда звонит звонок, даже если еды нет.

Таким образом, вызывается условная реакция слюноотделения на основе условного раздражителя Белла.

Другими словами, если между стимулом и реакцией создается ассоциация, каждый раз, когда возникает стимул, он автоматически запускает соответствующую реакцию.

Теперь люди в этом отношении не слишком отличаются от собак, поскольку мы работаем по более или менее тому же принципу, за исключением временами (психического состояния).

Прежде чем мы перейдем к модели S-O-R, давайте применим модель S-R к людям.

Модель

SR и люди

  • Каждый раз, когда новорожденный плачет, мать дает ему еду. Поскольку между плачем и едой возникает связь, всякий раз, когда ребенок плачет, мать первым делом предлагает ему еду. Многие матери выражают любовь к своим детям, кормя их, и ребенок учится ассоциировать любовь с едой. Позже, когда люди чувствовали себя одинокими или нелюбимыми, они инстинктивно чувствовали потребность поесть, поскольку это внутренне заставляло их чувствовать себя любимыми.
  • Еще один пример применения модели S-R — образование. Студент чувствует себя некомфортно с конкретным учителем. Этот учитель преподает предмет, скажем, математику. Ученик в течение определенного периода времени создает косвенную ассоциацию дискомфорта с математикой. Большинство таких учеников продолжают чувствовать себя некомфортно в математике даже после того, как вырастут.

Как вы, возможно, уже поняли, модель S-R применима к людям, модель S-O-R является как бы обновлением той же самой и вводит идею о том, что организм может по-разному реагировать на один и тот же стимул в зависимости от его состояния ума.

Например, ребенок, который любит играть в видеоигры, обычно отвечает игрой (реакция 1), когда ему предъявляется стимул видеоигры перед ним. Если, когда ребенок играет в игру, мать злится на него, то эта реакция матери становится обратной связью для ребенка. Теперь ребенок связывает страх с игрой перед ним в видеоигру. В будущем всякий раз, когда мать присутствует из-за психического состояния страха, тот же самый ребенок будет реагировать на видеоигры, избегая их (реакция 2).

Применение модели S-R и S-O-R в терапии:

Эти модели помогают нам понять, если не полностью, причины поведения человека и, следовательно, очень важны, когда речь идет о проблемах, связанных с поведением.

Большая часть нашего поведения обусловлена ​​нашим психическим состоянием, которое в большинстве случаев зависит от того, как мы ассоциируем определенный раздражитель. Другими словами, если мы хотим обратиться к поведению, нужно понять, как стимул влияет на психическое состояние клиентов, а затем изменить эту ассоциацию.

Вопрос в том, как мы можем классически обусловливать (якорить) себя или других для нашей выгоды и/или изменить существующую обусловленность, которая управляет нашим поведением? а ответ….

Якоря/Триггеры:

Привязка в нейролингвистическом программировании и установка триггеров в гипнотерапии — это выражения, используемые для процесса, посредством которого вы применяете жест, прикосновение или звук на пике состояния либо к себе, либо к кому-то другому. Упомянутое закрепленное состояние затем можно вызвать или повторно активировать (запустить) путем повторного применения жеста, прикосновения или звука.

По словам Бендлера и Гриндера

Якорение относится к тенденции любого элемента опыта возвращать весь опыт.

Как только мы научимся создавать якоря (с собой и другими), мы сможем использовать их для достижения ресурсного состояния по своему желанию. Например, прикосновение к суставу левой руки после того, как якорь был установлен, так что это действие приводит к изобретательному состоянию.

Операторы «если-то»:

Мощная техника управления мыслями, основанная на применении модели S-O-R.Этот метод помогает нам изменить то, как мы думаем или ведем себя в определенных ситуациях, с определенными людьми или при воздействии определенных триггеров.

Техника работает путем связывания стимула (пример: просьба выступить на сцене) с желаемой мыслью (пример: люди аплодируют мне) для создания желаемой эмоции (пример: уверенность), которая приводит к желаемой реакции (пример: наступить на на сцене и произнесение речи).

Формат, используемый для создания инструкции if-then:

Если СТИМУЛ то ЖЕЛАЕМАЯ МЫСЛЬ

Таким образом, в приведенном выше примере этапа оператор if-then принимает следующий вид:

Если меня попросят выступить на сцене, то я понимаю, что после выступления мне будут аплодировать.

Для получения дополнительной информации о том, как создавать утверждения «если-то» для реструктуризации мыслей, вы можете ознакомиться со статьей под названием «Простая, но мощная техника для создания утверждений «если-то»»

.

Термины, используемые в классическом обусловливании

Безусловный раздражитель (США):  Раздражитель, который безоговорочно, естественно и автоматически вызывает непривычную реакцию.

Безусловная реакция (UR):  Естественная, обычно неизменная реакция, вызываемая стимулом в отсутствие обучения или обусловливания.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *