Дифференцировка между двумя двигательными реакциями, подкрепляемыми одним безусловным раздражителем - интегративная деятельность мозга
Переходим к рассмотрению следующей проблемы, касающейся взаимоотношений между двумя (и более) инструментальными реакциями, вырабатываемыми на разные условные сигналы второго типа, в одной обстановке и при одном драйве. В американской литературе эту методику определяют как «различительное обучение». Следует, однако, напомнить, что мы называем различением чисто перцептивный процесс, когда различают два сходных раздражителя, в то время как использование уже воспринятого различия между двумя условными сигналами для образования ассоциаций именуем дифференцировкой. В гл. VII (приложение) мы рассматривали павловскую дифференцировку классических условных рефлексов, когда положительный условный сигнал подкрепляется безусловным агентом, а отрицательный не подкрепляется. Ниже, в разд. 6, будет обсуждаться тот же тип дифференцировки в отношении инструментальных условных рефлексов. Здесь же речь будет идти только о дифференцировке между двумя инструментальными реакциями, которые подкрепляются одним и тем же безусловным агентом.
Дифференцировка инструментальных реакций, подкрепляемых одним и тем же безусловным агентом, принадлежит к наиболее популярным процедурам в поведенческих исследованиях. Она была введена в физиологию высшей нервной деятельности П. К. Анохиным и его сотрудниками под названием «активного выбора» [32]. В нашей лаборатории применяется как методика локомоторных реакций, почти идентичная с методикой, применяемой Анохиным, так и методика манипуляторных реакций, когда собаки обучаются ставить левую или правую переднюю лапу на кормушку в ответ на два различных условных раздражителя.
Ниже мы сделаем беглый обзор нескольких вариантов опытов, касающихся дифференцировки двигательных реакций, базируясь преимущественно на данных, полученных в нашей лаборатории. Затем мы постараемся выяснить механизм, лежащий в основе этого явления.
- Дифференцировка между локомоторными реакциями «побежка направо — побежка налево», когда условные раздражители пространственно совмещены с местами получения пищи (метод выбора I). Для иллюстрации приведем здесь описание нашей методики, поскольку мы проводим обычно эксперименты этого рода (на собаках и кошках) как предварительный этап для выработки отсроченной реакции. Схема экспериментальной установки представлена на фиг. 106. У трех стен комнаты помещают три источника пищи. Стартовая площадка находится у четвертой стены. Условным сигналом служит зуммер или свет, действующие как раз на том месте, где стоит кормушка, к которой следует подойти в данном сочетании. Животное обучают оставаться на стартовой площадке до начала действия условного сигнала, а затем бежать к тому источнику пищи, откуда действует условный сигнал. Если животное подходит к нужной кормушке, подается пища.
Оказалось, что задача не представляет для животного никакой трудности, даже если приходится выбирать между тремя кормушками (фиг. 98, а).
- Дифференцировка между реакциями «побежка направо — побежка налево» при разных источниках звука (метод выбора II) [8—101. Собак обучали идти к правой или левой кормушке в ответ на один и тот же звук в зависимости от того, откуда он исходил. Для этого два репродуктора помещали при стартовой площадке—один внизу, на полу, другой на высоте 2 м. Как показано на фиг. 98, б, собаку удавалось быстро научить выполнению этой задачи- после 10 опытов (180 предъявлений) частота правильных ответов достигала 90%. Таким образом, эту задачу, даже не такую простую, как предыдущую, животные решали легко.
- Дифференцировка между реакциями «побежка направо — побежка налево» при расположении раздражителей в направлении, противоположном месту нахождения источников пищи (метод выбора III) [111. При этой методике слуховой раздражитель, подаваемый справа, сигнализировал предъявление пищи слева, и наоборот. Эта задача оказалась столь же легко разрешимой для собак, как и предыдущая (фиг. 98, в).
- Дифференцировка между реакциями «побежка направо — побежка налево» на раздражители, действующие из одного источника (метод выбора IV). Бихевиористские эксперименты этого рода проводились обычно на крысах (аппарат Лэшли) и на обезьянах (висконсинский прибор) с применением зрительных раздражителей. Раздражители располагались между двумя кормушками. Один из них означал, что пища будет даваться слева, другой — что пища будет справа. Разрешимость задачи зависела от степени несходства раздражителей.
Фиг. 98. Выполнение животными различных задач по дифференцировке между двигательными реакциями.
а — «побежка направо—побежка налево» при расположении раздражителей на кормушках- б — «побежка направо — побежка налево» при расположении раздражителей в разных местах- в—«побежка направо— побежка налево» при расположении раздражителей в местах, противоположных местам расположения пищи- г—«побежка направо—побежка налево» при действии раздражителей из одного места: д—«поднятие левой конечности—поднятие правой конечности» при расположении раздражителей в разных местах- е—«поднятие левой конечности — поднятие правой конечности» при действии специфических тактильных раздражителей- ж — «поднятие левой конечности— поднятие правой конечности» при действии раздражителей из одного места- з—«поднятие левой конечности— поднятие правой конечности» на зрительный и слуховой раздражители.
Совсем другие результаты получила Лавицка, применявшая слуховые раздражители [12]. В этих экспериментах репродуктор располагался перед стартовой платформой- два тона, сильно различавшиеся по частоте (300 и 900 гц), сигнализировали соответственно о том, дается корм слева или справа. Задача оказалась для животных очень трудной (фиг. 98, г)- она решалась правильно только при значительно большей разнице между тонами. Но в таком случае оказывалось, что высокий тон вызывал более сильную ориентировочную реакцию, чем низкий, и что именно это и было основой вырабатывающейся дифференцировки. Если по каким-то причинам реакция на высокий тон была слабой, а на низкий — сильной, то собака чаще всего ошибалась. Как мы видим, эти данные резко отличаются от данных по павловской дифференцировке, когда один тон подкрепляется пищей, а другой — не подкрепляется. Как известно, собаки легко справляются с этой задачей и способны распознавать тоны значительно более близкой частоты. Таким образом, нам кажется, что у собак дифференцировка реакций «побежка направо — побежка налево» на тоны разной высоты (или, в более общем виде, на различные качества звука) возможна только при условии существенных различий в ориентировочной реакции, как, например, при раздражителях, действующих из разных источников [12].
- Дифференцировка между реакциями «поднятие правой конечности — поднятие левой конечности». Для того чтобы выяснить, в какой мере эти закономерности, установленные в опытах с локомоторными реакциями, приложимы к манипуляционным реакциям, были поставлены следующие опыты [13, 14].
В павловской камере собак обучали поднимать правую переднюю лапу в ответ на звук метронома, расположенного непосредственно перед нею, а левую переднюю лапу — в ответ на бульканье, доносящееся сзади. Каждый день производили 8 сочетаний (четыре—с метрономом, четыре — с бульканьем) при нестереотипном их чередовании. Промежутки времени между сочетаниями равнялись примерно 1 мин.
После 12 опытов собаки научались правильно решать эту задачу в 100% случаев. Перед выполнением инструментального движения у собак наблюдалась четкая ориентировочная реакция в направлении источника раздражителя. Перед тем как поднять правую лапу, собака устремляла взгляд вперед — на метроном, а перед тем как поднять левую — оглядывалась назад, откуда доносилось бульканье.
После выработки прочной дифференцировки, когда ошибочных ответов уже не было, раздражители меняли местами: метроном ставили позади станка, а источник бульканья — впереди. При этом оказалось, что в ответ на бульканье собака поднимала правую лапу, а на звук метронома — левую.
Эти результаты весьма показательны. По поведению животных было ясно, что они «знали» о том, что звук метронома должен доноситься спереди, а звук бульканья сзади, т. е. между характером раздражителя и местом его расположения установилась прочная ассоциация. Это проявлялось, помимо всего прочего, также и в том, что при первом предъявлении раздражителя с нового места у некоторых животных была четкая ориентировочная реакция («удивление»). Однако при выборе реакции они не могли использовать информацию о качестве раздражителя- :в то же время для этой же цели они свободно использовали информацию о его расположении.
В эксперименте другого типа на обе передние лапы собаки подавались ритмические тактильные раздражения («касалки»), каждое из которых вызывало инструментальную реакцию соответствующей конечности. Как показано выше (разд. 2), такие раздражители обладают большой рефлексогенной силой в отношении условных реакций второго типа с той же конечности. В описываемых экспериментах было обнаружено, что при выработке инструментального движения правой лапы на правую касалку и левой лапы на левую не встречалось никаких затруднений, а число ошибочных реакций было весьма незначительным (фиг. 98, е).
Наконец, была сделана попытка научить собак поднимать правую переднюю лапу в ответ на метроном, а левую — в ответ на бульканье, когда оба источника звука помещались перед животным. Оказалось, что эта задача, подобно аналогичной задаче с локомоторными реакциями, -оказалась исключительно трудной (фиг. 98, ж). Положение, однако, менялось, если один из раздражителей был слуховым (бульканье), а другой— зрительным (ритмический свет). В этом случае задача решалась легко и дифференцировка между движениями правой и левой конечности отличалась стабильностью (фиг. 98, з) [15].
Все эти эксперименты показывают, что результаты выработки дифференцировки между двумя двигательными реакциями при одном подкреплении можно разделить на следующие три категории:
- В некоторых случаях выработка двух различных условных рефлексов второго типа не представляет для животного никакой трудности, поскольку инструментальные реакции не обнаруживают тенденции замещать друг друга. В таком случае обе реакции становятся специфическими уже после короткой дифференцировочной тренировки или даже совсем без нее. Происходит это при следующих условиях: а) две локомоторные реакции («побежка направо — побежка налево») вырабатываются на раздражители, указывающие направление движения- б) два инструментальных условных рефлекса, состоящих в поднимании одной и другой конечности, вырабатываются на Тактильные раздражители одноименных конечностей и в) два инструментальных условных рефлекса вырабатываются в различной экспериментальной обстановке.
- В других случаях выработка двух различных условных рефлексов второго типа при одном и том же подкреплении, хотя и возможна, но происходит не сразу, а требует более или менее длительной дифференцировочной тренировки. Происходит это при следующих условиях: а) в. качестве условных сигналов второго типа применяются зрительные раздражители (эксперименты, выполненные на крысах и обезьянах методом выбора)- б) условные раздражители имеют разные модальности- в) в качестве условных сигналов второго типа применяются слуховые раздражители, источники которых находятся в разных местах (эксперименты с локомоторными и манипуляторными реакциями на собаках и обезьянах).
- Наконец, бывают случаи, когда выработка двух различных условных рефлексов второго типа при одном и том же подкреплении крайне трудна или же практически невозможна. Это бывает, когда в экспериментах на собаках в качестве условного раздражителя применяются раздражители, различающиеся между собой лишь качественно, а не по характеру вызываемой ими ориентировочной реакции.
Как объяснить эти различные результаты?
Наиболее приемлемым представляется предположение, что нейроны центра условного сигнала и нейроны центра инструментальной реакции связаны друг с другом потенциальными связями различной силы. Если эти связи сильны (категория 1), то действующие связи между этими центрами при соответствующей тренировке образуются очень быстро, и поэтому выработка соответствующих инструментальных реакций не представляет трудностей (фиг. 92). В двух случаях причина существования особенно сильных связей условный сигнал — движение понятна. Во-первых, когда условный сигнал совпадает по направлению с местом кормления (метод выбора I), естественная ориентировочная реакция на источник этого раздражителя суммируется с локомоторной условной реакцией на пищу, поскольку обе они имеют одно и то же направление. Во-вторых, когда условными сигналами служат специфические тактильные раздражители, они сами по себе оказываются подпороговыми в отношении рефлекса сгибания соответствующей конечности и поэтому их действие суммируется с инструментальной реакцией. Третий случай, когда инструментальная реакция оказывается тесно связанной с обстановкой, в которой она вырабатывалась, представляется нам менее ясным. Причина этой связи должна быть выяснена в специальных опытах.
В категории 2 положение несколько иное. «Естественные» связи между центром условного сигнала и центром заученного движения не так сильны, как в предыдущей категории. Поскольку центр драйва, общий для обоих условных рефлексов, связан с обоими движениями и поскольку прямые связи между условным сигналом и соответствующим движением еще не выработаны, животное легко ошибается и совершает «ошибочные» движения. Причину таких ошибок найти легко. Они возникают при временном преобладании одного из движений над другими, вследствие ряда случайных факторов, таких, например, как первое сочетание в данном опыте, наличие нескольких предыдущих успешных реакций и т. д. Действительно, на начальных стадиях выработки животное часто выполняет одну и ту же реакцию в ряде последовательных сочетаний, независимо от того, какой из раздражителей применялся (ошибки типа персеверации). Только спустя некоторое время собака обучается не выполнять неправильную реакцию на данный условный сигнал и таким образом решает поставленную перед ней задачу (фиг. 98, А).
Наконец, в категории 3 животное не в состоянии усвоить дифференцировку между двумя двигательными реакциями. Это можно объяснить, допустив, что между нейронами данного условного сигнала и нейронами представительства данного движения отсутствуют потенциальные связи, которые способствовали бы выработке дифференцировки (фиг. 99, Б). Вследствие этого животное хотя и различает четко два условных сигнала, но не в состоянии использовать эту свою способность для решения задачи, т. е. для того, чтобы установить, какой из раздражителей какому движению соответствует. (В этом отношении животное подобно больному со зрительно-слуховой афазией, который различает слова символизирующие данные объекты, и объекты сами по себе, но который не в состоянии усвоить, какое слово какому объекту соответствует- см. гл. V, разд. 2.)
Как показали наши эксперименты, несмотря на наличие у собак прекрасной и тонкой способности к различению звуков, они не могут применять эту способность в задаче дифференцировки двух двигательных реакций, что, по-видимому, связано с отсутствием у них потенциальных связей между слуховым и кинестетическим анализаторами. Вместе с тем у собаки могут формироваться ассоциации между различными раздражителями внутри кинестетического анализатора, в частности между кинестезией данной ориентировочной реакции и кинестезией данной инструментальной реакции. Вследствие этого когда перед животным встает задача дифференцировки двух двигательных актов в ответ на разные слуховые раздражители, собака не будет решать задачу прямо, поскольку это ей недоступно, а будет основывать свое решение на различии ориентировочных реакций, вызываемых двумя раздражителями (фиг. 99, В). Эта задача проста, когда раздражители по-разному расположены в пространстве, но она значительно усложняется и решить ее не всегда удается, если оба раздражителя действуют из одного места.
*
Действительно, тактильное раздражение передней поверхности лапы вызывает у животного, которое подвешено в станке, рефлекс постановки лапы. И хотя у стоящего на полу животного этот рефлекс подавлен, подпороговые раздражения все же активируют двигательную область коры.
В случае же дифференцировки между подкрепляемым и неподкрепляемым раздражителями положение оказывается совсем иным. Оба дифференцируемых раздражителя действуют на центр голода: положительный раздражитель активирует этот центр, а отрицательный — тормозит его вследствие активации центра антидрайва. Поскольку слуховой анализатор имеет обширные связи с лимбической системой, возможна очень тонкая степень дифференцировки без какой бы то ни было помощи со стороны кинестетического анализатора (фиг. 99, Г).