Вернемся к примеру об утолении голода в ресторане. Чтобы добыть себе еды, вы активируете генераторы сигналов, которые воспроизводят образ ресторана на углу, побуждают вас сесть на велосипед и крутить педали. Это шаблон мотивации, мыслей и действий, который приводит вас в ресторан. Теперь представим, что вы пообедали в ресторане, и еда оказалась очень вкусной. Неожиданно вкусной. Вы удовлетворили цель принятия пищи очень успешно. Генераторы сигналов, которые привели вас в ресторан, начинают посылать свои сообщения более настойчиво и в следующий раз: когда вы почувствуете голод, то скорее всего очень захотите снова попасть в ресторан на углу. Возможно, даже сядете на велосипед, чтобы снова оказаться там. Вы начнете получать удовольствие от мысли о ресторане, вспоминая его внешний вид и запах еды. Вариант поведения, который приводит вас в ресторан на углу, получает подкрепление.
Обучение приводит в соответствие все три уровня процесса осуществления выбора – мотивационного, когнитивного и двигательного. Подкрепление усиливает все три аспекта, потому что все они требуются для осуществления эффективного целевого поведения. Процесс подкрепления проходит полностью за пределами сознательного понимания. Он существовал еще до наших общих с миногами предков.
Обучение также работает в противоположном направлении. Если в результате выбранного варианта поведения случается что-то плохое, вероятность того, что подобное поведение повторится, снижается. Например, если вы отравились в ресторане на углу, то едва ли станете обедать там снова, даже когда почувствуете голод. А мысль о ресторане, его внешнем виде и запахе могут вызвать у вас тошноту. Это называется негативное подкрепление.
Чтобы осуществилось подкрепление, должен возникнуть обучающий сигнал. Он изменяет способ работы нейронных цепей в базальных ганглиях. При этом действия с хорошей ответной реакцией закрепляются, а с плохой – отсеиваются. Большинство ученых полагают, что обучающий сигнал в мозге производят удивительные молекулы дофамина.[35]
Росс МакДевитт, стажер-исследователь из Национального института здравоохранения в городе Балтимор, аккуратно сажает подопытную мышь в пластиковую клетку и присоединяет к ее голове тонкий волоконно-оптический кабель, там же расположен миниатюрный коннектор. МакДевитт пользуется передовым методом исследования, который получил название оптогенетики, чтобы воздействовать на клетки мозга в вентральной тегментальной области (вентральной области покрышки). Как мы уже выяснили в предыдущей главе, вентральный тигментум посылает дофаминовые волокна в главный мотивационный центр мозга – вентральный стриатум (рис. 14). Волокна выделяют молекулы дофамина, которые изменяют функцию клеток вентрального стриатума и прилежащих к нему других отделов мозга. Этот процесс оказывает влияние на поведение. Мы уже говорили о том, что высокий уровень дофамина повышает вероятность того, что власть над поведением перейдет в руки определенного генератора сигналов. Дофамин оказывает и более тонкое воздействие на организм. Фактически дофамин является средством подкрепления.