Уместный вопрос: как задать изначальные безусловные рефлексы и рефлексы оценочного восприятия? Природа ответила на этот вопрос, запустив процесс естественного отбора и свойственный ему метод проб и ошибок. Для робота можно попытаться задать рефлексы экспертно, руководствуясь определенной логикой. А можно попытаться повторить путь природы, но тогда придется задать среду, естественный отбор и условия выживания и наследования.
Вся описанная конструкция – это одна из разновидностей персептрона. Персептрон — это нейронная сеть, состоящая из входных (S), ассоциативных (A) и реагирующих элементов (R), с переменной матрицей взаимодействия, определяемой последовательностью прошлых состояний активности сети. Термин был введен Фрэнком Розенблаттом в 1957 году. Ему же принадлежит первая реализация в виде электронной машины «Марк-1» в 1960 году. Персептрон стал одной из первых моделей нейросетей, а «Марк-1» — первым в мире нейрокомпьютером (Rosenblatt, 1962).
Рисунок 11. Персептрон Розенблатта
Сам принцип, когда новый опыт изменяет структуру нейронной сети, называется «обучением с подкреплением». Для персептрона необходимо задать систему управления подкреплением. Задача этой системы - оценить успешность взаимодействия устройства со средой и на основе полученных знаний изменить веса ассоциативных элементов таким образом, чтобы повысить шансы устройства на последующий успех. Что считать успехом – это тот вопрос, который всецело зависит от системы управления подкреплением и соответственно тех задач, для решения которых она создается. В нашем случае система подкрепления — это внешняя среда, оценочное восприятие и характер его участия в формировании памяти.
Разработкой систем, которые действуют по принципу эмоционального управления, успешно занимается Александр Жданов. Описание теории и примеры работающих систем можно найти в его книге «Автономный искусственный интеллект» (Жданов, 2009), которую могу порекомендовать каждому, кто хочет найти строгое формализованное изложение. В свои модели Жданов закладывает те же эмоциональные принципы, что описываем мы в этой книге. В его интерпретации обобщенная схема мозга робота выглядит следующим образом:
Рисунок 12. Адаптивное управление по Жданову
Виртуальный опыт
Приобретать опыт можно не только совершая поступки. Когда мы представляем себе что-либо, мы даем эмоциональную оценку своим фантазиям. И тут же запоминаем этот «виртуальный» опыт, и он моментально начинает управлять нашим поведением наравне с опытом реальным.
Гарвардский невролог Альваро Паскуаль-Леоне в 90-х годах XX века провел серию экспериментов, результаты которых наделали много шума. Он обучал две группы людей играть на пианино. При этом одна группа действительно занималась игрой, а вторая проводила большую часть отведенного времени в «психической тренировке», представляя, как они играют. Оказалось, что обе группы добились одинаковых успехов в игре. Более того, изменения моторных областей коры мозга у людей, выполнявших упражнения в уме, походили по размеру на соответствующие изменения у тех, кто по-настоящему занимался на клавиатуре.
Рисунок 13. Динамика изменения моторной зоны, связанной со средним пальцем. Верхний ряд – реальные упражнения, нижний ряд – мысленные
Получение виртуального опыта через оценку своих же фантазий - это то, чем мы занимаемся постоянно. Когда мы думаем о каком-либо поступке, у нас в воображении проносится картина будущего результата. Эта картина получает эмоциональную оценку, и тут же формируется воспоминание о виртуальном опыте. Далее, в зависимости от знака эмоциональной оценки, память либо будет «толкать» нас на совершение представленного действия, либо наоборот, будет ему «препятствовать». Кстати, именно такое понимание того, как соотносятся фантазии и поведение, примеряет бихевиоризм и когнитивную психологию, так как, с одной стороны, констатирует бессознательную основу всех поступков, а с другой стороны - показывает, как когнитивные процессы меняют память, и, соответственно, влияют на поведение.
Этот несложный принцип «виртуального моделирования» позволяет объяснить три фундаментальных свойства мозга.
Выбор
Когда присутствуют близкие альтернативы, а нашего опыта оказывается недостаточно, для того чтобы перевесила одна из них, мы попадаем в затруднительное положение. Память оказывается не в состоянии сформировать поведение, отдав предпочтение одной из альтернатив.