Все эти свойства (в упрощенном виде) согласуются с основными характеристиками нашей нервной системы. Человеческий мозг, состоящий почти из 100 миллиардов (1011) клеток, представляет собой архетип массово-параллельной системы, где все нейроны работают одновременно. Связи, которые их соединяют, так называемые синапсы, передают информацию о внешнем сенсорном стимуле. Некоторые из этих синапсов являются ингибирующими (тормозящими). Это означает, что при срабатывании исходного нейрона происходит подавление возбуждения других нервных клеток. Канадский нейрофизиолог Дональд Хебб уподобил результат сети «клеточных ансамблей» – коалиций нейронов, постоянно конкурирующих между собой. По этой причине неудивительно, что пандемониум Селфриджа послужил источником вдохновения для многих теоретических моделей нервной системы, включая первые нейросетевые модели чтения. На рис. 1.5 показана одна из самых ранних моделей, предложенная Джеем Макклелландом и Дэвидом Румельхартом в 1981 году[86]
. Она включает три иерархических уровня нейроноподобных модулей:• Нижние входные модули чувствительны к линейным сегментам, отображаемым на сетчатке глаза.
• В середине находятся детекторы букв, которые срабатывают всякий раз, когда появляется определенная буква.
• Верхние модули кодируют целые слова.
Рис. 1.5.
Процесс идентификации слов подобен обширному собранию, где тысячи буквенных и словесных модулей сообща пытаются обеспечить наилучшую интерпретацию входной буквенной цепочки. В модели Макклелланда и Румельхарта, фрагмент которой приведен на рисунке, базовые характеристики входной цепочки активируют детекторы букв, а те подключаются к детекторам соответствующих слов. Связи могут быть возбуждающими (стрелки) или тормозящими (линии с черными кружками на конце). Конкуренция между лексическими модулями в конечном счете позволяет идентифицировать доминирующее слово – наиболее подходящую гипотезу о поступающей буквенной цепочке, которую выбирает сеть.Все они соединены многочисленными связями. Подобное взаимодействие (коннективность) превращает сетевую динамику в сложную политическую игру, в которой буквы и слова поддерживают, критикуют или исключают друг друга. Если вы внимательно посмотрите на рисунок, то увидите возбуждающие связи, обозначенные стрелочками, и ингибирующие связи, обозначенные кружочками. Их роль заключается в распространении голосов каждого из демонов. Входной детектор, кодирующий некий базовый элемент, например вертикальную черту, посылает сигнал всем буквам, содержащим этот специфический компонент. Иными словами, каждый зрительный нейрон «голосует» за ту или иную букву. На следующем уровне детекторы букв избирают целые слова, стимулируя соответствующие им модули. Наличие букв «А» и «N», например, поддерживает слова «RAIN» и «TANK», частично выступает в пользу слова «RAIL», но совсем не реагирует на слово «PEST».
Не менее важную роль в отборе наилучшего кандидата играет и торможение. Благодаря тормозящим связям буквы могут «голосовать» против слов, которые их не содержат. Например, модуль, кодирующий букву «N», выступает против слова «RAIL» и оказывает на него сдерживающее влияние. Кроме того, конкурирующие слова подавляют друг друга. Таким образом, идентификация слова «RAIN» несовместима с присутствием слова «RAIL», и наоборот.
Нисходящие связи ведут от слов к составляющим их буквам. Этот процесс можно сравнить с сенатом, где буквы представлены словами. Слова же активно поддерживают буквы, которые за них «проголосовали». Взаимные связи позволяют создавать устойчивые коалиции, способные компенсировать случайное отсутствие буквы. Например, если в слове «крокдил» отсутствует «o», то его соседи все равно «изберут» слово «крокодил», а последний «проголосует» за наличие средней буквы «о», которой физически нет. В целом для интеграции многочисленных статистических ограничений, объединяющих уровни слов, букв и базовых элементов, требуются миллионы связей.
Другие тонкости позволяют всей сети работать бесперебойно. Например, словесным модулям могут быть присущи разные пороги активации. Слово, которое встречается часто, характеризуется более низким порогом, нежели редкое слово, и при равной восходящей поддержке имеет больше шансов на «победу». Самые последние модели также осуществляют подробное кодирование позиции буквы в слове. Такая сеть обладает столь сложной динамикой, что полностью описать ее математически невозможно. Приходится прибегать к компьютерным симуляциям – только так мы можем установить, сколько времени требуется системе, чтобы определить правильное слово и то, как часто она ошибается.
Параллельное чтение