Рис. 3.7.
Сложные объекты распознаются по расположению их контуров. В точках пересечения контуры образуют воспроизводимые конфигурации в виде букв T, L, Y или F. Их удаление существенно усложняет распознавание изображения (левый столбик). Удаление эквивалентного количества контуров, не затрагивающих такие соединения, не приводит к выраженным трудностям (средний столбик) (по материалам статьи Biederman, 1987). Любой организованный набор контуров, даже если он не образует единого целого, наша зрительная система автоматически воспринимает как трехмерный объект (внизу).То же самое происходит, когда нам нужно определить идентичность двух любых объектов. Различия очевидны, если они касаются неслучайных свойств (например, «О» и цифра 8); но почти незаметны, если касаются только метрических характеристик, таких как размер (например, «О» и «о»)[235]
. Бидерман, сотрудничая с нейрофизиологом Руфином Фогельсом, показал, что многие нейроны нижневисочной коры макаки игнорируют метрические искажения изображения при условии, что они не затрагивают неслучайные свойства[236].Таким образом, нейроны нижневисочной коры предпочитают формы, напоминающие латинские буквы T, F, Y или O, по одной простой причине: в совокупности они обеспечивают оптимальный код, который характеризуется инвариантностью относительно трансформаций изображения и позволяет представлять бесконечное множество объектов. Вполне вероятно, что позже к этому алфавиту были добавлены и другие биологически значимые формы. Например, Танака заметил, что некоторые нейроны кодируют черную точку на белом фоне – глазной детектор, очень полезное устройство для такого социального вида, как наш. Другие клетки чувствительны к очертаниям руки или пальца. В первую очередь, однако, нижневисочная кора полагается на набор геометрических фигур и простых математических инвариантов. Большую часть букв мы вовсе не изобретали: они дремали в нашем мозгу миллионы лет и просто были открыты заново, когда человек придумал письмо и алфавит.
Распознавание форм
Но откуда именно берется корковый алфавит примитивных протобукв: он вписан в наши гены или возникает заново у каждого ребенка в результате процесса научения? Пока мы не знаем точного ответа на этот вопрос. Некоторые формы настолько облегчают процесс восприятия, что, вероятно, были заранее встроены в нашу зрительную систему в ходе эволюции. Уже в первые месяцы жизни младенцы чувствительны к лицам и окклюзии предметов. Следовательно, лица, глаза и Т-образные соединения действительно могут быть частью «врожденного» лексикона форм. С эволюционной точки зрения это дало бы приматам большое преимущество, особенно в раннем взаимодействии с другими представителями своего вида и окружающей средой.
Однако трудно представить, каким образом человеческий геном, включающий максимум 30 000 генов, может содержать подробные инструкции, необходимые для программирования нейронных детекторов множества базовых форм, вплоть до профилей лица и огнетушителей! Кроме того, пластичность нижневисочной коры делает это маловероятным. Даже если мы допустим первоначальную генетическую предрасположенность, вероятно, большинство нейронов, участвующих в распознавании объектов, становятся избирательными в процессе взаимодействия со структурированной визуальной средой. Нас постоянно бомбардируют миллионы изображений, которые поставляют первичные данные для статистического алгоритма обучения мозга. В процессе развития, а возможно, и в течение всей жизни, синаптические контакты в нашей зрительной системе постоянно меняются. Эти трансформации обеспечивают оптимальное кодирование наиболее подходящих фрагментов изображений. Мы начинаем учить ребенка читать в очень раннем возрасте, когда пластичность коры находится на максимуме. Конечно, это не случайно. Погружая детей в искусственную среду букв и слов, мы, вероятно, переориентируем многие из нижневисочных нейронов на кодирование письменной речи.