Но реальный мир не всегда гладок и непрерывен. Представьте, что вы играете в гольф и используете разрозненные данные о высоте, чтобы найти 18 лунок на 300 га поля для гольфа «Сент-Эндрюс» в Шотландии (рис. 25). По самой своей природе, будучи небольшими, лунки невидимы для любого алгоритма, соединяющего точки, если только у него нет количества данных, достигающих уровня меньшего, чем лунка. Действительно, как только машинное обучение достигнет великолепно ровной зелени, его алгоритмы «градиентного спуска» вообще перестанут работать, в результате чего можно будет прийти к выводу, что лунка может быть где угодно в этой области (в квантовых вычислениях, которые мы обсуждаем в восьмой главе, этот результат называется «бесплодное плато»). И, чтобы найти лунки, нам снова придется обратиться к картам Борхеса, масштаба 1:1. Аналогичным образом аппроксимация кривой хороша для простых систем, но ее может сбить с толку сложность и нелинейность, которыми изобилует организм, от кровотока и динамики жидкости до электрической активности в сердце, реакций иммунной системы на вторжение патогена и динамики молекул.
Рисунок 25. Графики, иллюстрирующие, как свойства системы («ландшафта») могут победить подходы машинного обучения
Есть и практические проблемы: мир сталкивается с чрезвычайной климатической ситуацией и алгоритмы машинного обучения потребляют значительное количество энергии[236]. Также растет осознание того, что потребность в энергии для тренировок и проведения глубокого обучения становится настолько велика, что нам необходимо искать новые способы повышения производительности, не вызывая при этом заоблачных выбросов углекислого газа от вычислений[237]. Один из многообещающих способов решения этой проблемы – не полагаться на специализированные микрочипы, а вместо них использовать аналоговую обработку, которая есть в любой физической системе, например управление светом с помощью кристалла как части глубокой нейронной сети. Команда Корнеллского университета в Итаке, штат Нью-Йорк, показала, что так называемые глубокие физические нейронные сети (PNN) могут использовать механические, оптические и электрические системы для выполнения таких задач, как классификация изображений и распознавание гласных. Обучение физическим процессам идет напрямую, в отличие от традиционного метода, в котором сначала учатся математические функции, а затем разрабатывается физический процесс для их выполнения. Теоретически PNN предлагают способ сделать машинное обучение на несколько порядков быстрее и более энергоэффективным, чем традиционное оборудование[238].
Однако, пожалуй, самая тревожная проблема заключается в том, что мы пока не знаем, как построить успешную нейронную сеть с точки зрения идеального рецепта слоев, количества нейронов, взаимосвязей, сетевой архитектуры и т. д. Создание нейронной сети остается туманным искусством: единственный способ усовершенствовать машинное обучение – это метод проб и ошибок. Пока мы не поймем, что именно происходит внутри этих черных ящиков, маловероятно, что нынешнее поколение слабого ИИ, особенно основанное на цифровых машинах, легко превратится в общий ИИ, который присутствует в таких фильмах, как «Из машины» или «Терминатор».
Мы действительно живем в эпоху больших данных, но, как мы указывали в первой главе, для описания человеческого тела требуются колоссальные данные. Биологические системы настолько сложны, что выбор определенного набора данных может повлиять на способность машинного обучения понимать, что эти данные описывают. Например, в реальной системе, в живой клетке, представляющей собой котел активности 42 миллионов белковых молекул, можем ли мы быть уверены, что получили правильные данные? Случайный поиск данных для выявления корреляций в сложных системах, таких как человеческое тело, обречен на провал, если неизвестно, какие переменные важны.