Читаем Виртуальный ты. Как создание цифровых близнецов изменит будущее человечества полностью

Виртуальный ты. Как создание цифровых близнецов изменит будущее человечества

Но реальный мир не всегда гладок и непрерывен. Представьте, что вы играете в гольф и используете разрозненные данные о высоте, чтобы найти 18 лунок на 300 га поля для гольфа «Сент-Эндрюс» в Шотландии (рис. 25). По самой своей природе, будучи небольшими, лунки невидимы для любого алгоритма, соединяющего точки, если только у него нет количества данных, достигающих уровня меньшего, чем лунка. Действительно, как только машинное обучение достигнет великолепно ровной зелени, его алгоритмы «градиентного спуска» вообще перестанут работать, в результате чего можно будет прийти к выводу, что лунка может быть где угодно в этой области (в квантовых вычислениях, которые мы обсуждаем в восьмой главе, этот результат называется «бесплодное плато»). И, чтобы найти лунки, нам снова придется обратиться к картам Борхеса, масштаба 1:1. Аналогичным образом аппроксимация кривой хороша для простых систем, но ее может сбить с толку сложность и нелинейность, которыми изобилует организм, от кровотока и динамики жидкости до электрической активности в сердце, реакций иммунной системы на вторжение патогена и динамики молекул.

Рисунок 25. Графики, иллюстрирующие, как свойства системы («ландшафта») могут победить подходы машинного обучения (а). В простых ситуациях, когда ландшафт относительно ровный, можно ожидать, что методы машинного обучения хорошо справятся с прогнозированием поведения. Примеры (б) и (в) показывают, когда машинное обучение может оказаться в тупике или потерпеть неудачу. Адаптировано из книги Big data need Big theory too (Peter V. Coveney, Edward R. Dougherty, and Roger R. Highfield (Phil. Trans. R. Soc. A 374, 2016))

Есть и практические проблемы: мир сталкивается с чрезвычайной климатической ситуацией и алгоритмы машинного обучения потребляют значительное количество энергии[236]. Также растет осознание того, что потребность в энергии для тренировок и проведения глубокого обучения становится настолько велика, что нам необходимо искать новые способы повышения производительности, не вызывая при этом заоблачных выбросов углекислого газа от вычислений[237]. Один из многообещающих способов решения этой проблемы – не полагаться на специализированные микрочипы, а вместо них использовать аналоговую обработку, которая есть в любой физической системе, например управление светом с помощью кристалла как части глубокой нейронной сети. Команда Корнеллского университета в Итаке, штат Нью-Йорк, показала, что так называемые глубокие физические нейронные сети (PNN) могут использовать механические, оптические и электрические системы для выполнения таких задач, как классификация изображений и распознавание гласных. Обучение физическим процессам идет напрямую, в отличие от традиционного метода, в котором сначала учатся математические функции, а затем разрабатывается физический процесс для их выполнения. Теоретически PNN предлагают способ сделать машинное обучение на несколько порядков быстрее и более энергоэффективным, чем традиционное оборудование[238].

Однако, пожалуй, самая тревожная проблема заключается в том, что мы пока не знаем, как построить успешную нейронную сеть с точки зрения идеального рецепта слоев, количества нейронов, взаимосвязей, сетевой архитектуры и т. д. Создание нейронной сети остается туманным искусством: единственный способ усовершенствовать машинное обучение – это метод проб и ошибок. Пока мы не поймем, что именно происходит внутри этих черных ящиков, маловероятно, что нынешнее поколение слабого ИИ, особенно основанное на цифровых машинах, легко превратится в общий ИИ, который присутствует в таких фильмах, как «Из машины» или «Терминатор».

Мы действительно живем в эпоху больших данных, но, как мы указывали в первой главе, для описания человеческого тела требуются колоссальные данные. Биологические системы настолько сложны, что выбор определенного набора данных может повлиять на способность машинного обучения понимать, что эти данные описывают. Например, в реальной системе, в живой клетке, представляющей собой котел активности 42 миллионов белковых молекул, можем ли мы быть уверены, что получили правильные данные? Случайный поиск данных для выявления корреляций в сложных системах, таких как человеческое тело, обречен на провал, если неизвестно, какие переменные важны.

Читаем Виртуальный ты. Как создание цифровых близнецов изменит будущее человечества полностью

Виртуальный ты. Как создание цифровых близнецов изменит будущее человечества

Все жанры