Читаем Новые боги. Как онлайн-платформы манипулируют нашим выбором и что вернет нам свободу полностью

На самом деле проблема машинного обучения заключается в том, что мы не знаем, чему именно учится искусственный интеллект. Эту неопределенность можно в некоторой степени уменьшить, сузив фокус исследования до конкретных характеристик. Мы с моим коллегой Джоном Д. Элхаи из Университета Толедо (США) недавно размышляли о том, как теоретическая надстройка, важная в психологии, может быть учтена в исследовательских проектах с применением машинного обучения[375]. Одна из опций – предоставить компьютеру только те данные, которые теоретически могут обладать диагностической силой для определенного фенотипа (например, сексуальной ориентации). В этом случае при анализе можно было бы уделить больше внимания вышеупомянутым внешним атрибутам моды и времени. В начале 2021 года механизм из описанных выше исследований был перенесен в политическую сферу (что, в общем-то, неудивительно). Михал Косински[376] опубликовал еще одну работу, в которой показал, что по фотографиям с лицами можно с некоторой вероятностью определить не только сексуальную, но и политическую ориентацию человека, а точнее, склонность к либеральным или консервативным взглядам (см. рис. 5.1). Известно, что в США белые, пожилые и мужчины более склонны к консервативному мышлению

[377]. Интересно, что даже после того, как Косински проконтролировал эти факторы в своем анализе, ИИ все равно смог сделать предсказания о политической ориентации с точностью более 50 % (от 65 до 71 % в зависимости от выборки). То есть даже если не смотреть на такие очевидные характеристики, как пол, возраст или этническая принадлежность, изображения лиц содержат информацию, которая позволяет верно определить политические взгляды. Но что это за информация? К примеру, Косински заметил, что люди с либеральными взглядами чаще смотрят прямо в камеру. Кроме того, у них чаще встречается удивленное и менее недовольное выражение лица. Обобщая результаты, я собрал информацию из статьи Косински и отобразил на диаграмме, сравнивающей, насколько хорошо ИИ («алгоритм») и живые люди могут определить по фото политические взгляды, сексуальную ориентацию или характер. В целом, люди справляются с задачей лишь чуть лучше, чем подброшенная монетка. ИИ работает с точностью выше 50 %, но тоже далек от идеального результата.


Рис. 5.1. Люди определяли политическую и сексуальную ориентацию, а также характер человека по фотографии с вероятностью чуть более 50 %. Точность прогноза заметно возрастает, если подключить машинное обучение (здесь – «алгоритм»). Цифры взяты из исследования Косински (2012; см. также примечание 31)


В завершение главы хотелось бы вспомнить простой принцип из информатики «Мусор на входе – мусор на выходе», иллюстрирующий ограничения, стоящие перед искусственным интеллектом (ИИ) в отношении оценки цифровых следов. Вообще, логично: если у вас плохие, «мусорные» данные, то и в результате ничего хорошего можно не ждать. Иными словами, минимальное требование для успешного применения ИИ – высокое качество данных. В примере с работой Йилуна Вонга и Михала Косински возникает закономерный вопрос: возможно ли вообще доказать, что фотографии лиц содержат какую-либо информацию о сексуальной ориентации их обладателей?

В целом, тема структуры данных занимает важное место в изучении ИИ. Об этом говорит в своей книге «Сверхдержавы искусственного интеллекта»[378] доктор Кай-Фу Ли, ведущий исследователь ИИ. Недавно он задался вопросом, какая из двух глобальных держав – США или Китай – выиграет гонку за более совершенный искусственный интеллект. Если вкратце, он утверждает, что Китай неизбежно опережает соперника по объему информации: 1,4 миллиарда китайцев попросту генерируют больше данных, чем около 330 миллионов американцев, особенно если учесть, сколько видеокамер установлено в Поднебесной и какой масштаб здесь приобрела цифровизация. По идее, те, у кого больше «хороших» данных, могут лучше обучить ИИ. На примере нескольких исследований, приведенных в этой книге, мы уже могли убедиться, что изучение или анализ больших объемов данных часто приводят к более надежным результатам. Китай, вероятно, будет лидером будущих разработок ИИ благодаря поддержке со стороны правительства, большому количеству специалистов, а также, не в последнюю очередь, особой культуре предпринимательства[379].

Глава 6. IT-компании манипулируют нами при помощи предварительной фильтрации контента?

Мы слышим эхо не только в горах, но и в ландшафте ежедневных новостей. Широко обсуждаемый феномен эхокамеры не нов и был известен задолго до цифровой эпохи: люди окружают себя той информацией, которая соответствует их мировоззрению. В такую эхокамеру легко попасть, например, если предпочитать один источник новостей, будь то газета taz или газета Bild. Логично, что любимое издание будет, скорее всего, подтверждать наши взгляды. А вот чтобы посмотреть на ситуацию под другим углом, всегда требуются серьезные усилия.

Перейти на страницу:

Похожие книги