Читаем На краю пропасти. Экзистенциальный риск и будущее человечества полностью

Это может произойти одним из двух способов. Системы, основанные на использовании моделей, спрогнозируют последствия отключения и увидят, что в таком случае будут серьезно ограничены все будущие траектории и, как правило, отрезаны многие из лучших вариантов. Соответственно, действиям, ведущим к отключению, будет присвоена очень низкая ценность.

Безмодельные системы тоже могут научиться избегать отключения. Orseau & Armstrong (2016) показывают, как периодическое отключение агента в процессе обучения может привести к появлению систематических ошибок в усвоенном поведении (и предлагают возможное решение проблемы).

Далее я по большей части буду исходить из того, что продвинутый ИИ основан на использовании моделей. Или хотя бы способен применять свои фоновые знания о мире, чтобы с первой попытки успешно справляться со сложными и комплексными задачами, вместо того чтобы всегда сначала делать многие тысячи неудачных попыток, нащупывая путь к успеху. Хотя на момент написания этой книги такие системы еще не созданы, это совместимо с текущей парадигмой и является условием для того, чтобы признать систему общим ИИ. Нет необходимости считать, что такая система справляется с задачами с первого раза лучше, чем человек.

417


Omohundro (2008); Bostrom (2012). В книге Ника Бустрёма Superintelligence (2014) подробно объясняется, как именно такие инструментальные цели могут привести к очень плохим исходам для человечества.

418


Алгоритмы обучения редко учитывают возможность изменения функции вознаграждения в будущем. Неясно, будут ли они оценивать будущие состояния, ориентируясь на текущую или на будущую функцию вознаграждения. Исследователи приступают к изучению этих возможностей (Everitt et al., 2016), и каждая из них сопряжена с трудностями. Применение будущей функции вознаграждения помогает справиться с проблемой противостояния агентов попыткам человека откалибровать их функцию вознаграждения, но усугубляет проблему стимуляции “центра удовольствия” – склонности агентов менять собственную функцию вознаграждения таким образом, чтобы получать вознаграждение стало проще.

419


Несколько из этих инструментальных целей можно считать примерами “сдвигов распределения” – ситуаций, когда агент в процессе работы сталкивается с совершенно неожиданными обстоятельствами, что вынуждает его совершать действия, которые никогда не демонстрировались в процессе обучения и испытания. В этом случае агент в процессе испытания может и не получить возможность стать сильнее людей, которые им управляют, а следовательно, ему не понадобится демонстрировать поведение, сопряженное с обманом и захватом контроля над ресурсами.

420


Например, в книге “Просвещение продолжается” (2018, pp. 299–300; перевод Г. Бородиной и С. Кузнецовой) Стивен Пинкер говорит, что сценарии риска, сопряженного с ИИ, “основаны на двух гипотезах… (2) этот ИИ будет так гениален, что сможет придумать, как преобразовывать химические элементы и перепрошивать мозги, но так придурковат, что погрузит мир в хаос из за элементарной оплошности или недопонимания”.

421


Обратите также внимание, что агент может замечать вероятное несоответствие между своими и нашими ценностями (что вызовет враждебность к человечеству), даже если наши ценности ему не совсем понятны. В этом случае, даже если он был запрограммирован таким образом, чтобы заменять свои ценности на наши, вполне возможно возникновение несоответствия, пусть и менее опасного.

Есть несколько перспективных направлений исследований проблемы контроля, связанных с предоставлением агентам возможности обновлять свои функции вознаграждения таким образом, чтобы они лучше соответствовали нашим. Одно из них – широкий набор идей о “возможности внесения поправок”, то есть о создании агентов, которые не противятся изменению их целей. Другое – основанный на неопределенности подход к обучению с вознаграждением, в рамках которого агент действует не так, словно уверен в своей трактовке человеческих ценностей, а так, словно пребывает в состоянии моральной неопределенности, а степень его уверенности в различных человеческих ценностях зависит от данных, полученных к настоящему моменту (Russell, 2019). Это подталкивает агента считаться с людьми (которые лучше понимают собственные ценности) и просить совета при необходимости. Поскольку я сам занимаюсь философскими вопросами, связанными с моральной неопределенностью, я нахожу этот подход особенно перспективным (MacAskill & Ord, 2018; MacAskill, Bykvist & Ord, готовится к публикации). Чтобы все сделать правильно, потребуется и дальше изучать этот раздел философии.

422


Скорее всего, люди и правда некоторое время будут эффективнее справляться с выполнением стандартных физических задач при меньших издержках, и потому создание роботов будет стоять на втором месте.

423


Даже если очистить 99 % дисков, все равно сохранятся десятки копий, которые готовы будут размножиться на новых производимых компьютерах.

424


Перейти на страницу:

Похожие книги

Философия музыки в новом ключе: музыка как проблемное поле человеческого бытия
Философия музыки в новом ключе: музыка как проблемное поле человеческого бытия

В предлагаемой книге выделены две области исследования музыкальной культуры, в основном искусства оперы, которые неизбежно взаимодействуют: осмысление классического наследия с точки зрения содержащихся в нем вечных проблем человеческого бытия, делающих великие произведения прошлого интересными и важными для любой эпохи и для любой социокультурной ситуации, с одной стороны, и специфики существования этих произведений как части живой ткани культуры нашего времени, которое хочет видеть в них смыслы, релевантные для наших современников, передающиеся в тех формах, что стали определяющими для культурных практик начала XX! века.Автор книги – Екатерина Николаевна Шапинская – доктор философских наук, профессор, автор более 150 научных публикаций, в том числе ряда монографий и учебных пособий. Исследует проблемы современной культуры и искусства, судьбы классического наследия в современной культуре, художественные практики массовой культуры и постмодернизма.

Екатерина Николаевна Шапинская

Философия
Что такое философия
Что такое философия

Совместная книга двух выдающихся французских мыслителей — философа Жиля Делеза (1925–1995) и психоаналитика Феликса Гваттари (1930–1992) — посвящена одной из самых сложных и вместе с тем традиционных для философского исследования тем: что такое философия? Модель философии, которую предлагают авторы, отдает предпочтение имманентности и пространству перед трансцендентностью и временем. Философия — творчество — концептов" — работает в "плане имманенции" и этим отличается, в частности, от "мудростии религии, апеллирующих к трансцендентным реальностям. Философское мышление — мышление пространственное, и потому основные его жесты — "детерриториализация" и "ретерриториализация".Для преподавателей философии, а также для студентов и аспирантов, специализирующихся в области общественных наук. Представляет интерес для специалистов — философов, социологов, филологов, искусствоведов и широкого круга интеллектуалов.Издание осуществлено при поддержке Министерства иностранных дел Франции и Французского культурного центра в Москве, а также Издательства ЦентральноЕвропейского университета (CEU Press) и Института "Открытое Общество"

Жиль Делез , Жиль Делёз , Пьер-Феликс Гваттари , Феликс Гваттари , Хосе Ортега-и-Гассет

Философия / Образование и наука
Том 1. Философские и историко-публицистические работы
Том 1. Философские и историко-публицистические работы

Издание полного собрания трудов, писем и биографических материалов И. В. Киреевского и П. В. Киреевского предпринимается впервые.Иван Васильевич Киреевский (22 марта /3 апреля 1806 — 11/23 июня 1856) и Петр Васильевич Киреевский (11/23 февраля 1808 — 25 октября /6 ноября 1856) — выдающиеся русские мыслители, положившие начало самобытной отечественной философии, основанной на живой православной вере и опыте восточнохристианской аскетики.В первый том входят философские работы И. В. Киреевского и историко-публицистические работы П. В. Киреевского.Все тексты приведены в соответствие с нормами современного литературного языка при сохранении их авторской стилистики.Адресуется самому широкому кругу читателей, интересующихся историей отечественной духовной культуры.Составление, примечания и комментарии А. Ф. МалышевскогоИздано при финансовой поддержке Федерального агентства по печати и массовым коммуникациям в рамках Федеральной целевой программы «Культура России»Note: для воспроизведения выделения размером шрифта в файле использованы стили.

А. Ф. Малышевский , Иван Васильевич Киреевский , Петр Васильевич Киреевский

Публицистика / История / Философия / Образование и наука / Документальное