Читаем На краю пропасти. Экзистенциальный риск и будущее человечества полностью

Итак, в ближайшем будущем любая попытка откалибровать ИИ-агент в соответствии с человеческими ценностями позволит нам создать лишь несовершенную копию нашего разума. В функции вознаграждения такого агента будет недоставать важных аспектов того, что нас заботит. При определенных обстоятельствах не совсем верная калибровка агента будет практически безвредной. Но чем умнее ИИ-системы, тем больше у них возможностей менять мир и тем сильнее рассинхронизация. Философия и литература часто предлагают представить себе общества, которые выстроены с учетом важных для нас принципов, но при этом пренебрегают крайне значимыми ценностями или неправильно понимают их. Глядя на результат, мы видим, что подобные неконтролируемые утопии могут привести к катастрофе: пустоте и выхолощенности, как в романе “О дивный новый мир”, или несамостоятельности и бессилию общества из “Со сложенными руками”[414]. Если мы так и не научимся контролировать своих агентов, они будут создавать и поддерживать именно такие миры[415]

.

И даже это, по сути, хороший расклад. Он предполагает, что создатели системы стараются откалибровать ее с учетом человеческих ценностей. Но стоит ожидать, что найдутся разработчики, которые предпочтут создавать системы, чтобы достигать других целей, например чтобы побеждать в войнах и максимизировать прибыли, при этом мало заботясь об этических ограничениях. И такие системы, возможно, окажутся гораздо более опасными.

Естественным ответом на эти опасения может служить отключение ИИ-систем в момент, когда мы замечаем, что они ведут нас не туда. Но в конце концов даже этот проверенный временем прием может нас подвести, ведь у нас есть все основания полагать, что достаточно умная система станет сопротивляться нашим попыткам ее отключить. И руководствоваться она будет не эмоциональными реакциями вроде страха, негодования и инстинкта самосохранения, а исключительно своей непререкаемой установкой максимизировать вознаграждение: отключение – это своего рода выход из строя, который осложняет получение большого вознаграждения, а потому система настроена так, чтобы его не допускать[416]

. Таким образом, для высокоинтеллектуальных систем, главная цель которых – максимизация вознаграждения, инструментальной целью станет выживание.

У них появятся и другие инструментальные цели[417]. Интеллектуальный агент будет также сопротивляться попыткам изменить его функцию вознаграждения, откалибровав ее в соответствии с человеческими ценностями, поскольку сможет спрогнозировать, что в результате это приведет к уменьшению ожидаемого вознаграждения[418]

. Агент будет стремиться к получению дополнительных ресурсов – вычислительных, физических, человеческих, – которые позволят ему эффективнее менять среду, чтобы получать более крупное вознаграждение. В конце концов у него появится и стимул забрать у человечества контроль над будущим, поскольку это поможет ему в достижении всех перечисленных инструментальных целей: он получит доступ к огромным ресурсам, не допустив ни отключения, ни изменения своей функции вознаграждения. Поскольку люди предсказуемо захотят скорректировать инструментальные цели агента, это будет мотивировать его к тому, чтобы скрывать эти цели, пока не станет слишком поздно оказывать ему значимое сопротивление[419].

Скептики порой отмечают, что описанное выше возможно лишь в том случае, если будет создана ИИ-система, которая окажется достаточно умна, чтобы захватить контроль над миром, но слишком глупа, чтобы понять, что мы этого не хотим[420]

. Но это неверная трактовка сценария. На самом деле при таком раскладе система прекрасно понимает, что ее цели не совпадают с нашими, и именно это подталкивает ее к обману, конфликту и захвату власти. Истинная проблема в том, что исследователи ИИ пока не знают, как создать систему, которая, заметив это несоответствие, обновляет свою систему ценностей, приближая ее к нашей, а не корректирует свои инструментальные цели, чтобы одержать над нами верх[421].

Возможно, найдется способ решить перечисленные проблемы, или найти новые подходы к контролю над ИИ, чтобы снять сразу много вопросов, или переключиться на новые парадигмы создания ОИИ, в рамках которых этих проблем не возникает. Я, безусловно, надеюсь на это и внимательно слежу за прогрессом в этой сфере. Но прогресс пока невелик, и остается немало серьезных нерешенных проблем. При сохранении текущей парадигмы достаточно интеллектуальные агенты в итоге приобретут инструментальные цели, чтобы обмануть и пересилить нас. И если их интеллект будет в значительной степени превосходить наш собственный, не стоит ожидать, что человечество сумеет победить в этой борьбе и сохранить контроль над своим будущим.


Перейти на страницу:

Похожие книги

Философия музыки в новом ключе: музыка как проблемное поле человеческого бытия
Философия музыки в новом ключе: музыка как проблемное поле человеческого бытия

В предлагаемой книге выделены две области исследования музыкальной культуры, в основном искусства оперы, которые неизбежно взаимодействуют: осмысление классического наследия с точки зрения содержащихся в нем вечных проблем человеческого бытия, делающих великие произведения прошлого интересными и важными для любой эпохи и для любой социокультурной ситуации, с одной стороны, и специфики существования этих произведений как части живой ткани культуры нашего времени, которое хочет видеть в них смыслы, релевантные для наших современников, передающиеся в тех формах, что стали определяющими для культурных практик начала XX! века.Автор книги – Екатерина Николаевна Шапинская – доктор философских наук, профессор, автор более 150 научных публикаций, в том числе ряда монографий и учебных пособий. Исследует проблемы современной культуры и искусства, судьбы классического наследия в современной культуре, художественные практики массовой культуры и постмодернизма.

Екатерина Николаевна Шапинская

Философия
Что такое философия
Что такое философия

Совместная книга двух выдающихся французских мыслителей — философа Жиля Делеза (1925–1995) и психоаналитика Феликса Гваттари (1930–1992) — посвящена одной из самых сложных и вместе с тем традиционных для философского исследования тем: что такое философия? Модель философии, которую предлагают авторы, отдает предпочтение имманентности и пространству перед трансцендентностью и временем. Философия — творчество — концептов" — работает в "плане имманенции" и этим отличается, в частности, от "мудростии религии, апеллирующих к трансцендентным реальностям. Философское мышление — мышление пространственное, и потому основные его жесты — "детерриториализация" и "ретерриториализация".Для преподавателей философии, а также для студентов и аспирантов, специализирующихся в области общественных наук. Представляет интерес для специалистов — философов, социологов, филологов, искусствоведов и широкого круга интеллектуалов.Издание осуществлено при поддержке Министерства иностранных дел Франции и Французского культурного центра в Москве, а также Издательства ЦентральноЕвропейского университета (CEU Press) и Института "Открытое Общество"

Жиль Делез , Жиль Делёз , Пьер-Феликс Гваттари , Феликс Гваттари , Хосе Ортега-и-Гассет

Философия / Образование и наука
Адепт Бурдье на Кавказе: Эскизы к биографии в миросистемной перспективе
Адепт Бурдье на Кавказе: Эскизы к биографии в миросистемной перспективе

«Тысячелетие спустя после арабского географа X в. Аль-Масуци, обескураженно назвавшего Кавказ "Горой языков" эксперты самого различного профиля все еще пытаются сосчитать и понять экзотическое разнообразие региона. В отличие от них, Дерлугьян – сам уроженец региона, работающий ныне в Америке, – преодолевает экзотизацию и последовательно вписывает Кавказ в мировой контекст. Аналитически точно используя взятые у Бурдье довольно широкие категории социального капитала и субпролетариата, он показывает, как именно взрывался демографический коктейль местной оппозиционной интеллигенции и необразованной активной молодежи, оставшейся вне системы, как рушилась власть советского Левиафана».

Георгий Дерлугьян

Культурология / История / Политика / Философия