Читаем ИИ-2041. Десять образов нашего будущего полностью

Несколько лет назад практически все нейронные сети для ОЕЯ учили язык с использованием стандартного подхода «обучение с учителем» — мы обсуждали его ранее. Он подразумевает, что в процессе обучения ИИ нужно снабдить правильным ответом для каждого обучающего входа (входных данных). (Обратите внимание: человек при этом не должен «запрограммировать» правила в ИИ; как мы разобрали в главе 1, это не работает.)

ИИ получает пары размеченных данных (входные данные и правильный выход) и учится выдавать результат, соответствующий заданному входу. Помните пример ИИ, распознающего изображение кошки? Глубокое обучение с учителем — это процесс, в ходе которого ИИ обучается выдавать на выходе слово «кошка».

В случае с естественным языком можно применить принцип обучения с учителем, подбирая размеченные ранее для наших, человеческих, целей данные. Например, в ООН и многих других подобных организациях имеются датасеты многоязычных переводов для одних и тех же документов. Они обеспечивают естественный источник «учительского сигнала» для машин в процессе их обучения переводу между языками.

ИИ обучается путем простого «спаривания» каждого из миллионов предложений, скажем, на английском языке с его профессионально переведенным аналогом на французском. Также обучение с учителем может быть применено для распознавания речи (преобразование устной речи в текст), оптического распознавания символов (преобразование рукописного ввода или изображений в текст) или синтеза речи (преобразование текста в речь).

Во всех задачах распознавания естественного языка, где применимо обучение с учителем, ИИ уже сейчас превосходит большинство людей.

При более сложном применении ОЕЯ происходит переход от распознавания к пониманию. Чтобы совершить этот скачок, слова должны быть реализованы в действиях. Например, виртуальная ассистентка Алекса, услышав команду сыграть Баха, должна понять: вы хотите, чтобы она воспроизвела что-нибудь из классических произведений, написанных композитором Иоганном Себастьяном Бахом. А в ответ на фразу «я хочу вернуть деньги» чат-бот в программе для е-коммерции, скорее всего, посоветует, как вернуть купленный товар, а затем получить обратно уплаченное за него.

Создание таких «понимающих» предметно-ориентированных ОЕЯ-приложений посредством обучения с учителем требует огромных затрат времени. Подумайте только, каким количеством фраз люди могут выразить, по сути, одно и то же — вместо, например, «я хочу вернуть деньги» человек произнесет «этот тостер неисправен», и с человеческой точки зрения это будет означать то же самое!

В данных для такого обучения с учителем должны быть представлены все мыслимые вариации в диалоге, которые только могут возникнуть при пояснении и уточнении. Причем не только представлены, но и определенным образом размечены человеком, чтобы обеспечить ИИ достаточными подсказками для обучения.

Разметка данных для обучения с учителем систем понимания языка на протяжении двадцати лет является мощной индустрией. Такие данные в автоматизированной системе обслуживания клиентов авиакомпании выглядят примерно так:

[Намерение купить билет] я хочу [метод: вылететь] из [место вылета: Бостон] в [время вылета: 8:38 утра] и прибыть в [пункт назначения: Денвер] в [время прибытия: 11:10 утра].

Но это самый простой пример. А теперь представьте, каково будет разметить сотни тысяч фраз при таком уровне детализации. Как бы вы ни старались, вам все равно не удастся охватить все возможные варианты даже в рамках относительно узкой сферы действий вроде бронирования авиабилетов.

В течение многих лет понимание языка при помощи технологий ОЕЯ работало, только если вы были готовы потратить массу времени на очень узкую область применения (то есть речь идет о предметно-ориентированном ОЕЯ с учителем для одной конкретной сферы).

Грандиозная цель — понимание языка на человеческом уровне — оставалась недостижимой: мы не знали, как это выглядит. И мы не знали, как построить обучение с учителем в применении к ОЕЯ, задавая выход для каждого входа. Однако даже если бы и знали, разметка данных на всех языках мира все равно оказалась бы задачей непомерно трудоемкой и дорогостоящей.

САМООБУЧЕНИЕ ДЛЯ ОЕЯ

Не так давно возник простой, но элегантный подход — самообучение. То есть ИИ сам обучает себя, ему не требуется никакой сделанной человеком разметки, и это позволяет обойти «узкое место», которое мы только что обсудили. Этот подход называется «предсказание последовательности».

Перейти на страницу:

Все книги серии МИФ. Бизнес

Похожие книги

Пища богов
Пища богов

Книга «Пища Богов» — это увлекательное путешествие в древний мир и возможность познакомиться с образом жизни наших далеких предков. Как говорится, человек есть то, что он ест. Эта книга ответит на вопрос, откуда воины древности брали силу богатырскую и здоровье недюжинное, как им удавалось сохранять свой род крепким и жить гораздо дольше нашего.Ученые давно пришли к выводу — наши предки сохраняли силу и красоту благодаря особому рациону питания. А легенды гласят, что это дар, полученный древними людьми от богов. В этой книге собраны старейшие секреты здоровья и долголетия, которые бережно передавались из поколения в поколение. Вы знали, что русский народ всегда был могучим, потому что позже всех в Европе узнал о крепком алкоголе? Кому же было выгодно уничтожить богатые традиции русской кухни? Об этом и о том, откуда появились те или иные продукты и как они влияют на наш организм, в новой книге Игоря Прокопенко, подкрепленной комментариями ведущих кулинаров, врачей и историков.

Игорь Станиславович Прокопенко

Альтернативные науки и научные теории