Несколько лет назад практически все нейронные сети для ОЕЯ учили язык с использованием стандартного подхода «обучение с учителем» — мы обсуждали его ранее. Он подразумевает, что в процессе обучения ИИ нужно снабдить правильным ответом для каждого обучающего входа (входных данных). (Обратите внимание: человек при этом не должен «запрограммировать» правила в ИИ; как мы разобрали в главе 1
, это не работает.)ИИ получает пары размеченных данных (входные данные и правильный выход) и учится выдавать результат, соответствующий заданному входу. Помните пример ИИ, распознающего изображение кошки? Глубокое обучение с учителем — это процесс, в ходе которого ИИ обучается выдавать на выходе слово «кошка».
В случае с естественным языком можно применить принцип обучения с учителем, подбирая размеченные ранее для наших, человеческих, целей данные. Например, в ООН и многих других подобных организациях имеются датасеты многоязычных переводов для одних и тех же документов. Они обеспечивают естественный источник «учительского сигнала» для машин в процессе их обучения переводу между языками.
ИИ обучается путем простого «спаривания» каждого из миллионов предложений, скажем, на английском языке с его профессионально переведенным аналогом на французском. Также обучение с учителем может быть применено для распознавания речи (преобразование устной речи в текст), оптического распознавания символов (преобразование рукописного ввода или изображений в текст) или синтеза речи (преобразование текста в речь).
Во всех задачах распознавания естественного языка, где применимо обучение с учителем, ИИ уже сейчас превосходит большинство людей.
При более сложном применении ОЕЯ происходит переход от распознавания к пониманию. Чтобы совершить этот скачок, слова должны быть реализованы в действиях. Например, виртуальная ассистентка Алекса, услышав команду сыграть Баха, должна понять: вы хотите, чтобы она воспроизвела что-нибудь из классических произведений, написанных композитором Иоганном Себастьяном Бахом. А в ответ на фразу «я хочу вернуть деньги» чат-бот в программе для е-коммерции, скорее всего, посоветует, как вернуть купленный товар, а затем получить обратно уплаченное за него.
Создание таких «понимающих» предметно-ориентированных ОЕЯ-приложений посредством обучения с учителем требует огромных затрат времени. Подумайте только, каким количеством фраз люди могут выразить, по сути, одно и то же — вместо, например, «я хочу вернуть деньги» человек произнесет «этот тостер неисправен», и с человеческой точки зрения это будет означать то же самое!
В данных для такого обучения с учителем должны быть представлены все мыслимые вариации в диалоге, которые только могут возникнуть при пояснении и уточнении. Причем не только представлены, но и определенным образом размечены человеком, чтобы обеспечить ИИ достаточными подсказками для обучения.
Разметка данных для обучения с учителем систем понимания языка на протяжении двадцати лет является мощной индустрией. Такие данные в автоматизированной системе обслуживания клиентов авиакомпании выглядят примерно так:
[Намерение купить билет] я хочу [метод: вылететь] из [место вылета: Бостон] в [время вылета: 8:38 утра] и прибыть в [пункт назначения: Денвер] в [время прибытия: 11:10 утра].
Но это самый простой пример. А теперь представьте, каково будет разметить сотни тысяч фраз при таком уровне детализации. Как бы вы ни старались, вам все равно не удастся охватить все возможные варианты даже в рамках относительно узкой сферы действий вроде бронирования авиабилетов.
В течение многих лет понимание языка при помощи технологий ОЕЯ работало, только если вы были готовы потратить массу времени на очень узкую область применения (то есть речь идет о предметно-ориентированном ОЕЯ с учителем для одной конкретной сферы).
Грандиозная цель — понимание языка на человеческом уровне — оставалась недостижимой: мы не знали, как это выглядит. И мы не знали, как построить обучение с учителем в применении к ОЕЯ, задавая выход для каждого входа. Однако даже если бы и знали, разметка данных на всех языках мира все равно оказалась бы задачей непомерно трудоемкой и дорогостоящей.
Не так давно возник простой, но элегантный подход —