Читаем Звуки и знаки полностью

Прежде всего, ученые решительно отказались от мысли обучать машину пословно, то есть вводить в ее электронную память эталоны звучания отдельных слов. Ведь слов в языке десятки и сотни тысяч. И пропорционально числу этих слов растут трудности, связанные с их распознаванием — легко научить отличать по звучанию два и пять, но не так-то просто различить два и льва или пядь и пять. Память ЭВМ предельно нагружается словами, а на выборку нужного слова из словаря отводится очень мало времени.

Может быть, научить машину распознавать не слова, а фонемы? Но мы-то различаем их по смыслу — бабу от папы, пять от пядь. Машина же смысла не понимает. Кроме того, произношение фонем во многом зависит от возраста, пола, происхождения, образования говорящего. Интуитивно мы делаем поправку на это, мы распознаем фонемы, произносимые с искажениями, так как сравниваем их с эталонами фонем, что хранятся в нашем мозгу. Но ведь электронный мозг машины не имеет подобного рода эталонов!

Наиболее эффективным оказалось решение использовать различительные признаки, ту дюжину языковых универсалий, о которых мы говорили. Плюс еще универсалии, связанные с особенностями произношения людей — речь быстрая, медленная, плавная, резкая и т. д.

Сначала, принимая звуковые волны, то есть человеческую речь, машина делит ее на различительные признаки. Затем она сравнивает их с эталоном целого слова, которое хранится в ее электронной памяти. Но не в виде полной записи слова, а в виде последовательности различительных признаков, кодирующих его.

У современных вычислительных машин есть два вида памяти: оперативная память, небольшого объема, но быстродействующая, и память долговременная, значительно превосходящая первую в объеме и столь же значительно отстающая в скорости. Быстрая оперативная память может быть использована для переработки звуков речи в различительные признаки, а память большого объема — для хранения всего словаря.

Сначала эта модель была предложена из чисто языковедческих соображений. Затем исследования, проведенные в нашей стране под руководством Л. А. Чистович, показали, что распознавание речи человеком также происходит по сходному принципу. Чтобы понимать человеческую речь, машина должна, оказывается, делать это «по-человечески»!

В настоящее время в нашей стране и за рубежом создано немало машин, распознающих человеческую речь. И с каждым годом они совершенствуются. Как пример приведем электронно-вычислительную систему «ТРЕШОЛД-500», созданную в Англии. Практическое применение нашло уже более полутысячи систем «ТРЕШОЛД». Она используется для контроля качества продукции на конвейерах, для управления станками, для сортировки товаров, для опознания личности, для проверки багажа в аэропортах, в системах программированного обучения, для обслуживания парализованных больных в больницах (выключить электроприбор, вызвать врача или медсестру и т. п.)…

Как же распознает речь эта система? Звуки, которые улавливает электронное «ухо» машины, разлагаются на составляющие элементы, преобразуются в двоичный код и поступают в память ЭВМ. Тут они группируются в пять семейств по тридцати двум фонетическим признакам (создатели «ТРЕШОЛДа» ограничились делением на согласные, гласные, короткие паузы, длинные паузы, взрывные звуки). Чтобы машина смогла определить еще и индивидуальные особенности голоса, слова произносятся многократно…

ЭВМ расчленяет длительность произношения слов на шестнадцать равных временных промежутков. Затем выявляет в каждом из них тридцать два фонетических признака. Слово преобразуется в числовой код по этим признакам. Наконец, после многократных повторов одного и того же слова машина выводит «усредненный код», то есть получает характеристики индивидуального голоса, понятные ее электронному мозгу.

Общая емкость словаря системы «ТРЕШОЛД» — до двухсот двадцати слов. Словарь записывается на магнитной ленте, которая хранится в библиотеке словарей системы. Естественно, что словарь составляется для каждого человека и фиксирует особенности голоса с их индивидуальным тембром, окраской и прочими особенностями. Причем машина различает слова, хранящиеся в ее памяти, независимо от того, в каком настроении мы их произнесем— со страхом, радостью, болью и т. д.

У колыбели языка

Конечно, система «ТРЕШОЛД» — явление не уникальное. Например, в университете Карнеги — Меллона, в США, разработана экспериментальная система «захвата речи», которая позволяет распознавать до девяноста пяти процентов фраз. Причем произносит эти фразы не один человек, а пять, три мужчины и две женщины, а словарь содержит более тысячи слов.

Работы по «захвату речи» ведутся в Национальном исследовательском центре дальней связи во Франции, ведут их также советские ученые — в Москве, Ленинграде, Тбилиси, Киеве… Рассказ об этих работах занял бы много времени, к тому же они все-таки относятся более к технике, чем к лингвистике, основной теме нашей книги.

Перейти на страницу:

Все книги серии Библиотека «Знание»

Похожие книги

Письмо на английском языке: примеры, как писать (личное, деловое, резюме, готовые письма как образец)
Письмо на английском языке: примеры, как писать (личное, деловое, резюме, готовые письма как образец)

Как писать письмо на английском языке? Пособие представляет собой собрание образцов писем на английском языке, затрагивающих самые разнообразные стороны повседневной жизни. Это дружеские и деловые письма, письма – приглашения в гости и письма-благодарности, письма-извинения и письма-просьбы.Книга знакомит с этикетом написания письма на английском языке, некоторыми правилами английской пунктуации и орфографии, а также содержит справочные материалы, необходимые при написании писем.Пособие рассчитано на широкий круг лиц, владеющих английским языком в той или иной степени и стремящихся поддерживать письменные контакты с представителями англоязычных стран. Может использоваться как учебник английского языка, репетитор английского.Книга основана на ускоренных методах изучения иностранных языков.

Денис Александрович Шевчук

Языкознание, иностранные языки / Иностранные языки / Образование и наука
Английский язык с Робинзоном Крузо (в пересказе для детей) (ASCII-IPA)
Английский язык с Робинзоном Крузо (в пересказе для детей) (ASCII-IPA)

Английский язык с Робинзоном Крузо (в пересказе для детей)Robinson Crusoe Written Anew for Children by James BaldwinНеобыкновенно простой язык. C этой книги хорошо начинать читать по-английски.Текст адаптирован (без упрощения текста оригинала) по методу Ильи Франка: текст разбит на небольшие отрывки, каждый и который повторяется дважды: сначала идет английский текст с «подсказками» — с вкрапленным в него дословным русским переводом и лексико-грамматическим комментарием (то есть адаптированный), а затем — тот же текст, но уже неадаптированный, без подсказок.Начинающие осваивать английский язык могут при этом читать сначала отрывок текста с подсказками, а затем тот же отрывок — без подсказок. Вы как бы учитесь плавать: сначала плывете с доской, потом без доски. Совершенствующие свой английский могут поступать наоборот: читать текст без подсказок, по мере необходимости подглядывая в подсказки.Запоминание слов и выражений происходит при этом за счет их повторяемости, без зубрежки.Кроме того, читатель привыкает к логике английского языка, начинает его «чувствовать».Этот метод избавляет вас от стресса первого этапа освоения языка — от механического поиска каждого слова в словаре и от бесплодного гадания, что же все-таки значит фраза, все слова из которой вы уже нашли.Пособие способствует эффективному освоению языка, может служить дополнением к учебникам по грамматике или к основным занятиям. Предназначено для студентов, для изучающих английский язык самостоятельно, а также для всех интересующихся английской культурой.Мультиязыковой проект Ильи Франка: www.franklang.ruОт редактора fb2. Есть два способа оформления транскрипции: UTF-LATIN и ASCII-IPA. Для корректного отображения UTF-LATIN необходимы полноценные юникодные шрифты, например, DejaVu или Arial Unicode MS. Если по каким либо причинам вас это не устраивает, то воспользуйтесь ASCII-IPA версией той же самой книги (отличается только кодированием транскрипции). Но это сопряженно с небольшими трудностями восприятия на начальном этапе. Более подробно об ASCII-IPA читайте в Интернете:http://alt-usage-english.org/ipa/ascii_ipa_combined.shtmlhttp://en.wikipedia.org/wiki/Kirshenbaum

Джеймс Болдуин , Илья Михайлович Франк

Языкознание, иностранные языки