Читаем Актуальные проблемы современной лингвистики полностью

Рассмотрим указанные и иные относящиеся к ним вопросы в определенной последовательности. Для начала зафиксируем исходные позиции, которые заключаются, по-видимому, в следующем.

Моделирование процессов восприятия речи (во всяком случае, на материале русского языка) включает в себя такие подготовительные этапы, как:

• формирование представительного корпуса текстов (на начальном этапе – в орфографической записи) с акцентуацией словоформ и разметкой согласно специально разработанной системы аннотирования;

• создание, на базе корпуса текстов, словаря для моделирования восприятия речи; единицей словаря выступает словоформа с индексом частотности.

На настоящий момент общий объем нашего корпуса – 1 031 920 словоупотреблений.

На основании подкорпуса объемом 322 тысячи словоупотреблений организован частотный словарь словоформ, включающий 63 742 единицы и словарь фонетических слов объемом 84 174 единицы. Этот подкорпус имеется также в транскрибированном виде. Автоматическое транскрибирование текстов осуществлялось с помощью версии фонологического транскриптора на базе кириллицы (автор программы А.В. Венцов).

В данной статье мы попытались отразить как методологический подход, так и основные направления исследований авторского коллектива в заявленной области.

Компьютерное моделирование сегментации и идентификации графической записи текста

Наличие корпуса и словаря словоформ позволило осуществить компьютерное моделирование сегментации графической беспробельной записи текста через идентификацию, т.е. путем сличения с единицами словаря. Мы исходим из того, что подобная процедура на материале «сплошной» графической записи может рассматриваться как некоторое приближение к работе с материалом звучащего текста, а используемые принципы компьютерного моделирования до некоторой степени соответствуют процессам восприятия речи человеком. Сделанный акцент на процедуре сегментации через идентификацию ни в коей мере не означает отказ от исследования автономного механизма сегментации (независимой от идентификации), но лишь признание относительно небольшого удельного веса автономной сегментации на слова в восприятии речи (подробнее см. об этом <...>).

Существенно отметить, что в большинстве ранних работ, выполненных в русле «модели когорты», материалом, подлежащим распознаванию, выступали изолированные слова – соответственно проблема сегментации вообще не возникала. В отличие от этого, наш алгоритм принципиально нацелен на обработку слитной речи – на данной стадии исследования в ее графическом представлении, а именно орфографической и транскрипционной (в терминах фонем) записей. В основу алгоритма положено упрощенное предположение о том, что в буфер памяти слушающего сведения о символах, составляющих экспонент слова, поступают последовательно во времени и, соответственно, происходит накопление информации, обеспечивающей выбор подходящего слова из словаря.

Сам процесс выбора начинается сразу же, как только в буфере появляются первые один-два символа. По ним из словаря выбираются все подходящие слова – т.е. начинающиеся на тот же символ или последовательность символов слова, которые и образуют «когорту». По мере поступления в буфер следующих символов, из когорты удаляются все слова, не согласующиеся по началу с имеющейся в буфере цепочкой, и процесс этот продолжается до тех пор, пока в когорте не останется одно-единственное слово, которое и будет считаться идентификатором распознаваемого отрезка текста.

Создатели «модели когорты» предполагали, что по мере накопления информации о фонемном составе слова будет резко сокращаться объем когорты и процесс идентификации должен сходиться достаточно быстро и эффективно (особенно если принять во внимание возможность априорного контекстного ограничения словаря, из которого производится начальная выборка когорты, что обычно не учитывается). Сделанные нами самые предварительные расчеты для русского языка показали, что объем выборки действительно стремительно сокращается по мере появления во входном буфере все новых фонем, особенно если при составлении когорты принять во внимание ритмическую структуру распознаваемого слова.

Перейти на страницу:

Похожие книги

История России
История России

Издание описывает основные проблемы отечественной истории с древнейших времен по настоящее время.Материал изложен в доступной форме. Удобная периодизация учитывает как важнейшие вехи социально-экономического развития, так и смену государственных институтов.Книга написана в соответствии с программой курса «История России» и с учетом последних достижений исторической науки.Учебное пособие предназначено для студентов технических вузов, а также для всех интересующихся историей России.Рекомендовано Научно-методическим советом по истории Министерства образования и науки РФ в качестве учебного пособия по дисциплине «История» для студентов технических вузов.

И. Н. Данилевский , Юрий Викторович Тот , Андрей Викторович Матюхин , Раиса Евгеньевна Азизбаева , Александр Ахиезер

Педагогика, воспитание детей, литература для родителей / Детская образовательная литература / История / Учебники и пособия / Учебная и научная литература
История русской литературы XX века. Том I. 1890-е годы – 1953 год
История русской литературы XX века. Том I. 1890-е годы – 1953 год

Русская литература XX века с её выдающимися художественными достижениями рассматривается автором как часть великой русской культуры, запечатлевшей неповторимый природный язык и многогранный русский национальный характер. XX век – продолжатель тысячелетних исторических и литературных традиций XIX столетия (в книге помещены литературные портреты Л. Н. Толстого, А. П. Чехова, В. Г. Короленко), он же – свидетель глубоких перемен в обществе и литературе, о чём одним из первых заявил яркий публицист А. С. Суворин в своей газете «Новое время», а следом за ним – Д. Мережковский. На рубеже веков всё большую роль в России начинает играть финансовый капитал банкиров (Рафалович, Гинцбург, Поляков и др.), возникают издательства и газеты («Речь», «Русские ведомости», «Биржевые ведомости», «День», «Россия»), хозяевами которых были банки и крупные предприятия. Во множестве появляются авторы, «чуждые коренной русской жизни, её духа, её формы, её юмора, совершенно непонятного для них, и видящие в русском человеке ни больше ни меньше, как скучного инородца» (А. П. Чехов), выпускающие чаще всего работы «штемпелёванной культуры», а также «только то, что угодно королям литературной биржи…» (А. Белый). В литературных кругах завязывается обоюдоострая полемика, нашедшая отражение на страницах настоящего издания, свою позицию чётко обозначают А. М. Горький, И. А. Бунин, А. И. Куприн и др.XX век открыл много новых имён. В книге представлены литературные портреты М. Меньшикова, В. Розанова, Н. Гумилёва, В. Брюсова, В. Хлебникова, С. Есенина, А. Блока, А. Белого, В. Маяковского, М. Горького, А. Куприна, Н. Островского, О. Мандельштама, Н. Клюева, С. Клычкова, П. Васильева, И. Бабеля, М. Булгакова, М. Цветаевой, А. Толстого, И. Шмелёва, И. Бунина, А. Ремизова, других выдающихся писателей, а также обзоры литературы 10, 20, 30, 40-х годов.

Виктор Васильевич Петелин

Культурология / История / Учебники и пособия / Языкознание / Образование и наука
Социальная психология
Социальная психология

Эта книга, выдержавшая пять изданий, обладает всеми ключевыми характеристиками современного учебника по социальной психологии. В ней всесторонне освещены подходы к пониманию таких социально-психологических явлений, как социальное влияние, убеждение, познание, самооценка, подробно рассмотрены феномены социальной психологии дружбы и любви.Учебник Роберта Чалдини и его соавторов Дугласа Кенрика и Стивена Нейберга идеально подходит для первого знакомства с социальной психологией как наукой, раскрывая для читателя возможности социально-психологического анализа любой ситуации, где люди взаимодействуют друг с другом.Новейшее пятое издание оценят не только те, кто изучает или преподает социальную психологию, но и менеджеры, юристы, экономисты, педагоги, политологи – все, кому по роду деятельности постоянно приходится иметь дело с людьми.

Стивен Л. Нейберг , Роберт Чалдини , Н. Миронов , Девид Майерс , Николай Васильевич Михалкин

Детская образовательная литература / Психология и психотерапия / Учебники и пособия / Психология / Зарубежная психология / Книги по психологии / Книги Для Детей