Читаем Актуальные проблемы современной лингвистики полностью

Но все это относилось к идентификации изолированных слов. Мы же попытались использовать ту же идею при «работе» с непрерывной последовательностью слов, не разделенных какими бы то ни было метками сегментации, т.е. возможности того же алгоритма оценивались применительно к распознаванию слитной речи, которая характеризуется как раз отсутствием границ между словами, образующими высказывание (синтагму). Одна из вытекающих при этом сложных проблем заключается в том, что единый процесс идентификации-сегментации предполагает нахождение правой границы слова. В нашей модели анализируемый текст считывается из файла слово за словом и записывается в строку без пробелов и знаков препинания. Начальная часть строки длиной в 7 – 9 открытых слогов представляет собой буфер, с содержимым которого работает в дальнейшем программа. Объем буфера выбран на основании имеющихся данных об объеме оперативной (кратковременной) памяти человека (7+2 слога). На этом этапе алгоритм работы программы, скорее всего, не соответствует предполагаемому алгоритму работы системы распознавания речи человеком и выбран таковым только из условия удобства программной реализации процесса.

По первому символу строки-буфера начинается процесс образования текущей когорты. Для орфографической записи при этом применяются следующие правила: (1) если первая буква не является допустимым однобуквенным словом, не содержащим ударного гласного (союзом, предлогом), то происходит только определение объема когорты, сама же когорта как набор слов не создается (это чисто программистский ход, экономящий время); если первая буква является допустимым однобуквенным словом, то из соответствующей словарной статьи в промежуточный буфер записывается слово-кандидат, а из остальных словарных статей выбираются данные об их объеме для сбора статистики; (2) заполнение когорты производится по двум первым буквам буфера-строки (или только по первой, когда это ударный гласный, поскольку по чисто техническим причинам ударные гласные представлены в текстах и в словарных статьях двухсимвольными сочетаниями: собственно гласный и знак ударения «+»; равным образом согласные тоже могут иметь двухсимвольные соответствия с учетом «ъ» или «ь»); (3) буфер слов-кандидатов заполняется до тех пор, пока N первых символов в исходном буфере совпадают хотя бы с одним словом в когорте и прекращается, когда добавление еще одного элемента создает комбинацию, не представленную в словаре; вслед за этим начинается анализ слов-кандидатов.

Правила работы с транскрипционной записью полностью аналогичны приведенным выше.

В данный момент при выборе окончательного варианта из всех слов-кандидатов принято самое простое правило: окончательным считается слово, последним занесенное в список, – при условии, что сохраняется возможность идентификации через словарь «оставшейся» цепочки. Это вполне соответствует правилу отбора, сформулированному в теории когорты: выбирается только слово, полностью и без остатка совпадающее с входной последовательностью символов.

На материале как беспробельной орфографической, так и транскрипционной записи рассмотренных текстов точность работы компьютерной сегментации через идентификацию составила более 98%. Столь высокую результативность описанных правил мы можем рассматривать как косвенное (в силу специфичности исходного материала), но убедительное подтверждение «работоспособности» алгоритма, основывающегося на основных положениях модели когорты.

Перцептивный словарь

Одна из задач нашей работы заключается в проверке выдвинутой гипотезы о существовании особого перцептивного словаря. В качестве одного из средств верификации гипотезы был использован свободный ассоциативный эксперимент, где в роли стимулов используются как словарные, так и несловарные формы слов.

Предварительный ассоциативный эксперимент в его устно-письменном варианте был ранее проведен студенткой А. Морозовой (рук. Е.В. Глазанова) на материале, включающем все финитные формы глаголов. В протоколах зафиксировано в среднем более 15% реакций, явно, непосредственно обусловленных грамматической формой глагола-стимула. В большинстве случаев это относится к парадигматическим реакциям, например, берешь – отдаешь.

Перейти на страницу:

Похожие книги

История России
История России

Издание описывает основные проблемы отечественной истории с древнейших времен по настоящее время.Материал изложен в доступной форме. Удобная периодизация учитывает как важнейшие вехи социально-экономического развития, так и смену государственных институтов.Книга написана в соответствии с программой курса «История России» и с учетом последних достижений исторической науки.Учебное пособие предназначено для студентов технических вузов, а также для всех интересующихся историей России.Рекомендовано Научно-методическим советом по истории Министерства образования и науки РФ в качестве учебного пособия по дисциплине «История» для студентов технических вузов.

И. Н. Данилевский , Юрий Викторович Тот , Андрей Викторович Матюхин , Раиса Евгеньевна Азизбаева , Александр Ахиезер

Педагогика, воспитание детей, литература для родителей / Детская образовательная литература / История / Учебники и пособия / Учебная и научная литература
История русской литературы XX века. Том I. 1890-е годы – 1953 год
История русской литературы XX века. Том I. 1890-е годы – 1953 год

Русская литература XX века с её выдающимися художественными достижениями рассматривается автором как часть великой русской культуры, запечатлевшей неповторимый природный язык и многогранный русский национальный характер. XX век – продолжатель тысячелетних исторических и литературных традиций XIX столетия (в книге помещены литературные портреты Л. Н. Толстого, А. П. Чехова, В. Г. Короленко), он же – свидетель глубоких перемен в обществе и литературе, о чём одним из первых заявил яркий публицист А. С. Суворин в своей газете «Новое время», а следом за ним – Д. Мережковский. На рубеже веков всё большую роль в России начинает играть финансовый капитал банкиров (Рафалович, Гинцбург, Поляков и др.), возникают издательства и газеты («Речь», «Русские ведомости», «Биржевые ведомости», «День», «Россия»), хозяевами которых были банки и крупные предприятия. Во множестве появляются авторы, «чуждые коренной русской жизни, её духа, её формы, её юмора, совершенно непонятного для них, и видящие в русском человеке ни больше ни меньше, как скучного инородца» (А. П. Чехов), выпускающие чаще всего работы «штемпелёванной культуры», а также «только то, что угодно королям литературной биржи…» (А. Белый). В литературных кругах завязывается обоюдоострая полемика, нашедшая отражение на страницах настоящего издания, свою позицию чётко обозначают А. М. Горький, И. А. Бунин, А. И. Куприн и др.XX век открыл много новых имён. В книге представлены литературные портреты М. Меньшикова, В. Розанова, Н. Гумилёва, В. Брюсова, В. Хлебникова, С. Есенина, А. Блока, А. Белого, В. Маяковского, М. Горького, А. Куприна, Н. Островского, О. Мандельштама, Н. Клюева, С. Клычкова, П. Васильева, И. Бабеля, М. Булгакова, М. Цветаевой, А. Толстого, И. Шмелёва, И. Бунина, А. Ремизова, других выдающихся писателей, а также обзоры литературы 10, 20, 30, 40-х годов.

Виктор Васильевич Петелин

Культурология / История / Учебники и пособия / Языкознание / Образование и наука
Социальная психология
Социальная психология

Эта книга, выдержавшая пять изданий, обладает всеми ключевыми характеристиками современного учебника по социальной психологии. В ней всесторонне освещены подходы к пониманию таких социально-психологических явлений, как социальное влияние, убеждение, познание, самооценка, подробно рассмотрены феномены социальной психологии дружбы и любви.Учебник Роберта Чалдини и его соавторов Дугласа Кенрика и Стивена Нейберга идеально подходит для первого знакомства с социальной психологией как наукой, раскрывая для читателя возможности социально-психологического анализа любой ситуации, где люди взаимодействуют друг с другом.Новейшее пятое издание оценят не только те, кто изучает или преподает социальную психологию, но и менеджеры, юристы, экономисты, педагоги, политологи – все, кому по роду деятельности постоянно приходится иметь дело с людьми.

Стивен Л. Нейберг , Роберт Чалдини , Н. Миронов , Девид Майерс , Николай Васильевич Михалкин

Детская образовательная литература / Психология и психотерапия / Учебники и пособия / Психология / Зарубежная психология / Книги по психологии / Книги Для Детей