Читаем Информационные технологии и лингвистика XXI века полностью

Впрочем, мечты, с которыми российские и зарубежные ученые взялись полвека назад за задачу машинного перевода, в значительной мере остаются по-прежнему мечтами, поскольку высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако несомненным является ускорение работы переводчика при использовании систем машинного перевода (по оценкам конца 1980-х) приблизительно до пяти раз.

Качество же перевода зависит от тематики и стиля исходного текста. Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Тем не менее для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение качественного перевода, который нуждается лишь в небольшой редакторской корректировке. Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.

Применение машинного перевода без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных шуток, особенно в профессиональной среде переводчиков. Например, программа ПРОМТ переводит предложение «Му cat has given birth to four kittens, two yellow; one white and one black»

на русский язык следующим образом: «Мой кот родил четырёх котят, два жёлтых цвета, одно белое и одного афроамериканца».

Профессиональная работа невозможна без надежных инструментов. Перевод и локализация[8] как область профессиональной активности в этом смысле не являются исключением. Любой переводчик сталкивается с проблемой согласованного применения терминологического глоссария в ходе длительного проекта или быстрого повторного использования ранее переведенного текста. По своей природе подобные рутинные задачи сравнительно легко (в отличие от машинного перевода) формализуются и программируются, поэтому оснащение рабочего места (локализатора) автоматизированными средствами является нормой в отрасли, постепенно трансформируясь в отраслевые стандарты.

Большинство таких средств построены на основе концепции памяти перевода

(translation memory) – простой базы данных, каждая запись которой представляет собой единицу (предложение или абзац) параллельных текстов (как правило, на двух языках). Такая база данных хранит предыдущие переводы с целью их возможного повторного использования и решения задач быстрого поиска по содержимому. Несмотря на то, что программы, оснащенные памятью перевода, называются системами автоматизированного перевода (CAT, или computer-aided/ assisted translation), их не следует путать с программами машинного перевода (machine translation) – память перевода ничего не переводит сама по себе, в то время как машинный перевод основан на генерации переводов по результатам грамматического разбора исходного текста.

Как правило, запись памяти перевода состоит из двух сегментов: на исходном (source) и конечном (target) языках. Если идентичный (или похожий) сегмент на исходном языке встречается в тексте, сегмент на конечном языке будет найден в памяти перевода и предложен переводчику в качестве основы для нового перевода. Автоматически найденный текст может быть задействован как есть, отредактирован или полностью отклонен. Большинство программ используют алгоритм нечеткого соответствия (fuzzy matching), существенно улучшающий их функциональные возможности, поскольку в этом случае можно находить предложения, лишь отдаленно напоминающие искомые фразы, но тем не менее пригодные для последующего редактирования.

Преимущества от использования такого программного обеспечения поначалу могут быть неочевидны – однако по мере наполнения базы данных результаты автоматической подстановки основ для перевода будут становиться все более точными и регулярными.

Архитектура автоматизированной системы и ее функциональные возможности могут различаться. Средства поиска могут работать как с целыми сегментами, так и с отдельными словами или фразами, позволяя переводчику выполнять терминологический поиск. В систему также включают отдельную программу для работы с глоссарием, содержащим утвержденные для применения в проекте термины. Некоторые системы работают с программами машинного перевода. Основной рабочий интерфейс либо встраивается непосредственно в имеющийся текстовый процессор, такой как Word, либо представляет собой отдельный редактор. В состав системы обязательно включают фильтры для импорта-экспорта файлов различных форматов. Кроме того, многие системы, если не все, имеют средство для добавления в память перевода сегментов из, как правило, имеющихся у переводчика старых переведенных файлов.

Перейти на страницу:

Похожие книги

Физика для всех. Движение. Теплота
Физика для всех. Движение. Теплота

Авторы этой книги – лауреат Ленинской и Нобелевской премий академик Л.Д. Ландау и профессор А.И. Китайгородский – в доступной форме излагают начала общего курса физики. Примечательно, что вопросы атомного строения вещества, теория лунных приливов, теория ударных волн, теория жидкого гелия и другие подобные вопросы изложены вместе с классическими разделами механики и теплоты. Подобная тесная связь актуальных проблем физики с ее классическими понятиями, их взаимная обусловленность и неизбежные противоречия, выводящие за рамки классических понятий, – все это составляет сущность современного подхода к изучению физики. Новое, свежее изложение делает книгу полезной для самого широкого круга читателей.

Александр Исаакович Китайгородский , Лев Давидович Ландау

Научная литература / Физика / Технические науки / Учебники / Образование и наука
Стратегические операции люфтваффе
Стратегические операции люфтваффе

Бомбардировочной авиации люфтваффе, любимому детищу рейхсмаршала Геринга, отводилась ведущая роль в стратегии блицкрига. Она была самой многочисленной в ВВС нацистской Германии и всегда первой наносила удар по противнику. Между тем из большинства книг о люфтваффе складывается впечатление, что они занимались исключительно поддержкой наступающих войск и были «не способны осуществлять стратегические бомбардировки». Также «бомберам Гитлера» приписывается масса «террористических» налетов: Герника, Роттердам, Ковентри, Белград и т. д.Данная книга предлагает совершенно новый взгляд на ход воздушной войны в Европе в 1939–1941 годах. В ней впервые приведен анализ наиболее важных стратегических операций люфтваффе в начальный период Второй мировой войны. Кроме того, читатели узнают ответы на вопросы: правда ли, что Германия не имела стратегических бомбардировщиков, что немецкая авиация была нацелена на выполнение чисто тактических задач, действительно ли советская ПВО оказалась сильнее английской и не дала немцам сровнять Москву с землей и не является ли мифом, что битва над Англией в 1940 году была проиграна люфтваффе.

Дмитрий Владимирович Зубов , Дмитрий Михайлович Дегтев , Дмитрий Михайлович Дёгтев

Военное дело / История / Технические науки / Образование и наука