Читаем Итоги № 13 (2012) полностью

Командный тон

Hi-tech
Бизнес

Почему порой так сложно договориться со своим гаджетом

 

Мода на «яблочные» гаджеты подогрела интерес общественности к управлению смартфонами и планшетами голосом. Хотя Apple в этой сфере никак нельзя назвать первопроходцем: набирать номер телефона, называя его цифры, или находить нужное имя в телефонной книжке — все это было вполне возможно уже несколько лет назад. А голосовой поиск, реализованный Google, успешно работает на всех современных Android-устройствах, причем он понимает русский язык, чего не скажешь о последней модной новинке — технологии распознавания голоса Apple Siri. Сегодня речь идет о том, что разговор с гаджетом станет интереснее. Но вот намного ли?

Надо сказать, что распознавание речи — это сложнейший продукт исследовательской мысли, за которым стоят серьезные научные школы. Во всем мире около дюжины компаний с собственными голосовыми технологиями. А исходных научных школ вообще, по сути, две: одну представляет американская компания Nuance Communications, вторую — питерская команда «Центра речевых технологий» (ЦРТ). Внимание наших разработчиков традиционно было сосредоточено на проектах для госструктур, правоохранительных органов и т. п. — там, где востребованы их технологии очистки голоса от посторонних шумов, точная идентификация говорящего человека и т. д. А вот до массового рынка быстрее дошли технологии Nuance. Именно они, как рассказывает Мартин Веселка, директор по продажам Nuance Communications в Центральной и Восточной Европе, работают в гаджетах Samsung, Nokia, HTC, Motorola и других. И Apple также. « Причем она ведет себя весьма агрессивно, — отмечает Игорь Ашманов, генеральный директор «Наносемантики», — скупает менее крупные компании и практически сразу после покупки закрывает их, явно стремясь к монополизму на этом рынке».

На фоне этого глобального роста ЦРТ выглядит субтильно. Однако с точки зрения собственно механизмов распознавания голоса оба источника технологий находятся приблизительно на равных позициях. Кажется лишь, что Apple умудрилась затолкать в компактный корпус смартфона огромную вычислительную мощь, необходимую для работы голосовых алгоритмов. Но это не совсем так, поясняет Алексей Калачев, руководитель отдела продаж компании «МакЦентр»: «Голосовое управление серьезно ограничено аппаратными и программными возможностями смартфонов. Поэтому Apple использует для обработки команд мощный удаленный сервер: iPhone записывает фразу, произнесенную пользователем, и отправляет полученный файл на этот сервер, где фраза распознается и возвращается назад в iPhone в виде текстовой команды для смартфона». Решение действительно простое и к тому же позволяет голосовому движку распознавания быть независимым от конкретной платформы смартфона, будь то iOS, Android или Windows Phone 7. Одно условие — для его работы требуется подключение к Интернету по сети 3G или Wi-Fi.

Кстати, по такому же принципу работает голосовой поиск Google Voice Search на Android-гаджетах, а также слушают команды современные умные телевизоры SmartTV с доступом в Интернет. «Современные технологии облачного распознавания решают проблему качества и подключения новых языков, не затрагивая конечное пользовательское устройство»,— поясняет Виталий Свистунов, менеджер LG Electronics RUS по развитию SmartTV.

Иными словами, все, что мы говорим нашему гаджету, не только проходит через серверы Apple, Google или других вендоров, но и сохраняется там в виде голоса и текста. Желающие могут развить конспирологическую версию происходящего. Но вендорам эти записи нужны для собственных целей. Как рассказали в ЦРТ, таким образом вендоры автоматически пополняют свои речевые базы и с их помощью совершенствуют голосовые модели. Интересующиеся пользователи могли заметить, что голосовой поиск Google на русском языке сегодня работает во много раз лучше, чем два с небольшим года назад, когда компания только вывела эту услугу на рынок. Дело в том, что каждый новый голосовой запрос — это очередная тренировка, маленький шаг системы вперед. В этом плане потрясающие возможности открывает функция диктовки текстов (с автоматическим превращением голоса в документ) — она, напомним, в семействе технологий Nuance является одной из базовых. (Правда, «Войну и мир» за один сеанс нынешние системы вряд ли потянут, но с текстами SMS и прочими малыми литературными формами справляются вполне достойно.)

Если с этой точки зрения посмотреть на партнерское соглашение Google и Sprint, одного из крупнейших операторов связи США, которое предполагает предустановку в брендированных мобильных телефонах приложения Google Voice, становится понятно, что тем самым интернет-гигант получил доступ к голосовому трафику, который производят десятки миллионов абонентов Sprint, — к «речевой руде», из которой выплавляются все более совершенные голосовые модели. Это необходимо для перехода к естественному стилю общения с компьютерным устройством.

Перейти на страницу:

Все книги серии Журнал «Итоги»

Похожие книги

Зеленый свет
Зеленый свет

Впервые на русском – одно из главных книжных событий 2020 года, «Зеленый свет» знаменитого Мэттью Макконахи (лауреат «Оскара» за главную мужскую роль в фильме «Далласский клуб покупателей», Раст Коул в сериале «Настоящий детектив», Микки Пирсон в «Джентльменах» Гая Ричи) – отчасти иллюстрированная автобиография, отчасти учебник жизни. Став на рубеже веков звездой романтических комедий, Макконахи решил переломить судьбу и реализоваться как серьезный драматический актер. Он рассказывает о том, чего ему стоило это решение – и другие судьбоносные решения в его жизни: уехать после школы на год в Австралию, сменить юридический факультет на институт кинематографии, три года прожить на колесах, путешествуя от одной съемочной площадки к другой на автотрейлере в компании дворняги по кличке Мисс Хад, и главное – заслужить уважение отца… Итак, слово – автору: «Тридцать пять лет я осмысливал, вспоминал, распознавал, собирал и записывал то, что меня восхищало или помогало мне на жизненном пути. Как быть честным. Как избежать стресса. Как радоваться жизни. Как не обижать людей. Как не обижаться самому. Как быть хорошим. Как добиваться желаемого. Как обрести смысл жизни. Как быть собой».Дополнительно после приобретения книга будет доступна в формате epub.Больше интересных фактов об этой книге читайте в ЛитРес: Журнале

Мэттью Макконахи

Биографии и Мемуары / Публицистика
Воздушная битва за Сталинград. Операции люфтваффе по поддержке армии Паулюса. 1942–1943
Воздушная битва за Сталинград. Операции люфтваффе по поддержке армии Паулюса. 1942–1943

О роли авиации в Сталинградской битве до сих пор не написано ни одного серьезного труда. Складывается впечатление, что все сводилось к уличным боям, танковым атакам и артиллерийским дуэлям. В данной книге сражение показано как бы с высоты птичьего полета, глазами германских асов и советских летчиков, летавших на грани физического и нервного истощения. Особое внимание уделено знаменитому воздушному мосту в Сталинград, организованному люфтваффе, аналогов которому не было в истории. Сотни перегруженных самолетов сквозь снег и туман, днем и ночью летали в «котел», невзирая на зенитный огонь и атаки «сталинских соколов», которые противостояли им, не щадя сил и не считаясь с огромными потерями. Автор собрал невероятные и порой шокирующие подробности воздушных боев в небе Сталинграда, а также в радиусе двухсот километров вокруг него, систематизировав огромный массив информации из германских и отечественных архивов. Объективный взгляд на события позволит читателю ощутить всю жестокость и драматизм этого беспрецедентного сражения.В формате PDF A4 сохранен издательский макет.

Дмитрий Михайлович Дегтев , Дмитрий Михайлович Дёгтев

Военное дело / Публицистика / Документальное