Проекты для HP Labs тщательно отбираются . Как это происходит ?
- У нас есть офис открытых инноваций, который был создан для управления всеми связанными с инновациями программами HP Labs с мировым академическим сообществом. Мы считаем, что наука интернациональна, что ученые должны регулярно обмениваться результатами исследований, обсуждать их. В феврале HP Labs сформулировала более двух десятков исследовательских тем, которые выложены в открытом доступе на портале Лабораторий вместе с приглашением подавать проектные предложения на конкурсной основе, В конкурсе может участвовать любая академическая или исследовательская организация. Российские Лаборатории HP курировали две темы: построение моделей знаний и обработку текстов на естественном языке. Мы получили и проанализировали больше тридцати предложений со всего мира, и в итоге пять из них рекомендовали для финансирования: две темы из России и по одной из Германии (Университет Кобленц-Ландау), США (Wright State University) и
Индии (Технологический институт в Бангалоре). Все пять рекомендаций, которые дали российские Лаборатории HP, были приняты финансистами и руководством HP Labs. В дальнейшем мы будем курировать эти проекты {к каждому прикреплен конкретный сотрудник из наших Лабораторий)Расскажите чуть подробнее о двух российских работах из этой пятерки .
- Работа, которую мы проводим совместно с СПбГУ и группой профессора Бориса Новикова, нацелена на повышение скорости обработки поисковых запросов. Группа Новикова занимается семантическим кэшированием. Мы считаем, что при правильном формировании кэша, который в дальнейшем может использоваться при обращении к информационной системе, мы сумеем сократить время получения результатов поиска. Формирование такого кэша - задача нетривиальная. Работа Новикова состоит в исследовании процесса семантического кэширования на более высоких семантических уровнях относительно простых запросов xQuery. Работа с семантикой высокого уровня необходима при выполнении интеллектуального поиска среди слабоструктурированных документов. Грубо говоря, мы должны спрогнозировать и перетащить в кэш-память компьютерной системы данные, которые с наибольшей вероятностью потребуются пользователю для удовлетворения его информационного запроса в кратчайшее время.
У Максима Гринева и его группы есть хорошие наработки и даже продукты, которые разработчики собираются выводить на рынок. Это системы поиска контекстуальной информации, то есть то, что близко нашим Лабораториям в целом. В работе Гринева больший упор делается на обработку текстов на естественном языке (вспомним пример слова «платформа»). извлечение из них сущностей и смысло
вых отношений между сущностями, Под сущностями понимаются любые существительные с их смысловым описанием. Скажем, название компании, фамилия руководителя компании, профиль деятельности компании, технологический процесс, промышленный образец, финансовая транзакция и т. п,
Остра ли для HP Labs проблема промышленного шпионажа ? Сказывается ли открытость ваших программ для ученых разных стран ?
- У нас инцидентов не было, и я не знаю о таких случаях в других Лабораториях. Однако мы понимаем, что научные центры HP Labs - своего рода узловые точки, где занимаются самым что ни на есть «новьем», Ради безопасности, конечно, применяются некоторые технические средства, да и вся работа в Лабораториях, не исключая российскую, организована по определенному стандарту, который предусматривает
сохранность интеллектуальной собственности. Есть особые тренинги, где наши специалисты получают навыки работы с закрытой информацией, навыки фиксации хода собственных исследований в рабочих тетрадях, чтобы при необходимости можно было доказать свой приоритет в вероятных правовых коллизиях.
Что для вас было самым сложным на стадии организации работы Лабораторий
в России ?