Читаем Аналитика: методология, технология и организация информационно-аналитической работы полностью

В зависимости от реализации статистические критерии могут применяться к тексту на раннем этапе (до грамматико-логической обработки текста), а могут и на завершающей стадии (после предварительной обработки, согласования словоформ и т. п.). Однако, в настоящее время без поддержки интерактивного режима (диалога с экспертом) качество реферирования достаточно низко и не всегда удовлетворяет потребителя. Вне зависимости от спектра технологий, используемых при анализе словоформ (формальные ли грамматики, нейросетевые ли технологии), результаты семантической обработки пока далеки от тех, которые в состоянии обеспечить эксперт, что отчасти объясняется тем, что любая из созданных на сегодня баз знаний, в известном смысле, наивнее ребенка. Причиной такой «наивности» является то, что механизмы обучения подобных систем и способы организации знаний в них несовершенны, а количество каналов приобретения знаний слишком мало. Существуют прототипы самообучающихся интеллектуальных систем, но до уровня интеллекта разумных существ эти системы пока не могут дорасти.

Однако оставим подробное рассмотрение этих вопросов специалистам в области теории систем искусственного интеллекта. Заметим лишь, что работы в области теории систем искусственного интеллекта действительно заслуживают того, чтобы с ними ознакомились люди, занятые в «сфере информационного производства». Чрезвычайно интересны эти работы хотя бы потому, что представляют собой попытки осмыслить то, каким образом человек осуществляет свою мыслительную деятельность, алгоритмизировать и упорядочить ее, что крайне важно и для эксперта-аналитика. Кроме того, нелишне хотя бы в общих чертах представлять, каким образом работает твой инструмент, каковы его параметры и особенности функционирования. Так, например, ряд направлений современной психологии выросли не из классической психологии, а из гибрида теории искусственного интеллекта, классической психологии и философской теории познания. И столь необычное происхождение этих психологических теорий, отнюдь, не мешает специалистам в этой области успешно решать задачи именно психологического плана.

Методы первичного структурирования информации широко используются при синтезе баз данных и подробно рассматриваются в разнообразных изданиях по информатике, в частности — тех, которые посвящены вопросам проектирования и разработки баз данных различного назначения[52]

. В наиболее популярном и, в то же время, профессиональном изложении эти проблемы рассматриваются в книге американского автора Дэвида Васкевича[53], написанной именно для тех людей, которые руководят деятельностью или формулируют задачи перед специалистами в области разработки программного обеспечения, но не обязаны вникать в технологические подробности процесса разработки. В частности, в книге Васкевича описываются различные способы организации и структурирования данных, виды отношений между ними, приведены наглядные примеры, что позволяет руководителю по ее прочтении квалифицированно руководить коллективом разработчиков и грамотно организовать технологический процесс. Но подчеркнем еще раз: для нас в этой книге содержится информация, связанная именно с проблемой структурирования информации.

Нет ничего удивительного в том, что мы обращаемся к базам данных для того, чтобы проиллюстрировать процессы структурирования информации. Базы данныхэто тоже модели,

описывающие те или иные аспекты существования системы/процесса, поэтому при их создании и проектировании так же применяются методы структурирования информации, отличающиеся от прочих методов лишь тем, что структурирование осуществляется уже с учетом ограничений, налагаемых технологической платформой. В общем случае при структурировании информации такие ограничения не всегда принимаются в расчет.

Так или иначе, но полученный массив описаний предметной области или проблемы на начальном этапе структурирования информации должен быть приведен к виду, упрощающему его дальнейшую обработку. Если сведения получены в результате проведения информационно-поисковых процедур (например, в различного рода средствах массовой информации — от печатной прессы до сети Интернет), полученный исходный массив, как правило, не структурирован и разноформатен. В этом случае перед аналитиком встает задача первичного структурирования массива сообщений в ее наиболее сложном варианте (здесь требуется выделение из сообщений информации, релевантной задачам исследования, ее компоновка и т. п.).

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже