Читаем Журнал «Компьютерра» № 5 за 7 февраля 2006 года полностью

Найденные документы программа выводит в результирующем списке согласно релевантности – соответствию документа тексту запроса. В разных технологиях используются разные методы поиска и определения релевантности (количество «вхождений» слова, частота упоминания, отношение этих параметров к общему количеству слов в документе, расстояние между словами фразы запроса в искомых файлах и т. д.). На основе этих параметров определяется «вес» документа, и в зависимости от него тот или иной файл оказывается в списке результатов на определенной позиции. В случае с интернет-поиском дело обстоит еще сложнее. Ведь в данном случае надо учитывать и множество иных факторов (Page Rank Google тому пример). Но это тема для отдельной статьи, так что Интернет трогать не будем.

На подопытный компьютер (Athlon 2,2 МГц; 1 Гбайт RAM, IDE-винчестер Seagate, 160 Гбайт, 7200 об./мин.; Windows XP) был установлен набор программ: dtSearch Desktop, «Ищейка Проф Deluxe», Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Для тестов была скомпонована текстовая база документов в форматах doc, txt и html общим объемом 20 Гбайт. Группа товарищей под руководством вашего покорного слуги тестировала, сравнивала и делилась своими субъективными впечатлениями по каждой софтине.

dtSearch Desktop 7.0

Разработчик: dtSearch Corp.

Официальный сайт: www.dtsearch.com

Цена: $199

Размер дистрибутива: 23,1 Мбайт

Интерфейс dtSearch довольно прост, но некоторые окна или вкладки перегружены элементами, из-за чего создается впечатление сложности использования. Единственным действительно неприятным моментом является отсутствие русскоязычного интерфейса, хотя искать документы программа может на нескольких языках. Зато dtSearch одна из немногих утилит, которая может индексировать веб-страницы на заданную пользователем «глубину» (для этого, правда, нужно докупить адд-он dtSearch Spider).

Имеется морфологический поиск (слово во всех морфологических формах), поиск с коррекцией ошибок (с опечатками) и поиск с использованием синонимов. dtSearch может производить поиск с использованием фраз, состоящих из слов, соединенных логическими операциями. Каждому слову в запросе можно устанавливать свой вес.

В общем и целом неплохая программа из разряда профессиональных поисковиков. Накладок с русским текстом при поиске не было. Как не было их ни с заявленной морфологией, ни с нечетким поиском. Система вполне адекватно находила нужные документы и по простому запросу в одно слово, и при использовании в качестве ключевой фразы пары абзацев документа.

iSYS Desktop 7.0

Разработчик: iSYS Search

Официальный сайт: www.isys-search.com

Цена: $570

Размер дистрибутива: 38,8 Мбайт

Очень мощная программа, но размер установочного файла больше 40 Мбайт! Интерфейс весьма симпатичный, но разобраться, где и что находится, куда нажимать и где наконец-то осуществить поиск, новичку будет непросто: запросы для поиска вводятся при помощи запуска одной программы, а управление индексами производится при помощи другой. Поисковые запросы вводятся также в отдельных появляющихся окошках. Ко всему прочему не поддерживается русский язык.

Возможности по созданию индексов включают в себя несколько готовых шаблонов (по папке «Мои документы», «Почта», «Почта и документы», «Определенная папка», «Папка с выбором типов файлов» и др.). ISYS Desktop умеет индексировать информацию из различных источников данных и предоставляет для этого множество настроек. Дополнительные возможности: поддержка SQL, FTP, TRIM Context, WORLDOX 2002, скрипты, планировщик индексации.

Из продвинутых функций программа предлагает использование синонимов, фильтра сортировки (по пути, имени и дате создания файла). Удивило то, что отсутствует поиск с использованием морфологии. Кроме того, нет списка значимых слов, зато имеется обширный список слов незначимых. Также заявлены функции «приблизительный поиск» и «эвристический анализ».

Результаты поиска весьма информативны, отображаются в виде списка документов, отсортированных по релевантности. К сожалению, предпросмотр документа доступен лишь в виде обычного текста, добиться отображения файлов в родном формате, будь то Word, Html или PDF, так и не удалось. Программа позволяет разбивать найденные документы на группы по определенным признакам (по умолчанию они разделены по релевантности).

Google Desktop Search + GDE Enterprise

Разработчик: Google

Официальный сайт: www.google.com

Цена: бесплатно

Размер дистрибутива вместе с TweakGDS:

1,2 Мбайт

Имя Google уже говорит о многом. Бесплатная разработка предназначена для поиска информации на персональном компьютере, в Интернете и корпоративной сети. С одной лишь оговоркой: компания Google предлагает свои услуги по консультации и развертыванию системы GDS Enterprise на предприятии за 10 тысяч долларов на каждую тысячу пользователей.

Первое, что бросается в глаза, – отсутствие собственной оболочки для программы. Google Desktop Search по-прежнему находится в окне браузера, соответственно весь интерфейс настольной версии достался софтине от старшего интернет-брата.

Перейти на страницу:

Похожие книги

Восстановление данных на 100%
Восстановление данных на 100%

В книге изложены методы восстановления данных с различных носителей информации – жестких дисков, массивов RAID, CD, DVD, карт флэш-памяти, карт фотоаппаратов и мобильных телефонов. Ремонт поврежденного оборудования рассматривается в издании только как один из аспектов всего процесса извлечения данных. Основная тема – извлечение данных, поврежденных из-за физических или логических нарушений в работе компьютерной системы либо неверных действий пользователя. В книге рассматривается восстановление случайно удаленных файлов, извлечение ценной информации с поломанных жестких дисков; описываются программы и методика восстановления данных с поврежденных массивов RAID, что критически важно для работы корпоративных компьютерных систем.Книга не требует специальной подготовки читателя: простые пошаговые процедуры восстановления данных предваряются описанием принципов их хранения на различных носителях.

Петр Андреевич Ташков

Зарубежная компьютерная, околокомпьютерная литература / Прочая компьютерная литература / Книги по IT
Цифровой журнал «Компьютерра» № 4
Цифровой журнал «Компьютерра» № 4

ОглавлениеА где же ГЛОНАСС? Автор: Марина ПелепецНоябрьский приз Автор: Игорь ТереховКивино гнездо: Даёшь молодежь! Автор: БЕРД КИВИСчастливое ПО Автор: Alienatio MentaleЦифровые технологии и английские школьницы Автор: Сергей ВильяновВасилий Щепетнёв: О совпадениях Автор: Василий ЩепетневGlobal Mobile Awards 2010: забавные номинанты Автор: Алексей СтародымовYlmf OS: китайский клон Windows XP Автор: Андрей КрупинLeadtek WinFast PxVC1100 — ускоритель кодирования видео Автор: Игорь ОсколковО производстве, портках и логистике Автор: Ваннах Михаил"Компьютерра" в FB2: всё готово Автор: Сергей ВильяновInternet Explorer под ударом Автор: Андрей КрупинБольшая новость Nokia Автор: Алексей СтародымовГолубятня: Коммуникатор в дорогу Автор: Сергей ГолубицкийВасилий Щепетнёв: Прогулка под присмотром Автор: Василий ЩепетневОблачная веб-система Glide OS Автор: Андрей КрупинБилл Гейтс, Facebook и Twitter Автор: Алексей СтародымовКивино гнездо: Акустическая иллюзия Автор: БЕРД КИВИОперационные системы и маркетинговый взгляд Автор: Алексей СаминскийICQ: седьмое пришествие Автор: Андрей КрупинМини-противостояние: Jetway против Zotac Автор: Константин Иванов"Компьютерра" в формате FB2: релиз-кандидат Автор: Сергей ВильяновВасилий Щепетнёв: Ловцы мгновений Автор: Василий Щепетнев

Журнал «Компьютерра» , Коллектив Авторов , Компьютерра Журнал

Зарубежная компьютерная, околокомпьютерная литература / Прочая компьютерная литература / Книги по IT