Читаем Интернет на 100% полностью

Для примера рассмотрим, как действует  поисковой робот всемирно известной системы Google. Когда он просматривает веб-ресурс, то прежде всего он интересуется тем, какие слова и в каких местах веб-страницы ему попадаются. Затем перечень адресов и ключевых фраз, которые им соответствуют, поисковой робот сохраняет в своей базе данных.

Помимо этого, он также сохраняет сведения о частоте упоминаний слова на веб-ресурсе с применением условной величины, которую принято называть «вес слова». После анализа всех этих данных Google автоматически генерирует списки ссылок, данные в которых отсортированы по весу слов из поискового запроса, а также по месту их расположения (название веб-ресурса, гиперссылки, метатеги, т др.).

ПРИМЕЧАНИЕ

Не все пользователи знают, что каждая поисковая система имеет свой механизм для расчета веса ключевых слов при сканировании веб-страниц. Во многом именно поэтому разные поисковые машины на одни и те же запросы предлагают разные результаты поиска.

Чтобы найти интересующую информацию, пользователь самостоятельно формирует соответствующий поисковой запрос, и вводит его в поисковую систему. Как правило, результаты поиска ему выводятся в порядке релевантности, то есть по соответствию обнаруженных веб-ресурсов заданному поисковому запросу. В этом случае первые позиции списка результатов будут принадлежать ссылкам на веб-ресурсы, содержащие максимум ключевых слов из введенного запроса. Правда, в некоторых поисковых системах вы можете изменить порядок сортировки ссылок в результатах поиска – например, по дате (вначале – новые веб-ресурсы, затем – старые), по доменной принадлежности, по цене и т.п.

Стоит отметить, что разные поисковые системы, несмотря на внешнюю схожесть и почти одинаковый инструментарий, они имеют немало скрытых отличий. Это, например, порядок определения релевантности итогов поиска, размер и периодичность обновления баз данных, удобство в эксплуатации, оперативность обработки и вывода итогов поиска, и др. Кроме этого, поисковые системы могут различаться по поддержке языков запроса (одна система может работать с двумя-тремя языками, а другая – с десятком языков), расстановка приоритетов, области сканирования. Это также зачастую становится причиной получения разных результатов поиска у разных поисковых систем при вводе в них одного и того же запроса.

Таким образом, поисковая система автоматически генерирует перечень ссылок на веб-ресурсы на основании заданного пользователем запроса. Учтите, что если запрос сформулирован неточно или некорректно – трудно рассчитывать на получение удовлетворительного результата. Одним из главных условий формирования правильного поискового запроса является умение пользователя максимально сузить область поиска, а также правильно найти для запроса те ключевые фразы и слова, которые несут главную смысловую нагрузку. При этом стоит учитывать, что наибольшую эффективность среди всех ключевых слов имеют существительные, далее с большим отрывом следуют прилагательные, и в самом конце по эффективности находятся глаголы, причастия и деепричастия.

Любая поисковая система пользуется своей собственной методикой поиска, и от того, насколько она эффективна, в определяющей степени зависит популярность данной системы у пользователей. Эта методика тщательно охраняется от посторонних (конкурентов, недоброжелателей и просто любопытных), а также, опять же – с целью сохранения конфиденциальности, постоянно дорабатывается и совершенствуется. Одним из наиболее распространенных приемов (особенно это касается поисковых систем, поддерживающих русский язык) является механизм морфологического поиска. Сущность его заключается в том, что система ищет не просто введенное в строке запроса слово, но и любые его формы, падежи и синонимы.

В соответствии с общепринятой терминологией, все виды поиска можно разделить на три категории: простой, расширенный и сложный. Для решения большинства поисковых задач пользователи применяют простой поиск. Более того – именно этот вид поиска применяется большинством поисковых систем по умолчанию. Сущность его заключается в составлении поискового запроса и получения по результатам поиска списка ссылок на соответствующие веб-ресурсы. В данном случае ключевая роль отводится грамотному подбору слов для формирования запроса. Здесь важно помнить следующее: слова или фразы поискового запроса должны встречаться в отыскиваемых ресурсах, и отсутствовать – в тех ресурсах, которые интереса не представляют.

Утилита WebMultiSearcher – удобный инструмент для быстрого поиска

Перейти на страницу:

Похожие книги

Основы безопасности жизнедеятельности. 7 класс
Основы безопасности жизнедеятельности. 7 класс

Учебник "Основы безопасности жизнедеятельности. 7 класс" создан большим коллективом преподавателей и специалистов в области безопасности человека на основе обязательного минимума содержания образования и доработан с учетом нового федерального компонента образовательных стандартов.В учебнике всесторонне рассматриваются природные явления, опасные для человека: землетрясения, наводнения, ураганы, лесные пожары и др. Приводится разнообразный документальный и статистический материал. Предлагаются правила поведения человека при угрозе стихийных бедствий и алгоритм действий при оказании первой медицинской помощи.

Евгений Николаевич Литвинов , Евгений Яковлевич Гаткин , Михаил Петрович Фролов , Юрий Дмитриевич Жилов , Юрий Юрьевич Корнейчук

Руководства / Учебники / Образование и наука / Словари и Энциклопедии