Читаем Журнал «Компьютерра» № 11 от 21 марта 2006 года полностью

Сегалович: Это, конечно, тоже играет роль. Но дело еще и в том, что у нас база обновляется очень часто, трижды в неделю. И если какой-то сайт почему-то не ответил, мы его сразу же убираем. А у того же Google месячный период обхода плюс быстрый робот, который обслуживает далеко не всех. И если уж я попал в Google со своей страничкой, то так в нем и живу. А «Яндекс» может меня выкинуть, потому что сайт в тот момент, когда ткнулся робот, лежал. И всё. На три дня меня в базе нет. То есть сама наша живость – это, безусловно, плюс, но у нее есть и неприятный побочный эффект.

Себрант: Нужно учесть, что когда мы случайно выкинули какой-то сайт, качество ответа практически не изменилось.

Волож: Зато увеличилась живость всей базы.

«КТ»:

Веб-мастера жалко.

Себрант: Жалко. Но одним из проявлений кризиса, о котором говорит Илья, были мертвые ссылки в первой десятке выдачи. Люди переходили по ссылке, а ничего не открывалось. И это было страшно раздражающим фактором.

Волож: Не будет пользователей, веб-мастерам еще хуже станет со временем.

Яндекс.Теории

– У нас есть скрипт, собирающий и сравнивающий ответы поисковых систем по редким запросам, – поясняет Илья Сегалович, – и мы постоянно себя измеряем. Так вот, моя теория, в которую Аркаша и Андрей не верят, говорит, что рост популярности «Яндекса» коррелирует с состоянием базы. Не 87 процентов стала чистота, а 92 процента. Не 91 процент небитых ссылок, а 94, и так далее.

– Под «не верю» нужно понимать, что я не верю в абсолютизацию базы, – поправляет Себрант.

Перенос фокуса на базу позволяет нам вытащить домашнюю заготовку и спросить, как «Яндекс» относится к метапоисковым машинам, использующим для формирования результатов в том числе и выдачу «Яндекса».

– Выдачу у нас, кстати, можно купить, – замечает Волож.

Сегалович к паразитизму относится плохо, и в перспективность такого подхода – независимо от его этичности – в принципе не слишком верит. Портальная поисковая система при обработке запроса анализирует его, учитывая историю предыдущих запросов пользователя, историю кликов и переходов. А у метапоисковиков данных одновременно с двух концов цепочки (со стороны пользователей и со стороны веб-сайтов) нет и быть не может. Даже поисковые машины без портала – и те находятся в невыгодном положении.

– Все такие искалки умерли. Fast умер и был продан Yahoo через вторые руки (часть разработчиков осталась в Норвегии, а часть перешла в Yahoo и сделала поисковый движок для почты). Бизнес-идея компании Inktomi, полагавшей, что сможет разрабатывать поисковый механизм, продавать его порталам и жить на вырученные деньги, не сработала. Потому что нельзя жить без толстого портала с толстым слоем пользователей и информацией об этих пользователях. Потому что это, черт возьми, та самая обратная связь. Логика развития поисковых систем и порталов такова, что толстый портал с пользователями и хорошим поиском – это законченная модель, которую очень трудно разрезать. Нельзя сделать поиск отдельно.

Наши собеседники согласны с тем, что появление новых игроков на рынке поиска маловероятно. Эпоха накопления первоначального капитала завершилась, и сейчас хорошему поиску необходимо множество разных источников информации, которых у нового движка не может быть по определению. И если нишевые поисковые движки вполне могут появиться, то названия всех важных поисковиков, скажем так, общего назначения мы уже знаем. Скорее всего.

– Но Google ведь тоже пришел на практически поделенный рынок, – задумчиво говорит Сегалович.

По поводу успеха Google у Сегаловича есть теория.

– Считается, – говорит Илья, – что успех Google базируется на PageRank, новаторском алгоритме который придумали два студента в гараже. Однако ничто из этого не является правдой. Первое: опубликованный вариант PageRank не имеет почти никакого отношения к тому, что на самом деле работает в Google. Новизна его тоже под вопросом. По большому счету, все это уже было опубликовано, но в параллельных областях. И самое главное, PageRank не предоставлял никакого конкурентного преимущества, потому что то же самое практически сразу было реализовано во всех остальных поисковых системах.

А что сработало на Google? Например, с 1999 по 2003 год – как минимум четыре года – Google был единственной мировой искалкой, которая выдавала сниппеты, что повышает информативность выдачи на 30 процентов. Мы это тоже делали, но в России. Такая, казалось бы, мелочь. Технологически – совсем не сложная задача. У меня в 2000 году это было тестовым заданием при приеме на работу. Тем не менее четыре года сниппеты выдавал только Google. Почему остальные порталы это не реализовали? Не знаю.

– В Yahoo это теперь называется search lessons. Типа, «что мы делали неправильно с 2000 по 2003 год», – улыбается Волож.

Яндекс.Завтра

Снова Волож.

Перейти на страницу:

Похожие книги

Информатика: аппаратные средства персонального компьютера
Информатика: аппаратные средства персонального компьютера

Рассмотрены основы информатики и описаны современные аппаратные средства персонального компьютера. Сформулированы подходы к определению основных понятий в области информатики и раскрыто их содержание. Дана классификация современных аппаратных средств персонального компьютера и приведены их основные характеристики. Все основные положения иллюстрированы примерами, в которых при решении конкретных задач используются соответствующие программные средства.Рекомендуется для подготовки по дисциплине «Информатика». Для студентов, аспирантов, преподавателей вузов и всех интересующихся вопросами современных информационных технологий.

Владимир Николаевич Яшин

Зарубежная компьютерная, околокомпьютерная литература / Прочая компьютерная литература / Книги по IT