Читаем Интернет-разведка. Руководство к действию полностью

Посередине представленного рисунка жирным курсивом выведено: «Это простой сайт». Данная надпись – и есть заголовок текста. Шрифт фразы «Это простой сайт» по размеру превосходит шрифт текста на сайте, он специально выделен как заголовок текста. При разметке с помощью HTML этот текст расположен ниже тега

, но при этом вместе с тегом

находится внутри тега . То есть содержимое, заключенное в

, – это часть того, что находится в . Такое расположение дает дополнительную возможность пауку лучше определять ключевые слова на сайте. Ведь если слова вынесены в заголовок текста или, тем более, всей страницы, вероятность того, что страница и текст посвящены теме, формулируемой этими словами, повышается.

Ниже фразы «Это простой сайт» приведены четыре варианта написания основного текста сайта:

– обычный;

– жирный (пишется под тегом );

– курсив (пишется под тегом );

– текстовая гиперссылка (пишется под тегом «Текст гиперссылки»).

Основной текст сайта, вне зависимости от того, каким вариантом шрифта он написан, располагается внутри тега . Именно содержимое тега представляет собой основной объект для паука и рассматривается им как текст страницы (собственно, это действительно текст страницы).

Чтобы увидеть внутреннюю разметку сайта, надо в браузере Мозилла Файрфокс навести курсор на любой незанятый текстом участок поля и нажать правую кнопку мыши. В всплывающем меню следует выбрать пункт «Просмотр исходного кода страницы».

Применительно к сайту, который мы рассматривали на рис. 1, этот исходный код будет выглядеть следующим образом:

Показываем устройство сайта:

Это простой сайт

Это текст на сайте. Обычный шрифт.

Жирный шрифт.

Курсив.

«А это – гиперссылка»

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже