Представленная ниже
таблица включает характерные
особенности работы основных
автоматических поисковых
систем (автоматические
поисковые системы - те, которые
для наполнения своей базы
используют поисковых роботов). Показаны основные факторы, влияющие на индексирование и последующие ранжирование сайтов. Поисковые каталоги, которые наполняются людьми, имеют иные особенности работы и в данной таблице не представлены. |
В таблице представлены сведения на 1 Июня 2000 г. Данные охватывают характеристики поисковых систем AltaVista, Excite, FAST Search, Go (Infoseek), Google, Lycos and Northern Light в той их части, которая создается с использованием поисковых роботов. Также таблица включает характеристику работы Inktomi в части, которую используют в своих результатах AOL Search, HotBot and MSN Search. Excite представлен в той доли, которая принадлежит Magellan и WebCrawler. | |
||||||
Наполнение базы | Да | Нет | Коммент. | |
|||
Глубина индексации | AltaVista,
FAST, Google, Inktomi, NLight |
Excite,
Go, Lycos |
|
||||
Немедленная индексация | AltaVista (страницы появляются в течении нескольких дней) |
Excite,
FAST, Google, Go, Inktomi, Lycos, NLight, |
|
||||
Поддержка
фреймов |
AltaVista,
FAST, Google, NLight |
Excite,
Inktomi, Go, Lycos |
|
||||
Image
Maps |
AltaVista, Go, NLight |
Excite,
FAST, Google, Inktomi, Lycos |
|
||||
robots.txt |
All |
не определено | |
||||
Мета-тэг ROBOTS | All |
n/a |
Google может не поддерживать (проверяется) | ||||
Влияние рейтинга популярности на глубину индексации | Inktomi,
Lycos |
AltaVista,
Excite, FAST, Go, NLight |
|
||||
Частота изменения | AltaVista, Go, Inktomi, | Excite,
FAST, Google, Lycos, NLight |
|
||||
Проверка URL | Подробнее: >>Проиндексирован ли мой сайт? << | ||||||
Индексация | Да | Нет | Коммент. | ||||
Полнотекстовая | Все | не определено | Некоторые стоп-слова могут быть не проиндекси-рованы | ||||
Стоп-слова |
AltaVista,
Excite, Inktomi, Lycos, Google |
FAST,
Go, NLight |
|
||||
Мета-тэг
DESCRIPTION |
Все,
кроме... |
FAST,
Google, Lycos, NLight |
|
||||
Мета-тэг KEYWORDS | Все, кроме... | Excite,
FAST, Google, Lycos, NLight |
|
||||
Текст в атрибуте ALT | AltaVista, Go, Google, Lycos |
Excite,
FAST, Inktomi, NLight |
|
||||
Текст в комментариях | Inktomi | Остальные | |
||||
Поиск однокоренных слов | Подробнее >>Скоро появится<< | ||||||
Ранжирование | Да | Нет | Коммент. | ||||
Влияние мета-тэгов | Go,
Inktomi |
AltaVista,
Excite, FAST, Google, Lycos, NLight |
|
||||
Перечисление в каталогах | Go |
AltaVista,
Excite, FAST, Google, Inktomi, Lycos, NLight |
|
||||
Рейтинг
популярности |
AltaVista,
Excite, FAST, Google, Go, Inktomi, NLight |
Lycos | Очень
важно для Google |
||||
Direct
Hit |
HotBot,
Lycos |
Остальные | |
||||
Спам | Да | Нет | Коммент. | ||||
Мета-refresh | AltaVista, Go, Lycos |
Excite,
FAST, Google, Inktomi, NLight |
|
||||
Невидимый текст | Остальные | Excite,
FAST, Google |
|
||||
Мелкий
текст |
AltaVista,
Inktomi, Lycos |
Excite,
FAST, Google, Go, NLight |
|
||||
|
|
Наполнение базы | ||
Глубина индексации Каждый сайт может
состоять из нескольких страниц
- от двух-четырех - до
нескольких сотен. С фреймами у
поисковых систем обычно бывают
проблемы. Дело в том, что
основная страница, несущая
структуру фреймов, никакой
информации не имеет, и,
следовательно, не представляет
для поисковой системы никакого
интереса. Наоборот, те файлы, на
которые ссылается эта основная
страница, как раз и являются
носителями всего содержания.
Так вот, некоторые системы
умеют использовать ссылки и
переходить на страницы с
содержанием, а некоторые - нет. Image Maps Image Map - это
графическое изображение,
которая вставляется в
страницу, причем в HTML-коде оно
при помощи координат
разбивается на участки,
которым присваиваются ссылки.
Т.е. на них можно нажимать
также, как и на другие элементы,
снабженные гиперссылками. robots.txt Если у вас на сайте
кроме общедоступной
информации имеются еще и
сведения для узкого круга лиц
(например, что-то вроде проекта "VIP"-клуб),
то вряд ли вы захотите, чтобы ее
увидели те, кто не входит в сей
узкий круг. Мета-тэг ROBOTS ROBOTS - это
специальный мета-тэг для тех,
кто по каким-то причинам не
хочет создавать файл robots.txt. Тэг
прописывается на тех
страницах, которые не подлежат
индексации роботами (всеми или
некоторыми). Влияние рейтинга популярности на глубину индексации Все поисковые
серверы могут определять
популярность страницы,
анализируя количество ссылок
на нее с других страниц. На
основании этого, некоторые
поисковики решают вопрос о
включении данной страницы в
свой индекс. Частота изменения Некоторые сайты
меняются редко, некоторые
вообще не меняются, а какие-то -
каждый день. Проверка URL Когда вы отправили
запрос на индексацию вашего
сайта, вам, через некоторое
время, обязательно захочется
проверить проиндексирован ли
он. Многие поисковые системы
позволяют сделать это при
помощи специальных команд. |
||
Индексация | ||
Данный раздел поясняет как поисковая система индексирует страницу после занесения ее в базу данных. Полнотекстовая индексация Все главные
поисковые системы заявляют,
что они индексируют весь
видимы текст страницы. Стоп-слова Вас интересуют,
скажем, предлоги "в" и
"на"? Будете искать
страницы, где они встречаются? Текст в комментариях Некоторые поисковые системы при индексации обращают внимание даже на слова в тэгах комментариях. Я сказал "некоторые", хотя в таблице указана лишь одна. Дело в том, что базой поисковой системы Inktomi пользуются очень многие поисковые сервера. Поиск однокоренных слов Некоторые поисковые системы найдут вам страницы, в которых встречаются слова, однокоренные к тем, что вы указали в запросе. |
||
Индексация | ||
Повышения рейтинга сайта "в глазах" поисковой системы - главная цель всего нашего проекта. Этому вопросу посвящены большинство статей и выпусков рассылки. Ну а в данной таблице перечислены некоторые характерные факторы, влияющие на релевантность страницы. Т.е. те, которые есть у одних поисковых систем, но нет у других. Влияние мета-тэгов Некоторые поисковые системы все-таки поднимут рейтинг страницы, если ключевые слова из запроса будут перечислены в мета-тэгах DESCRIPTON и KEYWORDS. Рейтинг популярности Большинство поисковых систем могут определять популярность страницы, анализируя количество ссылок на нее с других сайтов. Некоторые поисковые системы, например, Google, придают этому большое значение Direct Hit Прямое Нажатие - система, которая измеряет то, какие пользователи нажимают по от результатов поиска, чтобы очистить ранжирования уместности. Это показывает, который поисковые серверы используют это как фактор. Для получения дополнительной информации, см. статью(изделие) ниже: Direct Hit - это система,
которая определяет количество
кликов на ссылки в результатах
поиска. Другими словами, Direct Hit
считает количество
посетителей, пришедших на сайт
с поисковых систем. Это похоже
на обычный рейтинг
посещаемости, вроде
РамблерТоп100 или ТопЛист. Но
здесь учитываются только
посетители, пришедшие с
поисковых серверов. |
||
Спам | ||
Спам - это обман.
Поисковые системы не любят
когда их обманывают (а кто
любит). Обнаружив такого
обманщика, они его просто
выкидывают из своей базы
данных. Мета-refresh Некоторые
владельцы сайтов
автоматичестки перенаправляют
посетителей на нужную страницу
с множества различных страниц,
на которых нет смыслового
содержания, но зато они имеют
достаточно высокий рейтинг в
поисковых системах (их начинка
специально подгоняется для
определенных ключевых слов). Невидимый текст Еще одно ухищрение. Текст делается цветом таким же, как и фон. Для посетителей его не видно, а вот в HTML-коде он прекрасно заметен. Но большинство поисковых систем не станет индексировать такие страницы. Мелкий текст Это вариация предыдущей методики. Но здесь текст просто очень мелкий и составлен преимущественно из ключевых слов. Он, конечно, может быть элементом дизайна, но если его много - это явный спам. И такие страницы... Правильно! Не будут индексироваться. |