Как заставить Yandex, Google, Rambler проиндексировать сайт
Как заставить Yandex, Google, Rambler проиндексировать сайт
Почему Яндекс (Google, Rambler, и т.д.) не индексирует мой сайт? Как заставить его проиндексировать сайт?
Возможны несколько причин, по которым сайт не индексируется.
Прошло недостаточно времени с момента заполнения формы
добавления сайта. Самый быстрый робот у Яндекса. Если он не
загружен, то добавляемая страница появляется в результатах поиска уже
через 3 часа. Большинство страниц попадают в индекс не позже, чем через
неделю с момента добавления. У остальных поисковиков время обновления
индекса существенно больше -- можно начинать беспокоится месяца через
полтора.
В момент визита робота поисковика сайт был недоступен или имел
очень большое время отклика. Если сервер "тормозит" не постоянно,
то рано или поздно сайт попадёт в поисковик. Через какое время -- см.
пункт 1.
Некоторые поисковики (например, Google) индексируют только те
сайты, на которые есть хотя бы одна внешняя ссылка с документа, уже
проиндексированного данным поисковиком.
Некорректная настройка сервера. Самая распространённая
ошибка среди любителей использовать .htaccess -- в результате применения
директив ErrorDocument или RewriteRule робот поисковика при обращении к
robots.txt получает от сервера код отличный от 200(OK) или 404 (Not
Found). Некоторых роботов (Rambler) это вводит в ступор и индексация не
произойдёт до тех пор, пока не ошибка не будет исправлена. Как избежать
ошибки: в случае использования ErrorDocument всегда создавать robots.txt
хотя бы и пустой, в случае использования RewriteRule быть аккуратным и
всегда проверять код ответа сервера.
Неправильно написанный robots.txt. При попытке запретить
индексацию сервера для какого-либо робота под правило попадают и другие
роботы. Как избежать ошибки? Всегда проверять
правильность составления robots.txt.
Поисковик не может распознать ссылки на страницах сайта.
Самый распространенный случай -- все ссылки сделаны на JavaScript или на
Flash. Некоторые поисковики неадекватно понимают редиректы. Наиболее
"безопасен" в этом смысле Google -- он отлично справляется как со
ссылками на флэше, так и с редиректами, и лишь JS ему еще не совсем по
зубам.
Сайт был забанен.
Проблемы у поисковика. Серьезные сбои редки, но случаются,
и если избыточность аппаратуры оказывается недостаточной, часть индекса
теряется. Кроме того, проблемы могут быть связаны с кластерной
структурой поисковика.
Использование динамических страниц. Это будет раскрыто в
отдельном пункте FAQ, а пока можно заметить, что динамические страницы
индексируются нормально далеко не всеми поисковиками. Почему? Динамика
несет два вида проблем. Первая -- дублирование информации. Если для
сайта URL вида .../page.php?par1=x&par2=y означает, как правило, то
же, что и .../page.php?par2=y&par1=x, то для поисковика это совсем
другая страница. Особенно часто эта проблема возникает при отслеживании
сессий посетителей -- роботы поисковиков не используют cookies, и потому
URL для них каждый раз меняется. Вторая проблема -- робот может легко
перегрузить сайт, который формирует страницы динамически.
Сайт находится в неиндексируемой зоне. У каждого поисковика
есть своя "область действия", например, Яндекс и Рамблер охватывают
русскоязычную часть интернета. Поэтому, если сайт не входит в
соответствующие доменные зоны (например, su, ru, am, az, by, ge, kg, kz,
md, tj, ua, uz для Яндекса; ru, su, ua, by, kz, kg, uz, ge для
Рамблера), то автоматическая индексация может не пройти. В таком случае
необходимо написать письмо в службу поддержки поисковика с просьбой о
включении сайта в индекс. Многие крупные поисковики чураются
бесплатных хостингов с сотнями тысяч сайтов, равно как и редиректных
служб (таких, как da.ru) и если ваша страница расположена на одном из
подобных хостингов, индексации можно ждать вечно.
Пользователей: 2372 Новых за месяц: 25 Новых за неделю: 5 Новых вчера: 1 Новых сегодня: 0Темы на форуме: 331 Сообщения на форуме: 2285 Материалы на сайте: 637 Комментарии к материалам: 271