
Googlebot 2.1
Вопрос индексации ссылок до такой степени важен, что его лучше рассмотреть отдельно. Ссылка как элемент гипертекстовой разметки, представляет собой средство навигации. Но отношение поисковых систем к ссылкам куда шире. Зачем и почему индексируются ссылки? Это происходит по многим причинам.
1. Пополнение базы данных страниц, которые требуется проиндексировать.
2. Организация отдельного поиска, с помощью которого сайт можно найти даже до того момента, когда его страницы попадут в основной индекс. Это так называемый поиск по ссылкам, результатом которого становится выдача «найден по ссылке».
3. Определение уровня авторитетности страницы и сайта в целом. Решая задачку о том, какие же страницы с каких сайтов показывать в ответ на определённый запрос, поисковые системы прибегают к методу ссылочного ранжирования. Это веками проверенный способ определения значимости одних научных работ по количеству и качеству их упоминания в других работах и на страницах журналов. Эту методику заимствовала и впервые применила компания Google, впоследствии серьёзно его изменившая и переработавшая. Подробнее »

Оставить твой ГС в индексе или нет...
На самом деле поисковые компании не придумывали что-то новое, но использовали проверенное веками. Сам по себе поисковый индекс достаточно прост. Все мы знаем, что любая книга, кроме непосредственно содержания, включает в себя издательский индекс, предметный указатель и библиографическое описание. Если библиография книги ближе к метаданным сайта, то предметный указатель к индексу его страниц.
Для создания поискового индекса в первую очередь убираются все теги и весь программный код. Получается чистый текст. После этого из него выбираются все буквенно-цифровые последовательности, которые разработчики программ считают логическими словами. Из этих слов формируются отдельные отсортированные по алфавиту списки. Далее вступает в силу «машинная морфология» и начинается лингвистическая обработка собранных слов. Подробнее »

Google вычисляет SEO-спам
Поисковые системы — основное звено современного Интернета. Этих сервисов достаточно много, но внимание вебмастеров рунета чаще всего оказывается направленным на лидирующие: Google и Яндекс.
Если рассматривать всё содержимое Сети в качестве одного огромного гипертекста, то упорядочивают его именно поисковые системы. Они составляют и хранят огромный предметный указатель всех сайтов, всех страниц разбросанных в Сети, и выделяют в нём ключевые слова.
Для этого поисковая машина, основной программный комплекс поисковых систем, индексирует все Web-страницы. Этот процесс делится на несколько этапов. Прежде всего составляется начальный список страниц, содержащий адреса, которые в дальнейшем будут проиндексированы и покажут поисковым программам — какие страницы необходимо проиндексировать кроме них. Подробнее »