
Индексация слов
Для того чтобы научиться делать релевантные страницы нам потребуется найти ответ на вопрос о том, какие слова хранят поисковые системы.
На сегодняшний день будет правильным утверждение: крупнейшие поисковики хранят все слова, кроме разделителей и специальных символов. Они отбрасывают знаки препинания и теги. Каких-то других стоп-слов в популярных поисковых системах давно уже не осталось. Несколько лет назад отбрасывались предлоги, частицы, союзы. Это было связано с желанием хранить данные в наиболее компактном виде. Сегодня, когда стоимость хранения мегабайта существенно снизилась из-за стремительного падения цен на жёсткие диски, потребность в этом исчезла. Подробнее »

Оставить твой ГС в индексе или нет...
На самом деле поисковые компании не придумывали что-то новое, но использовали проверенное веками. Сам по себе поисковый индекс достаточно прост. Все мы знаем, что любая книга, кроме непосредственно содержания, включает в себя издательский индекс, предметный указатель и библиографическое описание. Если библиография книги ближе к метаданным сайта, то предметный указатель к индексу его страниц.
Для создания поискового индекса в первую очередь убираются все теги и весь программный код. Получается чистый текст. После этого из него выбираются все буквенно-цифровые последовательности, которые разработчики программ считают логическими словами. Из этих слов формируются отдельные отсортированные по алфавиту списки. Далее вступает в силу «машинная морфология» и начинается лингвистическая обработка собранных слов. Подробнее »

Google вычисляет SEO-спам
Поисковые системы — основное звено современного Интернета. Этих сервисов достаточно много, но внимание вебмастеров рунета чаще всего оказывается направленным на лидирующие: Google и Яндекс.
Если рассматривать всё содержимое Сети в качестве одного огромного гипертекста, то упорядочивают его именно поисковые системы. Они составляют и хранят огромный предметный указатель всех сайтов, всех страниц разбросанных в Сети, и выделяют в нём ключевые слова.
Для этого поисковая машина, основной программный комплекс поисковых систем, индексирует все Web-страницы. Этот процесс делится на несколько этапов. Прежде всего составляется начальный список страниц, содержащий адреса, которые в дальнейшем будут проиндексированы и покажут поисковым программам — какие страницы необходимо проиндексировать кроме них. Подробнее »