Устройство поисковых систем

Интерне́ т — всемирная система объединённых компьютерных сетей, построенная на базе IP.
IP (интернет протокол) объединяет сегменты сети в единую сеть, обеспечивая доставку данных между любыми узлами сети.

Поиско́вая систе́ма — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете.

Сайт (от англ. website: web — «паутина, сеть» и site — «место», буквально «место, сегмент, часть в сети») — совокупность электронных документов (файлов) частного лица или организации в компьютерной сети, объединённых под одним адресом URL – АДРЕС САЙТА — UNIVERSAL RESOURCE LOCATOR

Единицей сетевой информации является страница сайта. – и продвигаем мы
отдельные страницы сайта, каждую под свой ключевой запрос!!!

Чтобы получить информацию на странице пользователь должен знать ее адрес или найти ее URL в поиске. Поиск в интернете обеспечивают поисковые системы (ПС) – сервисы навигации по страницам сайтов.

Каждая страница имеет уникальный адрес URL — он состоит из доменного имени сайта,
пути к странице по сайту и имени файла страницы. Пример: site.ru/catalog/tovar site.ru – доменное имя сайта site.ru/catalog/ — путь к странице по сайту site.ru/catalog/tovar – имя файла страницы

Как работает поиск
Поисковые роботы сканируют web-сайты, выкачивая из них информацию постранично –происходит индексация. Затем передают индексному роботу, который перебирает все выкачанные страницы, обрабатывает их и заносит в индекс или не заносит, если  страница подозрительна (дубль, низкое качество).

Причем есть быстрый индекс и основной. Если страница попала в быстрый индекс (обработка свежих документов), то не факт, что попадет в основной (для этого она должна быть качественной).

И есть апдейты (обновления) ПС. Это когда они пересчитывают выдачу, с учетом новых документов, изменения параметров старых документов, внедряют новые алгоритмы и перестраивают правила индексирования и ранжирования сайтов.

Виды апдейтов:
 Выдачи – появились новые сайты, у старых изменились параметры
 Текстовые – появились новые документы (тексты)
 Ссылочные – переучет новых ссылок между сайтами
 ТИЦ, PR – рейтинги тематической популярности сайтов
У Яндекса 1-2 раза в неделю, у гугла даже чаще, несколько раз в день

Апдейты алгоритмов – нерегулярны, могут происходить подолгу – в это время выдачу «штормит».При передаче запроса поисковой системе, пользователь получает список сайтов, по теме запроса. Этот список формируется на основе рекомендаций индексного робота,
который заранее проанализировал все страницы.

Сейчас поисковые системы научились исправлять ошибки в запросах, учитывать регион, в котором находится пользователь, и даже историю поиска и поведения пользователя (что искал ранее, какие сайты уже посещал).

Поскольку места в поисковой выдаче после каждого апдейта распределяются поновому, то борьба за место ведется постоянно, причем в условиях относительной неопределенности – никто не знает, как сделать идеальный сайт.