Поисковая система (англ. search engine, синонимы: поисковый сервер, поисковая машина) - специальный веб-сайт, на котором пользователь по заданному запросу может получить ссылки на сайты, соответствующие этому запросу.
Как правило, работа поисковой системы состоит из двух этапов. Поисковый робот (паук, crawler) постоянно обходит сеть и собирает информацию с веб-страниц (индексирует их). Когда пользователь задает запрос, поиск идет по предварительно построенному индексу. Результатом поиска является так называемая поисковая выдача - список ссылок на документы (веб-страницы), соответствующие запросу.
Робот поисковой системы - компонента или программа, которая посещает веб-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Робот возвращается через определенные периоды времени и индексирует страницу снова. Вся информация заносится роботом в индексы поисковой системы.
В Интернете поисковых систем сотни и тысячи, но с точки зрения важности для нас отметим следующие основные и наиболее авторитетные:
- Яндекс (www.yandex.ru) — крупнейший российский портал, ежедневная аудитория Яндекса — 4,000,000 человек, что составляет порядка 65% суточной аудитории всего русского Интернета, ежемесячная — около двадцати четырех миллионов;
- Рамблер (www.rambler.ru) — посещает около 1,000,000 уникальных человек в день;
- Google (www.google.ru) — посещаемость неизвестна (предположительно около 500,000 человек в день). Это самая большая поисковая система в мире, которая очень хорошо ищет в русскоязычных документах и важна по той причине, что следующая упомянутая ниже поисковая система использует ее движок;
- Поиск@Mail.ru (go.mail.ru) — самая молодая поисковая система. Работает на движке Google, но, в отличие от нее, ищет только по русской части Интернета и с учетом морфологии русского языка.
В белорусском Интернете поисковых систем нет. Но есть порталы и каталоги сайтов, которые осуществляют поиск посредством поисковых систем Яндекс или Google. Наиболее популярные из них:
- TUT.BY (www.tut.by) – наиболее посещаемый белорусский портал существующий с 5 октября 2000 года. Число заходов уникальных посетителей на титульную страницу составляет более 70 000 в сутки;
- All.by (www.all.by) – интернет портал, мета-поиск которого реализован на основе данных Яндекс.XML и All.by;
- Br.by (www.br.by) - каталог ресурсов белорусской части Интернета. Поиск по ресурсам зоны .by;
- Поиск.com (www.poisk.com) - каталог сайтов и полнотекстовая поисковая система. Проект основан осенью 1999 года;
В целом, поисковые системы и каталоги являются самыми посещаемыми сайтами в Интернете. Важны два основных факта:
- Почти каждый пользователь хотя бы раз в день заходит на поисковую систему;
- От 5 до 90% посетителей приходят на сайт через поисковые системы.