студия создания и раскрутки сайтов

Главная arrow история поиска
история поиска
история поисковиков

Общие принципы работы поисковых систем Версия для печати

 Общие принципы работы поисковых систем

   Поисковая система состоит из следующих основных компонентов:

   Spider (паук) - браузероподобная программа, которая скачивает веб-страницы.

   Crawler (краулер, «путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице.

   Indexer (индексатор) - программа, которая анализирует веб-страницы, скаченные пауками.

   Database (база данных) – хранилище скачанных и обработанных страниц.

   Search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных.

   Web server (веб-сервер) – веб-сервер, который осуществляет взаимодействие между пользователем и остальными компонентами поисковой системы. 

   

 
начало поискового движения Версия для печати

 История развития поисковых систем

   В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации относительно небольшим. В большинстве случаев доступ к Интернет имели сотрудники различных университетов и лабораторий, а в целом Сеть использовалась в научных целях. В это время задача поиска информации в сети Интернет была далеко не столько актуальной, как в настоящее время.

   Одним из первых способов организации доступа к информационным ресурсам сети стало создание каталогов сайтов, в которых ссылки на ресурсы группировались согласно тематике. Первым таким проектом стал сайт Yahoo, открывшийся в апреле 1994 года. После того, как число сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска информации по каталогу. Это, конечно же, не было поисковой системой в полном смысле, так как область поиска была ограничена только ресурсами, присутствующими в каталоге, а не всеми ресурсами сети Интернет.

   Каталоги ссылок широко использовались ранее, но практически утратили свою популярность в настоящее время. Причина этого очень проста – даже современные каталоги, содержащие огромное количество ресурсов, представляют информацию лишь об очень малой части сети Интернет. Самый большой каталог сети DMOZ (или Open Directory Project) содержит информацию о 5 миллионах ресурсов, в то время как база поисковой системы Google состоит из более чем 8 миллиардов документов.

 
студия создания и раскрутки сайтов © 2010
улетные и смешные видео пробившие на хаха
Рейтинг@Mail.ru Rambler's Top100