Белый каталог сайтов PCcat.net
Каталог | Карта     
Поисковые машины
 
Поисковая машина - программа, предназначенная для поиска информации. Обычно является частью [[поисковой системы]].

По области поиска поисковые машины можно разделить на локальные и глобальные. Это деление весьма условно.

Локальные поисковые машины предназначены для поиска информации по какой-либо части всемирной сети, например по одному или нескольким сайтам, либо по [[локальной сети]].

Глобальные поисковые машины предназначены для поиска информации по всей сети Интернет либо по значительной её части. Представителями таких поисковых машин являются поисковые машины поисковых систем [[Google]],[[Yahoo]] и т. д.

Теоретически могут существовать поисковые машины для поиска самой разной информации, например текстов, видео, изображений, людей и др.

При этом документами, по которым осуществляется поиск, могут быть как текстовые [[формат]]ы (например .html,.htm,.txt,.doc,.rtf, ...), так и форматы для хранения изображений (.gif, .png, .svg, ...), видео, звука и другой информации.

Однако на момент написания статьи наиболее распространённым является именно поиск по текстовым документам. Такими документами могут быть web-страницы, документы в формате doc, rtf, txt и др.

Поиск по изображениям, видео, звукам более сложен с технологической точки зрения, поэтому массово не реализован. Такие системы, как, например, Yandex.картинки, в настоящее время ищут не по самим изображениям, а по альтернативным текстам, соответствующим этим изображениям.

Исходной информацией для поиска является поисковый запрос.

Обычно поисковые машины выполняют следующие функции:
Поиск ссылок на страницы и другие документы сайтов.
Индексация документов сайтов.
Поиск по базе данных проиндексированных документов.

Поиск ссылок может осуществляться несколькими путями:
Автоматически. При этом поисковая машина ищет ссылки со страниц сайтов.
В ручном режиме. Пользователи сами добавляют в базу данных поисковой машины ссылки на страницы своих сайтов.

Индексация документов сайтов - извлечение из документов информации, важной для поиска, преобразование этой информации в формат, удобный для поисковой машины и сохранение этой информации в базу данных поисковой машины.

Поиск по базе данных проиндексированных документов может состоять из нескольких этапов, а именно:
Нахождение документов, соответствующих поисковому запросу.
Ранжирование документов в соответствии с их релевантностью поисковым запросам.
Источник: http://nullwarez.net
Категории:

Оценка модератора: Нет
Переходов на сайт:377
Переходов с сайта:118
 

Реклама