Информационная среда WWW (World Wide Web), работающая на ресурсах глобальной компьютерной сети Интернет, насчитывает огромное число документов, например, в 2005 году она содержала уже 1млрд. только русскоязычных документов. В настоящее время число новых документов, размещаемых на WWW, составляет более 1 млн. в день. Кроме того, уже имеющаяся в сети информация изменяется ежедневно, например, сведения о новостях, бизнесе, развлечениях и т. д. Постоянно увеличивающийся объем информации WWW (по некоторым оценкам по экспоненциальному закону) порождает проблему поиска релевантной информации по запросу пользователя. пользователь web релевантный информация Классические методы поиска информации в сети Интернет используют поисковые машины (ПМ). Поисковая машина представляет собой сложную систему, состоящую из следующих компонентов:
cистемы автоматического анализа (индексации) Интернет — страниц;
базы данных для хранения информации об этих страницах;
Web интерфейса, с помощью которого пользователь вводит поисковый запрос;
системы анализа запроса и поиска соответствующего запросу (релевантного) документа в базе данных поисковых образов;
системы ранжирования найденных документов с учетом пользовательских оценок.
Как правило, большинство пользователей просматривает не более 15−20 первых найденных поисковой системой документов. Поэтому крайне важно, чтобы в это число попали документы, релевантные его запросу. Системы ранжирования различных поисковых систем могут значительно различаться и строятся таким образом, чтобы удовлетворить информационные потребности максимального количества пользователей, при этом им приходится противодействовать недобросовестным рекламодателям, которые пытаются с помощью некорректных технических методов добиться неоправданно высокой оценки своих Интернет ресурсов.