stringtranslate.com

Состязательный поиск информации

Состязательный поиск информации ( состязательный IR ) — это тема в поиске информации , связанная со стратегиями работы с источником данных, часть которого была злонамеренно изменена. Задачи могут включать сбор, индексацию, фильтрацию, извлечение и ранжирование информации из такого источника данных. Состязательный IR включает изучение методов обнаружения, изоляции и отражения таких манипуляций.

В Интернете преобладающей формой такой манипуляции является спам в поисковых системах (также известный как спамдексинг), который включает в себя использование различных методов для нарушения работы поисковых систем , как правило, с целью получения финансовой выгоды. Примерами спамдексинга являются бомбардировка ссылками , спам в комментариях или реферерах , спам-блоги (сплоги), вредоносные теги. Обратное проектирование алгоритмов ранжирования , мошенничество с кликами [ 1] и фильтрация веб-контента также могут считаться формами состязательной манипуляции данными . [2]

Темы

Темы, связанные с веб-спамом (спамдексинг):

Другие темы:

История

Термин «конкурентный поиск информации» был впервые введен в оборот в 2000 году Андреем Бродером (тогда главным научным сотрудником Alta Vista ) во время веб-пленарного заседания на конференции TREC -9. [3]

Смотрите также

Ссылки

  1. ^ Янсен, Б. Дж. (2007) Клик-фрод. IEEE Computer. 40(7), 85-86.
  2. ^ Б. Дэвисон, М. Наджорк и Т. Конверс (2006), Отчет о рабочем листе SIGIR: состязательный поиск информации в Интернете (AIRWeb 2006)
  3. ^ Д. Хокинг и Н. Красвелл (2004), Очень большой поиск и веб-поиск (препринтная версия) Архивировано 29 августа 2007 г. на Wayback Machine

Внешние ссылки