Состязательный поиск информации ( состязательный IR ) — это тема в поиске информации , связанная со стратегиями работы с источником данных, часть которого была злонамеренно изменена. Задачи могут включать сбор, индексацию, фильтрацию, извлечение и ранжирование информации из такого источника данных. Состязательный IR включает изучение методов обнаружения, изоляции и отражения таких манипуляций.
В Интернете преобладающей формой такой манипуляции является спам в поисковых системах (также известный как спамдексинг), который включает в себя использование различных методов для нарушения работы поисковых систем , как правило, с целью получения финансовой выгоды. Примерами спамдексинга являются бомбардировка ссылками , спам в комментариях или реферерах , спам-блоги (сплоги), вредоносные теги. Обратное проектирование алгоритмов ранжирования , мошенничество с кликами [ 1] и фильтрация веб-контента также могут считаться формами состязательной манипуляции данными . [2]
Темы, связанные с веб-спамом (спамдексинг):
Другие темы:
Термин «конкурентный поиск информации» был впервые введен в оборот в 2000 году Андреем Бродером (тогда главным научным сотрудником Alta Vista ) во время веб-пленарного заседания на конференции TREC -9. [3]