Контент -ферма или контент-мельница — это компания, которая нанимает внештатных создателей или использует автоматизированные инструменты для создания большого количества веб- контента , который специально разработан для удовлетворения алгоритмов максимального извлечения поисковыми системами , известных как SEO ( поисковая оптимизация ). Их главная цель — получение дохода от рекламы путем привлечения просмотров страниц , [1] как впервые было выявлено в контексте социального спама . [2]
Было обнаружено, что текстовые статьи в контент-фермах содержат идентичные отрывки в нескольких источниках СМИ, что приводит к вопросам о том, что сайт ставит цели SEO выше фактической релевантности. [3] Сторонники контент-ферм утверждают, что с точки зрения бизнеса традиционная журналистика неэффективна. [1] Контент-фермы часто заказывают работу своих авторов на основе анализа поисковых запросов, которые сторонники представляют как «истинный рыночный спрос», функция, которая якобы отсутствует в традиционной журналистике . [1]
Некоторые сайты, обозначенные как контент-фермы, могут содержать множество статей и оцениваться в миллионы долларов. В 2009 году журнал Wired написал, что, по словам основателя и генерального директора Demand Media (включая eHow ) Ричарда Розенблатта , «к следующему лету Demand будет публиковать один миллион статей в месяц, что эквивалентно четырем англоязычным Википедиям в год». [4] Другой сайт, Associated Content, был куплен в мае 2010 года Yahoo! за 90 миллионов долларов. [5] Однако этот новый сайт, который был переименован в Yahoo! Voices , был закрыт в 2014 году. [6]
Шкала оплаты за контент низкая по сравнению с традиционными зарплатами, которые получают авторы. Одна компания платила авторам по ставке 3,50 доллара за статью. Такие ставки существенно ниже, чем может получать типичный автор, работающий в основных онлайн-изданиях; однако некоторые авторы контент-ферм выпускают много статей в день и могут зарабатывать достаточно для жизни. Было замечено, что авторами контента в основном являются женщины с детьми, студенты факультета английского языка или студенты факультета журналистики, ищущие дополнительный доход, работая дома. [7]
С момента появления и популярности больших языковых моделей контент-фермы начали использовать инструменты искусственного интеллекта , такие как ChatGPT, для автоматического создания контента без необходимости участия людей-авторов или контроля. [8] Отчет, опубликованный новостной рейтинговой фирмой NewsGuard, выявил более 141 всемирно признанного бренда, которые поддерживали контент-фермы ИИ, многие из которых выпускали сотни статей в день. [9] Было обнаружено, что сотни компаний из списка Fortune 500 размещали рекламу на этих контент-фермах, причем более 90 процентов рекламы обслуживалось Google Ads . [9]
Критики утверждают, что контент-фермы предоставляют относительно низкокачественный контент [10] и что они максимизируют прибыль, производя «достаточно хороший» материал, а не высококачественные статьи. [11] Статьи, написанные людьми (а не автоматизированными методами), часто не пишутся специалистами по освещаемым темам. Некоторые авторы, работающие на сайтах, идентифицированных как контент-фермы, признались, что мало знают о областях, в которых они освещают. [12]
Поисковые системы рассматривают контент-фермы как проблему, поскольку они, как правило, приводят пользователя к менее релевантным и низкокачественным результатам поиска. [13] [14] Низкое качество и быстрое создание статей на таких сайтах вызвали сравнения с индустрией быстрого питания [15] и загрязнением окружающей среды:
Потребители информации в итоге получают менее релевантные или ценные ресурсы. Производители релевантных ресурсов получают меньше денег в качестве вознаграждения (более низкий рейтинг кликов), в то время как производители мусора получают больше денег. Один из способов описать это как загрязнение. Виртуальный мусор загрязняет веб-среду, добавляя шум. Все, кроме загрязнителей, платят цену за загрязнение веб-среды: поисковые системы работают хуже, пользователи тратят драгоценное время и внимание на мусорные сайты, а честные издатели теряют доход. Загрязнитель портит веб-среду для всех остальных.
— Маркинес, Бенджамин; Каттуто, Чиро; Менцер, Филиппо, «Обнаружение социального спама» [2]
Контент, создаваемый этими системами, не только «не требует больших усилий», но эти пути также используются для распространения дезинформации. Например, теории заговора относительно COVID-19 распространялись контент-фермами, поощряя вовлеченность путем подпитки массовой паранойи. Веб-сайты, продвигающие эти идеи, часто также скрывают личности тех, кто принимает решения о редактировании, что еще больше затрудняет определение повестки дня. [16]
Контент-фермы также подвергаются критике за то, что они являются источником поддельных рекламных показов [17], формы рекламного мошенничества , которая отнимает несправедливую долю доступных рекламных расходов у законных издателей. [18]
В одном из рекламных видеороликов Google для поиска, опубликованном летом 2010 года, сообщалось, что большинство доступных ссылок были созданы на фермах контента. [19] В конце февраля 2011 года Google объявил, что он значительно корректирует алгоритмы поиска , чтобы «обеспечить лучшие рейтинги для высококачественных сайтов — сайтов с оригинальным контентом и информацией, такой как исследования, подробные отчеты, вдумчивый анализ и т. д.». [20] Сообщалось, что это было реакцией на фермы контента и попыткой снизить их эффективность в манипулировании рейтингами результатов поиска. [21]
Габриэль Вайнберг, создатель поисковой системы DuckDuckGo, ориентированной на конфиденциальность , сообщил, что его поисковая система прилагает усилия для блокировки контента с контент-ферм. [22]
С момента своего появления в сети в 2011 году контент-фермы пока не получили особого внимания со стороны исследовательского сообщества. Модель найма недорогих фрилансеров для производства контента посредственного или сомнительного качества впервые обсуждалась как альтернативная стратегия автоматической генерации фейкового контента; это обсуждалось вместе с примером инфраструктуры, необходимой для того, чтобы сделать сайты на основе контент-ферм прибыльными за счет онлайн-рекламы, а также методами обнаружения социального спама, который продвигает такой контент. [2]
Хотя это и не мотивировано явно контент-фермами, в последнее время появился интерес к автоматической категоризации веб-сайтов в соответствии с качеством их контента. [23] [24] Детальное исследование применения этих методов для идентификации страниц контент-ферм еще предстоит провести. [ необходима цитата ]