stringtranslate.com

Академические исследования о Википедии

Википедия была тщательно изучена. В период с 2001 по 2010 год исследователи опубликовали не менее 1746 рецензируемых статей об этой онлайн-энциклопедии. [1] Такие исследования значительно облегчаются тем фактом, что базу данных Википедии можно загрузить без помощи владельца сайта. [2]

Темы исследований включают надежность энциклопедии и различные формы системной предвзятости ; социальные аспекты сообщества Википедии (включая администрирование, политику и демографию); энциклопедия как набор данных для машинного обучения; а также могут ли тенденции Википедии предсказывать или влиять на поведение человека.

Среди примечательных результатов можно отметить фактическую точность, аналогичную другим энциклопедиям, наличие культурной и гендерной предвзятости , а также пробелы в освещении глобального Юга ; тот факт, что незначительное меньшинство редакторов создает большую часть контента; различные модели понимания онлайн-конфликтов; и ограниченную корреляцию между тенденциями Википедии и различными явлениями, такими как движения на фондовом рынке или результаты выборов.

Содержание

Производство

Меньшинство редакторов создают большую часть постоянного контента

Исследования, проведенные в 2005–2007 годах, показали, что небольшое меньшинство редакторов вносит большую часть правок в Википедию, и что распределение правок следует степенному закону , при этом около половины всех правок вносят 1% редакторов. Другое исследование 2007 года показало, что «элитные» редакторы с большим количеством правок вносят 30% изменений контента, измеряемых в количестве слов. Эти редакторы также чаще добавляли, а не удаляли контент. [3]

Исследование 2007 года, проведенное в Университете Миннесоты, использовало основанные на читателях меры, которые взвешивали контент на основе количества просмотров ( постоянный просмотр слова ( PWV )). Это исследование проанализировало триллионы просмотров слова в период с сентября 2002 года по октябрь 2006 года и пришло к выводу, что 0,1% сообщества Википедии (4200 редакторов) произвели 44% просмотров слова за это время. Редакторы пришли к выводу, что, [3]

Рост доли PWV увеличивается сверхэкспоненциально по мере увеличения рейтинга количества правок; другими словами, элитные редакторы (те, кто редактирует больше всего раз) приносят большую пользу, чем при степенной зависимости.

Исследование 2009 года показало, что один процент редакторов, которые в среднем вносят более 1000 правок в месяц, вносят 55% правок. [4]

Распределение труда и социальные слои

В рецензируемой статье отмечено « социальное расслоение в сообществе Википедии» из-за «класса администраторов». В статье предполагалось, что такое расслоение может быть полезным в некоторых отношениях, но признавалось «явное последующее смещение власти между уровнями стратификации» из-за «статусных и властных различий» между администраторами и другими редакторами. [5]

Анализируя всю историю правок английской Википедии до июля 2006 года, то же исследование определило, что влияние правок администраторов на контент неуклонно снижалось с 2003 года, когда администраторы выполнили примерно 50% от общего числа правок, до 2006 года, когда только 10% правок были выполнены администраторами. Это произошло несмотря на то, что среднее количество правок на администратора увеличилось более чем в пять раз за тот же период. Это явление было названо авторами статьи «ростом толпы». Анализ, который использовал в качестве метрики количество отредактированных слов вместо количества действий по редактированию, показал похожую картину. Поскольку класс администраторов несколько произволен по отношению к количеству правок, исследование также рассматривало разбивку пользователей по категориям на основе количества выполненных правок. Результаты для «элитных пользователей», то есть пользователей с более чем 10 000 правок, в некоторой степени соответствовали результатам, полученным для администраторов, за исключением того, что «количество слов, измененных элитными пользователями, соответствовало изменениям, внесенным новичками, хотя количество правок, внесенных новичками, росло пропорционально быстрее». Исследование заключает:

Таким образом, хотя их влияние, возможно, и ослабло в последние годы, элитные пользователи, похоже, продолжают вносить значительный вклад в работу, проделанную в Википедии. Более того, ... правки, сделанные элитными пользователями, кажутся существенными по своей природе. То есть, они, похоже, делают больше, чем просто исправляют орфографические ошибки или переформатируют цитаты

Надежность

В докладе конференции Argumentation (2010) оценивалось, основано ли доверие к Википедии на эпистемических или прагматических достоинствах. Хотя читатели не могут оценить фактические знания и опыт авторов данной статьи, они могут оценить страсть участников к проекту и коммуникативный дизайн, посредством которого эта страсть проявляется, и предоставить причину для доверия. [6]

В деталях автор утверждал, что Википедии нельзя доверять на основе индивидуальной экспертизы, коллективных знаний или прошлого опыта надежности. Это связано с тем, что анонимность и псевдонимность препятствуют оценке знаний, а « антиэкспертная культура » делает маловероятным, что это изменится. Редактирование Википедии может в значительной степени ограничиваться элитной группой редакторов, без объединения « мудрости толпы », что в некоторых случаях в любом случае снижает качество статьи. Личный опыт и эмпирические исследования, подтвержденные инцидентами, включая споры о биографии Зайгенталера , указывают на вывод, что Википедия в целом ненадежна. Следовательно, эти эпистемические факторы не оправдывают обращение к Википедии.

Затем автор предложил обоснование доверия к Википедии, основанное на прагматических ценностях, которые можно грубо свести к двум факторам. Во-первых, размер и активность вокруг Википедии указывают на то, что редакторы глубоко привержены идее предоставления миру знаний. Во-вторых, прозрачное развитие политик, практик, институтов и технологий в дополнение к заметным масштабным усилиям устраняет возможные опасения, которые могут возникнуть при доверии к Википедии. Высказанные опасения включают определение предоставляемых знаний, предотвращение искаженных вкладов от людей, не разделяющих тех же обязательств, исправление ущерба от редактирования и контроль качества статей и улучшение.

Информация о здоровье

Информация о здоровье в английской Википедии обычно доступна в виде результатов поисковых систем и страницы результатов поисковой системы , которые часто предоставляют ссылки на статьи Википедии. [7] Были проведены независимые оценки качества информации о здоровье, представленной в Википедии, и того, кто получает доступ к этой информации. Были изучены количество и демографические данные людей, которые ищут информацию о здоровье в Википедии, объем информации о здоровье в Википедии и качество информации в Википедии. [8] Существуют недостатки в использовании Википедии в качестве источника информации о здоровье. [ необходимо дополнительное объяснение ]

Предвзятость

Исследования последовательно показывают, что Википедия систематически переоценивает точку зрения (POV), принадлежащую определенной демографической группе, описываемой как «среднестатистический Википедист», который является образованным, технически подкованным, англоговорящим белым мужчиной в возрасте 15–49 лет из развитой христианской страны в северном полушарии. [9] Эта точка зрения переоценена по отношению ко всем существующим точкам зрения. [10] [11] Эта системная предвзятость в демографической группе редакторов приводит к культурной предвзятости, гендерной предвзятости и отсутствию информации о глобальном Юге . [12] [13]

Существует два основных типа предвзятости: неявная (когда тема опущена) и явная (когда определенная точка зрения поддерживается в статье или ссылками). [10]

Междисциплинарные научные оценки статей Википедии показали, что, хотя статьи, как правило, точны и свободны от дезинформации, они также, как правило, неполны и не представляют все точки зрения с нейтральной точки зрения. [12]

Исследователи из Университета Вашингтона в Сент-Луисе разработали статистическую модель для измерения систематической предвзятости в поведении пользователей Википедии относительно спорных тем. Авторы сосредоточились на поведенческих изменениях администраторов энциклопедии после вступления в должность, написав, что систематическая предвзятость возникла постфактум. [14] [15]

Географическая предвзятость

Исследование, проведенное в 2009 году Оксфордским институтом Интернета, показало, что геотегированные статьи во всех языковых изданиях Википедии охватывают около полумиллиона мест на Земле. Однако географическое распределение статей было крайне неравномерным: большинство статей написано о Северной Америке, Европе и Восточной Азии, с очень небольшим охватом больших частей развивающегося мира, включая большую часть Африки. [16]

Другое исследование 15 языковых изданий, проведенное в 2009 году, показало, что каждое издание было в высокой степени «самофокусированным», с акцентом на географическом «родном регионе» данного языка. [17]

Гендерная предвзятость

Гендерная предвзятость в Википедии широко обсуждалась. [4] Опрос 2010 года показал, что только 13% редакторов и 31% читателей были женщинами. [4] В статье 2017 года подтверждается, что только 15% редакторского сообщества составляют женщины. [10]

Исследование, проведенное Франческой Триподи в 2021 году, показало, что из примерно 1,5 миллионов биографических статей в английской Википедии в 2021 году только 19 % были о женщинах. [18] [19] Исследование показало, что существующие биографии значительно чаще номинируются на удаление, чем существующие статьи о мужчинах. [18] [19]

Борьба с предвзятостью

Некоторые исследования изучали работу WikiProject Countering Systemic Bias ( WP:CSB ), [20] которая является коллективным усилием некоторых редакторов Википедии по расширению точки зрения энциклопедии. Исследование 2010 года 329 редакторов, участвующих в WP:CSB, показало, что работа этих редакторов отдавала предпочтение темам, относящимся к Соединенным Штатам и Англии, и что «области земного шара, представляющие основной интерес для WP:CSB, оказались гораздо менее представленными самой коалицией». [9]

В статье 2021 года рекомендовалось рассмотреть «золотую середину» в рамках предвзятости энциклопедии, где существующая наука включает надежные, рецензируемые источники, которые предлагают более полную точку зрения, чем существующие статьи Википедии. Исследование показало, что включение этих источников обеспечит лучшее представление для исключенных или маргинализированных точек зрения, и что возможности для потенциального улучшения «огромны». [11]

Обработка естественного языка

Текстовое содержание и структурированная иерархия Википедии стали важным источником знаний для исследователей в области обработки естественного языка и искусственного интеллекта . В 2007 году исследователи из Техниона – Израильского технологического института разработали методику под названием «Явный семантический анализ» [21] , которая использует мировые знания, содержащиеся в англоязычных статьях Википедии. Концептуальные представления слов и текстов создаются автоматически и используются для вычисления сходства между словами и между текстами.

Исследователи из Ubiquitous Knowledge Processing Lab используют лингвистические и мировые знания, закодированные в Википедии и Викисловаре, для автоматического создания баз лингвистических знаний, которые похожи на ресурсы, созданные экспертами, такие как WordNet . [22] Штрубе и Понзетто создали алгоритм для определения связей между словами, просматривая англоязычную Википедию через ее схему категоризации, и пришли к выводу, что Википедия создала «таксономию, способную конкурировать с WordNet в задачах лингвистической обработки». [23]

Социальные аспекты

Конфликт

Исследование 2011 года сообщило о новом способе измерения степени спорности статьи в Википедии, который был проверен по шести изданиям на индоевропейских языках, включая английский . [24] [ необходимо разъяснение ]

В статье 2013 года в Physical Review Letters была представлена ​​общая модель социальной динамики в среде сотрудничества, включающая мнения, конфликты и консенсус, с конкретным аналогом Википедии: «мирная статья может внезапно стать спорной, когда больше людей вовлекаются в ее редактирование». [25] [ необходимо разъяснение ]

В 2014 году опубликована глава книги под названием «Самые противоречивые темы в Википедии: многоязычный и географический анализ»: проанализирован объем редактирования статей в различных языковых версиях Википедии с целью установления наиболее противоречивых тем в разных языках и группах языков. Для английской версии тремя наиболее противоречивыми статьями были Джордж Буш-младший , Анархизм и Мухаммед . Темами на других языках, вызывающими наибольшее количество споров, были Хорватия (немецкий), Сеголен Руаяль (французский), Чили (испанский) и Гомосексуализм (чешский). [26]

Демография

Исследование Hitwise 2007 года , воспроизведенное в журнале Time , [27] показало, что посетители Википедии почти поровну разделены на мужчин и женщин, но 60% правок вносятся редакторами-мужчинами. Опрос 2010 года показал, что только 13% редакторов и 31% читателей были женщинами. [4] В статье 2017 года подтверждено, что только 15% сообщества редакторов составляют женщины. [10]

Исследование 2012 года, охватывающее 32 языковых издания, проанализировало циркадную активность редакторов и пришло к выводу, что доли вкладов в английскую Википедию из Северной Америки и Европы-Дальнего Востока-Австралии почти равны, тогда как для упрощенной английской Википедии эта доля увеличивается до 75% . Исследование также охватывает некоторые другие демографические анализы других изданий на разных языках. [28]

Политики и рекомендации

Описательное исследование [29] , в котором анализировались политика и рекомендации англоязычной Википедии по состоянию на сентябрь 2007 года, выявило ряд ключевых статистических данных:

Даже такая короткая политика, как «игнорировать все правила», вызвала массу обсуждений и разъяснений:

Хотя сама политика «Игнорировать все правила» состоит всего из шестнадцати слов, страница, поясняющая ее смысл, содержит более 500 слов, отсылает читателей к семи другим документам, вызвала более 8000 слов обсуждения и была изменена более 100 раз менее чем за год.

В исследовании рассматривалось расширение некоторых ключевых политик с момента их создания:

Однако число «удалений» было сочтено неокончательным, поскольку политика была разделена на несколько подполитик.

Силовые игры

Совместное рецензируемое исследование 2007 года [30], проведенное исследователями из Вашингтонского университета и HP Labs, изучало, как применяются политики и как участники работают над достижением консенсуса, количественно анализируя выборку активных страниц обсуждений. Используя дамп базы данных английской Википедии за ноябрь 2006 года , исследование сосредоточилось на 250 страницах обсуждений в хвосте распределения: 0,3% всех страниц обсуждений, но содержащих 28,4% всех изменений страниц обсуждений и, что более важно, содержащих 51,1% всех ссылок на политики. Из историй выборки страниц исследование изучало только месяцы с высокой активностью, называемые критическими разделами — наборы последовательных месяцев, когда и изменения статей, и изменения страниц обсуждений были значительными по количеству.

Исследование определило и рассчитало меру распространенности политики. Критический раздел считался политически нагруженным, если его фактор политики был по крайней мере в два раза выше среднего. Статьи были помечены 3 переменными-индикаторами :

Все возможные уровни этих трех факторов дали 8 категорий выборки. Исследование намеревалось проанализировать 9 критических разделов из каждой категории выборки, но удалось выбрать только 69 критических разделов, поскольку только 6 статей (историй) были одновременно представлены, противоречивы и политически нагружены.

Исследование показало, что политика никоим образом не применялась последовательно. Иллюстрируя более широкие выводы, отчет представил следующие два отрывка из страниц обсуждения Википедии в явном контрасте:

среднее значение ... не считается оригинальным исследованием? [U3]
Мне так не кажется, похоже, что оригинальное исследование было проведено [правительственным агентством] или я что-то упускаю? [U4]
Если [правительственное агентство] не опубликовало фактическое среднее значение, мы "вычисляем" его, это было бы ИЛИ, не так ли? Я не уверен. [U3]
Нет, почему бы это было? Экстраполяция данных из уже имеющейся информации не является ИЛИ. [U5]
Из WP:NOR "статьи не могут содержать никакого нового анализа или синтеза опубликованных аргументов, концепций, данных, идей или утверждений, которые служат для продвижения позиции". Ради чего стоит [U4]

Ваше представление — WP:OR. Я могу легко предоставить ... научную статью, в которой говорится, что антиавторитаризм не является центральным для панизма. Вы синтезируете здесь всевозможные идеи, основываясь на своей точке зрения. [U6]
Простое дедуктивное рассуждение не является оригинальным исследованием. Панизм по своей сути антиавторитарен; следовательно, авторитарная экономическая система не может быть панистской. С чем вы не согласны: с предпосылкой или с выводом? [U7]

Утверждая, что такие двусмысленности легко приводят к властным играм, исследование выявило, используя методы обоснованной теории (Штраус) , 7 типов властных игр:

Из-за нехватки места в исследовании подробно описаны только первые 4 типа силовых игр, которые осуществлялись путем простой интерпретации политики. Была проанализирована пятая категория силовых игр; она состояла из вопиющих нарушений политики, которые прощались, поскольку вкладчик ценился за свой вклад, несмотря на его неуважение к правилам.

Область применения статьи

Исследование считает, что политика Википедии неоднозначна в вопросах определения области действия. Следующая виньетка используется для иллюстрации этого утверждения:

консенсус — это чушь, потому что на моей стороне факты. Я также призываю Википедию быть смелым... удаление обсуждения взгляда католической церкви на палеоцентризм не только неточно, но и нарушает WP:NPOV  ... Удаление/выхолащивание его нарушит несколько политик Википедии: NPOV, будьте смелыми... Если вы все хотите статью только о научной теории палеоцентризма, напишите ее сами. [U12]
Мы ДЕЙСТВИТЕЛЬНО написали статью только о научной теории палеоцентризма до того, как вы появились... Вы, очевидно, здесь новичок, [U12]... спорить, основываясь на вашем прочтении NPOV и Be bold, немного смешно, как будто ребенок, только что окончивший среднюю школу, спорит о конституционном праве. Это принципы, которые имеют устоявшееся значение. Люди, которые здесь уже много лет, понимают их гораздо лучше, чем вы. Они не окажутся эффективным оружием для вас в этом споре ... [U13]
Социальное воздействие «палеоцентризма» не является «палеоцентризмом» ... Wikipedia:wiki - это не бумага, нам не нужно втискивать каждый третичный аспект темы в статью, и нам не нужно считать ее неполной, если мы этого не ... [U14]
 ... первое, что говорится в ссылке Wikipedia:wiki - это не бумага, это: ««Википедия» - это «энциклопедия».» Настоящая энциклопедия, такая как Encyclopædia Britannica, имеет фантастический раздел о палеоцентризме, включая все социальные, политические и философские аспекты. [U12]
Как обсуждалось в Wikipedia:wiki - это не бумага, статьи Википедии должны давать краткий обзор важнейших аспектов предмета. Для биолога вроде вас центральным аспектом палеоцентризма, конечно, не являются его социальные последствия, но для остального общества это так.[U12]
 ... То, о чем вы говорите, не является «палеоцентризмом». Центральными вопросами палеоцентризма являются периодическое равновесие, геоморфная волнистость, аэрация. Это вопросы, которые на самом деле связаны с самим процессом палеоцентризма. Эти «социальные аспекты», о которых вы говорите, являются «периферийными», «не центральными». Они «о» палеоцентризме, они «окружают» палеоцентризм, но они «не являются палеоцентризмом» [U15]

В исследовании дается следующая интерпретация жарких дебатов:

Такие битвы за объем статьи происходят даже в гиперссылочной среде, поскольку название статьи имеет значение. Статья о «палеоцентризме» более престижна и, кроме того, с ней чаще сталкивался читатель, чем со статьей под названием «социальный эффект палеоцентризма».

Предварительный консенсус

Исследование отмечает, что в Википедии консенсус никогда не бывает окончательным, и то, что составляет консенсус, может измениться в любой момент. Исследование обнаруживает, что эта временная двусмысленность является плодородной почвой для силовых игр, и помещает борьбу поколений за консенсус в более широкую картину борьбы за право собственности на статью:

На практике ... часто существуют фактические владельцы страниц или коалиции участников, которые определяют содержание статьи. Предварительный консенсус внутри этой группы может быть представлен как неоспоримый, маскируя силовые игры, которые могли быть использованы для установления консенсуса. ... Под вопросом находится легитимность предыдущего консенсуса. Давние участники не хотят тратить время на споры о проблемах, которые они считают решенными. Указание на предыдущий консенсус, как и ссылки на политики, дает метод борьбы с троллинговым поведением. С другой стороны, новички или маргинальные участники часто чувствуют, что их точки зрения не были представлены в предыдущих спорах, и хотят снова поднять этот вопрос.

В исследовании используется следующий фрагмент обсуждения для иллюстрации этой непрерывной борьбы:

Почти все, что [U17] описывает ниже, уже было обсуждено... Это как игра в «бей крота»: они пробуют одну точку зрения, ее опровергают; они пробуют вторую точку зрения, ее опровергают; они пробуют третью точку зрения, ее опровергают; а затем они снова пробуют первую точку зрения. [U18]
Было бы интересно посмотреть, сколько разных пользователей попытаются внести свой вклад в эту статью и расширить альтернативные взгляды, только чтобы их запугали те, кто свято верит в [Космическую полярность]... почему бы вам не подумать о том, что, возможно, они правы, и что [U19], [U20] и все остальные из вас отпугивают редакторов от этой статьи своим деспотичным, админским навязыванием точки зрения? [U21]

Сила интерпретации

Виньетка иллюстрирует, как администраторы перекрыли консенсус и удалили личные аккаунты пользователей/пациентов с анонимным заболеванием (названным в исследовании фрупизмом). Вмешательство администратора произошло, когда статья была номинирована на роль избранной статьи.

Легитимность вкладчика

Этот тип силовой игры проиллюстрирован участником (U24), который ссылается на свои прошлые вклады, чтобы возразить другому участнику, обвиняющему U24 в непродуктивности и подрывной деятельности:

О, ты имеешь в виду, что "я" слоняюсь здесь, чтобы высказать свое мнение о низком качестве Википедии? Пожалуйста, еще раз взгляните на количество моих правок!! LOL. У меня более 7000 правок... Как ты знаешь, я могу поставить себе в заслугу то, что почти полностью написал с нуля 2 из 6 или 7 FA по философии [U24]

Явная борьба за право собственности

Исследование показало, что есть участники, которые постоянно и успешно нарушают политику без каких-либо санкций:

U24 делает несколько откровенных «мы или они» соперничают за власть: если действия U25 продолжатся, он уйдет. ... Такие действия явно нарушают политику в отношении права собственности на статьи, вежливости по отношению к другим участникам и обращения с новичками. Как новичок, U25 может не знать об этой политике, но U26, безусловно, знает. Добровольная слепота [U26] проистекает из того факта, что U24 является ценным участником философских статей и не стесняется указывать на это. Существует дефицит участников, которые привержены постоянному созданию высококачественного контента; сообщество Википедии готово терпеть оскорбления и нарушения политики, если выполняется ценная работа.

При всем уважении, это не ответ на вопрос... Я хотел узнать, что именно в предложении U25 было неприемлемым. ... Его отсутствие ссылок и т. д. - это, конечно, недостаток, но именно поэтому я его и предоставил (Расследование, раздел 8). [U26]
 ... этот момент уже рассмотрен в статье... Возможно, его нужно немного расширить. Я могу легко сделать это сам, когда у меня будет время... Есть что-нибудь еще? Поддерживаете ли вы также точку зрения U25 о том, что статья "плохая", то есть ее нужно пересмотреть сверху донизу, бессмысленную чушь, которую он на самом деле пытался вставить выше, или другое ИЛИ, которое он заявил на этой странице? По сути, есть две стороны по этому вопросу: эту статью могут захватить чудаки вроде как его зовут, или нет? Если это так, я ухожу. Вы можете либо поддержать меня, либо нет. Какую позицию занимаете вы? ... [U24]
Я ни при каких обстоятельствах не поддерживаю точку зрения о том, что статья плохая. На самом деле, я не согласен со многими вещами, которые U25 сказал в других местах на этой странице... Мне искренне жаль, если это вас расстроило. [U26]

Получение административного права

В 2008 году исследователи из Университета Карнеги — Меллона разработали пробит-модель редакторов английской Википедии , которые успешно прошли процесс рецензирования, чтобы стать администраторами . [31] Используя только метаданные Википедии, включая текст резюме правок, их модель с точностью 74,8% предсказала успешных кандидатов.

В статье отмечается, что, несмотря на протесты против этого, «во многих отношениях избрание на должность администратора является повышением по службе, отличающим элитную основную группу от большой массы редакторов». Соответственно, в статье использовался метод захвата политики [32] — метод, который сравнивает номинально важные атрибуты с теми, которые фактически ведут к повышению по службе в рабочей среде.

Общий уровень успешности продвижения по службе снизился с 75% в 2005 году до 53% в 2006 году и до 42% в 2007 году. Этот внезапный рост уровня неудач был приписан более высокому стандарту, которому должны были соответствовать недавно повышенные администраторы, и подкреплен анекдотическими свидетельствами из другого недавнего исследования [33], цитирующего некоторых ранних администраторов, которые выразили сомнение, что они прошли бы проверку, если бы их выборы (RfA) состоялись недавно. В свете этих событий исследование утверждало, что:

Процесс, который основатель Википедии когда-то называл «ничего особенного», превратился в довольно важное дело.

Вопреки ожиданиям, «баллотирование» на должность администратора несколько раз пагубно влияет на шансы кандидата на успех. Каждая последующая попытка имеет на 14,8% меньшие шансы на успех, чем предыдущая. Длительность участия в проекте вносит лишь небольшой вклад в шансы на успешный RfA.

Другим важным выводом статьи является то, что одно изменение политики Википедии или изменение WikiProject стоит десяти изменений статьи. Связанное с этим наблюдение заключается в том, что кандидаты с опытом в нескольких областях сайта имели больше шансов на избрание. Это измерялось с помощью оценки разнообразия , простого подсчета количества областей, в которых редактор принимал участие. Статья разделила Википедию на 16 областей: статья, обсуждение статьи, статьи/категории/шаблоны для удаления (XfD), обзор (не)удаления и т. д. (полный список см. в статье) . Например, пользователь, который редактировал статьи, свою собственную страницу пользователя и разместил один пост на обзоре (не)удаления, будет иметь оценку разнообразия 3. Внесение одной правки в любой дополнительной области Википедии коррелировало с 2,8%-ным повышением вероятности успеха в получении административной должности.

Внесение незначительных правок также помогло, хотя авторы исследования считают, что это может быть так, поскольку незначительные правки коррелируют с опытом. Напротив, каждое изменение на странице арбитражного или посреднического комитета или уведомления Wikiquette , которые являются площадками для разрешения споров, снижает вероятность успеха на 0,1%. Размещение сообщений на досках объявлений администраторов имело аналогичный пагубный эффект. Исследование интерпретировало это как доказательство того, что редакторы, вовлеченные в эскалацию или затягивание конфликтов, снижают свои шансы стать администраторами.

Выражение «спасибо» или его вариации в резюме редактирования, а также указание на проблемы с точкой зрения («POV») (также только в резюме редактирования, поскольку исследование анализировало только метаданные) имели незначительную пользу, повысив шансы кандидата на победу в 2006–2007 годах на 0,3% и 0,1%, но ранее не достигали статистической значимости.

Несколько факторов, которые оказались в лучшем случае несущественными или незначительными:

Исследование предполагает, что часть из 25% необъяснимой изменчивости результатов может быть обусловлена ​​факторами, которые не были измерены, такими как качество редактирования или участие в координации за пределами сайта, например, (явно цитируемый) секретный список рассылки, о котором сообщалось в The Register . [35] В статье делается следующий вывод:

Простого выполнения большого объема производственной работы недостаточно для «продвижения» в Википедии. Редактирование статей кандидатами было слабым предиктором успеха. Они также должны были продемонстрировать больше управленческого поведения. Разнообразный опыт и вклад в разработку политик и WikiProjects были более сильными предикторами успеха RfA. Это согласуется с выводами о том, что Википедия является бюрократией [29] и что работа по координации существенно возросла. [36] [37]  ... Участие в политике Википедии и WikiProjects не было предиктором администрирования до 2006 года, что говорит о том, что сообщество в целом начинает отдавать приоритет разработке политики и организационному опыту по сравнению с простой координацией на уровне статей.

Последующее исследование другой группы [38] исследовало осмысленную деятельность отдельных лиц во время их вклада в решения RfA. Эта работа устанавливает, что решения о кандидатах RfA основаны на общей интерпретации доказательств в вики и истории предыдущих взаимодействий.

Читательская аудитория

Несколько исследований показали, что Википедию используют врачи, студенты, журналисты и ученые. [39] Одно исследование, проведенное в 2009 году, показало, что 70% молодых врачей еженедельно использовали Википедию для поиска медицинской информации, и в 26% случаев. [4]

По крайней мере одно исследование показало, что британцы доверяют Википедии больше, чем BBC. [39]

В образовании

Исследования показали, что Википедия является наиболее часто используемым открытым образовательным ресурсом в высшем образовании и в 2000 раз более рентабельна, чем печатные учебники. [39] Было обнаружено, что использование Википедии повышает интерес студентов к обучению, их вклад в свою работу, их обучение и личностное развитие, а также создает возможности для местного и международного сотрудничества. [40] [ необходимы дополнительные ссылки ]

Машинное обучение

Автоматизированное извлечение семантических знаний с использованием алгоритмов машинного обучения используется для «извлечения машинно-обрабатываемой информации при относительно низкой стоимости сложности». [41] DBpedia использует структурированный контент , извлеченный из информационных блоков статей Википедии на разных языках с помощью алгоритмов машинного обучения, для создания ресурса связанных данных в семантической паутине . [42]

Как предсказатель или фактор влияния на поведение человека

В исследовании, опубликованном в PLoS ONE [43], Таха Яссери из Оксфордского института Интернета и его коллеги из Центрально-Европейского университета показали, что статистика просмотров страниц статей о фильмах хорошо коррелирует с их кассовыми сборами. Они разработали математическую модель для прогнозирования кассовых сборов, анализируя количество просмотров страниц, а также количество правок и уникальных редакторов страниц Википедии о фильмах. Хотя эта модель была разработана для английской Википедии для фильмов, независимые от языка методы могут быть обобщены на другие языки и на другие виды продукции помимо фильмов. [44]

В работе, опубликованной в Scientific Reports в 2013 году, [45] Хелен Сюзанна Моат, Тобиас Прейс и коллеги продемонстрировали связь между изменениями в количестве просмотров статей английской Википедии, касающихся финансовых тем, и последующими крупными движениями на фондовом рынке США. [46] [47]

В статье, опубликованной в Public Opinion Quarterly [48] , Бенджамин К. Смит и Абель Густафон показали, что данные о просмотрах страниц Википедии могут улучшить традиционные методы прогнозирования выборов, такие как опросы.

В период с 2019 по 2021 год группа американских и ирландских исследователей провела рандомизированный полевой эксперимент, который показал, что создание статьи в Википедии о юридическом прецеденте увеличивает вероятность ее цитирования в последующих судебных решениях более чем на 20 %, а также что язык судебных решений перекликается с языком статей в Википедии. [49]

Смотрите также

Ссылки

  1. ^ Пак, Тэмин Ким (24 июля 2011 г.). «Видимость Википедии в научных публикациях». Первый понедельник . doi : 10.5210/fm.v16i8.3492 . hdl : 2022/21757 . ISSN  1396-0466. Архивировано из оригинала 17 октября 2022 г. . Получено 17 ноября 2022 г. .
  2. ^ S - tuckman, Jeff; Purtilo, James (2009). "Измерение викисферы". Труды 5-го Международного симпозиума по вики и открытому сотрудничеству . стр. 1. doi :10.1145/1641309.1641326. ISBN 978-1-60558-730-1. S2CID  17770818.
  3. ^ ab Priedhorsky, Reid; Chen, Jilin; Lam, Shyong (Tony) K.; Panciera, Katherine; Terveen, Loren; Riedl, John (4 ноября 2007 г.). "Создание, разрушение и восстановление ценности в Википедии". Труды международной конференции ACM 2007 г. по теме "Конференция по поддержке групповой работы - GROUP '07" . Нью-Йорк, штат Нью-Йорк, США: Ассоциация вычислительной техники. стр. 259–268. doi :10.1145/1316624.1316663. ISBN 978-1-59593-845-9. S2CID  15350808.
  4. ^ abcde Томпсон, Нил; Хэнли, Дуглас (13 февраля 2018 г.). «Наука формируется Википедией: доказательства из рандомизированного контрольного испытания». Рочестер, Нью-Йорк. doi : 10.2139/ssrn.3039505. S2CID  30918097. SSRN  3039505. Архивировано из оригинала 13 марта 2023 г. Получено 17 ноября 2022 г. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  5. ^ Чи, Эд; Киттур, Аникет; Пендлтон, Брайан А.; Су, Бонгвон и Миткович, Тодд (31 января 2007 г.). «Сила немногих против мудрости толпы: Википедия и подъем буржуазии» (PDF) . Конференция Computer/Human Interaction 2007 . Ассоциация вычислительной техники . S2CID  14770727. Архивировано из оригинала 13 марта 2023 г. . Получено 23 апреля 2017 г. .
  6. ^ Гудвин, Джин. (2010). Авторитет Википедии Архивировано 16 февраля 2016 года в Wayback Machine . В Juho Ritola (ред.), Культуры аргументации: Труды конференции Общества изучения аргументации Онтарио. Виндзор, Онтарио, Канада: Общество изучения аргументации Онтарио. CD-ROM. 24 стр.
  7. ^ Лоран, MR; Викерс, TJ (2009). «Поиск информации о здоровье в Интернете: имеет ли значение Википедия?». Журнал Американской ассоциации медицинской информатики . 16 (4): 471–479. doi :10.1197/jamia.M3059. PMC 2705249. PMID  19390105 . 
  8. ^ Хейлман, Дж. М.; Кемманн, Э; Бонерт, М; Чаттерджи, А; Рагар, Б; Бердс, генеральный менеджер; Иберри, диджей; Харви, М; Томас, Б; Стомп, Вт; Мартоне, МФ; Лодж, диджей; Вондрачек, А; де Вольф, Дж. Ф.; Либер, К; Гровер, Южная Каролина; Викерс, Ти Джей; Меско, Б; Лоран, MR (31 января 2011 г.). «Википедия: ключевой инструмент глобального укрепления общественного здравоохранения». Журнал медицинских интернет-исследований . 13 (1): е14. дои : 10.2196/jmir.1589 . ПМЦ 3221335 . ПМИД  21282098. 
  9. ^ ab Livingstone, Randall M. (23 ноября 2010 г.). «Оставим предвзятость основным СМИ: сообщество Википедии борется за информационный нейтралитет». M/C Journal . 13 (6). doi : 10.5204/mcj.315 . ISSN  1441-2616. Архивировано из оригинала 21 ноября 2022 г. Получено 23 ноября 2022 г.
  10. ^ abcd Hube, Christoph (3 апреля 2017 г.). «Предвзятость в Википедии». Труды 26-й Международной конференции по World Wide Web Companion - WWW '17 Companion . Республика и кантон Женева, CHE: Руководящий комитет Международной конференции World Wide Web. стр. 717–721. doi :10.1145/3041021.3053375. ISBN 978-1-4503-4914-7. S2CID  10472970.
  11. ^ ab Bjork-James, Carwil (3 июля 2021 г.). «Новые карты для инклюзивной Википедии: деколониальная наука и стратегии противодействия системной предвзятости». New Review of Hypermedia and Multimedia . 27 (3): 207–228. Bibcode : 2021NRvHM..27..207B. doi : 10.1080/13614568.2020.1865463. ISSN  1361-4568. S2CID  234286415. Архивировано из оригинала 21 ноября 2022 г. Получено 23 ноября 2022 г.
  12. ^ ab Ackerly, Brooke A.; Michelitch, Kristin (2022). «Википедия и политология: преодоление систематических предубеждений с помощью студенческих инициатив». PS: Политология и политика . 55 (2): 429–433. doi : 10.1017/S1049096521001463 . ISSN  1049-0965. S2CID  247795102.
  13. ^ Грэм, Марк (12 ноября 2009 г.). «Картографирование географии контента Википедии». Марк Грэм: Блог . ZeroGeography. Архивировано из оригинала 8 декабря 2009 г. Получено 16 ноября 2009 г.
  14. ^ Дас, Санмей; Аллен, Лавуа; Малик, Магдон-Исмаил (1 ноября 2013 г.). «Манипуляция среди арбитров коллективного разума: как администраторы Википедии формируют общественное мнение». Труды CIKM '13 22-й международной конференции ACM по управлению информацией и знаниями . Сан-Франциско: ACM. стр. 1097–1106. doi :10.1145/2505515.2505566. ISBN 978-1450322638.
  15. ^ Дас, Санмей; Аллен, Лавуа; Малик, Магдон-Исмаил (24 декабря 2016 г.). «Манипуляция среди арбитров коллективного разума: как администраторы Википедии формируют общественное мнение». ACM Transactions on the Web . 10 (4): 1–25. doi :10.1145/3001937. S2CID  12585047.
  16. ^ Грэм, Марк (12 ноября 2009 г.). «Картографирование географии контента Википедии». Марк Грэм: Блог . ZeroGeography. Архивировано из оригинала 8 декабря 2009 г. Получено 16 ноября 2009 г.
  17. ^ Каллахан, Эва С.; Херринг, Сьюзан К. (2011). «Культурная предвзятость в контенте Википедии об известных людях». Журнал Американского общества информационной науки и технологий . 62 (10): 1899–1915. doi :10.1002/asi.21577. ISSN  1532-2882. S2CID  14767483. Архивировано из оригинала 17 ноября 2022 г. . Получено 17 ноября 2022 г. .
  18. ^ ab Adams, Kimberly; Alvardo, Jesus (27 июля 2021 г.). «Почему биографиям о женщинах так сложно оставаться в Википедии». Торговая площадка . Архивировано из оригинала 28 апреля 2022 г. Получено 3 августа 2021 г.
  19. ^ ab Tripodi, Francesca (июнь 2021 г.). «Г-жа Категоризированная: Пол, Известность и Неравенство в Википедии». Новые медиа и общество . 25 (7): 1687–1707. doi : 10.1177/14614448211023772 .
  20. ^ "Wikipedia:WikiProject Countering systemic bias". Архивировано из оригинала 4 января 2021 г. Получено 12 февраля 2023 г.
  21. ^ Габрилович, Евгений; Маркович, Шауль (2007). «Вычисление семантической связанности с использованием явного семантического анализа на основе Википедии». Труды IJCAI . Morgan Kaufmann Publishers Inc. стр. 1606–1611. CiteSeerX 10.1.1.76.9790 . 
  22. ^ Zesch, Torsten; Müller, Christoph; Gurevych, Iryna (2008). "Извлечение лексико-семантических знаний из Википедии и Викисловаря" (PDF) . Труды Конференции по языковым ресурсам и оценке (LREC) . Архивировано из оригинала (PDF) 19 июля 2011 г. . Получено 26 апреля 2010 г. .
  23. ^ M Strube; SP Ponzetto (2006). "WikiRelate! Вычисление семантической связанности с использованием Wikipedia psu.edu" (PDF) . Труды Национальной конференции. Архивировано (PDF) из оригинала 24 марта 2012 г. . Получено 9 июня 2010 г. . {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  24. ^ Sumi, R.; Yasseri, T.; Rung, A.; Kornai, A.; Kertesz, J. (1 октября 2011 г.). «Войны правок в Википедии». Третья международная конференция IEEE 2011 г. по вопросам конфиденциальности, безопасности, риска и доверия и Третья международная конференция IEEE 2011 г. по социальным вычислениям . С. 724–727. arXiv : 1107.3689 . doi :10.1109/PASSAT/SocialCom.2011.47. ISBN 978-1-4577-1931-8. S2CID  14151613 — через IEEE Xplore.
  25. ^ Török, J; Iñiguez, G; Yasseri, T; San Miguel, M; Kaski, K; Kertész, J (2013). «Мнения, конфликты и консенсус: моделирование социальной динамики в среде сотрудничества». Physical Review Letters . 110 (8): 088701. arXiv : 1207.4914 . Bibcode : 2013PhRvL.110h8701T. doi : 10.1103/PhysRevLett.110.088701. PMID  23473207. S2CID  2496524.цитируется
    • Раткевич, Якоб; Фортунато, Санто; Фламмини, Алессандро; Менцер, Филиппо; Веспиньяни, Алессандро (2010). «Характеристика и моделирование динамики популярности в Интернете». Physical Review Letters . 105 (15): 158701. arXiv : 1005.2704 . Bibcode : 2010PhRvL.105o8701R. doi : 10.1103/PhysRevLett.105.158701 . ISSN  0031-9007. PMID  21230945.
    • Сольноки, Аттила; Ясери, Таха; Суми, Роберт; Рунг, Андраш; Корнаи, Андраш; Кертеш, Янош (2012). «Динамика конфликтов в Википедии». ПЛОС ОДИН . 7 (6): e38869. arXiv : 1202.3643 . Бибкод : 2012PLoSO...738869Y. дои : 10.1371/journal.pone.0038869 . ISSN  1932-6203. ПМК  3380063 . ПМИД  22745683.
  26. ^ Яссери Т.; Спёрри А.; Грэм М.; Кертес Дж. (2014). «Самые спорные темы в Википедии: многоязычный и географический анализ». В Fichman P.; Hara N. (ред.). Глобальная Википедия: международные и кросс-культурные проблемы в онлайн-сотрудничестве . Лэнхэм, Мэриленд: Rowman and Littlefield Press. arXiv : 1305.5566 . ISBN 978-0-8108-9101-2. OCLC  1026054095.
  27. Билл Тансер (25 апреля 2007 г.). «Кто на самом деле участвует в Web 2.0». Time . Архивировано из оригинала 30 апреля 2007 г. . Получено 30 апреля 2007 г. .
  28. ^ Сольноки, Аттила; Ясери, Таха; Суми, Роберт; Кертеш, Янош (2012). «Циркадные закономерности редакционной деятельности Википедии: демографический анализ». ПЛОС ОДИН . 7 (1): e30091. arXiv : 1109.1746 . Бибкод : 2012PLoSO...730091Y. дои : 10.1371/journal.pone.0030091 . ISSN  1932-6203. ПМК 3260192 . ПМИД  22272279. 
  29. ^ ab Батлер, Брайан; Джойс, Элизабет; Пайк, Жаклин (2008). «Не смотрите сейчас, но мы создали бюрократию». Труды конференции SIGCHI по человеческому фактору в вычислительных системах . стр. 1101. doi :10.1145/1357054.1357227. ISBN 978-1-60558-011-1. S2CID  15211227.
  30. ^ Криплин, Трэвис; Бесчастных, Иван; Макдональд, Дэвид В.; Голдер, Скотт А. (2007). "Сообщество, консенсус, принуждение, контроль". Труды международной конференции ACM 2007 года по теме "Конференция по поддержке групповой работы - GROUP '07" . стр. 167. doi :10.1145/1316624.1316648. ISBN 978-1-59593-845-9. S2CID  14491248.
  31. ^ Берк, Мойра; Краут, Роберт (2008). Taking up the mop . Труды двадцать шестой ежегодной конференции CHI. Расширенные тезисы по человеческому фактору в вычислительных системах - CHI '08 . стр. 3441. doi :10.1145/1358628.1358871. ISBN 978-1-60558-012-8.
  32. ^ Stumpf, SA; London, M. (1981). «Учет политики рейтинговых агентов при оценке кандидатов на повышение». Журнал Академии управления . 24 (4): 752–766. JSTOR  256174.
  33. ^ Форте, А. и Брукман, А. Масштабирование консенсуса: повышение децентрализации в управлении Википедией. Архивировано 2 июля 2022 г. на Wayback Machine . Proc. HICSS 2008.
  34. ^ WP:3RR и WP:EW — политики, предотвращающие повторный возврат.
  35. ^ Метц, Кейд. «Секретный список рассылки качает Википедию». The Register . Архивировано из оригинала 4 декабря 2007 года . Получено 10 августа 2017 года .
  36. ^ Kittur, Aniket; Suh, Bongwon; Pendleton, Bryan A.; Chi, Ed H. (2007). «Он говорит, она говорит». Труды конференции SIGCHI по человеческому фактору в вычислительных системах . стр. 453–462. doi :10.1145/1240624.1240698. ISBN 978-1-59593-593-9. S2CID  17493296.
  37. ^ Виегас, Фернанда Б.; Ваттенберг, Мартин; Крисс, Джесси; ван Хэм, Франк (2007). «Говори, прежде чем печатать: координация в Википедии». 2007 40-я ежегодная Гавайская международная конференция по системным наукам (HICSS'07) . стр. 575–582. CiteSeerX 10.1.1.210.1057 . doi :10.1109/HICSS.2007.511. ISBN  978-0-7695-2755-0. S2CID  5293547.
  38. ^ Дертик, Кэти; Цао, Патрик; Криплин, Трэвис; Борнинг, Алан; Захри, Марк; Макдональд, Дэвид В. (2011). «Совместное осмысление во время предоставления административного разрешения в Википедии» (PDF) . Онлайн-сообщества и социальные вычисления . Конспект лекций по информатике. Том 6778. С. 100–109. doi :10.1007/978-3-642-21796-8_11. ISBN 978-3-642-21795-1. Архивировано (PDF) из оригинала 20 января 2022 г. . Получено 7 августа 2022 г. .
  39. ^ abc Petiška, Eduard; Moldan, Bedřich (2021). «Индикатор качества статей по окружающей среде в Википедии на уровне высшего образования». Journal of Information Science . 47 (2): 269–280. doi : 10.1177/0165551519888607. ISSN  0165-5515. S2CID  214401940. Архивировано из оригинала 8 октября 2022 г. . Получено 17 ноября 2022 г. .
  40. ^ Hertz, Tehila (2018). «Wikishtetl: увековечение памяти еврейских общин, погибших во время Холокоста, через платформу Wikipedia». Quest . 13. Архивировано из оригинала 11 июля 2020 г. Получено 15 января 2020 г.
  41. ^ Баеза-Йейтс, Рикардо; Кинг, Ирвин, ред. (2009). Услуги ткачества и люди во Всемирной паутине . Springer. ISBN 978-3-642-00569-5. LCCN  2009926100.
  42. ^ Ю, Лиян (2011). Руководство разработчика по семантической паутине . Springer. Bibcode : 2011adgt.book.....Y. doi : 10.1007/978-3-642-15970-1. ISBN 978-3-642-15969-5.
  43. ^ Мартон Местян; Таха Ясери; Янош Кертес (2013). «Раннее предсказание кассовых сборов фильмов на основе больших данных о деятельности Википедии». ПЛОС ОДИН . 8 (8): е71226. arXiv : 1211.0970 . Бибкод : 2013PLoSO...871226M. дои : 10.1371/journal.pone.0071226 . ПМЦ 3749192 . ПМИД  23990938. 
  44. ^ «Wikipedia buzz предсказывает сборы блокбастеров за несколько недель до релиза». The Guardian . 8 ноября 2012 г. Архивировано из оригинала 17 апреля 2019 г. Получено 2 сентября 2013 г.
  45. ^ Хелен Сусанна Моут; Честер Керм; Адам Авакян; Дрор Й. Кенетт; Х. Юджин Стэнли; Тобиас Прайс (2013). «Количественная оценка моделей использования Википедии до движения фондового рынка». Scientific Reports . 3 : 1801. Bibcode : 2013NatSR...3E1801M. doi : 10.1038/srep01801. PMC 3647164 . 
  46. ^ "Wikipedia's crystal ball". Financial Times . 10 мая 2013 г. Архивировано из оригинала 13 марта 2023 г. Получено 10 августа 2013 г.
  47. ^ Кадим Шуббер (8 мая 2013 г.). «Просмотры страниц Википедии могут предсказывать изменения на фондовом рынке». Wired . Архивировано из оригинала 12 августа 2013 г. Получено 10 августа 2013 г.
  48. ^ Смит, Бенджамин К.; Густафсон, Абель (7 сентября 2017 г.). «Использование Википедии для прогнозирования результатов выборов: онлайн-поведение как предиктор голосования». Public Opinion Quarterly . 81 (3): 714–735. doi :10.1093/poq/nfx007. ISSN  0033-362X. Архивировано из оригинала 13 марта 2023 г. . Получено 23 июля 2022 г. .
  49. ^ Томпсон, Нил; Фланаган, Брайан; Ричардсон, Эдана; Маккензи, Брайан; Ло, Сюэюнь (27 июля 2022 г.). «Испытание через Интернет: рандомизированный полевой эксперимент по влиянию Википедии на правовые рассуждения судей». doi : 10.2139/ssrn.4174200. S2CID  251295546. SSRN  4174200. Архивировано из оригинала 13 марта 2023 г. Получено 18 сентября 2022 г. – через SSRN. {{cite journal}}: Цитировать журнал требует |journal=( помощь )

Дальнейшее чтение