Активизм данных — это социальная практика, которая использует технологии и данные. Он возник из существующих субкультур активизма, таких как хакерские и движения с открытым исходным кодом. [1] Активизм данных — это особый тип активизма , который поддерживается и ограничивается инфраструктурой данных. [2] Он может использовать производство и сбор цифровых, добровольно предоставленных, открытых данных , чтобы бросить вызов существующим властным отношениям. [3] Это форма медиаактивизма; однако ее не следует путать со слактивизмом . Он использует цифровые технологии и данные политически и проактивно для содействия социальным изменениям . [4] Формы активизма данных могут включать цифровой гуманизм [5] и участие в хакатонах . Активизм данных — это социальная практика, которая становится все более известной с развитием технологий, программного обеспечения с открытым исходным кодом и возможностью общаться за пределами непосредственного сообщества человека. Культура активизма данных возникла из предыдущих форм медиаактивизма , таких как движения хакеров. Определяющей характеристикой дата-активизма является то, что в нем могут участвовать обычные граждане, в отличие от предыдущих форм медиа-активизма, где для участия требовались элитные навыки. [6] Все больше вовлекая рядовых пользователей, они являются сигналом об изменении точки зрения и отношения к массовому сбору данных , возникающих в сфере гражданского общества. [1]
Активизм данных может быть актом предоставления данных о событиях или проблемах, которые, по мнению отдельных лиц, не были должным образом рассмотрены теми, кто находится у власти. Например, первое развертывание платформы Ushahidi в 2008 году в Кении наглядно продемонстрировало послевыборное насилие, которое было замалчено правительством и новыми СМИ. [2] Социальная практика активизма данных вращается вокруг идеи о том, что данные носят политический характер. [7] Активизм данных позволяет отдельным лицам количественно оценить конкретную проблему. [6] Собирая данные для определенной цели, он позволяет активистам данных количественно оценить и раскрыть конкретные проблемы. По мере роста инфраструктур данных и аналитики данных активисты данных могут использовать доказательства из науки, основанной на данных, для поддержки заявлений о социальных проблемах. [8] [2]
Двойная классификация дата-активизма была предложена Стефанией Милан и Мирен Гутьеррес [9] , позже более подробно исследованная Милан [6] в соответствии с типом вовлеченности активистов в политику данных . «Реактивный дата-активизм» можно охарактеризовать как мотивированный восприятием массового сбора данных как угрозы, например, когда активисты стремятся противостоять корпоративной и правительственной слежке, тогда как «проактивный дата-активизм» рассматривает растущую доступность данных как возможность для содействия социальным изменениям. [6] Эти дифференцированные подходы к датафикации приводят к различным репертуарам действий, которые не противоречат друг другу, поскольку они имеют общую важную черту: они воспринимают информацию как конститутивную силу, способную формировать социальную реальность [10] и способствуют созданию новых альтернативных способов ее интерпретации. [11] Примерами реактивного активизма в области данных являются разработка и использование сетей шифрования и анонимности для сопротивления корпоративному или государственному надзору, в то время как примеры проактивного активизма в области данных включают проекты, в которых данные мобилизуются для пропаганды изменений и оспаривания устоявшегося социального нарратива. [9]
Было обнаружено, что в Соединенных Штатах от 180 000 до 500 000 наборов для анализа изнасилований остались необработанными на складах судебной экспертизы. [12] Регистрация и ввод ДНК преступников были непоследовательными, что привело к такому большому отставанию в наборах для анализа изнасилований на свидании. Задержка в анализе этих образцов ДНК составляла примерно от шести месяцев до двух лет. [13] Информация из наборов для анализа изнасилований должна была быть введена в базу данных склада судебной экспертизы, но между системой склада и национальной базой данных ДНК Объединенной системой индексации ДНК (CODIS) был разрыв, из-за которого эти наборы для анализа изнасилований остались неисследованными. Тестирование этих наборов для анализа изнасилований важно для выявления и судебного преследования преступников, распознавания серийных насильников и обеспечения справедливости для жертв изнасилования. [12] Инициатива по прекращению отставания привлекла внимание к этой проблеме, потребовав обработки данных из этих наборов для анализа изнасилований. Именно эта инициатива привлекла внимание правительства Соединенных Штатов к этой проблеме, которое заявило, что это неприемлемо, и выделило 79 миллионов долларов в виде грантов, которые будут использованы для устранения накопившихся наборов для изнасилования. [14] Количественная оценка этих данных изменила то, как общественность воспринимала процесс анализа наборов для изнасилования. Затем эти данные использовались для привлечения внимания политиков.
DataKind — это организация цифрового активизма, которая объединяет специалистов по данным и людей из других организаций и правительств с целью использования больших данных таким же образом, как корпорации в настоящее время используют большие данные, а именно для монетизации данных. Однако здесь большие данные используются для решения социальных проблем, таких как нехватка продовольствия и бездомность. DataKind была основана в 2011 году, и сегодня у нее есть отделения в Великобритании, Индии, Сингапуре и Соединенных Штатах Америки. [15] Джейк Порвэй — основатель и исполнительный директор DataKind. [16]
Хотя у активистов в области данных могут быть благие намерения, одна из критических замечаний заключается в том, что, позволяя гражданам генерировать данные без обучения или надежных форм измерения, данные могут быть искажены или представлены в разных формах. [17]
После ядерной катастрофы на Фукусиме в 2011 году Safecast была организацией, созданной группой граждан, обеспокоенных высоким уровнем радиации в этом районе. Получив противоречивые сообщения об уровнях радиации из разных источников СМИ и от ученых, люди не были уверены, какая информация наиболее надежна. Это привело к движению, в котором граждане использовали показания счетчика Гейгера для измерения уровней радиации и распространяли эти данные через Интернет, чтобы они были доступны общественности. [18] Safecast был разработан как средство получения нескольких источников данных о радиации. Предполагалось, что если данные были собраны с помощью аналогичных измерений счетчика Гейгера в массовом объеме, полученные данные, скорее всего, будут точными. [19] Safecast позволяет людям загружать необработанные данные о радиации, но Safecast также визуализирует данные. Данные, которые используются для создания визуальной карты, обрабатываются и классифицируются Safecast. Эти данные отличаются от необработанных данных о радиации, поскольку они были отфильтрованы, что представляет данные иначе, чем необработанные данные. [20] Изменение представления данных может изменить информацию, которую извлекают из них люди, что может представлять угрозу в случае неправильного понимания.