Датасфера — это междисциплинарная концепция, впервые появившаяся в 1980-х годах. Хотя для описания цифрового мира было принято много терминов, таких как Интернет , киберпространство , метавселенная , различные концепции датасферы, по-видимому, решают проблему растущей зависимости человеческой деятельности от данных, а также подходят к цифровому миру целостным образом. Связанные термины включают экономику данных , управление данными , общие данные и управление данными .
Термин «датасфера» использовался для широкого определения цифрового пространства и информации , особенно в отношении информационного потока , данных и цифровых платформ . С 1980-х годов эта концепция стала использоваться все чаще. С тех пор она применялась к различным контекстам, начиная от названий продуктов и заканчивая названиями конференций и терминами научно-фантастического искусства.
«Датасфера» как концепция была популяризирована теоретиком медиа, писателем и сторонником культуры киберпанка и решений социальных проблем с открытым исходным кодом Дугласом Рашкоффом в 1980-х годах. Он рассматривал датасферу как «кровеносную систему для сегодняшней информации, идей и изображений», понимаемую как «наша новая естественная среда». [1] [2] Концептуализация Рашкоффа, сосредоточенная на теории медиа, была развернута для объяснения того, как «медиавирусы» — идеи, которые захватывают общественное внимание — быстро распространяются. Таким образом, датасфера Рашкоффа вызывает идеи информационного потока, а не фокусируется на структурированных данных и их анализе.
Примерно в то же время, когда была придумана концепция глобальной сферы данных Рашкоффа, другие писали о «персональной сфере данных» — больше опираясь на идею сферы данных как запаса данных. Концепция личной сферы данных предполагает наличие нескольких сфер данных, каждая из которых имеет свой собственный центр (например, человек с персональной сферой данных, охватывающей все данные об этом человеке; местоположение, например, торговый центр; или компания и т. д.).
В 2004 году в короткой статье юриста и киберзащитника Эндрю Апдегроува была представлена концепция «Сферы персональных данных». [3] Апдегроув (2004) концептуализирует Сферу персональных данных (PDS), ссылаясь на концепцию Пьера Тейяра де Шардена 1925 года о «Ноосфере » — «слое сознания, окружающем земной шар и охватывающем всю человеческую мысль и культуру». [ 3] PDS Апдегроува перекликается с современными концепциями, такими как MiData, Vendor Relationship Management и Personal Data Stores . Его концепция относится к персональным цифровым данным, таким как записи о рождении и смерти, а также документы по планированию родительского имущества.
В 2015 году профессор права Стивен Хамфрис в своей статье «Совесть в сфере данных» намекает на идею «жизни в сфере данных», в которой он пытается переосмыслить дебаты о конфиденциальности, праве и технологиях, используя сферу данных для информирования о погружении общественности в данные. [4]
Термин появился снова в 2015 году, когда группа врачей опубликовала свою статью «Инициатива проекта Data Sphere: ускорение исследований рака путем обмена данными» в журнале The Oncologist. [5] Признавая, что исследования рака могут быть продвинуты за счет доступа к историческим данным клинических испытаний, авторы представляют Data Sphere как цифровую базу данных, которая позволяет исследователям в электронном виде обмениваться данными клинических испытаний рака. [5]
В 2016 году этот термин был принят и в медицинской сфере. Он использовался для обозначения «пространств данных» определенной области, как в работе Жерома Беранже «Большие данные и этика: медицинская сфера данных». [6] Беранже поднимает вопрос использования цифровой информации и необходимости поиска баланса между конфиденциальностью и прозрачностью. [6] Здесь сфера данных возвращается к «массивным данным» и этическим вопросам, связанным с их разработкой и обработкой, особенно в отношении персональных данных .
Берже, Грумбах и Зено-Зенкович (2018) описывают сферу данных как развивающееся пространство, размещенное в основном через цифровые платформы. Они описывают, как:
Это содержит параллели с идеей инфосферы, введенной Лучано Флориди (2007) как «целой информационной среды, образованной всеми информационными сущностями (включая, таким образом, и информационных агентов), их свойствами, взаимодействиями, процессами и взаимными отношениями». [8] Однако, там, где концепция Флориди включает как цифровые, так и «офлайновые и аналоговые пространства информации» наряду с цифровыми данными, область применения инфосферы определена более строго и касается в первую очередь цифровых представлений мира, которые были «найдены, собраны и организованы». [7]
В целом, понятие «сфера данных» все чаще используется и принимается для определения сложной цифровой экосистемы, в которой мы в настоящее время движемся.
Как метафора и как сложная система , понятие «датасфера» приближается к чрезвычайно сложной цифровой экосистеме и в целом отвечает на вопрос о типе общества, которое мы хотим построить.
Термин «датасфера» используется как пространственная метафора. Например, он был принят Центром GEODE, исследовательским и учебным центром, который изучает «стратегические и геополитические вопросы цифровой революции». [9] Цель GEODE двоякая. С одной стороны, он стремится изучать датасферу как геополитический «объект сам по себе». [9] С другой стороны, он использует ресурсы датасферы для проведения геополитического анализа. В рамках своей исследовательской работы Центр разработал картографию датасферы, [10] где основное внимание уделяется не только региональным подходам к цифровому пространству, потокам данных, логическим и физическим маршрутам и социальным сетям, но и распределению власти по географическим регионам.
И Флориди [8] , и Берже и др. [7] рассматривают эти новые сферы как «пространства, в которых мы обитаем»: архитектуры и экосистемы, влияющие на то, как проживается повседневная жизнь. Для Берже, в частности, пространственная метафора сферы данных подчеркивает способ, которым датафикация перестраивает отношения между «традиционными институциональными территориями (например, государствами, городами, международными и региональными организациями)» [7] и «дает начало новым территориям». [7] Для некоторых авторов идея «жизни в сфере данных» напоминает «публичную сферу» [4] и «сделку Гоббса» [11], посредством которой государственные институты, возможно, обоснованы, хотя и более шатко, поскольку расширение нерегулируемой сферы данных подрывает авторитет и эффективность классических институтов.
Поскольку сфера данных, похоже, все больше воспринимается как экосистема и пространство, в котором мы живем, по всему миру также возникли новые коллективные структуры управления данными . Эти структуры могут копировать некоторые элементы сферы данных в своих системах проектирования. Например, новые инструменты управления , такие как общие данные , доверительные отношения к данным, кооперативы, коллаборативы , пулы данных и т. д., могут быть инструментами, используемыми для навигации по сфере данных и делать это коллективно, тем самым повышая ее сложность.
Сферу данных можно также понимать как естественную экосистему . Так же, как это происходит в природе — где течет энергия и существует непрерывный цикл между экосистемами — сфера данных является экосистемой, где быстро развиваются и сложные потоки данных. Усилия по управлению в настоящее время сосредоточены на использовании свободных потоков данных, обеспечивая при этом защиту различных групп людей. Поскольку данные текут естественным образом, необходимы инновационные правила, позволяющие циклам течь и гарантирующие, что окружающая среда в целом и ее подсистемы защищены.
Понятие «датасфера» связано с понятием «киберпространство» , которое описывает широко распространенную взаимосвязанную цифровую технологию . «Датасфера» охватывает понятие «киберпространство», добавляя уровни сложности, а именно человеческие группы и нормы. Кроме того, «датасфера» рассматривает не только цифровые технологии, но и различные потоки данных, производимые в гиперсвязанном обществе.
По данным инициативы Datasphere, сфера данных была впервые концептуализирована в статье «Нам нужно поговорить о данных: формирование дебатов вокруг свободного потока данных и суверенитета данных» Бертрана Де Ла Шапеля и Лоррейн Порсиункулы (2021). [12] С тех пор инициатива Datasphere определила сферу данных как «сложную систему, охватывающую все типы данных и их динамическое взаимодействие с человеческими группами и нормами». [12]
Эта формула по сути привлекает внимание к взаимно со-составной природе цифровых артефактов (наборов данных), групп и социальных отношений (человеческих групп), а также правил и социальных ожиданий (норм) - и к множественности каждого из них. В то же время она останавливается перед детальной спецификацией наборов данных, человеческих групп или норм и оставляет открытым вопрос о том, как следует регулировать их взаимодействие.
Определение сферы данных в рамках инициативы Datasphere направлено на поиск связей между контекстами и поиск стратегий политики и управления , которые могут не возникнуть из-за фокусировки на встроенных локальных контекстах. Например, концепция человеческих групп неявно указывает на группы, которые потенциально совместно образованы инфраструктурами данных и могут существовать за пределами обычных границ географии и государственного устройства. Признание как глобальных норм, так и глобальной множественности норм требует подходов к управлению, которые имеют соответствующие уровни гибкости и адаптивности. Модель подразумевает управление одной взаимосвязанной сферой данных, а не множеством изолированных экземпляров.
Так же, как можно говорить об атмосфере и некоторых локальных атмосферных условиях, можно говорить и о сфере данных и о том, как она воспринимается совершенно по-разному в разных пространствах и условиях:
Концепция сферы данных уже применялась к нескольким публикациям и исследованиям, связанным со здоровьем. Медицинская сфера данных была концепцией, принятой Жеромом Беранже (2016), чтобы говорить о Больших данных и этике , а также о влиянии на медицинские парадигмы, такие как Клятва Гиппократа . [6] Более того, Центр клинических и трансляционных наук из Университета Кентукки запустил свое веб-приложение для исследователей, чтобы изучать обезличенные данные пациентов, которое они назвали DataSphere. [14] Некоторые исследователи также изучали усилия по управлению сферой данных для использования ее возможностей в интересах здравоохранения. Например, подходы, ориентированные на пациента, были выделены как необходимые для управления данными в секторе здравоохранения. [15]
По всему миру концепция сферы данных приобретает все большее значение и распространение. Например, в Африке Технический центр по сельскохозяйственному и сельскому сотрудничеству (CTA) ссылался на различные «сферы данных», которые могут возникнуть для копирования моделей, созданных для сельского хозяйства в других секторах, таких как мобильные услуги. [16] Концепция была также принята исследователями, картирующими поголовье скота с помощью данных из Статистической базы данных Продовольственной и сельскохозяйственной организации Объединенных Наций (FAOSTAT) . [17] Она использовалась для названия программного обеспечения в Германии в 2022 году, которое помогает оптимизировать орошение с помощью решений, основанных на данных. [18]
Как одна из самых острых проблем в настоящее время, изменение климата является одной из тем, связанных с управлением сферой данных. Компании все чаще стремятся использовать устойчивые модели, когда дело касается обмена данными. Seagate, американская компания по хранению данных, сформулировала свой подход к «продвижению более устойчивой сферы данных», [19] с помощью которого они стремятся обеспечить свое глобальное присутствие на 100% возобновляемой энергией к 2030 году и достичь углеродной нейтральности к 2040 году. [19] Кроме того, несколько организаций, занимающихся проблемой изменения климата, основываются на прогнозе Worldwide IDC Global DataSphere Forecast, 2022–2026, серии документов, подготовленных International Data Corporation (IDC), в которых прогнозируется, что к 2025 году глобальная сфера данных вырастет с 33 зеттабайт (ЗБ) в 2018 году до 175 ЗБ к 2025 году и удвоится в размере с 2022 по 2026 год. [20]
Поскольку сфера данных содержит данные от разных групп людей и о них, обеспечение ее разнообразия и равноправия является основополагающим для устранения гендерной предвзятости в сфере данных. [21] Разнообразие было выделено как ключ к эффективному и ориентированному на будущее управлению данными, [22] и, таким образом, для более инклюзивной сферы данных. Такие компании, как Seagate, также указали на важность создания инклюзивной сферы данных, не только с точки зрения пола, но и этнической принадлежности, национальностей и т. д. [23] Фактически, гендерные данные и управление гендерными данными в настоящее время активно продвигаются, как и принятие фреймворков управления данными и управления данными, которые принимают инклюзивные перспективы. [24]
Датасфера связана с недавними разработками метавселенной . Хотя это возникло как научно-фантастическая концепция, метавселенная в настоящее время реальна благодаря разработкам различных частных и крупных технологических компаний, а также других субъектов. Существование и растущее использование пространств метавселенной подверглось резкой критике , и люди по всему миру выразили свою обеспокоенность по поводу управления в рамках датасферы, а также доступа к ней. Несколько исследователей настаивали на том, что существует связь между усилиями по управлению датасферой и регулированием метавселенной, [25] что изменит язык регулирования и потенциально создаст новые цифровые права. [26]
Термин «датасфера» использовался для обозначения концепций научной фантастики. Например, « Исторический словарь научной фантастики» определяет термин «датасфера» как «воображаемую среду, в которой хранятся цифровые данные; в частности, интернет, рассматриваемый таким образом; (также) сферу виртуальной реальности; киберпространство сущ.». [27] «Исторический словарь научной фантастики» предоставляет временную шкалу ссылок на этот термин в популярных научно-фантастических СМИ, включая книги, статьи и онлайн-форумы.
В своей книге «Гиперион » Симмонс описал сферу данных как конструкт восторга: «Я вызывал информацию почти постоянно, живя в безумии полного интерфейса». [28] В «Киберии » Рашкофф упомянул, что любой может получить доступ к сфере данных — «паутине телекоммуникаций и компьютерных сетей, простирающейся по всему миру и в открытый космос» — через персональный компьютер и модем. [29] В «Лучшей научной фантастике года: Двадцать шестой ежегодный сборник» Дозуа автор говорил о сфере данных Дионы, которая «кишела агентами». [30]
Научно-фантастическая книга CA Mason "Datasphere: The New Epic Sci-fi Virtual Reality Adventure" (2016) снова ссылается на термин datasphere. В этом контексте это испорченная виртуальная реальность, созданная "программой, которая стала миром", почва которой определяется как компьютерная схема. [31] Интересно, что при определении термина cyberpunk Лоуренс Персон из Nova Express принял термин datasphere и сказал, что:
Настольная ролевая игра Numenera «Голоса Датасферы» позволяет игрокам «достичь и исследовать» Датасферу. [33] В Numenera Датасфера описывается как:
Наконец, репозиторий GitHub под названием «data-sphere» предоставляет код, который позволяет пользователю просматривать визуализации данных в виртуальной реальности.