stringtranslate.com

Анонимизация данных

Анонимизация данных — это тип очистки информации , целью которого является защита конфиденциальности . Это процесс удаления личной информации из наборов данных , чтобы люди, которых описывают данные, оставались анонимными .

Обзор

Анонимизация данных определяется как «процесс, при котором персональные данные изменяются таким образом, что субъект данных больше не может быть идентифицирован прямо или косвенно ни самим контролером данных, ни в сотрудничестве с любой другой стороной». [1] Анонимизация данных может обеспечить передачу информации через границу, например, между двумя отделами внутри агентства или между двумя агентствами, одновременно снижая риск непреднамеренного раскрытия, а в определенных средах - таким образом, чтобы обеспечить возможность оценки и анализа после анонимизация.

В контексте медицинских данных анонимизированные данные относятся к данным, по которым получатель информации не может идентифицировать пациента. Имя, адрес и полный почтовый индекс должны быть удалены вместе с любой другой информацией, которая в сочетании с другими данными, хранящимися или раскрытыми получателю, может идентифицировать пациента. [2]

Всегда будет существовать риск того, что обезличенные данные со временем перестанут оставаться анонимными. Сочетание анонимного набора данных с другими данными, умные методы и необузданная мощь — вот некоторые из способов, с помощью которых ранее анонимные наборы данных стали деанонимизированными; Субъекты данных больше не являются анонимными.

Деанонимизация — это обратный процесс, при котором анонимные данные сопоставляются с другими источниками данных для повторной идентификации анонимного источника данных. [3] Обобщение и искажение — два популярных подхода к анонимизации реляционных данных. [4] Процесс сокрытия данных с возможностью их повторной идентификации позже также называется псевдонимизацией и является одним из способов, с помощью которых компании могут хранить данные в соответствии с требованиями HIPAA .

Однако, согласно СТАТЬЕ 29 РАБОЧЕЙ ГРУППЫ ПО ЗАЩИТЕ ДАННЫХ, Директива 95/46/EC ссылается на анонимизацию в декларативной части 26, «означающей, что для анонимизации любых данных данные должны быть лишены достаточных элементов, чтобы субъект данных больше не мог быть идентифицирован. Точнее, эти данные должны обрабатываться таким образом, чтобы их больше нельзя было использовать для идентификации физического лица с использованием «всех средств, которые могут быть разумно использованы» ни контролером, ни третьей стороной. обработка должна быть необратимой. Директива не разъясняет, как должен или может осуществляться такой процесс деидентификации. Основное внимание уделяется результату: данные должны быть такими, чтобы не позволять идентифицировать субъекта данных через «все» «Вероятный» и «разумный» означает. Ссылка делается на кодексы поведения как инструмент для определения возможных механизмов анонимизации, а также сохранения в форме, в которой идентификация субъекта данных «больше невозможна» [5] .

Существует пять типов операций анонимизации данных: обобщение, подавление, анатомирование, перестановка и возмущение. [6]

Требования GDPR

Общий регламент по защите данных Европейского Союза (GDPR) требует, чтобы хранящиеся данные о людях в ЕС подвергались либо анонимизации, либо процессу псевдонимизации . [7] Декларация GDPR (26) устанавливает очень высокую планку для того, что представляет собой анонимные данные, тем самым освобождая данные от требований GDPR, а именно: «…информация, которая не относится к идентифицированному или идентифицируемому физическому лицу или к персональным данным, предоставленным анонимным таким образом, что субъект данных не может быть идентифицирован или больше не поддается идентификации». Европейский орган по надзору за защитой данных (EDPS) и Испанское агентство по защите данных (AEPD) выпустили совместное руководство, касающееся требований анонимности и освобождения от требований GDPR. Согласно EDPS и AEPD, никто, включая контролера данных, не должен иметь возможность повторно идентифицировать субъектов данных в должным образом анонимизированном наборе данных. [8] Исследования специалистов по обработке данных из Имперского колледжа в Лондоне и Калифорнийского университета в Лувене в Бельгии, [9] а также постановление судьи Михала Агмона-Гонена из Окружного суда Тель-Авива [10] подчеркивают недостатки «анонимизации» в сегодняшних условиях. мир больших данных . Анонимизация отражает устаревший подход к защите данных, который был разработан, когда обработка данных ограничивалась изолированными (разрозненными) приложениями, до того, как стала популярна обработка больших данных, предполагающая широкое совместное использование и объединение данных. [11]

Смотрите также

Рекомендации

  1. ^ ISO 25237:2017 Информатика здравоохранения. Псевдонимизация. ИСО. 2017. с. 7.
  2. ^ «Анонимизация данных». Бесплатный медицинский словарь . Проверено 17 января 2014 г.
  3. ^ «Деанонимизация». Whatis.com . Проверено 17 января 2014 г.
  4. ^ Бинь Чжоу; Цзянь Пей; ВоШун Лук (декабрь 2008 г.). «Краткий обзор методов анонимизации для сохранения конфиденциальности публикации данных социальных сетей» (PDF) . Информационный бюллетень Информационный бюллетень ACM SIGKDD Explorations . 10 (2): 12–22. дои : 10.1145/1540276.1540279. S2CID  609178.
  5. ^ «Мнение 05/2014 о методах анонимизации» (PDF) . Комиссия ЕС . 10 апреля 2014 года . Проверено 31 декабря 2023 г.
  6. ^ Эйюпоглу, Джан; Айдын, Мухаммед; Заим, Абдул; Сертбас, Ахмет (17 мая 2018 г.). «Эффективный алгоритм анонимизации больших данных, основанный на методах хаоса и возмущений». Энтропия . 20 (5): 373. Бибкод : 2018Entrp..20..373E. дои : 10.3390/e20050373 . ISSN  1099-4300. ПМЦ 7512893 . ПМИД  33265463.  Текст был скопирован из этого источника, который доступен по международной лицензии Creative Commons Attribution 4.0.
  7. ^ Скиера, Бернд (2022). Влияние GDPR на рынок онлайн-рекламы. Клаус Миллер, Юси Джин, Леннарт Крафт, Рене Лауб, Джулия Шмитт. Франкфурт-на-Майне. ISBN 978-3-9824173-0-1. ОСЛК  1303894344.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  8. ^ «Введение в хэш-функцию как метод псевдонимизации персональных данных» (PDF) . Управление по защите данных Испании. Октябрь 2019 года . Проверено 31 декабря 2023 г.
  9. Колата, Джина (23 июля 2019 г.). «Ваши данные были «анонимизированы»? Эти ученые все еще могут вас идентифицировать». Нью-Йорк Таймс .
  10. ^ «Attm (TA) 28857-06-17 Ассоциация медсестер против Министерства обороны» (на идиш). Перл Коэн. 2019 . Проверено 31 декабря 2023 г.
  11. ^ Соломон, С. (31 января 2019 г.). «Данные доступны для доступа в соответствии с устаревшим израильским законом о конфиденциальности, - говорят аналитические центры». Таймс Израиля . Проверено 31 декабря 2023 г.

дальнейшее чтение

Внешние ссылки