Анонимизация данных — это тип очистки информации , целью которого является защита конфиденциальности . Это процесс удаления личной информации из наборов данных , чтобы люди, которых описывают данные, оставались анонимными .
Анонимизация данных определяется как «процесс, при котором персональные данные изменяются таким образом, что субъект данных больше не может быть идентифицирован прямо или косвенно ни самим контролером данных, ни в сотрудничестве с любой другой стороной». [1] Анонимизация данных может обеспечить передачу информации через границу, например, между двумя отделами внутри агентства или между двумя агентствами, одновременно снижая риск непреднамеренного раскрытия, а в определенных средах - таким образом, чтобы обеспечить возможность оценки и анализа после анонимизация.
В контексте медицинских данных анонимизированные данные относятся к данным, по которым получатель информации не может идентифицировать пациента. Имя, адрес и полный почтовый индекс должны быть удалены вместе с любой другой информацией, которая в сочетании с другими данными, хранящимися или раскрытыми получателю, может идентифицировать пациента. [2]
Всегда будет существовать риск того, что обезличенные данные со временем перестанут оставаться анонимными. Сочетание анонимного набора данных с другими данными, умные методы и необузданная мощь — вот некоторые из способов, с помощью которых ранее анонимные наборы данных стали деанонимизированными; Субъекты данных больше не являются анонимными.
Деанонимизация — это обратный процесс, при котором анонимные данные сопоставляются с другими источниками данных для повторной идентификации анонимного источника данных. [3] Обобщение и искажение — два популярных подхода к анонимизации реляционных данных. [4] Процесс сокрытия данных с возможностью их повторной идентификации позже также называется псевдонимизацией и является одним из способов, с помощью которых компании могут хранить данные в соответствии с требованиями HIPAA .
Однако, согласно СТАТЬЕ 29 РАБОЧЕЙ ГРУППЫ ПО ЗАЩИТЕ ДАННЫХ, Директива 95/46/EC ссылается на анонимизацию в декларативной части 26, «означающей, что для анонимизации любых данных данные должны быть лишены достаточных элементов, чтобы субъект данных больше не мог быть идентифицирован. Точнее, эти данные должны обрабатываться таким образом, чтобы их больше нельзя было использовать для идентификации физического лица с использованием «всех средств, которые могут быть разумно использованы» ни контролером, ни третьей стороной. обработка должна быть необратимой. Директива не разъясняет, как должен или может осуществляться такой процесс деидентификации. Основное внимание уделяется результату: данные должны быть такими, чтобы не позволять идентифицировать субъекта данных через «все» «Вероятный» и «разумный» означает. Ссылка делается на кодексы поведения как инструмент для определения возможных механизмов анонимизации, а также сохранения в форме, в которой идентификация субъекта данных «больше невозможна» [5] .
Существует пять типов операций анонимизации данных: обобщение, подавление, анатомирование, перестановка и возмущение. [6]
Общий регламент по защите данных Европейского Союза (GDPR) требует, чтобы хранящиеся данные о людях в ЕС подвергались либо анонимизации, либо процессу псевдонимизации . [7] Декларация GDPR (26) устанавливает очень высокую планку для того, что представляет собой анонимные данные, тем самым освобождая данные от требований GDPR, а именно: «…информация, которая не относится к идентифицированному или идентифицируемому физическому лицу или к персональным данным, предоставленным анонимным таким образом, что субъект данных не может быть идентифицирован или больше не поддается идентификации». Европейский орган по надзору за защитой данных (EDPS) и Испанское агентство по защите данных (AEPD) выпустили совместное руководство, касающееся требований анонимности и освобождения от требований GDPR. Согласно EDPS и AEPD, никто, включая контролера данных, не должен иметь возможность повторно идентифицировать субъектов данных в должным образом анонимизированном наборе данных. [8] Исследования специалистов по обработке данных из Имперского колледжа в Лондоне и Калифорнийского университета в Лувене в Бельгии, [9] а также постановление судьи Михала Агмона-Гонена из Окружного суда Тель-Авива [10] подчеркивают недостатки «анонимизации» в сегодняшних условиях. мир больших данных . Анонимизация отражает устаревший подход к защите данных, который был разработан, когда обработка данных ограничивалась изолированными (разрозненными) приложениями, до того, как стала популярна обработка больших данных, предполагающая широкое совместное использование и объединение данных. [11]
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка )