Неличные данные (NPD) — это электронные данные , которые не содержат никакой информации, которая может быть использована для идентификации физического лица . Таким образом, это могут быть либо данные, которые изначально не содержат личной информации (например, данные о погоде, курсах акций, данные анонимных датчиков IoT); или это данные, содержащие личные данные, которые впоследствии были псевдоанонимизированы (например, идентифицируемые строки заменены случайными строками) или анонимизированы (например, путем необратимого удаления всех личных данных). [1] NPD является частью общей стратегии управления данными региона или страны. Хотя персональные данные подпадают под действие законодательства о защите данных, такого как GDPR , другие виды данных подпадают под действие Регламента NPD.
Было отмечено, что будущее зависит от данных. [2] Это означает, что большая часть нынешних инноваций, происходящих в таких областях, как машинное обучение и искусственный интеллект, подпитывается данными, которые необходимы для калибровки сложных моделей (включая модели на основе нейронных сетей, а также другие виды). Чем больше объем, разнообразие и качество данных, тем выше качество модели, что приводит к лучшим прогнозам и объяснениям.
Однако у доступности данных есть и обратная сторона. Новое понимание конфиденциальности и, как следствие, потребность в мощных правилах защиты данных (таких как GDPR ) делают получение данных в необходимых количествах все более трудным или невозможным. Это противоречие, и единственным выходом будет удаление всех персональных данных из наборов данных (либо путем анонимизации данных , либо путем псевдонимизации в сочетании с внедрением шума, после чего они станут NPD).
Поэтому многие страны, дружественные к инновациям, создают нормативные режимы, которые гарантируют защиту персональных данных и в то же время из персональных данных можно извлекать неличные данные, чтобы стимулировать инновации. Другими словами, NPD «разблокирует» значение, которое было заблокировано в наборах данных, содержащих личную информацию. Ожидается, что несколько наборов данных NPD станут доступны бесплатно или на коммерческой основе от разных поставщиков, как только правила вступят в силу.
Неличные данные имеют важное применение, которое может быть экономическим, социальным, политическим или связанным с безопасностью. Несколько стран и регионов находятся в процессе регулирования использования NPD. В мае 2019 года Европейский Союз ввел в действие свое Положение о свободном потоке НДП. [3] Индия объявила о создании экспертного комитета из девяти членов для выработки рекомендаций по регулированию НДП в 2019 году, который опубликовал свой первый отчет в середине 2020 года. Отчет был открыт для общественного обсуждения, после чего был доработан и опубликован в декабре 2020 года. [4]
Согласно пересмотренному отчету, цели предлагаемого индийского постановления были следующими:
Основная проблема при использовании NPD заключается в том, существуют ли методы (статистические или основанные на искусственном интеллекте), с помощью которых можно использовать несколько наборов данных для извлечения данных, позволяющих идентифицировать личность. [5]