stringtranslate.com

Агрегация данных

Агрегация данных — это сбор информации из баз данных с целью подготовки объединенных наборов данных для обработки . [1]

Описание

Геологическая служба США объясняет, что «когда данные хорошо документированы, вы знаете, как и где искать информацию, и результаты, которые вы получите, будут такими, как вы ожидаете». [2] Источником информации для агрегирования данных могут быть публичные записи и базы данных по уголовным делам . Информация упаковывается в сводные отчеты, а затем продается предприятиям , а также местным , государственным и правительственным учреждениям. Эта информация также может быть полезна в маркетинговых целях. В Соединенных Штатах деятельность многих брокеров данных подпадает под действие Закона о добросовестной кредитной отчетности (FCRA), который регулирует деятельность агентств, предоставляющих информацию о потребителях . Затем агентства собирают и упаковывают личную информацию в потребительские отчеты, которые продаются кредиторам , работодателям , страховщикам и другим предприятиям.

Различные информационные отчеты предоставляются агрегаторами баз данных. Физические лица могут запросить собственные отчеты для потребителей, содержащие основную биографическую информацию, такую ​​как имя, дата рождения, текущий адрес и номер телефона. Отчеты о проверке биографических данных сотрудников , которые содержат очень подробную информацию, такую ​​как прошлые адреса и продолжительность проживания, профессиональные лицензии и криминальное прошлое, могут быть запрошены имеющими на это право и квалифицированными третьими лицами. Эти данные можно использовать не только при проверке анкетных данных сотрудников, но также для принятия решений о страховом покрытии, ценах и правоохранительной деятельности. Активисты по защите конфиденциальности утверждают, что агрегаторы баз данных могут предоставлять ошибочную информацию. [3]

Роль Интернета

Потенциал Интернета в консолидации и манипулировании информацией нашел новое применение в агрегировании данных, также известном как очистка экрана . [4] Интернет дает пользователям возможность объединить свои имена пользователей и пароли или ПИН-коды. Такая консолидация позволяет потребителям получать доступ к широкому спектру веб-сайтов, защищенных PIN-кодом и содержащих личную информацию, используя один главный PIN-код на одном веб-сайте. К поставщикам онлайн-счетов относятся финансовые учреждения , а точнее банки и другие финансовые посредники, авиакомпании , программы для часто летающих пассажиров и другие программы вознаграждений, а также учетные записи электронной почты . Агрегаторы данных могут собирать учетные записи или другую информацию с определенных веб-сайтов, используя ПИН-коды владельцев учетных записей, а затем предоставляя им информацию об учетных записях пользователей на одном веб-сайте, управляемом агрегатором, по запросу владельца учетной записи. Услуги агрегирования могут предлагаться отдельно или в сочетании с другими финансовыми услугами, такими как отслеживание портфеля и оплата счетов , предоставляемыми специализированным веб-сайтом, или в качестве дополнительной услуги для расширения онлайн-присутствия предприятия, созданного за пределами виртуального мира. Многие авторитетные компании, присутствующие в Интернете, похоже, осознают ценность предложения услуги агрегирования для улучшения других веб-услуг и привлечения посетителей. Предложение услуги агрегирования данных для веб-сайта может быть привлекательным из-за возможности частого привлечения пользователей услуги с хостингового веб-сайта.

Агрегация локальных бизнес-данных

Когда дело доходит до сбора информации о местоположении местных предприятий, существует несколько крупных агрегаторов данных, которые собирают такую ​​​​информацию, как название компании, адрес, номер телефона, веб-сайт, описание и часы работы. Затем они проверяют эту информацию, используя различные методы проверки. После проверки точности бизнес-информации агрегаторы данных предоставляют ее таким издателям, как Google и Yelp .

Когда Yelp, например, собирается обновить свои списки Yelp, они будут получать данные из этих местных агрегаторов данных. Издатели берут данные о местном бизнесе из разных источников и сравнивают их с тем, что в настоящее время имеется в их базе данных. Затем они обновляют свою базу данных той информацией, которую считают точной.

Четыре основных агрегатора данных для местного бизнес-поиска — это Acxiom, Infogroup, Localeze и Factual. [5] С января 2020 года Acxiom больше не будет выступать в качестве агрегатора данных. Foursquare заменяет Acxiom в четырех основных агрегаторах данных. [6]

Юридические последствия

Финансовые учреждения обеспокоены возможностью ответственности , возникающей в результате деятельности по агрегированию данных, потенциальными проблемами безопасности , нарушением прав интеллектуальной собственности и возможностью уменьшения посещаемости веб-сайта учреждения. Агрегатор и финансовое учреждение могут договориться о механизме подачи данных, активируемом по запросу клиента, используя стандарт Open Financial Exchange (OFX) для запроса и доставки информации на сайт, выбранный клиентом в качестве места, с которого он будет просматривать данные своего счета. . Соглашения предоставляют учреждениям возможность вести переговоры для защиты интересов своих клиентов и предлагают агрегаторам возможность предоставлять надежные услуги. Агрегаторы, которые соглашаются с поставщиками информации извлекать данные без использования стандарта OFX, могут достичь более низкого уровня консенсуальных отношений; поэтому для получения данных учетной записи может использоваться «очистка экрана», но по деловым или другим причинам агрегатор может принять решение получить предварительное согласие и согласовать условия, на которых данные клиента становятся доступными. «Очистка экрана» без согласия контент-провайдера имеет то преимущество, что позволяет подписчикам просматривать практически любые учетные записи, которые они открыли где-либо в Интернете, через один веб-сайт.

Перспективы

Со временем передача больших объемов данных учетной записи от поставщика учетных записей на сервер агрегатора может превратиться в комплексный профиль пользователя с подробным описанием его операций с банковскими картами и кредитными картами , балансов, операций с ценными бумагами и портфелей, а также истории поездок и предпочтений. По мере роста чувствительности к вопросам защиты данных, вероятно, значительное внимание будет уделяться тому, в какой степени агрегаторы данных могут стремиться использовать эти данные либо для собственного использования, либо для передачи их третьим лицам и операторам сайт, на котором предлагается услуга. [7]

Рекомендации

  1. ^ Стэнли, Джей; Стейнхардт, Барри (январь 2003 г.). «Большой монстр, более слабые цепи: рост американского общества наблюдения». Американский союз гражданских свобод. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  2. ^ «Почему данными необходимо управлять?». Геологическая служба США . 11.06.2022 . Проверено 11 июня 2022 г.
  3. ^ Пирс, Дебора; Акерман, Линда (19 мая 2005 г.). «Агрегаторы данных: исследование качества и оперативности данных». Privacyactivism.org. Архивировано из оригинала 19 марта 2007 г. Проверено 2 апреля 2007 г.
  4. ^ ван Остенрейк, Алекс (2004). «Веб-сервисы очистки экрана». Нидерланды: Университет Радбауд в Неймегене, факультет компьютерных наук . Неймеген.
  5. Юздепски, Захари (16 июня 2016 г.). «Улучшите свой рейтинг в местном поиске с помощью агрегаторов данных». Вендаста . Архивировано из оригинала 25 ноября 2017 г.
  6. Чессалл, Эрика (22 января 2020 г.). «Распространение листинга: Foursquare как новый агрегатор данных». Архивировано из оригинала 25 апреля 2020 г.
  7. ^ Ледиг, Роберт Х.; Вартанян, Томас П. (11 сентября 2002 г.). «Очистите, очистите и покажите: битва за агрегацию данных». Фрид Фрэнк. Архивировано из оригинала 29 сентября 2007 г. Проверено 2 апреля 2007 г.