stringtranslate.com

Агрегация данных

Агрегация данных — это сбор информации из баз данных с целью подготовки объединенных наборов данных для обработки . [1]

Описание

Геологическая служба США поясняет, что «когда данные хорошо документированы, вы знаете, как и где искать информацию, и результаты, которые вы вернете, будут такими, как вы ожидаете». [2] Исходная информация для агрегации данных может происходить из публичных записей и баз данных по уголовным делам . Информация упаковывается в совокупные отчеты, а затем продается предприятиям , а также местным , государственным и правительственным учреждениям. Эта информация также может быть полезна в маркетинговых целях. В Соединенных Штатах деятельность многих брокеров данных подпадает под Закон о добросовестной кредитной отчетности (FCRA), который регулирует деятельность агентств по предоставлению отчетов потребителям . Затем агентства собирают и упаковывают личную информацию в отчеты потребителей , которые продаются кредиторам , работодателям , страховщикам и другим предприятиям.

Различные отчеты информации предоставляются агрегаторами баз данных. Отдельные лица могут запрашивать собственные потребительские отчеты, которые содержат основную биографическую информацию, такую ​​как имя, дата рождения, текущий адрес и номер телефона. Отчеты о проверке биографических данных сотрудников , которые содержат очень подробную информацию, такую ​​как прошлые адреса и продолжительность проживания, профессиональные лицензии и криминальное прошлое, могут быть запрошены имеющими на это право и квалифицированными третьими лицами. Эти данные могут использоваться не только при проверке биографических данных сотрудников, но и для принятия решений о страховом покрытии, ценообразовании и обеспечении соблюдения законов. Активисты по защите конфиденциальности утверждают, что агрегаторы баз данных могут предоставлять ошибочную информацию. [3]

Роль Интернета

Потенциал Интернета по консолидации и манипулированию информацией имеет новое применение в агрегации данных, также известной как скрапинг экрана . [4] Интернет дает пользователям возможность консолидировать свои имена пользователей и пароли , или PIN-коды. Такая консолидация позволяет потребителям получать доступ к широкому спектру защищенных PIN-кодом веб-сайтов, содержащих личную информацию , используя один главный PIN-код на одном веб-сайте. Поставщики онлайн-счетов включают финансовые учреждения , а точнее банки и других финансовых посредников, авиакомпании и программы поощрений для часто летающих пассажиров и другие программы, а также учетные записи электронной почты . Агрегаторы данных могут собирать учетные записи или другую информацию с определенных веб-сайтов, используя PIN-коды владельцев счетов, а затем предоставлять им информацию об учетных записях пользователей на одном веб-сайте, управляемом агрегатором по запросу владельца счета. Услуги агрегации могут предлагаться как отдельно, так и в сочетании с другими финансовыми услугами, такими как отслеживание портфеля и оплата счетов , предоставляемыми специализированным веб-сайтом, или в качестве дополнительной услуги для расширения онлайн-присутствия предприятия, созданного за пределами виртуального мира. Многие устоявшиеся компании с присутствием в Интернете, похоже, осознают ценность предложения услуги агрегации для улучшения других веб-сервисов и привлечения посетителей. Предложение услуги агрегации данных на веб-сайте может быть привлекательным из-за того, что это может часто привлекать пользователей услуги с веб-сайта хостинга.

Агрегация локальных бизнес-данных

Когда дело доходит до сбора информации о местоположении местных предприятий, есть несколько крупных агрегаторов данных, которые собирают такую ​​информацию, как название предприятия, адрес, номер телефона, веб-сайт, описание и часы работы. Затем они проверяют эту информацию, используя различные методы проверки. После того, как информация о предприятии проверена на точность, агрегаторы данных предоставляют ее издателям, таким как Google и Yelp .

Когда, например, Yelp обновляет свои списки Yelp, они берут данные из этих локальных агрегаторов данных. Издатели берут локальные бизнес-данные из разных источников и сравнивают их с тем, что у них есть в базе данных. Затем они обновляют свою базу данных той информацией, которую считают точной.

Четыре основных агрегатора данных для локального поиска по бизнесу — Acxiom, Infogroup, Localeze и Factual. [5] С января 2020 года Acxiom больше не будет выступать в качестве агрегатора данных. Foursquare занимает место Acxiom в четырех основных агрегаторах данных. [6]

Правовые последствия

Финансовые учреждения обеспокоены возможностью возникновения ответственности , возникающей в результате деятельности по агрегации данных, потенциальных проблем безопасности , нарушения прав интеллектуальной собственности и возможности уменьшения трафика на веб-сайт учреждения. Агрегатор и финансовое учреждение могут договориться о соглашении о подаче данных, активируемом по запросу клиента, используя стандарт Open Financial Exchange (OFX) для запроса и доставки информации на сайт, выбранный клиентом в качестве места, с которого он будет просматривать данные своего счета. Соглашения предоставляют учреждениям возможность вести переговоры для защиты интересов своих клиентов и предлагают агрегаторам возможность предоставлять надежную услугу. Агрегаторы, которые соглашаются с поставщиками информации извлекать данные без использования стандарта OFX, могут достичь более низкого уровня согласованных отношений; поэтому для получения данных счета может использоваться «скрин-скрейпинг», но по деловым или иным причинам агрегатор может принять решение о получении предварительного согласия и обсудить условия, на которых предоставляются данные клиентов. «Сканирование экрана» без согласия поставщика контента имеет то преимущество, что позволяет подписчикам просматривать практически все учетные записи, которые они открыли где-либо в Интернете, через один веб-сайт.

Перспективы

Со временем передача больших объемов данных учетной записи от поставщика учетной записи на сервер агрегатора может развиться в комплексный профиль пользователя, детализирующий его банковские и кредитные операции по картам, балансы, операции с ценными бумагами и портфели, а также историю поездок и предпочтения. По мере того, как растет чувствительность к соображениям защиты данных, вероятно, будет уделяться значительное внимание тому, в какой степени агрегаторы данных могут стремиться использовать эти данные либо для собственного использования, либо делиться ими с третьими лицами и оператором(ами) веб-сайта, на котором предлагается услуга. [7]

Ссылки

  1. ^ Стэнли, Джей; Стейнхардт, Барри (январь 2003 г.). «Больший монстр, слабые цепи: рост американского общества наблюдения». Американский союз защиты гражданских свобод. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  2. ^ «Почему данные необходимо управлять?». USGS . 2022-06-11 . Получено 2022-06-11 .
  3. ^ Пирс, Дебора; Акерман, Линда (2005-05-19). «Агрегаторы данных: исследование качества данных и оперативности». Privacyactivism.org. Архивировано из оригинала 2007-03-19 . Получено 2007-04-02 .
  4. ^ ван Остенрейк, Алекс (2004). «Веб-сервисы очистки экрана». Нидерланды: Университет Радбауд в Неймегене, факультет компьютерных наук . Неймеген.
  5. ^ Юздепски, Закари (16 июня 2016 г.). «Улучшите свой локальный поисковый рейтинг с помощью агрегаторов данных». Vendasta . Архивировано из оригинала 25.11.2017.
  6. ^ Чессалл, Эрика (22 января 2020 г.). «Распределение листинга: Foursquare как новый агрегатор данных». Архивировано из оригинала 25.04.2020.
  7. ^ Ledig, Robert H.; Vartanian, Thomas P. (2002-09-11). "Scrape It, Scrub It and Show It: The Battle Over Data Aggregation". Fried Frank. Архивировано из оригинала 29-09-2007 . Получено 02-04-2007 .