Агрегация данных — это сбор информации из баз данных с целью подготовки объединенных наборов данных для обработки . [1]
Геологическая служба США поясняет, что «когда данные хорошо документированы, вы знаете, как и где искать информацию, и результаты, которые вы вернете, будут такими, как вы ожидаете». [2] Исходная информация для агрегации данных может происходить из публичных записей и баз данных по уголовным делам . Информация упаковывается в совокупные отчеты, а затем продается предприятиям , а также местным , государственным и правительственным учреждениям. Эта информация также может быть полезна в маркетинговых целях. В Соединенных Штатах деятельность многих брокеров данных подпадает под Закон о добросовестной кредитной отчетности (FCRA), который регулирует деятельность агентств по предоставлению отчетов потребителям . Затем агентства собирают и упаковывают личную информацию в отчеты потребителей , которые продаются кредиторам , работодателям , страховщикам и другим предприятиям.
Различные отчеты информации предоставляются агрегаторами баз данных. Отдельные лица могут запрашивать собственные потребительские отчеты, которые содержат основную биографическую информацию, такую как имя, дата рождения, текущий адрес и номер телефона. Отчеты о проверке биографических данных сотрудников , которые содержат очень подробную информацию, такую как прошлые адреса и продолжительность проживания, профессиональные лицензии и криминальное прошлое, могут быть запрошены имеющими на это право и квалифицированными третьими лицами. Эти данные могут использоваться не только при проверке биографических данных сотрудников, но и для принятия решений о страховом покрытии, ценообразовании и обеспечении соблюдения законов. Активисты по защите конфиденциальности утверждают, что агрегаторы баз данных могут предоставлять ошибочную информацию. [3]
Потенциал Интернета по консолидации и манипулированию информацией имеет новое применение в агрегации данных, также известной как скрапинг экрана . [4] Интернет дает пользователям возможность консолидировать свои имена пользователей и пароли , или PIN-коды. Такая консолидация позволяет потребителям получать доступ к широкому спектру защищенных PIN-кодом веб-сайтов, содержащих личную информацию , используя один главный PIN-код на одном веб-сайте. Поставщики онлайн-счетов включают финансовые учреждения , а точнее банки и других финансовых посредников, авиакомпании и программы поощрений для часто летающих пассажиров и другие программы, а также учетные записи электронной почты . Агрегаторы данных могут собирать учетные записи или другую информацию с определенных веб-сайтов, используя PIN-коды владельцев счетов, а затем предоставлять им информацию об учетных записях пользователей на одном веб-сайте, управляемом агрегатором по запросу владельца счета. Услуги агрегации могут предлагаться как отдельно, так и в сочетании с другими финансовыми услугами, такими как отслеживание портфеля и оплата счетов , предоставляемыми специализированным веб-сайтом, или в качестве дополнительной услуги для расширения онлайн-присутствия предприятия, созданного за пределами виртуального мира. Многие устоявшиеся компании с присутствием в Интернете, похоже, осознают ценность предложения услуги агрегации для улучшения других веб-сервисов и привлечения посетителей. Предложение услуги агрегации данных на веб-сайте может быть привлекательным из-за того, что это может часто привлекать пользователей услуги с веб-сайта хостинга.
Когда дело доходит до сбора информации о местоположении местных предприятий, есть несколько крупных агрегаторов данных, которые собирают такую информацию, как название предприятия, адрес, номер телефона, веб-сайт, описание и часы работы. Затем они проверяют эту информацию, используя различные методы проверки. После того, как информация о предприятии проверена на точность, агрегаторы данных предоставляют ее издателям, таким как Google и Yelp .
Когда, например, Yelp обновляет свои списки Yelp, они берут данные из этих локальных агрегаторов данных. Издатели берут локальные бизнес-данные из разных источников и сравнивают их с тем, что у них есть в базе данных. Затем они обновляют свою базу данных той информацией, которую считают точной.
Четыре основных агрегатора данных для локального поиска по бизнесу — Acxiom, Infogroup, Localeze и Factual. [5] С января 2020 года Acxiom больше не будет выступать в качестве агрегатора данных. Foursquare занимает место Acxiom в четырех основных агрегаторах данных. [6]
Финансовые учреждения обеспокоены возможностью возникновения ответственности , возникающей в результате деятельности по агрегации данных, потенциальных проблем безопасности , нарушения прав интеллектуальной собственности и возможности уменьшения трафика на веб-сайт учреждения. Агрегатор и финансовое учреждение могут договориться о соглашении о подаче данных, активируемом по запросу клиента, используя стандарт Open Financial Exchange (OFX) для запроса и доставки информации на сайт, выбранный клиентом в качестве места, с которого он будет просматривать данные своего счета. Соглашения предоставляют учреждениям возможность вести переговоры для защиты интересов своих клиентов и предлагают агрегаторам возможность предоставлять надежную услугу. Агрегаторы, которые соглашаются с поставщиками информации извлекать данные без использования стандарта OFX, могут достичь более низкого уровня согласованных отношений; поэтому для получения данных счета может использоваться «скрин-скрейпинг», но по деловым или иным причинам агрегатор может принять решение о получении предварительного согласия и обсудить условия, на которых предоставляются данные клиентов. «Сканирование экрана» без согласия поставщика контента имеет то преимущество, что позволяет подписчикам просматривать практически все учетные записи, которые они открыли где-либо в Интернете, через один веб-сайт.
Со временем передача больших объемов данных учетной записи от поставщика учетной записи на сервер агрегатора может развиться в комплексный профиль пользователя, детализирующий его банковские и кредитные операции по картам, балансы, операции с ценными бумагами и портфели, а также историю поездок и предпочтения. По мере того, как растет чувствительность к соображениям защиты данных, вероятно, будет уделяться значительное внимание тому, в какой степени агрегаторы данных могут стремиться использовать эти данные либо для собственного использования, либо делиться ими с третьими лицами и оператором(ами) веб-сайта, на котором предлагается услуга. [7]
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь )