Информация в цифровом коде
В ориентированной на соединение коммуникации поток данных представляет собой передачу последовательности цифровых кодированных сигналов для передачи информации . [1] Обычно передаваемые символы группируются в серии пакетов . [2]
Потоковая передача данных стала повсеместной. Все, что передается через Интернет , передается как поток данных. Использование мобильного телефона для разговора передает звук как поток данных.
Формальное определение
Формально поток данных — это любая упорядоченная пара , где:
- представляет собой последовательность кортежей и
- представляет собой последовательность положительных интервалов реального времени .
Содержание
Поток данных содержит различные наборы данных, которые зависят от выбранного формата данных.
- Атрибуты – каждый атрибут [3] потока данных представляет определенный тип данных, например, идентификатор сегмента/точки данных, временную метку, геоданные.
- Атрибут временной метки помогает определить, когда произошло событие.
- Идентификатор субъекта — это закодированный алгоритмом идентификатор, извлеченный из файла cookie .
- Необработанные данные включают в себя информацию, полученную непосредственно от поставщика данных, без обработки алгоритмом или человеком.
- Обработанные данные — это данные, которые были подготовлены [4] (каким-либо образом изменены, проверены или очищены) для использования в будущих действиях.
Использование
Существуют различные области использования потоков данных:
- Обнаружение мошенничества и оценка — необработанные данные используются в качестве исходных данных для алгоритма борьбы с мошенничеством ( методы анализа данных для обнаружения мошенничества ). Например, временные метки, случаи использования cookie-файлов или анализ точек данных используются в системе оценки для обнаружения мошенничества или для того, чтобы убедиться, что получатель сообщения не является ботом (так называемый нечеловеческий трафик [5] ).
- Искусственный интеллект — необработанные данные обрабатываются как обучающий и тестовый наборы при построении алгоритмов ИИ и машинного обучения .
- Необработанные данные используются для профилирования и персонализации с целью настройки профилей пользователей [6] и их разделения для сегментации, например, по полу или местоположению (на основе точки данных ).
- Бизнес-аналитика – необработанные данные являются источником информации для систем BI, используются для обогащения профилей пользователей подробной информацией о них, например, путем покупки или геоданными. Эта информация используется для бизнес-анализа и предиктивных исследований.
- Таргетинг – обработанные учеными данные улучшают онлайн-кампании и используются для охвата целевой аудитории. [7]
- Обогащение CRM – необработанные данные интегрируются с системой управления взаимоотношениями с клиентами . Интеграция CRM позволяет заполнить пробелы в профилях пользователей демографическими данными, интересами или намерениями покупки.
Интеграция
Основные интеграции с потоками данных:
- Потоки данных интегрируются с такими системами, как платформа данных клиентов (CDP), управление взаимоотношениями с клиентами (CRM) или платформа управления данными (DMP), чтобы обогатить профили пользователей внешними данными. Можно расширить знания о существующих пользователях, используя внешние источники. [8]
- Потоки данных используются для обогащения систем бизнес-аналитики, повышения точности анализа и точности выводов.
- В случае интеграции системы управления контентом (CMS) Data Stream используется для идентификации пользователей и персонализации их визита, даже если это их первый визит. Благодаря анализу данных фактическое содержимое веб-сайта адаптируется к пользователю.
- Потоки данных интегрированы с платформой спроса (DSP) в экосистеме программной рекламы. Стороны (например, рекламодатели) могут обмениваться идентификаторами пользователей и объединять с ними существующие профили.
- Потоки данных используются для выбора соответствующих сегментов пользователей (например, людей, интересующихся автомобильной промышленностью) и их использования в онлайн-кампании. Сегменты обогащаются дополнительными характеристиками пользователей из потока данных, а затем отправляются в DSP.
Видимые источники данных
В потоке данных видно, какое устройство использовалось пользователем – это видно по пользовательскому агенту :
- мобильный — когда пользователь использует мобильный браузер для просмотра, у него соответственно узкое разрешение экрана и мобильная версия приложения;
- настольный компьютер — когда пользователь использует браузер или версию приложения для настольного компьютера.
Следующая информация передается с использованного устройства:
Форматы
Точка данных — это тег, который собирает информацию об определенном действии, выполненном пользователем на веб-сайте. Точки данных существуют двух типов, значения которых используются для создания соответствующих аудиторий. Это:
- «событие» с информацией о возникновении определенного события (например, нажатие на ссылку или показ рекламы)
- «атрибут» с числовыми или буквенно-цифровыми значениями.
Сегмент — это логическое утверждение, построенное на определенных точках данных с использованием операторов И, ИЛИ или НЕ. [9]
Гибридные данные — необработанные данные из форматов точек данных и сегментов. [10]
URL-адреса — это набор информации о конкретном URL-адресе , который был посещен.
GDPR
Информация, собранная с веб-сайтов, основана на поведении пользователя. Поставщики данных предоставляют как персональную, так и неперсональную информацию. В потоке данных доступны два типа пользовательских данных:
- Персонально идентифицируемая информация (PII) – информация, которая позволяет однозначно или в сочетании с методами идентификации данных идентифицировать человека. Примерами PII являются: страховой идентификатор, адрес электронной почты, номер телефона, IP-адрес , геолокация, биометрические данные . [11]
- Неперсонально идентифицируемая информация (non-PII) — это информация, которая не может быть использована для идентификации человека или отслеживания местоположения. Файл cookie или идентификатор устройства являются примером non-PII.
Смотрите также
Алгоритм потоковой передачи
Ссылки
- ^ "Federal Standard 1037C data stream". Архивировано из оригинала 13 апреля 2007 г. Получено 4 апреля 2007 г.
- ^ "Data Stream". techopedia.com . Архивировано из оригинала 24 апреля 2019 г. Получено 24 апреля 2019 г. .
- ^ "Атрибут". businessdictionary.com . Архивировано из оригинала 24 апреля 2019 г. . Получено 24 апреля 2019 г. .
- ^ "Что представляет собой обработка данных?". ec.europa.eu . Архивировано из оригинала 24 апреля 2019 г. . Получено 24 апреля 2019 г. .
- ^ "Торговля людьми, не являющимися людьми [NHT]". theonlineadvertisingguide.com . 7 июня 2017 г. Архивировано из оригинала 13 августа 2017 г. Получено 24 апреля 2019 г.
- ^ "ПОВЕДЕНЧЕСКОЕ ПРОФИЛИРОВАНИЕ И ПЕРСОНАЛИЗАЦИЯ: ОПЫТ КЛИЕНТА ПРЕЖДЕ ВСЕГО". selligent.com . Архивировано из оригинала 24 апреля 2019 г. . Получено 24 апреля 2019 г. .
- ^ "Что такое таргетинг – Значение". selligent.com . Архивировано из оригинала 24 апреля 2019 г. . Получено 24 апреля 2019 г. .
- ^ "Что такое Data Stream и как его использовать". OnAudience.com . Архивировано из оригинала 24 апреля 2019 г. . Получено 24 апреля 2019 г. .
- ^ «6 типов сегментации пользователей и что они означают для вашего продукта». uxdesign.cc . 12 июня 2018 г.
- ^ "Что такое гибридное управление данными". ibm.com . 2 января 2018 г. Архивировано из оригинала 24 апреля 2019 г. Получено 24 апреля 2019 г.
- ^ "Что такое персонально идентифицируемая информация (PII)? Как защитить ее в соответствии с GDPR". csoonline.com . Архивировано из оригинала 24 апреля 2019 г. . Получено 24 апреля 2019 г. .