stringtranslate.com

Веб-аналитика

Веб-аналитика — это измерение, сбор , анализ и составление отчетов по веб- данным для понимания и оптимизации использования веб-сайтов . [1] Веб-аналитика — это не просто процесс измерения веб-трафика , но и инструмент для бизнес- и маркетинговых исследований , а также для оценки и повышения эффективности веб-сайта . Приложения веб-аналитики также могут помочь компаниям измерить результаты традиционных печатных или широковещательных рекламных кампаний . Их можно использовать для оценки того, как трафик на веб-сайте меняется после запуска новой рекламной кампании. Веб-аналитика предоставляет информацию о количестве посетителей веб-сайта и количестве просмотров страниц или создает профили поведения пользователей. [2] Она помогает оценить тенденции трафика и популярности, что полезно для маркетинговых исследований.

Основные этапы процесса веб-аналитики

Основные этапы процесса веб-аналитики

Большинство процессов веб-аналитики сводятся к четырем основным этапам или шагам [3] , а именно:

Еще одной важной функцией, разработанной аналитиками для оптимизации веб-сайтов, являются эксперименты:

Целью A/B-тестирования является выявление и предложение изменений на веб-страницах, которые увеличивают или максимизируют эффект статистически проверенного интересующего результата.

Каждый этап влияет или может влиять (т. е. управлять) на предшествующий или следующий за ним этап. Таким образом, иногда данные, доступные для сбора, влияют на онлайн-стратегию. В других случаях онлайн-стратегия влияет на собранные данные.

Категории веб-аналитики

Существует как минимум две категории веб-аналитики: внешняя и внутренняя веб-аналитика.

В прошлом веб-аналитика использовалась для обозначения измерения посетителей на сайте. Однако это значение стало размытым, в основном потому, что поставщики выпускают инструменты, которые охватывают обе категории. Многие различные поставщики предоставляют программное обеспечение и услуги веб-аналитики на сайте . Существует два основных технических способа сбора данных. Первый и традиционный метод, анализ файла журнала сервера , считывает файлы журнала , в которых веб-сервер записывает запросы файлов браузерами. Второй метод, тегирование страниц , использует JavaScript, встроенный в веб-страницу, для выполнения запросов изображений на сторонний сервер, выделенный для аналитики, всякий раз, когда веб-страница отображается веб-браузером или, при желании, когда происходит щелчок мыши. Оба собирают данные, которые могут быть обработаны для создания отчетов о веб-трафике.

Веб-аналитика на месте

В веб-аналитике нет общепринятых определений, поскольку отраслевые организации уже некоторое время пытаются прийти к согласию относительно полезных и окончательных определений, то есть метрики в инструментах и ​​продуктах разных компаний могут иметь разные способы измерения, подсчета, в результате одно и то же название метрики может представлять разное значение данных. Основными органами, которые внесли свой вклад в эту область, были IAB (Бюро интерактивной рекламы), JICWEBS (Объединенный отраслевой комитет по веб-стандартам в Великобритании и Ирландии) и DAA (Ассоциация цифровой аналитики), официально известная как WAA (Ассоциация веб-аналитики, США). Однако многие термины используются последовательно от одного основного инструмента аналитики к другому, поэтому следующий список, основанный на этих соглашениях, может быть полезной отправной точкой:

Внешняя веб-аналитика

Внешняя веб-аналитика основана на анализе открытых данных, исследовании социальных сетей и доле голосов на веб-ресурсах. Обычно она используется для понимания того, как продвигать сайт, путем определения ключевых слов, привязанных к этому сайту, либо из социальных сетей, либо с других веб-сайтов.

Источники данных веб-аналитики

Основная цель веб-аналитики — собирать и анализировать данные, связанные с веб-трафиком и шаблонами использования. Данные в основном поступают из четырех источников: [8]

  1. Данные прямого HTTP-запроса : напрямую поступают из сообщений HTTP-запроса (заголовки HTTP-запроса).
  2. Данные сетевого уровня и данные, генерируемые сервером и связанные с HTTP-запросами: не являются частью HTTP-запроса, но необходимы для успешной передачи запроса — например, IP-адрес запрашивающей стороны.
  3. Данные уровня приложения, отправленные с HTTP-запросами: генерируются и обрабатываются программами уровня приложения (такими как JavaScript , PHP и ASP.Net ), включая сеансы и рефералы. Обычно они фиксируются внутренними журналами, а не общедоступными службами веб-аналитики.
  4. Внешние данные: могут быть объединены с данными на месте, чтобы помочь дополнить данные о поведении веб-сайта, описанные выше, и интерпретировать использование веб-сайта. Например, IP-адреса обычно связаны с географическими регионами и поставщиками интернет-услуг, показателями открытия электронной почты и кликов , данными о кампаниях прямой почтовой рассылки, продажами, историей лидов или другими типами данных по мере необходимости.

Анализ файла журнала веб-сервера

Веб-серверы записывают некоторые из своих транзакций в файл журнала. Вскоре стало понятно, что эти файлы журнала могут быть прочитаны программой для предоставления данных о популярности веб-сайта. Так возникло программное обеспечение для анализа веб-журналов .

В начале 1990-х годов статистика веб-сайтов в основном состояла из подсчета количества клиентских запросов (или хитов ), сделанных на веб-сервере. Это был разумный метод изначально, поскольку каждый веб-сайт часто состоял из одного HTML-файла. Однако с появлением изображений в HTML и веб-сайтов, охватывающих несколько HTML-файлов, этот подсчет стал менее полезным. Первый настоящий коммерческий Log Analyzer был выпущен IPRO в 1994 году. [9]

В середине 1990-х годов были введены две единицы измерения для более точного измерения объема человеческой активности на веб-серверах. Это были просмотры страниц и посещения (или сеансы ). Просмотр страницы определялся как запрос, сделанный веб-серверу для страницы, в отличие от графика, в то время как посещение определялось как последовательность запросов от уникально идентифицированного клиента, которая истекала после определенного количества бездействия, обычно 30 минут.

Появление поисковых роботов и пауков в конце 1990-х годов, а также веб-прокси и динамически назначаемых IP-адресов для крупных компаний и интернет-провайдеров , усложнило идентификацию уникальных посетителей веб-сайта. Анализаторы журналов отреагировали отслеживанием посещений с помощью файлов cookie и игнорированием запросов от известных пауков. [ необходима цитата ]

Широкое использование веб-кэшей также представляло проблему для анализа файлов журналов. Если человек повторно посещает страницу, второй запрос часто будет извлечен из кэша браузера, и поэтому веб-сервер не получит ни одного запроса. Это означает, что путь человека по сайту теряется. Кэширование можно обойти, настроив веб-сервер, но это может привести к снижению производительности для посетителя и увеличению нагрузки на серверы. [10]

Тегирование страниц

Опасения по поводу точности анализа файлов журналов при наличии кэширования и желание иметь возможность выполнять веб-аналитику в качестве аутсорсинговой услуги привели к появлению второго метода сбора данных — тегирования страниц или « веб-маяков ».

В середине 1990-х годов веб-счетчики были обычным явлением — это были изображения, включенные в веб-страницу, которые показывали количество раз, когда изображение было запрошено, что было оценкой количества посещений этой страницы. В конце 1990-х годов эта концепция развилась, включив небольшое невидимое изображение вместо видимого, и, используя JavaScript, чтобы передавать вместе с запросом изображения определенную информацию о странице и посетителе. Затем эта информация может быть удаленно обработана компанией веб-аналитики, и сгенерирована обширная статистика.

Служба веб-аналитики также управляет процессом назначения пользователю cookie-файла, который может однозначно идентифицировать его во время посещения и в последующих посещениях. Показатели принятия cookie-файлов значительно различаются между веб-сайтами и могут влиять на качество собираемых и сообщаемых данных.

Сбор данных веб-сайта с использованием стороннего сервера сбора данных (или даже внутреннего сервера сбора данных) требует дополнительного поиска DNS компьютером пользователя для определения IP-адреса сервера сбора. Иногда задержки в завершении успешных или неудачных поисков DNS могут привести к тому, что данные не будут собраны.

С ростом популярности решений на основе Ajax альтернативой использованию невидимого изображения является реализация обратного вызова на сервер с отображаемой страницы. В этом случае, когда страница отображается в веб-браузере, фрагмент кода JavaScript будет вызывать сервер и передавать информацию о клиенте, которая затем может быть агрегирована компанией веб-аналитики.

Анализ лог-файла и тегирование страниц

Как программы анализа лог-файлов, так и решения по разметке страниц легко доступны компаниям, желающим выполнять веб-аналитику. В некоторых случаях одна и та же компания веб-аналитики предложит оба подхода. Тогда возникает вопрос, какой метод следует выбрать компании. У каждого подхода есть свои преимущества и недостатки. [11] [12]

Преимущества анализа лог-файлов

Основные преимущества анализа лог-файлов по сравнению с тегированием страниц заключаются в следующем:

Преимущества маркировки страниц

Основные преимущества тегирования страниц по сравнению с анализом файлов журналов заключаются в следующем:

Экономические факторы

Анализ лог-файлов почти всегда выполняется внутри компании. Тегирование страниц может выполняться внутри компании, но чаще всего предоставляется как сторонняя услуга. Экономическая разница между этими двумя моделями также может быть фактором, который компания может учитывать при выборе того, что купить.

Какое решение будет дешевле реализовать, зависит от объема технических знаний в компании, выбранного поставщика, объема активности на веб-сайтах, глубины и типа запрашиваемой информации, а также количества отдельных веб-сайтов, для которых требуется статистика.

Независимо от решения поставщика или используемого метода сбора данных, стоимость анализа и интерпретации посетителей веб-сайта также должна быть включена. То есть стоимость превращения необработанных данных в полезную информацию. Это может быть использование сторонних консультантов, найм опытного веб-аналитика или обучение подходящего внутреннего специалиста. Затем можно выполнить анализ затрат и выгод . Например, какой прирост дохода или экономия затрат могут быть получены путем анализа данных посетителей веб-сайта?

Гибридные методы

Некоторые компании производят решения, которые собирают данные как через файлы журналов, так и через теги страниц и могут анализировать оба типа. Используя гибридный метод, они стремятся производить более точную статистику, чем любой из методов по отдельности. [14]

Геолокация посетителей

С помощью IP-геолокации можно отслеживать местоположение посетителей. Используя базу данных IP-геолокации или API, посетители могут быть геолокированы на уровне города, региона или страны. [15]

IP Intelligence, или Internet Protocol (IP) Intelligence, — это технология, которая отображает Интернет и классифицирует IP-адреса по таким параметрам, как географическое положение (страна, регион, штат, город и почтовый индекс), тип подключения, поставщик услуг Интернета (ISP), информация о прокси-сервере и т. д. Первое поколение IP Intelligence называлось геотаргетингом или технологией геолокации . Эта информация используется предприятиями для сегментации онлайн-аудитории в таких приложениях, как онлайн-реклама , поведенческий таргетинг , локализация контента (или локализация веб-сайта ), управление цифровыми правами , персонализация , обнаружение онлайн-мошенничества, локализованный поиск, расширенная аналитика, глобальное управление трафиком и распространение контента.

Аналитика кликов

Анализ пути клика со ссылками на страницы слева, а также стрелками и прямоугольниками разной толщины и ширины, символизирующими количество перемещений

Аналитика кликов , также известная как Clickstream, — это особый тип веб-аналитики, уделяющий особое внимание кликам .

Обычно аналитика кликов фокусируется на аналитике на сайте. Редактор веб-сайта использует аналитику кликов для определения производительности своего конкретного сайта с точки зрения того, куда нажимают пользователи сайта.

Кроме того, аналитика кликов может происходить в режиме реального времени или «нереального» времени, в зависимости от типа запрашиваемой информации. Обычно редакторы первой страницы на сайтах новостных СМИ с высоким трафиком хотят отслеживать свои страницы в режиме реального времени, чтобы оптимизировать контент. Редакторы, дизайнеры или другие заинтересованные лица могут анализировать клики в более широком временном интервале, чтобы помочь им оценить эффективность авторов, элементов дизайна или рекламы и т. д.

Данные о кликах можно собирать по крайней мере двумя способами. В идеале клик «регистрируется», когда он происходит, и этот метод требует некоторой функциональности, которая собирает соответствующую информацию, когда происходит событие. В качестве альтернативы можно ввести предположение, что просмотр страницы является результатом клика, и, следовательно, регистрировать смоделированный клик, который привел к просмотру этой страницы.

Аналитика жизненного цикла клиента

Аналитика жизненного цикла клиента — это подход к измерению, ориентированный на посетителя. [16] Просмотры страниц, клики и другие события (такие как вызовы API, доступ к сторонним сервисам и т. д.) привязаны к отдельному посетителю, а не хранятся в виде отдельных точек данных. Аналитика жизненного цикла клиента пытается объединить все точки данных в маркетинговую воронку , которая может дать представление о поведении посетителя и оптимизации веб-сайта . [17] Общие метрики, используемые в аналитике жизненного цикла клиента, включают стоимость привлечения клиента (CAC), пожизненную ценность клиента (CLV), показатель оттока клиентов и оценки удовлетворенности клиентов . [16]

Другие методы

Иногда используются и другие методы сбора данных. Анализ пакетов собирает данные, анализируя сетевой трафик, проходящий между веб-сервером и внешним миром. Анализ пакетов не требует никаких изменений в веб-страницах или веб-серверах. Интеграция веб-аналитики в само программное обеспечение веб-сервера также возможна. [18] Оба эти метода утверждают, что предоставляют лучшие данные в реальном времени, чем другие методы.

Распространенные источники путаницы в веб-аналитике

Проблема отеля

Проблема отеля, как правило, является первой проблемой, с которой сталкивается пользователь веб-аналитики. Проблема в том, что уникальные посетители за каждый день месяца не составляют в сумме ту же сумму, что и уникальные посетители за этот месяц. Неопытному пользователю это кажется проблемой в любом аналитическом программном обеспечении, которое он использует. На самом деле это простое свойство определений метрик.

Чтобы представить ситуацию, представьте себе отель. В отеле есть два номера (номер А и номер Б).

Как видно из таблицы, в отеле есть два уникальных пользователя каждый день в течение трех дней. Сумма итогов по дням, таким образом, составляет шесть.

В течение периода в каждой комнате было два уникальных пользователя. Таким образом, сумма всех номеров составляет четыре.

На самом деле за этот период в отеле побывало только три посетителя. Проблема в том, что человек, который останавливается в номере на две ночи, будет учтен дважды, если его подсчитывают по одному разу в каждый день, но только один раз, если смотреть на общую сумму за период. Любое программное обеспечение для веб-аналитики правильно суммирует эти данные за выбранный период времени, что приводит к проблеме, когда пользователь пытается сравнить итоги.

Аналитика Отравление

По мере развития Интернета распространение автоматизированного бот-трафика стало все большей проблемой для надежности веб-аналитики. [ требуется ссылка ] Поскольку боты пересекают Интернет, они отображают веб-документы способами, аналогичными органическим пользователям, и в результате могут случайно запустить тот же код, который веб-аналитика использует для подсчета трафика. В совокупности этот случайный запуск событий веб-аналитики влияет на интерпретируемость данных и выводы, сделанные на основе этих данных. IPM предоставил доказательство концепции того, как Google Analytics , а также их конкуренты легко запускаются общими стратегиями развертывания ботов. [19]

Проблемы со сторонними файлами cookie

Традиционно поставщики аналитических решений по тегированию страниц использовали сторонние файлы cookie, отправленные с домена поставщика, а не с домена просматриваемого веб-сайта. Сторонние файлы cookie могут обрабатывать посетителей, которые пересекают несколько несвязанных доменов на сайте компании, поскольку файл cookie всегда обрабатывается серверами поставщика.

Однако сторонние файлы cookie в принципе позволяют отслеживать отдельного пользователя на сайтах разных компаний, позволяя поставщику аналитики сопоставлять активность пользователя на сайтах, где он предоставил личную информацию, с его активностью на других сайтах, где он считал себя анонимным. Хотя компании веб-аналитики отрицают, что делают это, другие компании, такие как компании, поставляющие баннерную рекламу, делали это. Поэтому опасения по поводу конфиденциальности файлов cookie привели к тому, что заметное меньшинство пользователей заблокировало или удалило сторонние файлы cookie. В 2005 году некоторые отчеты показали, что около 28% интернет-пользователей блокировали сторонние файлы cookie, а 22% удаляли их по крайней мере раз в месяц. [20] Большинство поставщиков решений по тегированию страниц теперь перешли к предоставлению по крайней мере возможности использования основных файлов cookie (файлов cookie, назначенных из клиентского поддомена).

Другая проблема — удаление файлов cookie. Когда веб-аналитика зависит от файлов cookie для идентификации уникальных посетителей, статистика зависит от постоянного файла cookie для хранения уникального идентификатора посетителя. Когда пользователи удаляют файлы cookie, они обычно удаляют как основные, так и сторонние файлы cookie. Если это делается между взаимодействиями с сайтом, пользователь будет отображаться как впервые посещающий сайт в следующей точке взаимодействия. Без постоянного и уникального идентификатора посетителя конверсии, анализ потока кликов и другие показатели, зависящие от действий уникального посетителя с течением времени, не могут быть точными.

Файлы cookie используются, поскольку IP-адреса не всегда уникальны для пользователей и могут совместно использоваться большими группами или прокси-серверами. В некоторых случаях IP-адрес объединяется с пользовательским агентом, чтобы точнее идентифицировать посетителя, если файлы cookie недоступны. Однако это решает проблему лишь частично, поскольку часто пользователи за прокси-сервером имеют один и тот же пользовательский агент. Другие методы уникальной идентификации пользователя технически сложны и ограничат отслеживаемую аудиторию или будут считаться подозрительными. Файлы cookie достигают наименьшего общего знаменателя без использования технологий, рассматриваемых как шпионское ПО , а включение/активность файлов cookie приводит к проблемам безопасности. [21]

Безопасные методы аналитики (измерения)

Сбор информации третьими лицами зависит от любых сетевых ограничений и применяемой безопасности. Страны, поставщики услуг и частные сети могут предотвратить передачу данных о посещении сайта третьим лицам. Все описанные выше методы (и некоторые другие методы, не упомянутые здесь, такие как выборка) имеют центральную проблему уязвимости к манипуляциям (как инфляции, так и дефляции). Это означает, что эти методы неточны и небезопасны (в любой разумной модели безопасности). Эта проблема рассматривалась в нескольких работах, [22] [23] [24] [25], но на сегодняшний день решения, предложенные в этих работах, остаются теоретическими.

Смотрите также

Ссылки

  1. ^ Комитет по стандартам WAA. «Определения веб-аналитики». Вашингтон, округ Колумбия: Ассоциация веб-аналитики (2008).
  2. ^ Нильсен, Янне (27.04.2021). «Использование смешанных методов для изучения исторического использования веб-маяков в веб-отслеживании». Международный журнал цифровых гуманитарных наук . 2 (1–3): 65–88. doi :10.1007/s42803-021-00033-4. ISSN  2524-7832. S2CID  233416836.
  3. ^ Янсен, Б. Дж. (2009). Понимание взаимодействия пользователя с веб-сайтом с помощью веб-аналитики. Синтезирующие лекции по информационным концепциям, поиску и услугам, 1(1), 1-102.
  4. ^ Sng, Yun Fei (2016-08-22), «Исследование факторов, связанных с показателями отказов на веб-сайтах потребительских товаров», Business Analytics , WORLD SCIENTIFIC, стр. 526–546, doi :10.1142/9789813149311_0019, ISBN 978-981-314-929-8, получено 2023-08-11
  5. ^ Menasalvas, Ernestina; Millán, Socorro; Peña, José M.; Hadjimichael, Michael; Marbán, Oscar (июль 2004 г.). «Subsessions: A granular approach to click path analysis: Click Path Analysis». International Journal of Intelligent Systems . 19 (7): 619–637. doi :10.1002/int.20014.
  6. ^ Чаффи, Дэйв; Патрон, Марк (2012-07-01). «От веб-аналитики к оптимизации цифрового маркетинга: повышение коммерческой ценности цифровой аналитики». Журнал прямого, информационного и цифрового маркетинга . 14 (1): 30–45. doi : 10.1057/dddmp.2012.20 . ISSN  1746-0174.
  7. ^ «Как определяется веб-сеанс в Universal Analytics — Справка по Analytics». support.google.com . Получено 2023-08-11 .
  8. ^ Чжэн, Г. и Пельцвергер С. (2015) Обзор веб-аналитики, в книге: Энциклопедия информационной науки и технологий, третье издание, издатель: IGI Global, редакторы: Мехди Хосров-Пур
  9. ^ Источники данных о веб-трафике и сравнение поставщиков Брайана Клифтона и Omega Digital Media Ltd.
  10. ^ Управление маркетингом: процесс создания стоимости (2-е издание), Ален Жолибер, Пьер-Луи Дюбуа, Ханс Мюльбахер, Лоран Флорес, Пьер-Луи Жолибер Дюбуа, 2012, стр. 359.
  11. ^ Повышение точности для роста онлайн-бизнеса — технический документ по точности веб-аналитики
  12. ^ «Разметка страниц и анализ журнала. Официальный документ для руководителей» (PDF) . лесозаготовительная компания. 2008.
  13. ^ "Revisiting Log File Analysis versus Page Tagging": Статья в блоге McGill University Web Analytics (CMIS 530) "Revisiting Log File Analysis versus Page Tagging". Архивировано из оригинала 6 июля 2011 г. Получено 26 февраля 2010 г.
  14. ^ "Разметка страниц (cookie) против анализа журналов". Logaholic Web Analytics . 2018-04-25 . Получено 2023-07-21 .
  15. ^ IPInfoDB (2009-07-10). "База данных геолокации IP". IPInfoDB . Получено 2009-07-19 .
  16. ^ ab Kitchens, Brent; Dobolyi, David; Li, Jingjing; Abbasi, Ahmed (2018-04-03). «Расширенная аналитика клиентов: стратегическая ценность через интеграцию ориентированных на отношения больших данных». Журнал систем управленческой информации . 35 (2): 540–574. doi :10.1080/07421222.2018.1451957. ISSN  0742-1222. S2CID  49681142.
  17. ^ Ондер, Ирем; Бербекова, Адиюх (2022-08-10). «Веб-аналитика: больше, чем оценка эффективности веб-сайта?». Международный журнал туристических городов . 8 (3): 603–615. doi :10.1108/IJTC-03-2021-0039. ISSN  2056-5607.
  18. ^ Ху, Сяохуа; Черконе, Ник (1 июля 2004 г.). «Хранилище данных/онлайновая аналитическая обработка Framework для анализа использования веб-сайтов и бизнес-аналитических отчетов». Международный журнал интеллектуальных систем . 19 (7): 585–606. doi : 10.1002/int.v19:7 .
  19. ^ "Analytics Poisoning: A Short Review - IPM Corporation". 5 декабря 2020 г. Получено 29 июля 2022 г.
  20. ^ МакГанн, Роб (14 марта 2005 г.). «Исследование: потребители удаляют файлы cookie с удивительной скоростью» . Получено 3 апреля 2014 г.
  21. ^ "Главная Новости Доступ к руководству Инструменты Образование Покупки Интернет-файлы cookie — шпионское ПО или нейтральная технология?". CNET . 2 февраля 2005 г. Получено 24 апреля 2017 г.
  22. ^ Наор, М.; Пинкас, Б. (1998). «Безопасное и эффективное измерение». Достижения в криптологии – EUROCRYPT'98 . Конспект лекций по информатике. Том 1403. стр. 576. doi :10.1007/BFb0054155. ISBN 978-3-540-64518-4.
  23. ^ Наор, М.; Пинкас, Б. (1998). «Безопасный учет и аудит в Интернете». Компьютерные сети и системы ISDN . 30 (1–7): 541–550. doi :10.1016/S0169-7552(98)00116-0.
  24. ^ Франклин, МК ; Малхи, Д. (1997). "Аудиторская метрология с облегченной безопасностью" . Финансовая криптография . Конспект лекций по информатике. Том 1318. С. 151. CiteSeerX 10.1.1.46.7786 . doi :10.1007/3-540-63594-7_75. ISBN  978-3-540-63594-9.
  25. ^ Джонсон, Р.; Стаддон, Дж. (2007). «Безопасное веб-измерение дефляции». Международный журнал информации и компьютерной безопасности . 1 : 39. CiteSeerX 10.1.1.116.3451 . doi :10.1504/IJICS.2007.012244. 

Библиография