Измерение, сбор, анализ и предоставление отчетов по веб-данным
Веб-аналитика — это измерение, сбор , анализ и составление отчетов по веб- данным для понимания и оптимизации использования веб-сайтов . [1] Веб-аналитика — это не просто процесс измерения веб-трафика , но и инструмент для бизнес- и маркетинговых исследований , а также для оценки и повышения эффективности веб-сайта . Приложения веб-аналитики также могут помочь компаниям измерить результаты традиционных печатных или широковещательных рекламных кампаний . Их можно использовать для оценки того, как трафик на веб-сайте меняется после запуска новой рекламной кампании. Веб-аналитика предоставляет информацию о количестве посетителей веб-сайта и количестве просмотров страниц или создает профили поведения пользователей. [2] Она помогает оценить тенденции трафика и популярности, что полезно для маркетинговых исследований.
Основные этапы процесса веб-аналитики
Большинство процессов веб-аналитики сводятся к четырем основным этапам или шагам [3] , а именно:
Сбор данных : Этот этап представляет собой сбор основных, элементарных данных. Обычно эти данные представляют собой подсчеты вещей. Цель этого этапа — собрать данные.
Обработка данных в метрики : На этом этапе обычно берутся подсчеты и делаются их отношениями, хотя некоторые подсчеты все еще могут быть. Цель этого этапа — взять данные и преобразовать их в информацию, а именно в метрики.
Разработка KPI: этот этап фокусируется на использовании коэффициентов (и подсчетов) и их включении в бизнес-стратегии, называемые ключевыми показателями эффективности (KPI). Часто KPI связаны с аспектами конверсии, но не всегда. Это зависит от организации.
Формулирование онлайн-стратегии: Этот этап касается онлайн-целей, задач и стандартов для организации или бизнеса. Эти стратегии обычно связаны с получением прибыли , экономией денег или увеличением доли рынка .
Еще одной важной функцией, разработанной аналитиками для оптимизации веб-сайтов, являются эксперименты:
Эксперименты и тестирование: A/B-тестирование — это контролируемый эксперимент с двумя вариантами, проводимый в онлайн-среде, например, при веб-разработке .
Целью A/B-тестирования является выявление и предложение изменений на веб-страницах, которые увеличивают или максимизируют эффект статистически проверенного интересующего результата.
Каждый этап влияет или может влиять (т. е. управлять) на предшествующий или следующий за ним этап. Таким образом, иногда данные, доступные для сбора, влияют на онлайн-стратегию. В других случаях онлайн-стратегия влияет на собранные данные.
Категории веб-аналитики
Существует как минимум две категории веб-аналитики: внешняя и внутренняя веб-аналитика.
Внешняя веб-аналитика относится к веб-измерениям и анализу независимо от того, владеет ли человек веб-сайтом или поддерживает его. Она включает измерение потенциальной аудитории веб-сайта (возможности), доли голоса (видимости) и шума (комментариев), происходящего в Интернете в целом.
Веб-аналитика на месте , более распространенная из двух, измеряет поведение посетителя, когда он находится на определенном веб-сайте . Это включает его драйверы и конверсии; например, степень, в которой различные целевые страницы связаны с онлайн-покупками. Веб-аналитика на месте измеряет производительность определенного веб-сайта в коммерческом контексте. Эти данные обычно сравниваются с ключевыми показателями производительности для производительности и используются для улучшения отклика аудитории веб-сайта или маркетинговой кампании . Google Analytics и Adobe Analytics являются наиболее широко используемыми службами веб-аналитики на месте; хотя появляются новые инструменты, которые предоставляют дополнительные уровни информации, включая тепловые карты и воспроизведение сеанса .
В прошлом веб-аналитика использовалась для обозначения измерения посетителей на сайте. Однако это значение стало размытым, в основном потому, что поставщики выпускают инструменты, которые охватывают обе категории. Многие различные поставщики предоставляют программное обеспечение и услуги веб-аналитики на сайте . Существует два основных технических способа сбора данных. Первый и традиционный метод, анализ файла журнала сервера , считывает файлы журнала , в которых веб-сервер записывает запросы файлов браузерами. Второй метод, тегирование страниц , использует JavaScript, встроенный в веб-страницу, для выполнения запросов изображений на сторонний сервер, выделенный для аналитики, всякий раз, когда веб-страница отображается веб-браузером или, при желании, когда происходит щелчок мыши. Оба собирают данные, которые могут быть обработаны для создания отчетов о веб-трафике.
Веб-аналитика на месте
В веб-аналитике нет общепринятых определений, поскольку отраслевые организации уже некоторое время пытаются прийти к согласию относительно полезных и окончательных определений, то есть метрики в инструментах и продуктах разных компаний могут иметь разные способы измерения, подсчета, в результате одно и то же название метрики может представлять разное значение данных. Основными органами, которые внесли свой вклад в эту область, были IAB (Бюро интерактивной рекламы), JICWEBS (Объединенный отраслевой комитет по веб-стандартам в Великобритании и Ирландии) и DAA (Ассоциация цифровой аналитики), официально известная как WAA (Ассоциация веб-аналитики, США). Однако многие термины используются последовательно от одного основного инструмента аналитики к другому, поэтому следующий список, основанный на этих соглашениях, может быть полезной отправной точкой:
Показатель отказов — процент посещений, которые являются посещениями одной страницы и не содержат других взаимодействий (кликов) на этой странице. Другими словами, один клик в определенном сеансе называется отказом. Высокий показатель отказов может указывать на то, что контент или пользовательский опыт нуждаются в улучшении. [4]
Путь клика — хронологическая последовательность просмотров страниц в рамках посещения или сеанса. Анализ этого пути дает информацию о целях сеанса пользователя и целях пользователя. [5]
Hit — запрос файла с веб-сервера. Доступно только в анализе журнала. Количество хитов, полученных веб-сайтом, часто приводится для подтверждения его популярности, но это число крайне обманчиво и значительно переоценивает популярность. Одна веб-страница обычно состоит из нескольких (часто десятков) отдельных файлов, каждый из которых считается хитом по мере загрузки страницы, поэтому количество хитов на самом деле является произвольным числом, больше отражающим сложность отдельных страниц на веб-сайте, чем фактическую популярность веб-сайта. Общее количество посещений или просмотров страниц дает более реалистичную и точную оценку популярности.
Просмотр страницы (pageview) — запрос файла или иногда событие, например, щелчок мыши, которое определяется как страница в настройках инструмента веб-аналитики. Обычно количество просмотров страниц больше, чем посещений и посетителей (уникальных посетителей). Случай выполнения скрипта в тегах страниц. В анализе журнала просмотр одной страницы может генерировать несколько обращений, поскольку все ресурсы, необходимые для просмотра страницы (изображения, файлы .js и .css), также запрашиваются с веб-сервера. «Обновление» той же веб-страницы может быть засчитано как еще один просмотр страницы. Например, в момент времени: 16:07 пользователь просмотрел страницу A, через 2 секунды пользователь нажимает кнопку «обновить» в браузере, количество просмотров страницы A тогда равно 2.
Посетитель/уникальный посетитель/уникальный пользователь — уникально идентифицированный клиент, который генерирует просмотры страниц или хиты в течение определенного периода времени (например, день, неделя или месяц). Уникально идентифицированный клиент обычно представляет собой комбинацию машины (например, настольного компьютера на работе) и браузера (Firefox на этой машине). Идентификация обычно осуществляется с помощью постоянного файла cookie, который размещается на компьютере кодом страницы сайта. Более старый метод, используемый при анализе файлов журнала, представляет собой уникальное сочетание IP-адреса компьютера и информации User-Agent (браузера), предоставляемой веб-серверу браузером. «Посетитель» — это не то же самое, что человек, сидящий за компьютером во время посещения, поскольку отдельный человек может использовать разные компьютеры или, на одном компьютере, может использовать разные браузеры и будет рассматриваться как другой посетитель в каждом случае. Все чаще, но все еще довольно редко, посетители уникально идентифицируются с помощью Flash LSO ( локальных общих объектов ), которые менее восприимчивы к обеспечению конфиденциальности.
Визит/сеанс — Визит или сеанс определяется как серия запросов страниц или, в случае тегов, запросов изображений от одного и того же уникально идентифицированного клиента. Обычно количество Визитов превышает Посетителей (Уникальных Посетителей). Уникальный клиент обычно идентифицируется по IP-адресу или уникальному идентификатору, который помещается в файл cookie браузера. Визит считается завершенным, если в течение определенного количества прошедших минут не было зарегистрировано ни одного запроса. 30-минутный лимит («тайм-аут») используется многими аналитическими инструментами, но в некоторых инструментах (например, Google Analytics) может быть изменен на другое количество минут. Сборщики аналитических данных и инструменты анализа не имеют надежного способа узнать, просматривал ли посетитель другие сайты между просмотрами страниц; посещение считается одним посещением, если события (просмотры страниц, клики, все, что регистрируется) находятся в пределах 30 минут или менее близко друг к другу. Визит может состоять из просмотра одной страницы или тысяч. Уникальный сеанс посещения также может быть продлен, если время между загрузками страниц указывает на то, что посетитель просматривал страницы непрерывно.
Активное время/время взаимодействия — среднее количество времени, которое посетители тратят на фактическое взаимодействие с контентом на веб-странице, на основе движений мыши, щелчков, наведений и прокруток. В отличие от продолжительности сеанса и продолжительности просмотра страницы/времени на странице, эта метрика может точно измерить продолжительность взаимодействия при конечном просмотре страницы, но она недоступна во многих аналитических инструментах или методах сбора данных.
Средняя глубина просмотра страницы/количество просмотров страниц за средний сеанс . Глубина просмотра страницы — это приблизительный «размер» среднего посещения, рассчитываемый путем деления общего количества просмотров страниц на общее количество посещений.
Средняя продолжительность просмотра страницы — среднее количество времени, которое посетители проводят на средней странице сайта.
Клик — «относится к единичному случаю перехода пользователя по гиперссылке с одной страницы сайта на другую».
Событие — дискретное действие или класс действий, которые происходят на веб-сайте. Просмотр страницы — это тип события. События также инкапсулируют щелчки, отправку форм, нажатия клавиш и другие действия пользователя на стороне клиента.
Exit rate/% выхода - статистика, применяемая к отдельной странице, а не к веб-сайту. Процент посещений, на которых отображается страница, где эта страница является последней страницей, просмотренной в посещении.
Сегментация данных - Инструменты веб-аналитики позволяют сегментировать данные, что означает разбиение данных на более мелкие подмножества на основе таких критериев, как демография, местоположение или поведение. Это обеспечивает более глубокое понимание различных сегментов аудитории. [6]
Первый визит/первый сеанс - (также называется «Абсолютно уникальный посетитель» в некоторых инструментах) Визит уникально идентифицированного клиента, который теоретически не совершал предыдущих визитов. Поскольку единственный способ узнать, посещал ли уникально идентифицированный клиент сайт ранее, - это наличие постоянного файла cookie или с помощью цифрового отпечатка пальца , полученного при предыдущем посещении, метка «Первый визит» не является надежной, если файлы cookie сайта были удалены с момента предыдущего посещения.
Частота/сеанс на уникального посетителя — частота измеряет, как часто посетители заходят на сайт за определенный период времени. Она рассчитывается путем деления общего числа сеансов (или посещений) на общее число уникальных посетителей за определенный период времени, например, месяц или год. Иногда ее используют взаимозаменяемо с термином «лояльность».
Впечатление - Наиболее распространенное определение впечатления - это случай появления рекламы на просматриваемой странице. Реклама может отображаться на просматриваемой странице ниже области, фактически отображаемой на экране, поэтому большинство показателей впечатлений не обязательно означают, что реклама была просматриваемой.
Новый посетитель - Посетитель, который ранее не посещал сайт. Это определение создает некоторую путаницу (см. распространенные путаницы ниже) и иногда заменяется анализом первых посещений.
Время просмотра страницы/время видимости страницы/продолжительность просмотра страницы - время, в течение которого одна страница (или блог, рекламный баннер) находится на экране, измеряемое как расчетная разница между временем запроса этой страницы и временем следующего зарегистрированного запроса. Если следующего зарегистрированного запроса нет, то время просмотра этого экземпляра этой страницы не включается в отчеты.
Повторный посетитель - Посетитель, который совершил хотя бы один предыдущий визит. Период между последним и текущим визитом называется недавностью посетителя и измеряется в днях.
Повторный посетитель - уникальный посетитель с активностью, состоящей из посещения сайта в течение отчетного периода, и где уникальный посетитель посетил сайт до отчетного периода. Индивидуум учитывается только один раз в течение отчетного периода.
Длительность сеанса/длительность посещения — среднее количество времени, которое посетители проводят на сайте при каждом посещении. Рассчитывается как сумма продолжительности всех сеансов, деленная на общее количество сеансов. Этот показатель может быть усложнен тем, что аналитические программы не могут измерить длительность конечного просмотра страницы. [7]
Посещение одной страницы/синглтон — посещение, в ходе которого просматривается только одна страница (это не «отказ»).
Наложение сайта — это метод создания отчетов, при котором статистические данные (клики) или «горячие точки» накладываются по физическому местоположению на визуальный снимок веб-страницы.
Показатель кликабельности — это отношение пользователей, которые нажимают на определенную ссылку, к общему числу пользователей, которые просматривают страницу, электронное письмо или рекламу. Он обычно используется для измерения успешности онлайн-рекламной кампании для определенного веб-сайта, а также эффективности кампаний по электронной почте. Другое известное определение показателя кликабельности (CTR) — это общее число кликов, деленное на общее число показов, поскольку показатель показателя кликабельности измеряет отношение кликов и показов, а не количество пользователей (которые нажали и увидели).
Внешняя веб-аналитика
Внешняя веб-аналитика основана на анализе открытых данных, исследовании социальных сетей и доле голосов на веб-ресурсах. Обычно она используется для понимания того, как продвигать сайт, путем определения ключевых слов, привязанных к этому сайту, либо из социальных сетей, либо с других веб-сайтов.
Источники данных веб-аналитики
Основная цель веб-аналитики — собирать и анализировать данные, связанные с веб-трафиком и шаблонами использования. Данные в основном поступают из четырех источников: [8]
Данные прямого HTTP-запроса : напрямую поступают из сообщений HTTP-запроса (заголовки HTTP-запроса).
Данные сетевого уровня и данные, генерируемые сервером и связанные с HTTP-запросами: не являются частью HTTP-запроса, но необходимы для успешной передачи запроса — например, IP-адрес запрашивающей стороны.
Данные уровня приложения, отправленные с HTTP-запросами: генерируются и обрабатываются программами уровня приложения (такими как JavaScript , PHP и ASP.Net ), включая сеансы и рефералы. Обычно они фиксируются внутренними журналами, а не общедоступными службами веб-аналитики.
Внешние данные: могут быть объединены с данными на месте, чтобы помочь дополнить данные о поведении веб-сайта, описанные выше, и интерпретировать использование веб-сайта. Например, IP-адреса обычно связаны с географическими регионами и поставщиками интернет-услуг, показателями открытия электронной почты и кликов , данными о кампаниях прямой почтовой рассылки, продажами, историей лидов или другими типами данных по мере необходимости.
Анализ файла журнала веб-сервера
Веб-серверы записывают некоторые из своих транзакций в файл журнала. Вскоре стало понятно, что эти файлы журнала могут быть прочитаны программой для предоставления данных о популярности веб-сайта. Так возникло программное обеспечение для анализа веб-журналов .
В начале 1990-х годов статистика веб-сайтов в основном состояла из подсчета количества клиентских запросов (или хитов ), сделанных на веб-сервере. Это был разумный метод изначально, поскольку каждый веб-сайт часто состоял из одного HTML-файла. Однако с появлением изображений в HTML и веб-сайтов, охватывающих несколько HTML-файлов, этот подсчет стал менее полезным. Первый настоящий коммерческий Log Analyzer был выпущен IPRO в 1994 году. [9]
В середине 1990-х годов были введены две единицы измерения для более точного измерения объема человеческой активности на веб-серверах. Это были просмотры страниц и посещения (или сеансы ). Просмотр страницы определялся как запрос, сделанный веб-серверу для страницы, в отличие от графика, в то время как посещение определялось как последовательность запросов от уникально идентифицированного клиента, которая истекала после определенного количества бездействия, обычно 30 минут.
Широкое использование веб-кэшей также представляло проблему для анализа файлов журналов. Если человек повторно посещает страницу, второй запрос часто будет извлечен из кэша браузера, и поэтому веб-сервер не получит ни одного запроса. Это означает, что путь человека по сайту теряется. Кэширование можно обойти, настроив веб-сервер, но это может привести к снижению производительности для посетителя и увеличению нагрузки на серверы. [10]
Тегирование страниц
Опасения по поводу точности анализа файлов журналов при наличии кэширования и желание иметь возможность выполнять веб-аналитику в качестве аутсорсинговой услуги привели к появлению второго метода сбора данных — тегирования страниц или « веб-маяков ».
В середине 1990-х годов веб-счетчики были обычным явлением — это были изображения, включенные в веб-страницу, которые показывали количество раз, когда изображение было запрошено, что было оценкой количества посещений этой страницы. В конце 1990-х годов эта концепция развилась, включив небольшое невидимое изображение вместо видимого, и, используя JavaScript, чтобы передавать вместе с запросом изображения определенную информацию о странице и посетителе. Затем эта информация может быть удаленно обработана компанией веб-аналитики, и сгенерирована обширная статистика.
Служба веб-аналитики также управляет процессом назначения пользователю cookie-файла, который может однозначно идентифицировать его во время посещения и в последующих посещениях. Показатели принятия cookie-файлов значительно различаются между веб-сайтами и могут влиять на качество собираемых и сообщаемых данных.
Сбор данных веб-сайта с использованием стороннего сервера сбора данных (или даже внутреннего сервера сбора данных) требует дополнительного поиска DNS компьютером пользователя для определения IP-адреса сервера сбора. Иногда задержки в завершении успешных или неудачных поисков DNS могут привести к тому, что данные не будут собраны.
С ростом популярности решений на основе Ajax альтернативой использованию невидимого изображения является реализация обратного вызова на сервер с отображаемой страницы. В этом случае, когда страница отображается в веб-браузере, фрагмент кода JavaScript будет вызывать сервер и передавать информацию о клиенте, которая затем может быть агрегирована компанией веб-аналитики.
Анализ лог-файла и тегирование страниц
Как программы анализа лог-файлов, так и решения по разметке страниц легко доступны компаниям, желающим выполнять веб-аналитику. В некоторых случаях одна и та же компания веб-аналитики предложит оба подхода. Тогда возникает вопрос, какой метод следует выбрать компании. У каждого подхода есть свои преимущества и недостатки. [11] [12]
Преимущества анализа лог-файлов
Основные преимущества анализа лог-файлов по сравнению с тегированием страниц заключаются в следующем:
Веб-сервер обычно уже создает файлы журналов, поэтому необработанные данные уже доступны. Никаких изменений на веб-сайте не требуется.
Данные находятся на серверах компании и находятся в стандартном, а не в фирменном формате. Это позволяет компании легко переключать программы позже, использовать несколько разных программ и анализировать исторические данные с помощью новой программы.
Файлы журналов содержат информацию о посещениях поисковых роботов, которые обычно исключаются из инструментов аналитики с помощью тегов JavaScript. (Некоторые поисковые системы могут даже не выполнять JavaScript на странице.) Хотя они не должны сообщаться как часть человеческой деятельности, это полезная информация для поисковой оптимизации .
Файлы журналов не требуют дополнительных DNS- запросов или медленных запусков TCP . Таким образом, нет внешних серверных вызовов, которые могут замедлить скорость загрузки страниц или привести к неучтенным просмотрам страниц.
Веб-сервер надежно регистрирует каждую совершаемую им транзакцию, например, обслуживая PDF-документы и контент, созданный скриптами, и не полагается на взаимодействие браузеров посетителей.
Преимущества маркировки страниц
Основные преимущества тегирования страниц по сравнению с анализом файлов журналов заключаются в следующем:
Подсчет активируется при открытии страницы (при условии, что веб-клиент запускает скрипты тегов), а не при запросе ее с сервера. Если страница кэширована, она не будет учитываться серверным анализом журнала. Кэшированные страницы могут составлять до трети всех просмотров страниц, что может негативно повлиять на многие показатели сайта. [ необходима цитата ]
Данные собираются через компонент («тег») на странице, обычно написанный на JavaScript. Обычно он используется в сочетании с серверным языком сценариев (например, PHP ) для манипулирования и (обычно) сохранения в базе данных.
Скрипт может иметь доступ к дополнительной информации о веб-клиенте или пользователе, не отправленной в запросе, например, к размерам экранов посетителей и цене приобретенных ими товаров.
Тегирование страниц может сообщать о событиях, которые не подразумевают запрос к веб-серверу, таких как взаимодействия внутри Flash -роликов, частичное заполнение форм, события мыши, такие как onClick, onMouseOver, onFocus, onBlur и т. д.
Служба тегирования страниц управляет процессом назначения cookie-файлов посетителям; при анализе файлов журналов сервер должен быть настроен для этого.
Тегирование страниц доступно компаниям, не имеющим доступа к своим веб-серверам.
В последнее время тегирование страниц стало стандартом в веб-аналитике. [13]
Экономические факторы
Анализ лог-файлов почти всегда выполняется внутри компании. Тегирование страниц может выполняться внутри компании, но чаще всего предоставляется как сторонняя услуга. Экономическая разница между этими двумя моделями также может быть фактором, который компания может учитывать при выборе того, что купить.
Анализ лог-файлов обычно подразумевает единовременную покупку программного обеспечения; однако некоторые поставщики вводят максимальное количество просмотров страниц в год с дополнительными расходами на обработку дополнительной информации. [ необходима цитата ] Помимо коммерческих предложений, несколько инструментов анализа лог-файлов с открытым исходным кодом доступны бесплатно.
Для анализа Logfile данные должны храниться и архивироваться, что часто быстро становится большим. Хотя стоимость оборудования для этого минимальна, накладные расходы для ИТ-отдела могут быть значительными.
Для анализа лог-файлов необходимо поддерживать программное обеспечение в рабочем состоянии, включая обновления и исправления безопасности.
Поставщики услуг по комплексной разметке страниц взимают ежемесячную плату в зависимости от объема, т. е. количества просмотров страниц за месяц.
Какое решение будет дешевле реализовать, зависит от объема технических знаний в компании, выбранного поставщика, объема активности на веб-сайтах, глубины и типа запрашиваемой информации, а также количества отдельных веб-сайтов, для которых требуется статистика.
Независимо от решения поставщика или используемого метода сбора данных, стоимость анализа и интерпретации посетителей веб-сайта также должна быть включена. То есть стоимость превращения необработанных данных в полезную информацию. Это может быть использование сторонних консультантов, найм опытного веб-аналитика или обучение подходящего внутреннего специалиста. Затем можно выполнить анализ затрат и выгод . Например, какой прирост дохода или экономия затрат могут быть получены путем анализа данных посетителей веб-сайта?
Гибридные методы
Некоторые компании производят решения, которые собирают данные как через файлы журналов, так и через теги страниц и могут анализировать оба типа. Используя гибридный метод, они стремятся производить более точную статистику, чем любой из методов по отдельности. [14]
Геолокация посетителей
С помощью IP-геолокации можно отслеживать местоположение посетителей. Используя базу данных IP-геолокации или API, посетители могут быть геолокированы на уровне города, региона или страны. [15]
IP Intelligence, или Internet Protocol (IP) Intelligence, — это технология, которая отображает Интернет и классифицирует IP-адреса по таким параметрам, как географическое положение (страна, регион, штат, город и почтовый индекс), тип подключения, поставщик услуг Интернета (ISP), информация о прокси-сервере и т. д. Первое поколение IP Intelligence называлось геотаргетингом или технологией геолокации . Эта информация используется предприятиями для сегментации онлайн-аудитории в таких приложениях, как онлайн-реклама , поведенческий таргетинг , локализация контента (или локализация веб-сайта ), управление цифровыми правами , персонализация , обнаружение онлайн-мошенничества, локализованный поиск, расширенная аналитика, глобальное управление трафиком и распространение контента.
Обычно аналитика кликов фокусируется на аналитике на сайте. Редактор веб-сайта использует аналитику кликов для определения производительности своего конкретного сайта с точки зрения того, куда нажимают пользователи сайта.
Кроме того, аналитика кликов может происходить в режиме реального времени или «нереального» времени, в зависимости от типа запрашиваемой информации. Обычно редакторы первой страницы на сайтах новостных СМИ с высоким трафиком хотят отслеживать свои страницы в режиме реального времени, чтобы оптимизировать контент. Редакторы, дизайнеры или другие заинтересованные лица могут анализировать клики в более широком временном интервале, чтобы помочь им оценить эффективность авторов, элементов дизайна или рекламы и т. д.
Данные о кликах можно собирать по крайней мере двумя способами. В идеале клик «регистрируется», когда он происходит, и этот метод требует некоторой функциональности, которая собирает соответствующую информацию, когда происходит событие. В качестве альтернативы можно ввести предположение, что просмотр страницы является результатом клика, и, следовательно, регистрировать смоделированный клик, который привел к просмотру этой страницы.
Аналитика жизненного цикла клиента
Аналитика жизненного цикла клиента — это подход к измерению, ориентированный на посетителя. [16] Просмотры страниц, клики и другие события (такие как вызовы API, доступ к сторонним сервисам и т. д.) привязаны к отдельному посетителю, а не хранятся в виде отдельных точек данных. Аналитика жизненного цикла клиента пытается объединить все точки данных в маркетинговую воронку , которая может дать представление о поведении посетителя и оптимизации веб-сайта . [17] Общие метрики, используемые в аналитике жизненного цикла клиента, включают стоимость привлечения клиента (CAC), пожизненную ценность клиента (CLV), показатель оттока клиентов и оценки удовлетворенности клиентов . [16]
Другие методы
Иногда используются и другие методы сбора данных. Анализ пакетов собирает данные, анализируя сетевой трафик, проходящий между веб-сервером и внешним миром. Анализ пакетов не требует никаких изменений в веб-страницах или веб-серверах. Интеграция веб-аналитики в само программное обеспечение веб-сервера также возможна. [18] Оба эти метода утверждают, что предоставляют лучшие данные в реальном времени, чем другие методы.
Распространенные источники путаницы в веб-аналитике
Проблема отеля
Проблема отеля, как правило, является первой проблемой, с которой сталкивается пользователь веб-аналитики. Проблема в том, что уникальные посетители за каждый день месяца не составляют в сумме ту же сумму, что и уникальные посетители за этот месяц. Неопытному пользователю это кажется проблемой в любом аналитическом программном обеспечении, которое он использует. На самом деле это простое свойство определений метрик.
Чтобы представить ситуацию, представьте себе отель. В отеле есть два номера (номер А и номер Б).
Как видно из таблицы, в отеле есть два уникальных пользователя каждый день в течение трех дней. Сумма итогов по дням, таким образом, составляет шесть.
В течение периода в каждой комнате было два уникальных пользователя. Таким образом, сумма всех номеров составляет четыре.
На самом деле за этот период в отеле побывало только три посетителя. Проблема в том, что человек, который останавливается в номере на две ночи, будет учтен дважды, если его подсчитывают по одному разу в каждый день, но только один раз, если смотреть на общую сумму за период. Любое программное обеспечение для веб-аналитики правильно суммирует эти данные за выбранный период времени, что приводит к проблеме, когда пользователь пытается сравнить итоги.
Аналитика Отравление
По мере развития Интернета распространение автоматизированного бот-трафика стало все большей проблемой для надежности веб-аналитики. [ требуется ссылка ] Поскольку боты пересекают Интернет, они отображают веб-документы способами, аналогичными органическим пользователям, и в результате могут случайно запустить тот же код, который веб-аналитика использует для подсчета трафика. В совокупности этот случайный запуск событий веб-аналитики влияет на интерпретируемость данных и выводы, сделанные на основе этих данных. IPM предоставил доказательство концепции того, как Google Analytics , а также их конкуренты легко запускаются общими стратегиями развертывания ботов. [19]
Проблемы со сторонними файлами cookie
Традиционно поставщики аналитических решений по тегированию страниц использовали сторонние файлы cookie, отправленные с домена поставщика, а не с домена просматриваемого веб-сайта. Сторонние файлы cookie могут обрабатывать посетителей, которые пересекают несколько несвязанных доменов на сайте компании, поскольку файл cookie всегда обрабатывается серверами поставщика.
Однако сторонние файлы cookie в принципе позволяют отслеживать отдельного пользователя на сайтах разных компаний, позволяя поставщику аналитики сопоставлять активность пользователя на сайтах, где он предоставил личную информацию, с его активностью на других сайтах, где он считал себя анонимным. Хотя компании веб-аналитики отрицают, что делают это, другие компании, такие как компании, поставляющие баннерную рекламу, делали это. Поэтому опасения по поводу конфиденциальности файлов cookie привели к тому, что заметное меньшинство пользователей заблокировало или удалило сторонние файлы cookie. В 2005 году некоторые отчеты показали, что около 28% интернет-пользователей блокировали сторонние файлы cookie, а 22% удаляли их по крайней мере раз в месяц. [20]
Большинство поставщиков решений по тегированию страниц теперь перешли к предоставлению по крайней мере возможности использования основных файлов cookie (файлов cookie, назначенных из клиентского поддомена).
Другая проблема — удаление файлов cookie. Когда веб-аналитика зависит от файлов cookie для идентификации уникальных посетителей, статистика зависит от постоянного файла cookie для хранения уникального идентификатора посетителя. Когда пользователи удаляют файлы cookie, они обычно удаляют как основные, так и сторонние файлы cookie. Если это делается между взаимодействиями с сайтом, пользователь будет отображаться как впервые посещающий сайт в следующей точке взаимодействия. Без постоянного и уникального идентификатора посетителя конверсии, анализ потока кликов и другие показатели, зависящие от действий уникального посетителя с течением времени, не могут быть точными.
Файлы cookie используются, поскольку IP-адреса не всегда уникальны для пользователей и могут совместно использоваться большими группами или прокси-серверами. В некоторых случаях IP-адрес объединяется с пользовательским агентом, чтобы точнее идентифицировать посетителя, если файлы cookie недоступны. Однако это решает проблему лишь частично, поскольку часто пользователи за прокси-сервером имеют один и тот же пользовательский агент. Другие методы уникальной идентификации пользователя технически сложны и ограничат отслеживаемую аудиторию или будут считаться подозрительными. Файлы cookie достигают наименьшего общего знаменателя без использования технологий, рассматриваемых как шпионское ПО , а включение/активность файлов cookie приводит к проблемам безопасности. [21]
Безопасные методы аналитики (измерения)
Сбор информации третьими лицами зависит от любых сетевых ограничений и применяемой безопасности. Страны, поставщики услуг и частные сети могут предотвратить передачу данных о посещении сайта третьим лицам. Все описанные выше методы (и некоторые другие методы, не упомянутые здесь, такие как выборка) имеют центральную проблему уязвимости к манипуляциям (как инфляции, так и дефляции). Это означает, что эти методы неточны и небезопасны (в любой разумной модели безопасности). Эта проблема рассматривалась в нескольких работах, [22] [23] [24] [25], но на сегодняшний день решения, предложенные в этих работах, остаются теоретическими.
^ Комитет по стандартам WAA. «Определения веб-аналитики». Вашингтон, округ Колумбия: Ассоциация веб-аналитики (2008).
^ Нильсен, Янне (27.04.2021). «Использование смешанных методов для изучения исторического использования веб-маяков в веб-отслеживании». Международный журнал цифровых гуманитарных наук . 2 (1–3): 65–88. doi :10.1007/s42803-021-00033-4. ISSN 2524-7832. S2CID 233416836.
^ Янсен, Б. Дж. (2009). Понимание взаимодействия пользователя с веб-сайтом с помощью веб-аналитики. Синтезирующие лекции по информационным концепциям, поиску и услугам, 1(1), 1-102.
^ Sng, Yun Fei (2016-08-22), «Исследование факторов, связанных с показателями отказов на веб-сайтах потребительских товаров», Business Analytics , WORLD SCIENTIFIC, стр. 526–546, doi :10.1142/9789813149311_0019, ISBN978-981-314-929-8, получено 2023-08-11
^ Menasalvas, Ernestina; Millán, Socorro; Peña, José M.; Hadjimichael, Michael; Marbán, Oscar (июль 2004 г.). «Subsessions: A granular approach to click path analysis: Click Path Analysis». International Journal of Intelligent Systems . 19 (7): 619–637. doi :10.1002/int.20014.
^ Чаффи, Дэйв; Патрон, Марк (2012-07-01). «От веб-аналитики к оптимизации цифрового маркетинга: повышение коммерческой ценности цифровой аналитики». Журнал прямого, информационного и цифрового маркетинга . 14 (1): 30–45. doi : 10.1057/dddmp.2012.20 . ISSN 1746-0174.
^ «Как определяется веб-сеанс в Universal Analytics — Справка по Analytics». support.google.com . Получено 2023-08-11 .
^ Чжэн, Г. и Пельцвергер С. (2015) Обзор веб-аналитики, в книге: Энциклопедия информационной науки и технологий, третье издание, издатель: IGI Global, редакторы: Мехди Хосров-Пур
^ Источники данных о веб-трафике и сравнение поставщиков Брайана Клифтона и Omega Digital Media Ltd.
^ Управление маркетингом: процесс создания стоимости (2-е издание), Ален Жолибер, Пьер-Луи Дюбуа, Ханс Мюльбахер, Лоран Флорес, Пьер-Луи Жолибер Дюбуа, 2012, стр. 359.
^ Повышение точности для роста онлайн-бизнеса — технический документ по точности веб-аналитики
^ «Разметка страниц и анализ журнала. Официальный документ для руководителей» (PDF) . лесозаготовительная компания. 2008.
^ "Revisiting Log File Analysis versus Page Tagging": Статья в блоге McGill University Web Analytics (CMIS 530) "Revisiting Log File Analysis versus Page Tagging". Архивировано из оригинала 6 июля 2011 г. Получено 26 февраля 2010 г.
^ "Разметка страниц (cookie) против анализа журналов". Logaholic Web Analytics . 2018-04-25 . Получено 2023-07-21 .
^ ab Kitchens, Brent; Dobolyi, David; Li, Jingjing; Abbasi, Ahmed (2018-04-03). «Расширенная аналитика клиентов: стратегическая ценность через интеграцию ориентированных на отношения больших данных». Журнал систем управленческой информации . 35 (2): 540–574. doi :10.1080/07421222.2018.1451957. ISSN 0742-1222. S2CID 49681142.
^ Ондер, Ирем; Бербекова, Адиюх (2022-08-10). «Веб-аналитика: больше, чем оценка эффективности веб-сайта?». Международный журнал туристических городов . 8 (3): 603–615. doi :10.1108/IJTC-03-2021-0039. ISSN 2056-5607.
^ Ху, Сяохуа; Черконе, Ник (1 июля 2004 г.). «Хранилище данных/онлайновая аналитическая обработка Framework для анализа использования веб-сайтов и бизнес-аналитических отчетов». Международный журнал интеллектуальных систем . 19 (7): 585–606. doi : 10.1002/int.v19:7 .
^ "Analytics Poisoning: A Short Review - IPM Corporation". 5 декабря 2020 г. Получено 29 июля 2022 г.
^ МакГанн, Роб (14 марта 2005 г.). «Исследование: потребители удаляют файлы cookie с удивительной скоростью» . Получено 3 апреля 2014 г.
^ "Главная Новости Доступ к руководству Инструменты Образование Покупки Интернет-файлы cookie — шпионское ПО или нейтральная технология?". CNET . 2 февраля 2005 г. Получено 24 апреля 2017 г.
^ Наор, М.; Пинкас, Б. (1998). «Безопасное и эффективное измерение». Достижения в криптологии – EUROCRYPT'98 . Конспект лекций по информатике. Том 1403. стр. 576. doi :10.1007/BFb0054155. ISBN978-3-540-64518-4.
^ Наор, М.; Пинкас, Б. (1998). «Безопасный учет и аудит в Интернете». Компьютерные сети и системы ISDN . 30 (1–7): 541–550. doi :10.1016/S0169-7552(98)00116-0.
^ Франклин, МК ; Малхи, Д. (1997). "Аудиторская метрология с облегченной безопасностью" . Финансовая криптография . Конспект лекций по информатике. Том 1318. С. 151. CiteSeerX 10.1.1.46.7786 . doi :10.1007/3-540-63594-7_75. ISBN978-3-540-63594-9.
^ Джонсон, Р.; Стаддон, Дж. (2007). «Безопасное веб-измерение дефляции». Международный журнал информации и компьютерной безопасности . 1 : 39. CiteSeerX 10.1.1.116.3451 . doi :10.1504/IJICS.2007.012244.
Библиография
Клифтон, Брайан (2010) Расширенные веб-показатели с Google Analytics, 2-е издание, Sybex (мягкая обложка).
Мортенсен, Деннис Р. (2009). Yahoo! Веб-аналитика: отслеживание, отчетность и анализ для получения информации на основе данных . Индианаполис, штат Индиана: Wiley. ISBN 978-0470424247.
Фаррис, П., Бендл, Н. Т., Пфайфер, П. Э., Рейбштейн, Д. Дж. (2009) Ключевые маркетинговые показатели. Более 50 показателей, которые должен знать каждый менеджер, Prentice Hall , Лондон.
Plaza, Beatriz (18 сентября 2009 г.). «Мониторинг эффективности источника веб-трафика с помощью Google Analytics: эксперимент с временными рядами». Труды ASLIB . 61 (5): 474–482. doi :10.1108/00012530910989625.
Арикан, Акин (2008) Многоканальный маркетинг. Метрики и методы для успеха в Интернете и за его пределами. Sybex.
Туллис, Том и Альберт, Билл (2008) Измерение пользовательского опыта. Сбор, анализ и представление показателей удобства использования. Morgan Kaufmann , Elsevier , Burlington MA.
Каушик, Авинаш (2009). Веб-аналитика 2.0:: Искусство онлайн-отчетности и наука клиентоориентированности . Sybex. ISBN 9780470529393.
Каушик, Авинаш; Рейбоулд, Дэйв (2007). Веб-аналитика: час в день . Индианаполис, Индиана: Wiley. ISBN 9780470130650.
Брэдли Н. (2007) Маркетинговые исследования. Инструменты и методы. Oxford University Press , Оксфорд.
Состре, Педро и Леклер, Дженнифер (2007) Веб-аналитика для чайников. Wiley .
Берби, Джейсон и Атчисон, Шейн (2007) Практическая веб-аналитика: использование данных для принятия разумных бизнес-решений.
Дэвис, Дж. (2006) «Маркетинговые показатели: как создавать ответственные маркетинговые планы, которые действительно работают» John Wiley & Sons (Азия).
Петерсон Эрик Т. (2005) Методы измерения веб-сайта. Электронная книга O'Reilly .
Чжэн, Дж. Г. и Пельцвергер, С. (2015) Обзор веб-аналитики, в книге: Энциклопедия информационной науки и технологий, третье издание, издатель: IGI Global, редакторы: Мехди Хосров-Пур