stringtranslate.com

Веб-аналитика

Веб-аналитика — это измерение, сбор , анализ и составление отчетов веб- данных для понимания и оптимизации использования Интернета . [1] Веб-аналитика — это не просто процесс измерения веб-трафика , но может использоваться как инструмент для исследования бизнеса и рынка , а также оценки и повышения эффективности веб-сайта . Приложения веб-аналитики также могут помочь компаниям измерить результаты традиционных рекламных кампаний в печатных или радиовещательных СМИ . С его помощью можно оценить, как изменится посещаемость сайта после запуска новой рекламной кампании. Веб-аналитика предоставляет информацию о количестве посетителей веб-сайта и количестве просмотров страниц или создает профили поведения пользователей. [2] Это помогает оценить тенденции трафика и популярности, что полезно для исследования рынка.

Основные этапы процесса веб-аналитики

Основные этапы процесса веб-аналитики

Большинство процессов веб-аналитики сводятся к четырем основным этапам или шагам [3] , а именно:

Еще одной важной функцией, разработанной аналитиками для оптимизации веб-сайтов, являются эксперименты:

Целью A/B-тестирования является выявление и предложение изменений веб-страниц, которые увеличивают или максимизируют эффект интересующего статистически проверенного результата.

Каждый этап влияет или может влиять (т. е. стимулирует) этап, предшествующий или следующий за ним. Таким образом, иногда данные, доступные для сбора, влияют на онлайн-стратегию. В других случаях онлайн-стратегия влияет на собранные данные.

Категории веб-аналитики

Существует как минимум две категории веб-аналитики: внешняя и локальная веб-аналитика.

В прошлом веб-аналитика использовалась для измерения количества посетителей на сайте. Однако это значение стало размытым, главным образом потому, что поставщики производят инструменты, охватывающие обе категории. Многие поставщики предоставляют программное обеспечение и услуги для веб-аналитики на месте . Существует два основных технических способа сбора данных. Первый и традиционный метод — анализ файлов журналов сервера — считывает файлы журналов , в которых веб-сервер записывает запросы файлов браузерами. Второй метод, маркировка страниц , использует встроенный в веб-страницу JavaScript для отправки запросов изображений на сторонний аналитический сервер всякий раз, когда веб-страница отображается в веб- браузере или, если необходимо, при щелчке мыши. Оба собирают данные, которые можно обрабатывать для создания отчетов о веб-трафике.

Веб-аналитика на сайте

В рамках веб-аналитики не существует общепринятых определений, поскольку отраслевые организации уже некоторое время пытаются согласовать определения, которые будут полезными и окончательными, то есть показатели в инструментах и ​​продуктах разных компаний могут иметь разные способы измерения, подсчета, в результате одно и то же имя метрики может представлять разное значение данных. Основными организациями, внесшими вклад в эту область, были IAB (Бюро интерактивной рекламы), JICWEBS (Объединенный отраслевой комитет по веб-стандартам в Великобритании и Ирландии) и DAA (Ассоциация цифровой аналитики), официально известная как WAA. (Ассоциация веб-аналитики, США). Однако многие термины используются одинаково в разных основных аналитических инструментах, поэтому следующий список, основанный на этих соглашениях, может стать полезной отправной точкой:

Выездная веб-аналитика

Внешняя веб-аналитика основана на анализе открытых данных, изучении социальных сетей и доле голоса в веб-ресурсах. Обычно его используют, чтобы понять, как продвигать сайт, путем определения ключевых слов, отмеченных на этом сайте, либо из социальных сетей, либо с других веб-сайтов.

Источники данных веб-аналитики

Основная цель веб-аналитики — сбор и анализ данных, связанных с веб-трафиком и моделями использования. Данные в основном поступают из четырех источников: [8]

  1. Данные прямого HTTP-запроса : напрямую поступают из сообщений HTTP-запроса (заголовков HTTP-запросов).
  2. Данные сетевого уровня и данные, генерируемые сервером, связанные с HTTP-запросами: не являются частью HTTP-запроса, но необходимы для успешной передачи запроса — например, IP- адрес запрашивающей стороны.
  3. Данные уровня приложения, отправляемые с помощью HTTP-запросов: генерируются и обрабатываются программами уровня приложения (такими как JavaScript , PHP и ASP.Net ), включая сеансы и ссылки. Обычно они фиксируются внутренними журналами, а не общедоступными службами веб-аналитики.
  4. Внешние данные: могут быть объединены с данными на сайте, чтобы дополнить описанные выше данные о поведении веб-сайта и интерпретировать использование Интернета. Например, IP-адреса обычно связаны с географическими регионами и поставщиками интернет-услуг, показателями открытия электронной почты и рейтингом кликов , данными кампании прямой почтовой рассылки, продажами, историей потенциальных клиентов или другими типами данных по мере необходимости.

Анализ файла журнала веб-сервера

Веб-серверы записывают некоторые из своих транзакций в файл журнала. Вскоре выяснилось, что эти файлы журналов могут быть прочитаны программой для получения данных о популярности веб-сайта. Так возникло программное обеспечение для анализа веб-журналов .

В начале 1990-х годов статистика веб-сайта состояла в основном из подсчета количества клиентских запросов (или обращений ), сделанных к веб-серверу. Изначально это был разумный метод, поскольку каждый веб-сайт часто состоял из одного HTML-файла. Однако с появлением изображений в HTML и веб-сайтов, состоящих из нескольких файлов HTML, этот подсчет стал менее полезным. Первый настоящий коммерческий анализатор журналов был выпущен компанией IPRO в 1994 году. [9]

Две единицы измерения были введены в середине 1990-х годов для более точного измерения объема человеческой активности на веб-серверах. Это были просмотры страниц и посещения (или сеансы ). Просмотр страницы определялся как запрос к веб-серверу страницы, а не изображения, а посещение определялось как последовательность запросов от клиента с уникальной идентификацией, срок действия которых истекал после определенного периода бездействия, обычно 30 минут. .

Появление поисковых пауков и роботов в конце 1990-х годов, а также веб-прокси и динамически назначаемых IP-адресов крупным компаниям и интернет-провайдерам усложнило идентификацию уникальных посетителей веб-сайта. Анализаторы журналов ответили, отслеживая посещения с помощью файлов cookie и игнорируя запросы от известных пауков. [ нужна цитата ]

Широкое использование веб-кешей также представляло проблему для анализа файлов журналов. Если человек повторно посещает страницу, второй запрос часто будет получен из кеша браузера, поэтому веб-сервер не получит никакого запроса. Это означает, что путь человека по сайту потерян. Кэширование можно отключить путем настройки веб-сервера, но это может привести к снижению производительности посетителя и увеличению нагрузки на серверы. [10]

Маркировка страниц

Обеспокоенность по поводу точности анализа файлов журналов при наличии кэширования и желание иметь возможность выполнять веб-аналитику в качестве аутсорсинговой услуги привели к использованию второго метода сбора данных — маркировки страниц или « веб-маяков ».

В середине 1990-х годов веб-счетчики были широко распространены — это были изображения, включенные в веб-страницу, которые показывали количество раз, когда изображение было запрошено, что являлось оценкой количества посещений этой страницы. В конце 1990-х годов эта концепция развилась и стала включать небольшое невидимое изображение вместо видимого и с помощью JavaScript передавать вместе с запросом изображения определенную информацию о странице и посетителе. Затем эта информация может быть обработана удаленно компанией веб-аналитики и сгенерирована обширная статистика.

Служба веб-аналитики также управляет процессом назначения пользователю файла cookie, который может однозначно идентифицировать его во время посещения и при последующих посещениях. Уровень принятия файлов cookie значительно различается на разных веб-сайтах и ​​может повлиять на качество собираемых и сообщаемых данных.

Сбор данных веб-сайта с использованием стороннего сервера сбора данных (или даже собственного сервера сбора данных) требует дополнительного поиска DNS на компьютере пользователя для определения IP-адреса сервера сбора данных. Иногда задержки в завершении успешных или неудачных поисков DNS могут привести к тому, что данные не будут собраны.

С ростом популярности Ajax -решений альтернативой использованию невидимого изображения является реализация обратного вызова сервера с отрендеренной страницы. В этом случае, когда страница отображается в веб-браузере, фрагмент кода JavaScript будет возвращаться на сервер и передавать информацию о клиенте, которая затем может быть агрегирована компанией веб-аналитики.

Анализ файла журнала и разметка страниц

Как программы анализа файлов журналов, так и решения для разметки страниц легко доступны компаниям, желающим проводить веб-аналитику. В некоторых случаях одна и та же компания веб-аналитики предлагает оба подхода. Тогда возникает вопрос, какой метод следует выбрать компании. У каждого подхода есть преимущества и недостатки. [11] [12]

Преимущества анализа файлов журналов

Основные преимущества анализа файла журнала перед маркировкой страниц заключаются в следующем:

Преимущества тегов страниц

Основные преимущества маркировки страниц перед анализом файла журнала заключаются в следующем:

Экономические факторы

Анализ файлов журналов почти всегда выполняется собственными силами. Маркировка страниц может выполняться собственными силами, но чаще всего она предоставляется как сторонняя услуга. Экономическая разница между этими двумя моделями также может иметь значение для компании, решающей, какую из них приобрести.

Какое решение дешевле внедрить, зависит от объема технических знаний внутри компании, выбранного поставщика, объема активности, наблюдаемой на веб-сайтах, глубины и типа искомой информации, а также количества отдельных веб-сайтов, нуждающихся в статистике.

Независимо от используемого решения поставщика или метода сбора данных, стоимость анализа и интерпретации веб-посетителей также должна быть включена. То есть стоимость превращения необработанных данных в полезную информацию. Это может быть использование сторонних консультантов, найм опытного веб-аналитика или обучение подходящего штатного специалиста. Затем можно провести анализ затрат и выгод . Например, какое увеличение доходов или экономию средств можно получить, анализируя данные веб-посетителей?

Гибридные методы

Некоторые компании производят решения, которые собирают данные как с помощью файлов журналов, так и с помощью тегов страниц, и могут анализировать оба типа. Используя гибридный метод, они стремятся получить более точную статистику, чем любой метод по отдельности. [14]

Геолокация посетителей

С помощью IP-геолокации можно отслеживать местоположение посетителей. Используя базу данных геолокации IP или API, посетители могут определять свое местоположение на уровне города, региона или страны. [15]

IP Intelligence или Internet Protocol (IP) Intelligence — это технология, которая отображает Интернет и классифицирует IP-адреса по таким параметрам, как географическое местоположение (страна, регион, штат, город и почтовый индекс), тип подключения, поставщик интернет-услуг (ISP), информация о прокси и многое другое. Первое поколение IP Intelligence называлось технологией геотаргетинга или геолокации . Эта информация используется предприятиями для сегментации онлайн-аудитории в таких приложениях, как онлайн-реклама , поведенческий таргетинг , локализация контента (или локализация веб-сайта ), управление цифровыми правами , персонализация , обнаружение онлайн-мошенничества, локализованный поиск, расширенная аналитика, глобальное управление трафиком и контентом. распределение.

Нажмите аналитику

Анализ пути кликов со ссылочными страницами слева, а также стрелками и прямоугольниками разной толщины и ширины, обозначающими количество движений.

Аналитика кликов , также известная как Clickstream , представляет собой особый тип веб-аналитики, который уделяет особое внимание кликам .

Обычно аналитика кликов фокусируется на аналитике на сайте. Редактор веб-сайта использует аналитику кликов, чтобы определить эффективность своего конкретного сайта с учетом того, куда нажимают пользователи.

Кроме того, анализ кликов может осуществляться в реальном или «нереальном» времени, в зависимости от типа искомой информации. Как правило, редакторы первых полос новостных сайтов с высокой посещаемостью хотят отслеживать свои страницы в режиме реального времени, чтобы оптимизировать контент. Редакторы, дизайнеры и другие заинтересованные лица могут анализировать клики в более широком временном интервале, чтобы помочь им оценить работу авторов, элементы дизайна или рекламу и т. д.

Данные о кликах можно собирать как минимум двумя способами. В идеале щелчок «регистрируется», когда он происходит, и этот метод требует некоторой функциональности, которая собирает соответствующую информацию при возникновении события. В качестве альтернативы можно предположить, что просмотр страницы является результатом щелчка, и, следовательно, зарегистрировать смоделированный щелчок, который привел к этому просмотру страницы.

Аналитика жизненного цикла клиента

Аналитика жизненного цикла клиента — это подход к измерению, ориентированный на посетителей. [16] Просмотры страниц, клики и другие события (такие как вызовы API, доступ к сторонним сервисам и т. д.) привязываются к отдельному посетителю, а не сохраняются как отдельные точки данных. Аналитика жизненного цикла клиентов пытается объединить все точки данных в маркетинговую воронку , которая может дать представление о поведении посетителей и оптимизации веб-сайта . [17] Общие показатели, используемые в аналитике жизненного цикла клиента, включают стоимость привлечения клиента (CAC), пожизненную ценность клиента (CLV), уровень оттока клиентов и оценку удовлетворенности клиентов . [16]

Другие методы

Иногда используются другие методы сбора данных. Анализ пакетов собирает данные путем анализа сетевого трафика, проходящего между веб-сервером и внешним миром. Обнаружение пакетов не требует внесения изменений в веб-страницы или веб-серверы. Также возможна интеграция веб-аналитики в само программное обеспечение веб-сервера. [18] Оба эти метода утверждают, что предоставляют более качественные данные в реальном времени , чем другие методы.

Распространенные источники путаницы в веб-аналитике

Проблема с отелем

Проблема с отелем обычно является первой проблемой, с которой сталкивается пользователь веб-аналитики. Проблема в том, что количество уникальных посетителей за каждый день месяца не равно количеству уникальных посетителей за этот месяц. Неопытному пользователю это кажется проблемой любого аналитического программного обеспечения, которое он использует. На самом деле это простое свойство определений метрики.

Чтобы представить ситуацию, можно представить себе отель. В отеле два номера (номер А и номер Б).

Как видно из таблицы, в отеле ежедневно в течение трех дней присутствуют два уникальных пользователя. Таким образом, сумма итогов по дням равна шести.

За этот период в каждой комнате было два уникальных пользователя. Таким образом, сумма сумм по комнатам равна четырем.

На самом деле за это время в отеле побывало всего три посетителя. Проблема в том, что человек, который остается в комнате на две ночи, будет учтен дважды, если его учитывать один раз в день, но он будет учтен только один раз, если смотреть на общую сумму за период. Любое программное обеспечение для веб-аналитики правильно суммирует их за выбранный период времени, что приводит к проблеме, когда пользователь пытается сравнить итоговые суммы.

Отравление аналитикой

По мере развития Интернета распространение автоматизированного трафика ботов становится все более серьезной проблемой для надежности веб-аналитики. [ нужна цитация ] Когда боты перемещаются по Интернету, они отображают веб-документы так же, как обычные пользователи, и в результате могут случайно активировать тот же код, который веб-аналитика использует для подсчета трафика. В совокупности это случайное срабатывание событий веб-аналитики влияет на интерпретируемость данных и выводы, сделанные на основе этих данных. IPM предоставила доказательство того, как Google Analytics , а также его конкуренты, легко активируются с помощью общих стратегий развертывания ботов. [19]

Проблемы со сторонними файлами cookie

Исторически сложилось так, что поставщики аналитических решений для разметки страниц использовали сторонние файлы cookie , отправленные из домена поставщика, а не из домена просматриваемого веб-сайта. Сторонние файлы cookie могут обрабатывать посетителей, которые пересекают несколько несвязанных доменов на сайте компании, поскольку файлы cookie всегда обрабатываются серверами поставщика.

Однако сторонние файлы cookie в принципе позволяют отслеживать отдельного пользователя на сайтах разных компаний, позволяя поставщику аналитики сопоставлять активность пользователя на сайтах, где он предоставил личную информацию, с его активностью на других сайтах, где он считал себя анонимным. Хотя компании, занимающиеся веб-аналитикой, отрицают это, другие компании, например компании, предоставляющие баннерную рекламу , сделали это. Поэтому проблемы конфиденциальности в отношении файлов cookie привели к тому, что заметное меньшинство пользователей заблокировало или удалило сторонние файлы cookie. В 2005 году некоторые отчеты показали, что около 28% пользователей Интернета блокировали сторонние файлы cookie, а 22% удаляли их хотя бы раз в месяц. [20] Большинство поставщиков решений для разметки страниц теперь перешли к предоставлению как минимум возможности использования собственных файлов cookie (файлов cookie, назначенных из субдомена клиента).

Другая проблема — удаление файлов cookie. Когда веб-аналитика зависит от файлов cookie для идентификации уникальных посетителей, статистика зависит от постоянных файлов cookie для хранения уникального идентификатора посетителя. Когда пользователи удаляют файлы cookie, они обычно удаляют как собственные, так и сторонние файлы cookie. Если это будет сделано между взаимодействиями с сайтом, то в следующей точке взаимодействия пользователь будет отображаться как посетитель, впервые посетивший его. Без постоянного и уникального идентификатора посетителя конверсии, анализ потока кликов и другие показатели, зависящие от активности уникального посетителя с течением времени, не могут быть точными.

Файлы cookie используются, поскольку IP-адреса не всегда уникальны для пользователей и могут использоваться большими группами или прокси-серверами. В некоторых случаях IP-адрес объединяется с пользовательским агентом, чтобы более точно идентифицировать посетителя, если файлы cookie недоступны. Однако это лишь частично решает проблему, поскольку часто пользователи за прокси-сервером имеют один и тот же пользовательский агент. Другие методы однозначной идентификации пользователя технически сложны и могут ограничить отслеживаемую аудиторию или могут быть сочтены подозрительными. Файлы cookie достигают наименьшего общего знаменателя без использования технологий, которые считаются шпионским ПО , а включение/активность файлов cookie приводит к проблемам безопасности. [21]

Методы безопасной аналитики (измерения)

Сбор информации третьими лицами регулируется любыми сетевыми ограничениями и применяемыми мерами безопасности. Страны, поставщики услуг и частные сети могут предотвратить передачу данных о посещениях сайта третьим лицам. Все описанные выше методы (и некоторые другие методы, не упомянутые здесь, например, выборка) имеют центральную проблему: уязвимость к манипуляциям (как инфляции, так и дефляции). Это означает, что эти методы являются неточными и небезопасными (в любой разумной модели безопасности). Эта проблема рассматривалась в нескольких статьях, [22] [23] [24] [25] , но на сегодняшний день решения, предложенные в этих статьях, остаются теоретическими.

Смотрите также

Рекомендации

  1. ^ Комитет по стандартам WAA. «Определения веб-аналитики». Вашингтон, округ Колумбия: Ассоциация веб-аналитики (2008).
  2. ^ Нильсен, Янне (27 апреля 2021 г.). «Использование смешанных методов для изучения исторического использования веб-маяков в веб-отслеживании». Международный журнал цифровых гуманитарных наук . 2 (1–3): 65–88. дои : 10.1007/s42803-021-00033-4. ISSN  2524-7832. S2CID  233416836.
  3. ^ Янсен, Б.Дж. (2009). Понимание взаимодействия пользователя с Интернетом с помощью веб-аналитики. Обобщающие лекции по информационным концепциям, поиску и услугам, 1 (1), 1-102.
  4. ^ Снг, Юн Фей (22 августа 2016 г.), «Исследование факторов, связанных с показателем отказов на веб-сайтах потребительских товаров», Business Analytics , WORLD SCIENTIFIC, стр. 526–546, doi : 10.1142/9789813149311_0019, ISBN 978-981-314-929-8, получено 11 августа 2023 г.
  5. ^ Менасальвас, Эрнестина; Миллан, Сокорро; Пенья, Хосе М.; Хаджимайкл, Майкл; Марбан, Оскар (июль 2004 г.). «Подсеансы: детальный подход к анализу пути клика: анализ пути клика». Международный журнал интеллектуальных систем . 19 (7): 619–637. дои : 10.1002/int.20014.
  6. ^ Чаффи, Дэйв; Покровитель, Марк (01 июля 2012 г.). «От веб-аналитики к оптимизации цифрового маркетинга: повышение коммерческой ценности цифровой аналитики». Журнал практики прямого, цифрового и цифрового маркетинга . 14 (1): 30–45. дои : 10.1057/dddmp.2012.20 . ISSN  1746-0174.
  7. ^ «Как определяется веб-сеанс в Universal Analytics — Справка по Analytics» . support.google.com . Проверено 11 августа 2023 г.
  8. ^ Чжэн, Г. и Пельцвергер С. (2015) Обзор веб-аналитики, В книге: Энциклопедия информационных наук и технологий, третье издание, Издатель: IGI Global, Редакторы: Мехди Хосров-Пур
  9. ^ Источники данных о веб-трафике и сравнение поставщиков, Брайан Клифтон и Omega Digital Media Ltd.
  10. ^ Управление маркетингом: процесс создания ценности (2-е издание), Ален Жолибер, Пьер-Луи Дюбуа, Ханс Мюльбахер, Лоран Флорес, Пьер-Луи Жолибер Дюбуа, 2012, стр. 359.
  11. ^ Повышение точности для роста онлайн-бизнеса - технический документ по точности веб-аналитики.
  12. ^ «Разметка страниц и анализ журналов, технический документ для руководителей» (PDF) . лесопилка. 2008.
  13. ^ «Возврат к анализу файла журнала в сравнении с разметкой страниц»: статья в блоге Web Analytics Университета Макгилла (CMIS 530) «Возврат к анализу файла журнала в сравнении с разметкой страниц». Архивировано из оригинала 6 июля 2011 года . Проверено 26 февраля 2010 г.
  14. ^ «Разметка страниц (файлы cookie) и анализ журналов» . Логоголик Веб-аналитика . 25 апреля 2018 г. Проверено 21 июля 2023 г.
  15. ^ IPInfoDB (10 июля 2009 г.). «База данных геолокации IP». IPInfoDB . Проверено 19 июля 2009 г.
  16. ^ ab Kitchens, Брент; Добойи, Дэвид; Ли, Цзинцзин; Аббаси, Ахмед (3 апреля 2018 г.). «Расширенная аналитика клиентов: стратегическая ценность за счет интеграции больших данных, ориентированных на взаимоотношения». Журнал информационных систем управления . 35 (2): 540–574. дои : 10.1080/07421222.2018.1451957. ISSN  0742-1222. S2CID  49681142.
  17. ^ Ондер, Ирем; Бербекова, Адиюх (10 августа 2022 г.). «Веб-аналитика: больше, чем просто оценка эффективности веб-сайта?». Международный журнал туристических городов . 8 (3): 603–615. doi : 10.1108/IJTC-03-2021-0039. ISSN  2056-5607.
  18. ^ Ху, Сяохуа; Черконе, Ник (1 июля 2004 г.). «Хранилище данных/инфраструктура онлайн-аналитической обработки для анализа использования веб-страниц и отчетов бизнес-аналитики». Международный журнал интеллектуальных систем . 19 (7): 585–606. дои : 10.1002/int.v19:7 .
  19. ^ «Отравление аналитикой: краткий обзор - Корпорация IPM» . 5 декабря 2020 г. Проверено 29 июля 2022 г.
  20. Макганн, Роб (14 марта 2005 г.). «Исследование: потребители удаляют файлы cookie с поразительной скоростью» . Проверено 3 апреля 2014 г.
  21. ^ «Главная Новости Доступ к руководству Инструменты Образование Покупки Интернет-файлы cookie — шпионское ПО или нейтральная технология?». CNET . 2 февраля 2005 года . Проверено 24 апреля 2017 г.
  22. ^ Наор, М.; Пинкас, Б. (1998). «Безопасный и эффективный учет». Достижения криптологии – EUROCRYPT'98 . Конспекты лекций по информатике. Том. 1403. с. 576. дои : 10.1007/BFb0054155. ISBN 978-3-540-64518-4.
  23. ^ Наор, М.; Пинкас, Б. (1998). «Безопасный учет и аудит в Интернете». Компьютерные сети и системы ISDN . 30 (1–7): 541–550. дои : 10.1016/S0169-7552(98)00116-0.
  24. ^ Франклин, МК ; Малхи, Д. (1997). «Контролируемый учет с облегченной безопасностью» . Финансовая криптография . Конспекты лекций по информатике. Том. 1318. стр. 151. CiteSeerX 10.1.1.46.7786 . дои : 10.1007/3-540-63594-7_75. ISBN  978-3-540-63594-9.
  25. ^ Джонсон, Р.; Стаддон, Дж. (2007). «Веб-измерения с защитой от дефляции». Международный журнал информационной и компьютерной безопасности . 1:39 . CiteSeerX 10.1.1.116.3451 . doi :10.1504/IJICS.2007.012244. 

Библиография