Сбор информации об использовании веб-сайтов пользователями
Веб-отслеживание — это практика, с помощью которой операторы веб-сайтов и третьи лица собирают, хранят и обмениваются информацией о действиях посетителей во Всемирной паутине . Анализ поведения пользователя может использоваться для предоставления контента, который позволяет оператору делать выводы об их предпочтениях и может представлять интерес для различных сторон, таких как рекламодатели. [1] [2] Веб-отслеживание может быть частью управления посетителями. [3]
Использует
Использование веб-отслеживания включает в себя следующее:
- Рекламные компании активно собирают информацию о пользователях и создают профили, которые используются для индивидуализации рекламы. Действия пользователей включают посещенные веб-сайты, просмотренные видео, взаимодействие в социальных сетях и онлайн-транзакции. Такие веб-сайты, как Netflix и YouTube, собирают информацию о том, какие шоу смотрят пользователи, что помогает им предлагать больше шоу, которые могут им понравиться. Поисковые системы, такие как Google, будут вести учет того, что ищут пользователи, что может помочь им предлагать более релевантные поисковые запросы в будущем. [4]
- Правоохранительные органы могут использовать веб-отслеживание для слежки за людьми и раскрытия преступлений. [5]
- Веб-аналитика больше фокусируется на производительности веб-сайта в целом. Веб-отслеживание даст представление о том, как используется веб-сайт, и покажет, сколько времени пользователь проводит на определенной странице. Это можно использовать, чтобы узнать, кто может быть наиболее заинтересован в содержании веб-сайта. [6]
- Тесты удобства использования — это практика проверки того, насколько прост в использовании дизайн. За пользователями наблюдают, когда они выполняют задания. [7] Это поможет выявить проблемы удобства использования в дизайне веб-сайта, чтобы их можно было исправить для более легкой навигации.
Методы
IP-адрес
Каждому устройству, подключенному к Интернету, назначается уникальный IP-адрес , который необходим для того, чтобы устройства могли взаимодействовать друг с другом. При наличии соответствующего программного обеспечения на веб-сайте-хосте IP-адрес посетителей сайта может быть зарегистрирован и также может использоваться для определения географического местоположения посетителя . [8] [9] Регистрация IP-адреса может, например, отслеживать, голосовал ли человек более одного раза, а также его схему просмотра. Знание местоположения посетителя указывает, помимо прочего, на страну. Это может, например, привести к тому, что цены будут указаны в местной валюте, цена или ассортимент доступных товаров, будут применяться особые условия, а в некоторых случаях запросы или ответы из определенной страны будут полностью заблокированы. Интернет-пользователи могут обойти цензуру и геоблокировку и защитить личную идентификацию и местоположение, чтобы оставаться анонимными в Интернете, используя VPN- соединение.
HTTP-куки
Файл cookie HTTP — это код и информация, встроенные в устройство пользователя веб-сайтом, когда пользователь посещает веб-сайт. [10] Затем веб-сайт может извлекать информацию из файла cookie при последующих посещениях веб-сайта пользователем. Файлы cookie могут использоваться для настройки пользовательского опыта просмотра и показа целевой рекламы. [11] Вот некоторые действия при просмотре, которые могут хранить файлы cookie:
- страницы и контент, которые просматривал пользователь,
- что пользователь искал в Интернете,
- когда пользователь нажимал на онлайн-рекламу,
- в какое время пользователь посетил сайт.
Основные и сторонние файлы cookie
Файл cookie первой стороны создается веб-сайтом, который посещает пользователь. Эти файлы cookie считаются «хорошими», поскольку они помогают пользователю, а не шпионят за ним. Основная цель файлов cookie первой стороны — распознать пользователя и его предпочтения, чтобы можно было применить желаемые настройки. [12]
Сторонний файл cookie создается веб-сайтами, отличными от того, который посещает пользователь. Они вставляют дополнительный код отслеживания, который может регистрировать онлайн-активность пользователя. Аналитика на сайте относится к сбору данных на текущем сайте. Она используется для измерения многих аспектов взаимодействия пользователя, включая количество посещений пользователем. [13]
Ограничения на сторонние файлы cookie, введенные веб-браузерами, обходят некоторые отслеживающие компании, используя технику, называемую CNAME cloaking [de] , где сторонней службе отслеживания назначается DNS- запись в домене источника первой стороны (обычно CNAME ), так что она маскируется под первую сторону, хотя это отдельная сущность с юридической и организационной точки зрения. Эта техника блокируется некоторыми браузерами и блокировщиками рекламы с помощью списков блокировки известных трекеров. [14] [15]
ETags
ETags можно использовать для отслеживания уникальных пользователей, [16] поскольку HTTP-куки все чаще удаляются пользователями, заботящимися о конфиденциальности. В июле 2011 года Ашкан Солтани и группа исследователей из Калифорнийского университета в Беркли сообщили, что ряд веб-сайтов, включая Hulu , использовали ETags для отслеживания. [17] Hulu и KISSmetrics прекратили «возрождение» с 29 июля 2011 года, [18] поскольку KISSmetrics и более 20 ее клиентов столкнулись с коллективным иском из- за использования «неудаляемых» отслеживающих куки, частично связанных с использованием ETags. [19]
Поскольку ETag кэшируются браузером и возвращаются с последующими запросами на тот же ресурс, сервер отслеживания может просто повторить любой ETag, полученный от браузера, чтобы гарантировать, что назначенный ETag сохраняется неопределенно долго (аналогично постоянным файлам cookie ). Дополнительные заголовки кэширования также могут улучшить сохранность данных ETag. [20]
ETags можно очистить, очистив
кэш браузера (реализации различаются).
Другие методы
- Технология Canvas Fingerprinting позволяет веб-сайтам идентифицировать и отслеживать пользователей с помощью элементов HTML5 Canvas вместо использования cookie-файлов браузера. [21]
- Отслеживание между устройствами используется рекламодателями для определения наиболее успешных каналов, помогающих конвертировать посетителей в покупателей. [22]
- Показатель кликабельности используется рекламодателями для измерения количества кликов по их объявлениям в расчете на количество показов.
- Отслеживание мыши собирает данные о положении курсора мыши пользователя на компьютере.
- Браузерный отпечаток пальца зависит от вашего браузера и является способом идентификации пользователей каждый раз, когда они выходят в сеть, и отслеживания вашей активности. С помощью отпечатка пальца веб-сайты могут определять операционную систему пользователя, язык, часовой пояс и версию браузера без вашего разрешения. [23]
- Супер-cookie-файлы или « evercookie-файлы » не только могут использоваться для отслеживания пользователей в Интернете, но их также трудно обнаружить и удалить, поскольку они хранятся в другом месте, чем стандартные файлы cookie. [24]
- Скрипты воспроизведения сеанса позволяют воспроизводить путешествие посетителя на веб-сайте или в мобильном приложении или веб-приложении . [25] [26]
- «Отслеживание перенаправления» — это использование страниц перенаправления для отслеживания пользователей на веб-сайтах. [27]
- Веб-маяки обычно используются для того, чтобы сообщить, что человек, получивший электронное письмо, прочитал его.
- Значки можно использовать для отслеживания пользователей, поскольку они сохраняются на протяжении сеансов просмотра. [28]
- Федеративное обучение когорт (FLoC), опробованное в Google Chrome в 2021 году, призвано заменить существующее отслеживание поведения, которое основано на отслеживании действий отдельных пользователей и их агрегации на стороне сервера с веб-браузером, объявляющим их членство в поведенческой когорте. [29] EFF раскритиковала FLoC за сохранение фундаментальной парадигмы экономики наблюдения , где «поведение каждого пользователя следует за ними с сайта на сайт как метка, непостижимая на первый взгляд, но полная смысла для тех, кто в курсе». [30]
- Исследование 2022 года показало, что «контрабанда UID» [ необходимо разъяснение ] широко распространена и в значительной степени не смягчается новейшими средствами защиты, такими как защита от отслеживания Firefox и uBlock Origin , что также способствовало принятию мер противодействия. [31] [32]
Неэтичный характер веб-отслеживания
Просмотр веб-страниц связан с личной информацией пользователя. Местоположение, интересы, покупки и многое другое могут быть раскрыты просто по тому, какую страницу посещает пользователь. Это позволяет им делать выводы о пользователе и анализировать закономерности активности. [33] Использование веб-отслеживания неэтично, когда применяется в контексте частного лица; и в той или иной степени регулируется законодательством, таким как Директива ЕС об электронной коммерции и Закон Великобритании о защите данных . Когда это делается без ведома пользователя, это считается нарушением безопасности браузера .
Оправдание
В контексте «бизнес для бизнеса» понимание поведения посетителя для определения намерений покупки рассматривается многими коммерческими организациями как эффективный способ таргетирования маркетинговых мероприятий. [34] К посещающим компаниям можно обращаться как онлайн, так и офлайн с маркетинговыми и торговыми предложениями , которые соответствуют их текущим потребностям. С точки зрения организации продаж, взаимодействие с потенциальным клиентом, когда он активно ищет возможность купить, может привести к экономии маркетинговых средств, которые в противном случае тратились бы впустую.
Профилактика
Наиболее продвинутые инструменты защиты включают в себя защиту от отслеживания Firefox и надстройки браузера uBlock Origin и Privacy Badger . [32] [35] [36]
Более того, они могут включать в себя надстройку браузера NoScript , использование альтернативной поисковой системы, такой как DuckDuckGo , и использование VPN . Однако VPN стоят денег, и с 2023 года NoScript может «сделать обычный просмотр веб-страниц болезненным». [36]
- На мобильном телефоне
На мобильных устройствах наиболее продвинутым методом может быть использование мобильного браузера Firefox Focus , который в значительной степени смягчает веб-отслеживание на мобильных устройствах, включая полную защиту от файлов cookie и аналогичный приватный режим в обычном браузере Firefox. [37] [38] [39]
- Запросы на отказ
Пользователи также могут контролировать стороннее веб-отслеживание в некоторой степени другими способами. Отказ от куки-файлов позволяет пользователям блокировать веб-сайты от установки будущих куки-файлов. Веб-сайтам может быть запрещена установка сторонних рекламодателей или куки-файлов в браузере, что предотвратит отслеживание на странице пользователя. [40] Do Not Track — это настройка веб-браузера, которая может запрашивать веб-приложение для отключения отслеживания пользователя. Включение этой функции отправит запрос на веб-сайт, на котором находятся пользователи, для добровольного отключения их межсайтового отслеживания пользователей.
- Режим конфиденциальности
Вопреки распространенному мнению, режим конфиденциальности браузера не предотвращает (все) попытки отслеживания, поскольку он обычно блокирует только хранение информации на сайте посетителя ( cookie ). Однако он не помогает против различных методов снятия отпечатков пальцев . Такие отпечатки пальцев могут быть деанонимизированы . [41] Во многих случаях функциональность веб-сайта дает сбой. Например, пользователь может не иметь возможности войти на сайт или настройки теряются. [ требуется цитата ]
- Браузеры
Некоторые веб-браузеры используют функции «защиты от отслеживания» или «предотвращения отслеживания» для блокировки веб-трекеров. [42] Команды, стоящие за дополнениями NoScript и uBlock, помогали разрабатывать возможности SmartBlock для Firefox. [43]
Поисковые системы
Чтобы защитить данные пользователей от отслеживания поисковыми системами, были разработаны различные поисковые системы, ориентированные на конфиденциальность, в качестве жизнеспособных альтернатив. Примерами таких поисковых систем являются DuckDuckGo , MetaGer и Swiscows , которые отдают приоритет предотвращению хранения и отслеживания активности пользователя. Стоит отметить, что хотя эти альтернативы предлагают улучшенную конфиденциальность, некоторые из них не могут гарантировать полную анонимность, а некоторые могут быть менее удобными для пользователя по сравнению с основными поисковыми системами, такими как Google и Microsoft Bing . [44]
Смотрите также
Ссылки
- ^ Д. Сундарасен, Шила Деви (2019-04-08). «Институциональные характеристики, сигнальные переменные и первоначальная доходность IPO». Обзор исследований PSU . 3 (1): 29–49. doi : 10.1108/prr-10-2016-0003 . ISSN 2399-1747.
- ^ Самарасингхе, Наянамана; Маннан, Мохаммад (2019-11-01). «К глобальной перспективе веб-отслеживания». Компьютеры и безопасность . 87 : 101569. doi : 10.1016/j.cose.2019.101569. S2CID 199582679.
- ^ Нильсен, Янне (2021-04-27). «Использование смешанных методов для изучения исторического использования веб-маяков в веб-отслеживании». Международный журнал цифровых гуманитарных наук . 2 (1–3): 65–88. doi :10.1007/s42803-021-00033-4. ISSN 2524-7832. S2CID 233416836.
- ^ «Безопасность в Интернете: понимание отслеживания браузера». GCFGlobal.org . Получено 13 декабря 2019 г.
- ^ Валентино-ДеВриес, Дженнифер (13.04.2019). «Отслеживание телефонов, Google — это сеть для полиции (опубликовано в 2019 году)». The New York Times . ISSN 0362-4331. Архивировано из оригинала 30.10.2022 . Получено 23.10.2020 .
- ^ Клейнберг, Саманта; Мишра, Бад (2008). "PSST". Труды 17-й международной конференции по Всемирной паутине . Нью-Йорк, Нью-Йорк, США: ACM Press. стр. 1143–1144. doi :10.1145/1367497.1367697. ISBN 9781605580852. S2CID 15179069.
- ^ "Что такое тестирование удобства использования?". The Interaction Design Foundation . Получено 13 декабря 2019 г.
- ^ "Что такое IP-адрес?". HowStuffWorks . 2001-01-12 . Получено 2019-12-13 .
- ^ «Как файлы cookie отслеживают вас в Интернете и как их остановить». Privacy.net . 2018-02-24 . Получено 2019-12-13 .
- ^ Кобусинская, Анна; Павлючук, Камиль; Бжезинский, Ежи (2018). «Информационная аналитика больших данных для устойчивого развития». Компьютерные системы будущего поколения . 86 : 1321–1337. doi :10.1016/j.future.2017.12.061. S2CID 49646910.
- ^ Мартин, Кирстен (22.12.2015). «Агрегаторы данных, данные потребителей и ответственность в Интернете: кто отслеживает потребителей в Интернете и должны ли они это прекратить?». Информационное общество . 32 (1): 51–63. doi :10.1080/01972243.2015.1107166. ISSN 0197-2243. S2CID 205509140.
- ^ "Что такое основные файлы cookie?". IONOS Digitalguide . Получено 13.01.2022 .
- ^ Лошин, Дэвид; Рейфер, Эби (2013-01-01), Лошин, Дэвид; Рейфер, Эби (ред.), «Глава 4. Аналитика жизненного цикла и ценности клиента», Использование информации для разработки культуры клиентоориентированности , Morgan Kaufmann, стр. 23–31, ISBN 9780124105430, получено 2019-11-11.
- ^ «Онлайн-трекеры теперь переходят на новую инвазивную технику маскировки CNAME». Отчет о взломе . 2021-02-27 . Получено 2021-04-14 .
- ^ Димова, Яна; Акар, Гюнеш; Олейник, Лукаш; Йосен, Воутер; Ван Гётем, Том (2021-02-23). «CNAME игры: масштабный анализ обхода отслеживания на основе DNS». arXiv : 2102.09301 [cs.CR].
- ^ "отслеживание без файлов cookie". 17 февраля 2003 г.
- ^ Айенсон, Мика Д.; Вамбах, Дитрих Джеймс; Солтани, Ашкан; Гуд, Натан; Хуфнагл, Крис Джей (29 июля 2011 г.). «Flash Cookies и конфиденциальность II: теперь с HTML5 и ETag Respawning». SSRN 1898390.
- ^ Солтани, Ашкан (11 августа 2011 г.). «Flash Cookies и конфиденциальность II». askhansoltani.org . Получено 27.06.2023 .
- ^ Энтони, Себастьян (2011-08-04). «AOL, Spotify, GigaOm, Etsy, KISSmetrics подали в суд из-за неудаляемых отслеживающих файлов cookie». ExtremeTech . Получено 2023-06-27 .
- ^ "Cookieless cookies". GitHub lucb1e . 2013-08-25 . Получено 2023-06-27 .
- ^ Андреа Фортуна (2017-11-06). «Что такое Canvas Fingerprinting и как компании используют его для отслеживания вас в Интернете | Всего наилучшего, и спасибо за всю рыбу» . Получено 2019-12-13 .
- ^ BigCommerce (2019-12-12). "Что такое кросс-девайсное отслеживание?". BigCommerce . Получено 2019-12-13 .
- ^ "Что такое онлайн-отслеживание и как веб-сайты отслеживают вас?". Блог Koofr . Получено 13.12.2019 .
- ^ "Файлы cookie - Определение - Trend Micro USA". www.trendmicro.com . Получено 13.12.2019 .
- ^ "Повтор сеанса", Википедия , 2019-10-15 , получено 2019-12-13
- ^ "FullStory | Создайте более совершенный цифровой опыт | FullStory". www.fullstory.com . Получено 2021-04-05 .
- ^ "Защита от отслеживания перенаправлений - Конфиденциальность, разрешения и информационная безопасность | MDN". developer.mozilla.org . Получено 29.06.2022 .
- ^ Гудин, Дэн (19.02.2021). «Новый способ отслеживания браузера работает даже при очистке кэшей или переходе в режим инкогнито». Ars Technica . Получено 21.02.2021 .
- ^ "Компонент федеративного обучения". source.chromium.org . Получено 2023-02-27 .
- ^ Cyphers, Bennett (2021-03-03). «FLoC от Google — ужасная идея». Electronic Frontier Foundation . Получено 2021-03-05 .
- ^ Патрингенару, Иоана. «Новая технология веб-отслеживания обходит защиту конфиденциальности». Калифорнийский университет в Сан-Диего через techxplore.com . Получено 18 января 2023 г.
- ^ ab Рэндалл, Одри; Снайдер, Питер; Укани, Алиша; Снорен, Алекс К.; Фёлькер, Джеффри М.; Сэвидж, Стефан; Шульман, Аарон (25 октября 2022 г.). «Измерение контрабанды UID в дикой природе». Труды 22-й конференции ACM по измерению Интернета . Ассоциация вычислительной техники. стр. 230–243. doi :10.1145/3517745.3561415. ISBN 9781450392594. S2CID 250494286.
- ^ Mayer, JR; Mitchell, JC (май 2012 г.). «Стороннее веб-отслеживание: политика и технология». Симпозиум IEEE 2012 г. по безопасности и конфиденциальности . стр. 413–427. CiteSeerX 10.1.1.388.5781 . doi :10.1109/SP.2012.47. ISBN 978-1-4673-1244-8. S2CID 14652884.
- ^ "Отслеживание посетителей веб-сайта зашло слишком далеко?". Prospectvision.net. Архивировано из оригинала 2012-07-19 . Получено 2012-08-03 .
- ^ Уоллен, Джек (24 октября 2018 г.). «Как использовать Ublock Origin и Privacy Badger для предотвращения отслеживания браузера в Firefox». TechRepublic . Получено 3 февраля 2023 г.
- ^ ab «Наши любимые блокировщики рекламы и расширения браузера для защиты конфиденциальности». The New York Times . 10 января 2023 г. Получено 3 февраля 2023 г.
- ^ "Mozilla представляет Total Cookie Protection для Firefox Focus на Android". ZDNET . Получено 3 февраля 2023 г. .
- ^ Чен, Брайан X. (31 марта 2021 г.). «Если вы заботитесь о конфиденциальности, пришло время попробовать новый веб-браузер». The New York Times . Получено 3 февраля 2023 г. .
- ^ "Firefox включает функцию антитрекинга по умолчанию". Engadget . Получено 3 февраля 2023 г. .
- ^ «Что такое Opt Out Cookie? — Все о Cookies». www.allaboutcookies.org . 27 сентября 2018 г. Получено 11 ноября 2019 г.
- ^ «Думаете, вы анонимны в сети? Треть популярных веб-сайтов «снимают отпечатки пальцев» с вас». Washington Post .
- ^ «Заметки о выпуске Firefox 42.0».
- ^ Кац, Сара. «Firefox 87 раскрывает SmartBlock для приватного просмотра». techxplore.com . Получено 3 февраля 2023 г. .
- ^ Абдулазиз Саад Бубукайр, Марьям; Фриха, Мунир (2022). «Домен веб-отслеживания и возможные инструменты защиты конфиденциальности: обзор литературы». Журнал кибербезопасности . 4 (2): 79–94. doi : 10.32604/jcs.2022.029020 . ISSN 2579-0064.
- ^ «Каково определение онлайн-конфиденциальности? | Юридический глоссарий Winston & Strawn». Winston & Strawn . Получено 13 декабря 2019 г.
- ^ "Основы веб-аналитики". www.usability.gov . 2013-10-08 . Получено 2019-12-13 .
- ^ Бил, Вэнджи (22 января 2002 г.). «Что такое веб-маяк? Определение Webopedia». www.webopedia.com . Получено 13 декабря 2019 г.
Внешние ссылки
- "Princeton Web Transparency & Accountability Project (WebTap)" . Получено 2018-02-20 .
Мы отслеживаем веб-сайты и сервисы, чтобы узнать, какие данные пользователей собирают компании, как они их собирают и что они с ними делают. С помощью нашей измерительной платформы мы изучаем конфиденциальность, безопасность и этику использования данных потребителей
- «OpenWPM – Фреймворк измерения конфиденциальности». GitHub . Получено 20.02.2018 .