История просмотра веб-страниц — это список веб-страниц, которые посетил пользователь, а также связанные с ними метаданные, такие как заголовок страницы и время посещения. Обычно он сохраняется локально веб-браузерами [1] [2] для того, чтобы предоставить пользователю список истории для возврата к ранее посещенным страницам. Он может отражать интересы, потребности и привычки пользователя. [3]
Все основные браузеры имеют режим приватного просмотра , в котором история посещений не записывается. Это сделано для защиты от сбора истории посещений третьими лицами для целевой рекламы или других целей.
Локально хранимая история посещений может облегчить повторное открытие потерянных ранее посещенных веб-страниц, о которых у вас есть лишь смутные воспоминания, или страниц, которые трудно найти из-за того, что они расположены в глубокой сети. Браузеры также используют его для включения автозаполнения в адресной строке для более быстрой и удобной навигации по часто посещаемым страницам. [4]
Срок хранения истории просмотров зависит от интернет-браузера. Mozilla Firefox (версия для настольных компьютеров) по умолчанию записывает историю в файл с именем places.sqlite
, но автоматически стирает самую раннюю историю при исчерпании места на диске, [1] в то время как Google Chrome (версия для настольных компьютеров) по умолчанию хранит историю в течение десяти недель, автоматически удаляя более ранние записи. Файл истории с неопределенным именем Archived History
когда-то был записан, но был удален и автоматически удален в версии 37, выпущенной в сентябре 2014 года. [5] [6]
Расширения браузера, такие как History Trends Unlimited для Google Chrome (версия для ПК), позволяют неограниченное локальное хранение истории просмотров, экспорт в переносной файл и самоанализ привычек просмотра и статистики. [7]
История просмотров не записывается при использовании режима приватного просмотра , предоставляемого большинством браузеров.
Таргетированная реклама означает предоставление пользователю рекламных объявлений, которые более релевантны ему на основе истории просмотров. [8] Типичный пример: пользователь получает рекламу обуви при просмотре других веб-сайтов после поиска обуви на торговых сайтах. Одно исследование показывает, что таргетированная реклама удваивает коэффициент конверсии по сравнению с классической онлайн-рекламой. [9]
Ставки в режиме реального времени (RTB) — это метод, используемый в таргетированной рекламе. Это система, которая автоматически повышает цену за размещение рекламы на определенных веб-сайтах. [10] Рекламодатели решают, сколько они готовы платить, исходя из целевой аудитории веб-сайтов. Таким образом, дополнительная информация о пользователях может побудить рекламодателей платить более высокие цены. [10] Информация о пользователях, такая как история просмотров, предоставляется всем фирмам, участвующим в торгах. [11] Поскольку это процесс в реальном времени, информация обычно собирается без согласия пользователя и передается в незашифрованном виде. [12] Пользователь имеет очень ограниченные знания о том, как его информация собирается, хранится и используется. [13] [14]
Реакция пользователя на таргетированную рекламу зависит от того, знает ли он, что информация собирается. Если пользователь уже знает, что информация собирается заранее, целевая реклама потенциально может создать положительный эффект, что приведет к более высокому намерению перейти по ссылке. [11] Однако, если пользователь не проинформирован о сборе информации, его больше беспокоит конфиденциальность. Это уменьшит намерение перейти по ссылке. [11] Между тем, когда пользователь считает веб-сайт надежным, у него больше шансов перейти по ссылке и принять услугу персонализации. [11] [15]
Чтобы решить конфликт между конфиденциальностью и прибылью, была предложена новая система с оплатой за отслеживание. Между пользователями и рекламодателями существует посредник. Пользователи могли решить, предоставлять ли брокеру свою личную информацию, а затем брокер отправлял личную информацию, предложенную пользователями, рекламодателям. Между тем, пользователи могут получать денежное вознаграждение за обмен своей личной информацией. Это может помочь защитить конфиденциальность и эффективность отслеживания, но приведет к дополнительным затратам. [16]
Персонализированное ценообразование основано на идее, что если пользователь часто покупает определенный продукт или платит за этот продукт более высокую цену, с него может взиматься более высокая цена за этот продукт. История посещений веб-страниц может дать надежные прогнозы покупательского поведения пользователей. При использовании персонализированного ценообразования прибыль фирм может увеличиться на 12,99% по сравнению со случаями статус-кво . [17]
Историю просмотра веб-страниц можно использовать для облегчения исследований, например для выявления поведения людей в Интернете. Когда пользователь активно просматривает один сайт, вероятность запроса дополнительной страницы увеличивается. Когда пользователь посещает больше сайтов, вероятность запроса дополнительных страниц снижается. [18]
Историю просмотра веб-страниц также можно использовать для создания личных веб-библиотек. Персональная веб-библиотека создается путем сбора и анализа истории посещений веб-страниц пользователем. Это может помочь пользователю заметить тенденции просмотра, распределение времени и наиболее часто используемые веб-сайты. Некоторые пользователи считают эту функцию полезной. [3]
История посещений веб-страниц, хранящаяся локально, по умолчанию нигде не публикуется публично. Однако почти все веб-сайты отслеживаются рекламным ПО и потенциально нежелательными программами (ПНП), которые собирают информацию пользователей без их согласия. [19] Эти методы отслеживания обычно разрешены платформами по умолчанию. [12] История просмотров веб-страниц также собирается с помощью файлов cookie на веб-сайтах, которые можно разделить на два типа: основные файлы cookie и сторонние файлы cookie . Сторонние файлы cookie обычно встраиваются в собственные веб-сайты и собирают с них информацию. [10] Сторонние файлы cookie обладают более высокой эффективностью и способностью агрегировать данные, чем собственные файлы cookie. В то время как основные файлы cookie имеют доступ к данным пользователей только на одном веб-сайте, сторонние файлы cookie могут объединять данные, собранные с разных веб-сайтов, чтобы сделать изображение пользователя более полным. [10] Между тем, на одном и том же веб-сайте может существовать несколько сторонних файлов cookie. [10]
При наличии достаточной информации пользователи могут быть идентифицированы без входа в свои учетные записи. [20]
Когда сторонние файлы cookie собирают историю посещений пользователей с нескольких веб-сайтов, получение дополнительной информации приводит к увеличению проблем с конфиденциальностью. Например, пользователь просматривает новости на одном веб-сайте и ищет медицинскую информацию на другом. Когда история посещений этих двух веб-сайтов объединена, можно считать, что пользователь заинтересован в новостях, связанных с медицинской тематикой. [10] Если объединить историю просмотров с разных веб-сайтов, это может отразить более полное представление о человеке.
В 2006 году AOL опубликовала большой объем данных своих пользователей, включая историю поиска. Хотя идентификаторы или имена пользователей не были включены, пользователей можно было идентифицировать на основе опубликованной истории просмотров. [21] Например, пользователь № 4417749 был идентифицирован по ее истории поиска за три месяца. [22]
В 2020 году популярное антивирусное программное обеспечение Avast было обвинено в продаже истории просмотров третьим лицам. По этому обвинению власти Чехии проводят предварительное расследование. В отчете показано, что Avast продавала данные пользователей через Jumpshot, инструмент маркетинговой аналитики. В Avast заявили, что личная информация пользователей не попала в утечку. Однако история просмотров может использоваться для идентификации пользователей. В ответ на эту проблему Avast закрыл Jumpshot. [23]
Когда пользователь чувствует, что существует риск для конфиденциальности, его намерение раскрыть личную информацию будет меньше, но это не повлияет на его действия. [24] Однако некоторые исследования показывают, что нет существенной разницы между намерением и действиями по раскрытию частной информации, а это означает, что пользователь будет сокращать количество действий по раскрытию личной информации и принимать больше мер защиты, когда чувствует беспокойство по поводу конфиденциальности. [25] Когда пользователи беспокоятся о конфиденциальности, они будут меньше пользоваться онлайн-сервисами. [25] Они также предпримут дополнительные меры защиты, такие как отказ предоставлять свою информацию, предоставление ложной информации, удаление своей информации в Интернете и жалобы окружающим людям или соответствующим организациям. [26]
Однако пользователям сложно защитить свою конфиденциальность по нескольким причинам. Во-первых, пользователи недостаточно осведомлены о конфиденциальности. Они не беспокоятся о том, что их отслеживают, если только это не окажет на них существенного воздействия. Они также не осознают, что их данные содержат коммерческую ценность. [12] Пользователям, как правило, трудно заметить ссылки на политику конфиденциальности на всех типах веб-сайтов, причем пользователи женского пола и пользователи старшего возраста чаще игнорируют эти уведомления. Даже если пользователи заметят ссылки на конфиденциальность, это не повлияет на раскрытие их информации. [27] Кроме того, пользователи также не обладают достаточными техническими знаниями, чтобы защитить себя, даже если они заметят утечку конфиденциальной информации. Они расположены на пассивной стороне и имеют мало возможностей для изменения ситуации. [12]
Большинство пользователей используют блокировщики рекламы , удаляют файлы cookie и избегают веб-сайтов, которые собирают личную информацию, чтобы попытаться защитить свою историю посещений веб-страниц от сбора. [13] [28] Однако большинство блокировщиков рекламы не предоставляют пользователям достаточных рекомендаций, которые помогли бы им повысить осведомленность о конфиденциальности. Что еще более важно, они полагаются на стандартный черный и белый список . [29] В эти списки обычно не включаются веб-сайты, отслеживающие пользователей. Блокировщики рекламы могут быть эффективны только в том случае, если эти домены отслеживания заблокированы. [30]
Существует ряд проектов с открытым исходным кодом, которые пытаются защитить свою конфиденциальность, собирая историю просмотров на жестком диске, а не в браузере. [31] Это решает проблему, связанную с тем, что пользователи не могут видеть данные истории просмотров после удаления данных в браузере.