История просмотра веб-страниц относится к списку веб-страниц, которые посетил пользователь, а также к связанным метаданным, таким как заголовок страницы и время посещения. Обычно она хранится локально веб-браузерами [1] [2] , чтобы предоставить пользователю список истории для возврата к ранее посещенным страницам. Она может отражать интересы, потребности и привычки просмотра пользователя. [3]
Все основные браузеры имеют режим приватного просмотра , в котором история просмотров не записывается. Это сделано для защиты от сбора истории просмотров третьими лицами для целевой рекламы или других целей.
Локально сохраненная история просмотров может облегчить повторное открытие потерянных ранее посещенных веб-страниц, о которых у вас есть только смутные воспоминания, или страниц, которые трудно найти из-за их расположения в глубокой сети. Браузеры также используют ее для включения автодополнения в адресной строке для более быстрой и удобной навигации по часто посещаемым страницам. [4]
Срок хранения истории просмотров различается в зависимости от интернет-браузера. Mozilla Firefox (версия для настольных компьютеров) по умолчанию записывает историю в файл с именем places.sqlite
, но автоматически стирает самую раннюю историю при исчерпании места на диске, [1] в то время как Google Chrome (версия для настольных компьютеров) по умолчанию хранит историю в течение десяти недель, автоматически удаляя более ранние записи. Неопределенный файл истории с именем Archived History
был когда-то записан, но был удален и автоматически удален в версии 37, выпущенной в сентябре 2014 года. [5] [6]
Расширения браузера, такие как History Trends Unlimited для Google Chrome (версия для настольных компьютеров), позволяют хранить историю просмотров локально в течение неограниченного времени, экспортировать ее в портативный файл и самостоятельно анализировать привычки и статистику просмотров. [7]
История просмотров не сохраняется при использовании режима приватного просмотра, предоставляемого большинством браузеров.
Таргетированная реклама означает предоставление пользователю рекламы, которая более релевантна ему на основе истории просмотров. [8] Типичным примером является получение пользователем рекламы обуви при просмотре других веб-сайтов после поиска обуви на веб-сайтах покупок. Одно исследование показывает, что таргетированная реклама удваивает коэффициент конверсии классической онлайн-рекламы. [9]
Торги в реальном времени (RTB) — это метод, используемый в таргетированной рекламе. Это система, которая автоматически повышает цену за показ рекламы на определенных веб-сайтах. [10] Рекламодатели решают, сколько они готовы заплатить, исходя из целевой аудитории веб-сайтов. Поэтому дополнительная информация о пользователях может побудить рекламодателей платить более высокие цены. [10] Информация о пользователях, такая как история просмотров, предоставляется всем фирмам, которые участвуют в торгах. [11] Поскольку это процесс в реальном времени, информация обычно собирается без согласия пользователя и передается в незашифрованном виде. [12] Пользователь имеет очень ограниченные знания о том, как его информация собирается, хранится и используется. [13] [14]
Реакция пользователя на целевую рекламу зависит от того, знает ли он, что собирается информация. Если пользователь заранее знает, что собирается информация, целевая реклама может потенциально создать положительный эффект, что приведет к более высокому намерению перейти по ссылке. [11] Однако, если пользователь не проинформирован о сборе информации, он будет больше беспокоиться о конфиденциальности. Это снизит его намерение перейти по ссылке. [11] Между тем, когда пользователь считает веб-сайт надежным, для него более вероятно перейти по ссылке и принять услугу персонализации. [11] [15]
Для решения конфликтов между конфиденциальностью и прибылью, одна из новых предложенных систем — это оплата за отслеживание. Между пользователями и рекламодателями существует брокер. Пользователи могут решить, предоставлять ли свою личную информацию брокеру, а затем брокер будет отправлять личную информацию, предлагаемую пользователями, рекламодателям. Между тем, пользователи могут получать денежное вознаграждение за предоставление своей личной информации. Это может помочь защитить конфиденциальность и эффективность отслеживания, но приведет к дополнительным расходам. [16]
Персонализированное ценообразование основано на идее, что если пользователь часто покупает определенный продукт или платит более высокую цену за этот продукт, с пользователя может взиматься более высокая цена за этот продукт. История веб-браузинга может дать надежные прогнозы о покупательском поведении пользователей. При использовании персонализированного ценообразования прибыль фирм может увеличиться на 12,99% по сравнению со случаями статус-кво . [17]
История просмотра веб-страниц может быть использована для облегчения исследований, например, для выявления поведения людей при просмотре. Когда пользователь интенсивно просматривает один сайт, вероятность запроса дополнительной страницы увеличивается. Когда пользователь посещает больше сайтов, вероятность запроса дополнительных страниц уменьшается. [18]
История веб-браузинга также может быть использована для создания персональных веб-библиотек. Персональная веб-библиотека создается путем сбора и анализа истории веб-браузинга пользователя. Она может помочь пользователю заметить тенденции просмотра, распределение времени и наиболее часто используемые веб-сайты. Некоторые пользователи считают эту функцию полезной. [3]
История веб-браузинга, хранящаяся локально, по умолчанию нигде не публикуется публично. Однако почти все веб-сайты отслеживаются рекламными программами и потенциально нежелательными программами (ПНП), которые собирают информацию пользователей без их согласия. [19] Эти методы отслеживания обычно разрешены платформами по умолчанию. [12] История веб-браузинга также собирается файлами cookie на веб-сайтах, которые можно разделить на два вида: файлы cookie первой стороны и файлы cookie третьей стороны . Файлы cookie третьей стороны обычно встроены в веб-сайты первой стороны и собирают с них информацию. [10] Файлы cookie третьей стороны обладают более высокой эффективностью и способностью к агрегации данных, чем файлы cookie первой стороны. В то время как файлы cookie первой стороны имеют доступ только к данным пользователей на одном веб-сайте, файлы cookie третьей стороны могут объединять данные, собранные с разных веб-сайтов, чтобы сделать образ пользователя более полным. [10] Между тем, на одном и том же веб-сайте может существовать несколько файлов cookie третьей стороны. [10]
При наличии достаточного количества информации пользователи могут быть идентифицированы без входа в их учетные записи. [20]
Когда сторонние файлы cookie собирают историю просмотров веб-страниц пользователей с нескольких веб-сайтов, больше информации приводит к большему количеству проблем с конфиденциальностью. Например, пользователь просматривает новости на одном веб-сайте и ищет медицинскую информацию на другом веб-сайте. Когда история просмотров веб-страниц с этих двух веб-сайтов объединяется, пользователь может считаться заинтересованным в новостях, связанных с медицинскими темами. [10] Когда история просмотров с разных веб-сайтов объединяется, она может отражать более полный образ человека.
В 2006 году AOL опубликовала большой объем данных своих пользователей, включая историю поиска. Хотя идентификаторы или имена пользователей не были включены, пользователи могли быть идентифицированы на основе опубликованной истории просмотра. [21] Например, пользователь № 4417749 был идентифицирован по ее истории поиска за три месяца. [22]
В 2020 году Avast , популярное антивирусное программное обеспечение, было обвинено в продаже истории просмотров третьим лицам. Это предварительное расследование этого обвинения должностными лицами Чешской Республики. Отчет показывает, что Avast продавал данные пользователей через Jumpshot, инструмент маркетинговой аналитики. Avast утверждает, что личная информация пользователей не была включена в утечку. Однако история просмотров может быть использована для идентификации пользователей. Avast закрыл Jumpshot в ответ на эту проблему. [23]
Когда пользователь чувствует, что существует риск для конфиденциальности, его намерение раскрыть личную информацию будет ниже, но действия не будут затронуты. [24] Однако некоторые исследования показывают, что нет существенной разницы между намерением и действиями раскрытия личной информации, то есть пользователь сократит действия по обмену личной информацией и примет больше мер защиты, когда будет обеспокоен конфиденциальностью. [25] Когда пользователи будут обеспокоены конфиденциальностью, они будут меньше пользоваться онлайн-сервисами. [25] Они также будут принимать больше мер защиты, таких как отказ предоставлять свою информацию, предоставление ложной информации, удаление своей информации в сети и жалобы окружающим или соответствующим организациям. [26]
Однако пользователям сложно защитить свою конфиденциальность по нескольким причинам. Во-первых, пользователи недостаточно осведомлены о конфиденциальности. Они не беспокоятся о том, что их отслеживают , если только это не оказывает на них существенного влияния. Они также не знают, что их данные содержат коммерческую ценность. [12] Обычно пользователям сложно заметить ссылки на политику конфиденциальности на всех видах веб-сайтов, при этом женщины и пользователи старшего возраста с большей вероятностью игнорируют эти уведомления. Даже когда пользователи замечают ссылки на конфиденциальность, раскрытие их информации может не быть затронуто. [27] Кроме того, пользователи также не обладают достаточными техническими знаниями, чтобы защитить себя, даже если они замечают утечку конфиденциальной информации. Они находятся в пассивном положении с небольшими возможностями для изменения ситуации. [12]
Большинство пользователей используют блокировщики рекламы , удаляют файлы cookie и избегают веб-сайтов, которые собирают личную информацию, чтобы попытаться защитить свою историю веб-просмотра от сбора. [13] [28] Однако большинство блокировщиков рекламы не предлагают пользователям достаточно рекомендаций, чтобы помочь им повысить свою осведомленность о конфиденциальности. Что еще более важно, они полагаются на стандартные черные и белые списки . [29] Эти списки обычно не включают веб-сайты, которые отслеживают пользователей. Блокировщики рекламы могут быть эффективными только в том случае, если эти отслеживающие домены заблокированы. [30]
Существует ряд проектов с открытым исходным кодом, которые пытаются защитить свою конфиденциальность, собирая историю просмотров на жестком диске вместо браузера. [31] Это решает проблему, когда пользователи не могут видеть данные истории просмотров после того, как они удаляют данные в браузере.