Процесс сбора адресов электронной почты, как правило, для рассылки спама.
Сбор или скрапинг электронной почты — это процесс получения списков адресов электронной почты с использованием различных методов. Обычно они затем используются для массовой рассылки или спама .
Методы
Самый простой метод заключается в том, что спамеры покупают или обмениваются списками адресов электронной почты у других спамеров .
Другим распространенным методом является использование специального программного обеспечения, известного как « боты -сборщики » или «харвестеры», которое использует веб -страницы , сообщения в Usenet , архивы списков рассылки , интернет-форумы и другие онлайн-источники для получения адресов электронной почты из общедоступных данных.
Спамеры также могут использовать форму атаки по словарю для сбора адресов электронной почты, известную как атака по сбору каталогов , когда действительные адреса электронной почты в определенном домене находятся путем угадывания адреса электронной почты с использованием общих имен пользователей в адресах электронной почты в этом домене. Например, попытки [email protected] , [email protected], [email protected] и т. д. и любые другие, которые принимаются для доставки сервером электронной почты получателя, вместо того, чтобы быть отклоненными, добавляются в список теоретически действительных адресов электронной почты для этого домена.
Другой метод сбора адресов электронной почты — предлагать продукт или услугу бесплатно, пока пользователь предоставляет действительный адрес электронной почты, а затем использовать адреса, собранные у пользователей, в качестве целей для спама. Обычные предлагаемые продукты и услуги — это шутки дня, ежедневные цитаты из Библии, новости или биржевые оповещения, бесплатные товары или даже оповещения о зарегистрированных сексуальных преступниках в вашем регионе. Другой метод был использован в конце 2007 года компанией iDate, которая использовала сбор адресов электронной почты, направленных на подписчиков веб-сайта Quechup , чтобы рассылать спам друзьям и контактам жертвы. [1]
Источники сбора урожая
Спамеры могут собирать адреса электронной почты из ряда источников. Популярный метод использует адреса электронной почты, которые их владельцы опубликовали для других целей. Сообщения Usenet , особенно в архивах, таких как Google Groups , часто содержат адреса. Простой поиск в Интернете страниц с адресами — например, корпоративных справочников персонала или списков членов профессиональных обществ — с помощью спам-ботов может дать тысячи адресов, большинство из которых можно доставить. Спамеры также подписывались на списки рассылки обсуждений с целью сбора адресов авторов. Системы DNS и WHOIS требуют публикации технической контактной информации для всех интернет-доменов; спамеры незаконно прочесывали эти ресурсы в поисках адресов электронной почты. Спамеры также пришли к выводу, что, как правило, для доменных имен предприятий все адреса электронной почты будут следовать одному и тому же базовому шаблону и, таким образом, смогут точно угадывать адреса электронной почты сотрудников, чьи адреса они не собрали. Многие спамеры используют программы, называемые веб-пауками, для поиска адресов электронной почты на веб-страницах. Идентификаторы сообщений статей Usenet часто выглядят настолько похожими на адреса электронной почты, что их также собирают. Спамеры также собирали адреса электронной почты непосредственно из результатов поиска Google , фактически не просматривая веб-сайты, найденные в результатах поиска. [ оригинальное исследование? ]
Спаммерские вирусы могут включать функцию, которая сканирует дисковые накопители компьютера-жертвы (и, возможно, его сетевые интерфейсы) на предмет адресов электронной почты. Эти сканеры обнаруживают адреса электронной почты, которые никогда не были представлены в Интернете или в Whois. Взломанный компьютер, расположенный в общем сегменте сети, может перехватывать адреса электронной почты из трафика, адресованного его соседям по сети. Собранные адреса затем возвращаются спамеру через бот-сеть, созданную вирусом. Кроме того, иногда адреса могут быть дополнены другой информацией и перекрестными ссылками для извлечения финансовых и личных данных. [ оригинальное исследование? ]
Недавняя спорная тактика, называемая « e-pending » , подразумевает добавление адресов электронной почты в базы данных прямого маркетинга. Обычно специалисты по прямому маркетингу получают списки потенциальных клиентов из таких источников, как подписки на журналы и списки клиентов. Просматривая Интернет и другие ресурсы для поиска адресов электронной почты, соответствующих именам и адресам в своих записях, специалисты по прямому маркетингу могут отправлять целевые спам-сообщения. Однако, как и в случае с большинством «таргетингов» спамеров, это неточно; пользователи сообщали, например, о получении предложений заложить свой дом по определенному адресу — причем адрес явно был деловым адресом, включая почтовый индекс и номер офиса. [ оригинальное исследование? ]
Спамеры иногда используют различные средства для подтверждения адресов как доставляемых. Например, включение скрытого веб-жучка в спам-сообщение, написанное в HTML, может привести к тому, что почтовый клиент получателя передаст адрес получателя или любой другой уникальный ключ на веб-сайт спамера. [2] Пользователи могут защититься от таких злоупотреблений, отключив опцию своей почтовой программы для отображения изображений или читая электронную почту как обычный текст, а не как отформатированную. [ оригинальное исследование? ]
Аналогично, спамеры иногда используют веб-страницы, которые якобы удаляют отправленные адреса из спам-списков. В нескольких случаях было обнаружено, что они подписывали введенные адреса на получение большего количества спама. [3]
Когда люди заполняют форму, она часто продается спамеру, использующему веб-сервис или http post для передачи данных. Это происходит немедленно и поместит электронное письмо в различные базы данных спамеров. Доход, полученный от спамера, делится с источником. Например, если кто-то подает заявку на ипотеку онлайн, владелец этого сайта мог заключить сделку со спамером о продаже адреса. Такие письма спамеры считают лучшими, потому что они свежие, и пользователь только что подписался на продукт или услугу, которые часто рекламируются спамом.
Законность
Во многих юрисдикциях действуют законы о борьбе со спамом , которые ограничивают сбор или использование адресов электронной почты. [ оригинальное исследование? ]
В Австралии создание или использование программ сбора адресов электронной почты (программного обеспечения для сбора адресов) является незаконным, согласно антиспамовому законодательству 2003 года, только если оно предназначено для отправки нежелательных коммерческих писем. [4] [5] Законодательство направлено на запрет писем с «австралийским подключением» — спама, исходящего из Австралии, отправляемого в другие места, а также спама, отправляемого на австралийский адрес.
В Новой Зеландии аналогичные ограничения содержатся в Законе о незапрошенных электронных сообщениях 2007 года. [6]
В Соединенных Штатах Америки Закон CAN-SPAM 2003 года [7] сделал незаконной отправку коммерческих электронных писем получателю, адрес электронной почты которого был получен следующим образом:
- Использование автоматизированного средства, которое генерирует возможные адреса электронной почты путем комбинирования имен, букв или цифр в многочисленные комбинации.
- Использование автоматизированных средств для извлечения адресов электронной почты с веб-сайта в Интернете или с частной онлайн-службы, управляемой другим лицом, и такой веб-сайт или онлайн-служба включали на момент получения адреса уведомление о том, что оператор такого веб-сайта или онлайн-службы не будет передавать, продавать или иным образом передавать адреса, поддерживаемые таким веб-сайтом или онлайн-службой, какой-либо другой стороне в целях инициирования или предоставления другим лицам возможности инициировать электронные почтовые сообщения.
Кроме того, операторы веб-сайтов не могут распространять свои законно собранные списки. Закон CAN-SPAM 2003 года требует, чтобы операторы веб-сайтов и онлайн-сервисов включали уведомление о том, что сайт или сервис не будет предоставлять, продавать или иным образом передавать адреса, поддерживаемые таким веб-сайтом или онлайн-сервисом, любой другой стороне в целях инициирования или предоставления другим возможности инициировать электронные почтовые сообщения.
Контрмеры
- Адрес мингинга
- Изменение адреса — например, изменение "[email protected]" на "bob at example dot com" — это распространенный метод усложнения сбора адресов электронной почты. Хотя его относительно легко обойти — см., например, этот поиск Google — он все еще эффективен. [8] [9] Это несколько неудобно для пользователей, которые должны проверять адрес и вручную его исправлять.
- Изображения
- Использование изображений для отображения части или всего адреса электронной почты является очень эффективной мерой противодействия сбору данных. Обработка, необходимая для автоматического извлечения текста из изображений, экономически невыгодна для спамеров. Это очень неудобно для пользователей, которые вводят адрес вручную.
- Контактные формы
- Формы контактов электронной почты , которые отправляют электронное письмо, но не раскрывают адрес получателя, избегают публикации адреса электронной почты в первую очередь. Однако этот метод не позволяет пользователям писать в их предпочитаемом почтовом клиенте, ограничивает содержание сообщения простым текстом и не оставляет автоматически пользователю запись того, что он сказал, в его папке «отправленных» писем.
- Обфускация JavaScript
- Обфускация электронной почты JavaScript создает обычную, кликабельную ссылку электронной почты для пользователей, скрывая адрес от пауков. В исходном коде, который видят сборщики, адрес электронной почты зашифрован, закодирован или иным образом запутан. [8] Хотя это очень удобно для большинства пользователей, это снижает доступность , например, для текстовых браузеров и экранных ридеров или для тех, кто не использует браузер с поддержкой JavaScript. [10]
- HTML-запутывание
- В HTML адреса электронной почты могут быть запутаны многими способами, например, путем вставки скрытых элементов в адрес или перечисления частей в неправильном порядке и использования CSS для восстановления правильного порядка. Каждый из них имеет преимущество прозрачности для большинства пользователей, но ни один из них не поддерживает кликабельные ссылки электронной почты и ни один из них не доступен для текстовых браузеров и экранных ридеров.
- КАПЧА
- Требование от пользователей заполнить CAPTCHA перед тем, как предоставить адрес электронной почты, является эффективной мерой противодействия сбору данных. Популярным решением является сервис reCAPTCHA Mailhide. (Примечание, 12.9.18: Mailhide больше не поддерживается.) [11]
- Уведомление о CAN-SPAM
- Чтобы обеспечить судебное преследование спамеров в соответствии с Законом CAN-SPAM 2003 года, оператор веб-сайта должен разместить уведомление о том, что «сайт или служба не будет предоставлять, продавать или иным образом передавать адреса, поддерживаемые таким веб-сайтом или онлайн-службой, любой другой стороне в целях инициирования или предоставления другим возможности инициировать электронные почтовые сообщения». [12]
- Мониторинг почтового сервера
- Серверы электронной почты используют различные методы для борьбы с атаками по сбору адресов, включая отказ в общении с удаленными отправителями, которые указали более одного недействительного адреса получателя в течение короткого времени, но большинство таких мер несут в себе риск нарушения работы легитимной электронной почты.
- Ловушки для пауков
- Ловушка для паука — это часть веб-сайта, которая представляет собой приманку, предназначенную для борьбы с пауками, собирающими электронные письма. [13] На пауков, ведущих себя хорошо, это не влияет, поскольку файл robots.txt веб-сайта предупредит пауков держаться подальше от этой области — предупреждение, которое вредоносные пауки не учитывают. Некоторые ловушки блокируют доступ с IP-адреса клиента, как только к ловушке происходит доступ. [14] [15] [16] Другие, такие как сетевой тарпит , предназначены для траты времени и ресурсов вредоносных пауков, медленно и бесконечно скармливая им бесполезную информацию. [17] Содержимое «приманки» может содержать большое количество поддельных адресов, метод, известный как отравление списков ; хотя некоторые считают эту практику вредной. [18] [19] [20] [21]
Смотрите также
Ссылки
- ^ Артур, Чарлз (2007-09-13). «Действительно ли сайты социальных сетей заботятся о конфиденциальности?». theguardian. Архивировано из оригинала 2016-12-22 . Получено 2007-10-30 .
- ↑ Хезер Харрелд (5 декабря 2000 г.). «Встроенные HTML-«баги» представляют потенциальную угрозу безопасности». InfoWorld. Архивировано из оригинала 2006-12-10 . Получено 2007-01-06 .
- ^ "Службы отмены подписки на спам". Spamhaus Project Ltd. 29 сентября 2005 г. Архивировано из оригинала 2009-03-09 . Получено 2007-01-06 .
- ^ "Анализ австралийских счетов за спам 2003 г., проведенный EFA". efa.org.au. Electronic Frontiers Australia . 2003-11-01. Программное обеспечение и списки для сбора адресов. Архивировано из оригинала 2021-05-04.
- ^ "Австралия захлопнула дверь спаму". 2003-08-18. Архивировано из оригинала 2007-02-03 . Получено 2021-07-04 .
- ^ «Закон о незапрошенных электронных сообщениях 2007 г. № 7, Подраздел 2 Публичного закона — Программное обеспечение для сбора адресов и списки собранных адресов». legal.govt.nz . Архивировано из оригинала 2021-02-17 . Получено 2021-07-04 .
- ^ "Public Law 108–187" (PDF) . Архивировано (PDF) из оригинала 2006-01-04 . Получено 2007-05-28 .
- ^ ab Silvan Mühlemann, 20 июля 2008 г., Девять способов сокрытия адресов электронной почты по сравнению
- ^ Hohlfeld, Oliver; Graf, Thomas; Ciucu, Florin (2012). Longtime Behavior of Harvesting Spam Bots (PDF) . Конференция ACM Internet Measurement. Архивировано (PDF) из оригинала 2014-07-25 . Получено 2014-07-18 .
- ^ Роэл Ван Гилс, A List Apart , 6 ноября 2007 г., Изящное запутывание электронной почты. Архивировано 22 февраля 2011 г. на Wayback Machine.
- ^ "Mailhide: Бесплатная защита от спама" . Получено 18 марта 2023 г.
- ^ "15 Кодекс США § 7704 - Другие меры защиты пользователей коммерческой электронной почты" Архивировано 19 сентября 2016 г. на Wayback Machine , раздел a.4.b.1.Ai
- ^ SEO Glossary Архивировано 28 декабря 2010 г. на Wayback Machine : «Ловушка для паука означает либо непрерывный цикл, в котором пауки запрашивают страницы, а сервер запрашивает данные для отображения страницы, либо преднамеренную схему, разработанную для выявления (и «бана») пауков, которые не уважают robots.txt».
- ^ [1] Архивировано 17 мая 2008 г. на Wayback Machine. Ловушка-паук, которая блокирует клиентов, получающих к ней доступ.
- ^ Томас Зейтамл, Ловушка для паука: как это работает Архивировано 11 апреля 2018 г. на Wayback Machine
- ^ Ральф Д. Клот, Ловите плохих ботов в ловушке для ботов. Архивировано 17 января 2006 г. на Wayback Machine.
- ^ "Как сохранить плохих роботов". fleiner.com . Архивировано из оригинала 18 марта 2023 г. . Получено 18 марта 2023 г. .
- ^ Ральф Д. Клот, Борьба со СПАМом, поимка плохих ботов. Архивировано 1 июня 2006 г. на Wayback Machine : «Создание веб-страниц с длинными списками поддельных адресов для порчи адресной базы данных спам-бота не приветствуется, поскольку неизвестно, действительно ли спамеры заботятся об этом, и, с другой стороны, использование этих адресов спамерами приведет к дополнительной нагрузке на сетевые соединения и задействованные невинные сторонние серверы».
- ↑ Harvester Killer. Архивировано 11 апреля 2008 г. на Wayback Machine : генерирует поддельные электронные письма и загоняет пауков в бесконечный цикл.
- ^ "Поддержка переносимости: блокировка паука => ловушка паука — обнаруживает и блокирует плохих ботов". Архивировано из оригинала 2011-07-06 . Получено 2011-02-12 .Ловушка-паук, которая генерирует 5000 поддельных адресов электронной почты и блокирует клиенту дальнейший доступ.
- ^ robotcop.org Архивировано 20 октября 2019 г. на Wayback Machine : «Веб-мастера могут реагировать на некорректно ведущих себя пауков, отлавливая их, отравляя свои базы данных собранных адресов электронной почты или просто блокируя их».