stringtranslate.com

реКАПЧА

reCAPTCHA Inc. [1] — это система CAPTCHA , принадлежащая Google . Это позволяет веб-хостам различать человеческий и автоматический доступ к веб-сайтам. В оригинальной версии пользователям предлагалось расшифровывать трудночитаемый текст или сопоставлять изображения. Версия 2 также просила пользователей расшифровать текст или сопоставить изображения, если анализ файлов cookie и рендеринг холста показал, что страница загружается автоматически. [2] Начиная с версии 3, reCAPTCHA никогда не отвлекает пользователей и запускается автоматически, когда пользователи загружают страницы или нажимают кнопки. [3]

Первоначальная версия сервиса представляла собой платформу массового сотрудничества , предназначенную для оцифровки книг, особенно тех, которые были слишком неразборчивы для сканирования на компьютерах . В подсказках для проверки использовались пары слов из отсканированных страниц, при этом одно известное слово использовалось в качестве контроля проверки, а второе использовалось для краудсорсинга чтения неопределенного слова. [4] reCAPTCHA была первоначально разработана Луисом фон Аном , Дэвидом Абрахамом, Мануэлем Блюмом , Майклом Кроуфордом, Беном Маурером, Колином Макмилленом и Эдисоном Таном в главном кампусе Университета Карнеги-Меллон в Питтсбурге . [5] Она была приобретена Google в сентябре 2009 года. [6] Система помогла оцифровать архивы The New York Times и впоследствии использовалась Google Books для аналогичных целей. [7]

Сообщается, что система отображает более 100 миллионов CAPTCHA каждый день [8] на таких сайтах, как Facebook , TicketMaster , Twitter , 4chan , CNN.com , StumbleUpon , [9] Craigslist (с июня 2008 г.), [10] и в США. Веб-сайт программы купонов на конвертер цифрового телевидения Национального управления по телекоммуникациям и информации (в рамках перехода на цифровое телевидение в США ). [11]

В 2014 году Google отклонил сервис от своей первоначальной концепции, сосредоточив внимание на уменьшении количества взаимодействия с пользователем, необходимого для проверки пользователя, и создавая проблемы распознавания человека (например, идентификацию изображений в наборе, которые удовлетворяют определенному запросу), если поведенческий анализ подозревает, что пользователь может быть ботом.

В октябре 2023 года было обнаружено, что чат- бот GPT-4 Bing Chat может решать CAPTCHA. [12]

Источник

Распределенные корректоры были первым проектом, который добровольно потратил время на расшифровку отсканированного текста, который не мог быть прочитан программами оптического распознавания символов (OCR). Он сотрудничает с Project Gutenberg для оцифровки материалов, являющихся общественным достоянием , и использует методы, совершенно отличные от reCAPTCHA.

Программа reCAPTCHA была разработана гватемальским ученым-компьютерщиком Луисом фон Аном [ 13] при поддержке стипендии Макартура . Будучи одним из первых разработчиков CAPTCHA, он понял, что «невольно создал систему, которая с десятисекундными интервалами тратила миллионы часов самого ценного ресурса: циклов человеческого мозга». [14]

Операция

ReCAPTCHA v1 (распознавание текста с помощью человека)

Пример того, как выглядела задача reCAPTCHA в 2007 году [15] , содержащая слова «following» и «finding». Волнистость и горизонтальный штрих были добавлены, чтобы повысить сложность взлома CAPTCHA с помощью компьютерной программы.
Идентификация изображения CAPTCHA

Отсканированный текст подвергается анализу с помощью двух разных программ оптического распознавания символов. Любое слово, которое по-разному расшифровывается двумя программами OCR или которого нет в словаре английского языка, помечается как «подозрительное» и преобразуется в CAPTCHA. Подозрительное слово отображается вне контекста, иногда вместе с уже известным контрольным словом. Если человек правильно вводит контрольное слово, то ответ на сомнительное слово принимается как вероятно верный. Если достаточное количество пользователей правильно напечатают контрольное слово, но неправильно напечатают второе слово, которое OCR не распознает, то цифровая версия документов может в конечном итоге содержать неправильное слово. Идентификация, выполняемая каждой программой OCR, оценивается в 0,5 балла, а каждая интерпретация человеком оценивается в полный балл. Как только данная идентификация набирает 2,5 балла, слово считается действительным. Те слова, которым судьи-люди последовательно присваивают единую идентичность, позже перерабатываются в качестве контрольных слов. [16] Если первые три предположения совпадают друг с другом, но не совпадают ни с одним из OCR, они считаются правильным ответом, а слово становится контрольным. [17] Если шесть пользователей отклоняют слово до того, как будет выбрано правильное написание, слово отбрасывается как нечитаемое. [17]

Первоначальный метод reCAPTCHA был разработан для отображения сомнительных слов отдельно, как исправление вне контекста, а не в использовании, например, в фразе из пяти слов из исходного документа. [18] Кроме того, управляющее слово может ввести в заблуждение контекст второго слова, например, запрос на ввод «/metal//fife/» как «металлический напильник », поскольку логическая связь опиливания металлическим инструментом считается более распространен, чем музыкальный инструмент « файф ». [ нужна цитата ]

В 2012 году reCAPTCHA начала использовать помимо отсканированных слов фотографии, взятые из проекта Google Street View . [19] Пользователю будет предложено идентифицировать изображения пешеходных переходов, уличных фонарей и других объектов. Была выдвинута гипотеза, что данные используются Waymo (дочерней компанией Google) для обучения беспилотных транспортных средств, хотя неназванный представитель опроверг это, заявив, что по состоянию на середину 2021 года данные использовались только для улучшения Google Maps. [20]

Google взимает плату за использование reCAPTCHA на веб-сайтах, которые отправляют более миллиона запросов reCAPTCHA в месяц. [21]

Без CAPTCHA reCAPTCHA (v2+)

NoCAPTCHA reCAPTCHA

В 2013 году reCAPTCHA начала реализовывать поведенческий анализ взаимодействия браузера, чтобы предсказать, является ли пользователь человеком или ботом. В следующем году Google начал развертывать новый API reCAPTCHA с функцией «no CAPTCHA reCAPTCHA», при которой пользователям, которые относятся к группе низкого риска, нужно всего лишь установить один флажок , чтобы подтвердить свою личность. CAPTCHA все равно может быть представлена, если система не уверена в риске пользователя; Google также представил новый тип задачи CAPTCHA, призванный сделать ее более доступной для мобильных пользователей: пользователь должен выбрать изображения, соответствующие определенному запросу, из сетки. [2] [22]

В 2017 году Google представил новую «невидимую» reCAPTCHA, в которой проверка происходит в фоновом режиме, и никакие проблемы вообще не отображаются, если считается, что пользователь относится к группе низкого риска. [23] [24] [25] По словам бывшего «царя Google по мошенничеству с кликами » Шумана Госемаджумдера , эта возможность «создает новый вид проблемы, которую очень продвинутые боты все еще могут обойти, но создает гораздо меньше препятствий для законного человека. " [25]

Срок службы reCAPTCHA v1 был объявлен прекращенным и прекращено 31 марта 2018 г. [26]

Выполнение

Тесты reCAPTCHA отображаются с центрального сайта проекта reCAPTCHA, который предоставляет слова для расшифровки. Это делается через API JavaScript , при этом сервер выполняет обратный вызов reCAPTCHA после отправки запроса. Проект reCAPTCHA предоставляет библиотеки для различных языков программирования и приложений, чтобы упростить этот процесс. reCAPTCHA — это бесплатная услуга, предоставляемая веб-сайтам для помощи в расшифровке [27] , но программное обеспечение reCAPTCHA не имеет открытого исходного кода . [28]

Кроме того, reCAPTCHA предлагает плагины для нескольких платформ веб-приложений, включая ASP.NET , Ruby и PHP , для упрощения реализации службы. [29]

Безопасность

Пример того, как в 2010 году были представлены задачи reCAPTCHA, [30] содержащие слова «и долота».

Основная цель системы CAPTCHA — блокировать спам-боты, разрешая пользователям доступ к ней. 14 декабря 2009 года Джонатан Уилкинс опубликовал статью, описывающую недостатки reCAPTCHA, которые позволяли ботам достигать уровня решения 18%. [31] [32] [33]

1 августа 2010 года Чад Хоук выступил на хакерской конференции DEF CON 18 с подробным описанием метода устранения искажений, добавляемых к изображениям, которые позволяли компьютерной программе определять действительный ответ в 10% случаев. [34] [35] Система reCAPTCHA была модифицирована 21 июля 2010 года, до того, как Хоук рассказал о своем методе. Хоук модифицировал свой метод, сделав его «более простым» CAPTCHA, чтобы определить действительный ответ в 31,8% случаев. Хоук также упомянул защитные меры безопасности в системе, в том числе блокировку с высоким уровнем безопасности, если неверный ответ дается 32 раза подряд. [36]

26 мая 2012 года Адам, CP и Джеффбол из DC949 выступили с презентацией на хакерской конференции LayerOne, в которой подробно рассказали, как им удалось создать автоматизированное решение с точностью 99,1%. [37] Их тактика заключалась в использовании методов машинного обучения (подобласти искусственного интеллекта) для анализа аудиоверсии reCAPTCHA, доступной для слабовидящих. Google выпустил новую версию reCAPTCHA всего за несколько часов до их выступления, внося серьезные изменения как в аудио, так и в визуальную версию своего сервиса. В этом выпуске продолжительность аудиоверсии была увеличена с 8 до 30 секунд, и ее гораздо сложнее понять как людям, так и ботам. В ответ на это и следующее обновление члены DC949 выпустили еще две версии Stiltwalker, которые превзошли reCAPTCHA с точностью 60,95% и 59,4% соответственно. После каждого последующего перерыва Google обновлял reCAPTCHA в течение нескольких дней. По данным DC949, они часто возвращались к ранее взломанным функциям.

27 июня 2012 года Клаудия Круз, Фернандо Уседа и Леобардо Рейес опубликовали статью, показывающую систему, работающую на изображениях reCAPTCHA с точностью 82%. [38] Авторы не сообщили, способна ли их система решать последние изображения reCAPTCHA, хотя они заявляют, что их работа является интеллектуальным распознаванием текста и устойчива к некоторым, если не ко всем, изменениям в базе данных изображений.

В презентации, состоявшейся в августе 2012 года на BsidesLV 2012, DC949 назвал последнюю версию «непостижимо невозможной для людей» — они также не смогли решить их вручную. [37] Организация веб-доступности WebAIM сообщила в мае 2012 года: «Более 90% респондентов [пользователей программ чтения с экрана] считают CAPTCHA очень или несколько сложной задачей». [39]

Критика

Первоначальная версия reCAPTCHA подверглась критике как источник неоплачиваемой работы по расшифровке. [40]

Google получает прибыль от пользователей reCAPTCHA как бесплатных работников для улучшения своих исследований в области искусственного интеллекта. [41]

Конфиденциальность

Текущая версия системы подверглась критике за ее зависимость от файлов cookie отслеживания и поощрение привязки поставщика к сервисам Google; администраторам рекомендуется включать код отслеживания reCAPTCHA на все страницы своего веб-сайта для анализа поведения и «риска» пользователей, что определяет уровень проблем, возникающих при использовании запроса reCAPTCHA. [42] Google заявила в своей политике конфиденциальности , что пользовательские данные, собранные таким образом, не используются для персонализированной рекламы. Также было обнаружено, что система отдает предпочтение тем, у кого есть активный вход в учетную запись Google , и демонстрирует более высокий риск для тех, кто использует анонимизирующие прокси и службы VPN. [23]

Обеспокоенность по поводу конфиденциальности возникла, когда Google анонсировала reCAPTCHA v3.0, поскольку она позволяет Google отслеживать пользователей на веб-сайтах, не принадлежащих Google. [23]

В апреле 2020 года Cloudflare перешла с reCAPTCHA на hCaptcha, ссылаясь на опасения конфиденциальности по поводу потенциального использования Google данных, которые они вспоминают через reCAPTCHA, для целевой рекламы [43] и для сокращения операционных расходов, поскольку значительная часть клиентов Cloudflare не платит. . В ответ Google сообщил журналу PC Magazine , что данные reCAPTCHA никогда не используются в целях персонализированной рекламы. [21]

Доступность

В справочном центре Google говорится, что reCAPTCHA не поддерживается для сообщества слепоглухих , [44] что фактически блокирует таким пользователям доступ ко всем страницам, использующим эту услугу. Тем не менее, reCAPTCHA в настоящее время имеет самый длинный список рекомендаций по доступности среди всех служб CAPTCHA. [45]

Интерфейс

В одном из вариантов задач CAPTCHA изображения не подсвечиваются постепенно, а исчезают при нажатии и заменяются новым изображением, исчезающим, напоминающим « ударь крота» .

Критика была направлена ​​на длительную продолжительность исчезновения и появления изображений. [46]

Производные проекты

reCAPTCHA также создала проект Mailhide, который защищает адреса электронной почты на веб-страницах от сбора спамерами . [47] По умолчанию адрес электронной почты был преобразован в формат, который не позволял сканеру видеть полный адрес электронной почты; например, «[email protected]» было бы преобразовано в «[email protected]». Затем посетитель нажмет «...» и решит CAPTCHA, чтобы получить полный адрес электронной почты. Можно также отредактировать всплывающий код, чтобы ни один адрес не был виден. Поддержка Mailhide была прекращена в 2018 году, поскольку она использовала reCAPTCHA v1. [48]

Рекомендации

  1. ^ "Рекапча Inc". Открытые корпорации . 28 августа 2007 г. Архивировано из оригинала 20 августа 2023 г. Проверено 20 августа 2023 г.
  2. ↑ Аб Шет, Винай (3 декабря 2014 г.). «Вы робот? Представляем «CAPTCHA the ReCAPTCHA PREDATORS». Архивировано из оригинала 3 сентября 2020 года . Проверено 24 февраля 2021 г.
  3. ^ "reCAPTCHA v3" . Архивировано из оригинала 25 сентября 2020 года . Проверено 8 сентября 2020 г.
  4. Ан, Луис фон (6 декабря 2011 г.), Масштабное онлайн-сотрудничество, заархивировано из оригинала 15 июля 2020 г. , получено 14 апреля 2020 г.
  5. ^ «reCAPTCHA: О нас» . Архивировано из оригинала 11 июня 2010 года . Проверено 14 августа 2018 г.
  6. ^ «Обучаем компьютеры чтению: Google приобретает reCAPTCHA» . Архивировано из оригинала 19 мая 2013 года . Проверено 16 сентября 2009 г.
  7. ^ «Расшифровка старых текстов, по одному запутанному, кривому слову за раз» . Нью-Йорк Таймс . 28 марта 2011 года. Архивировано из оригинала 17 ноября 2017 года . Проверено 20 ноября 2017 г.
  8. ^ «Часто задаваемые вопросы по reCAPTCHA» . Архивировано из оригинала 5 июля 2010 года . Проверено 12 июня 2011 г.
  9. Рубенс, Пауль (2 октября 2007 г.). «Спам-оружие помогает сохранить книги». Би-би-си. Архивировано из оригинала 18 мая 2013 года . Проверено 3 октября 2007 г.
  10. ^ «Борьба со спамом, оцифровка книг». Блог Craigslist. Июнь 2008. Архивировано из оригинала 6 июля 2010 года . Проверено 17 июня 2008 г.
  11. ^ "Программа ТВ-конвертера" . dtv2009.gov . Архивировано из оригинала 4 ноября 2009 года.
  12. Эдвардс, Бендж (2 октября 2023 г.). «Запрос на медальон мертвой бабушки обманом заставляет ИИ Bing Chat решить головоломку безопасности» . Арс Техника . Архивировано из оригинала 10 октября 2023 года . Проверено 25 октября 2023 г.
  13. ^ «Полное интервью: Луис фон Ан о Duolingo», Spark, ноябрь 2011 г.». Канадская радиовещательная корпорация. 30 ноября 2011. Архивировано из оригинала 3 июня 2012 года . Проверено 10 июля 2013 г.
  14. Хатчинсон, Алекс (12 марта 2009 г.). «Человеческие ресурсы: работа, о которой вы даже не подозревали». Морж . Архивировано из оригинала 3 декабря 2015 года . Проверено 7 декабря 2015 г.
  15. ^ «reCAPTCHA: использование капч для оцифровки книг» . ТехКранч . 16 сентября 2007 года. Архивировано из оригинала 3 июня 2017 года . Проверено 25 июня 2017 г.
  16. Тиммер, Джон (14 августа 2008 г.). «CAPTCHA работает? для оцифровки старых, поврежденных текстов, рукописей». Арс Техника . Архивировано из оригинала 24 января 2009 года . Проверено 9 декабря 2008 г.
  17. ^ аб Луис; Маурер, Бен; Макмиллен, Колин; Авраам, Дэвид; Блюм, Мануэль (2008). «reCAPTCHA: человеческое распознавание символов с помощью мер веб-безопасности»". Science . 321 (5895): 1465–1468. Бибкод : 2008Sci...321.1465V. CiteSeerX  10.1.1.141.6563 . doi : 10.1126/science.1160379. PMID  18703711. S2CID  18371056.
  18. ^ «» сомнительная достоверность результатов, если слова представлены вне контекста», Группы Google, 29 августа 2008 г.». Архивировано из оригинала 30 апреля 2011 года . Проверено 10 июля 2013 г.
  19. Перес, Сара (29 марта 2012 г.). «Google теперь использует ReCAPTCHA для декодирования адресов просмотра улиц». ТехКранч . Архивировано из оригинала 23 августа 2012 года . Проверено 10 июля 2013 г.
  20. Вега, Эдвард (14 мая 2021 г.). «Почему капча становится сложнее». Вокс . Архивировано из оригинала 15 апреля 2022 года . Проверено 15 апреля 2022 г.
  21. ^ ab «Cloudflare сбрасывает ReCAPTCHA Google из-за проблем с конфиденциальностью и затратами» . PCMag . Архивировано из оригинала 19 июля 2020 года . Проверено 18 июля 2020 г.
  22. Гринберг, Энди (3 декабря 2014 г.). «Теперь Google может одним щелчком мыши сказать, что вы не робот». Проводной . Архивировано из оригинала 2 октября 2015 года . Проверено 1 октября 2015 г.
  23. ^ abc Шваб, Кэтрин (27 июня 2019 г.). «У новой reCAPTCHA Google есть темная сторона». Компания Фаст . Архивировано из оригинала 28 июня 2019 года . Проверено 8 апреля 2020 г.
  24. Амадео, Рон (9 марта 2017 г.). «ReCAPTCHA Google станет «невидимой» и позволит без проблем отделить ботов от людей». Арс Техника . Архивировано из оригинала 6 августа 2020 года . Проверено 14 апреля 2020 г.
  25. ^ ab «Google только что сделал Интернет немного менее раздражающим». Популярная наука . 10 марта 2017 года. Архивировано из оригинала 5 февраля 2021 года . Проверено 5 апреля 2017 г.
  26. ^ «API Google reCAPTCHA v1 закрывается в марте 2018 г.» . Программируемая сеть . Архивировано из оригинала 20 июня 2020 года . Проверено 14 апреля 2020 г.
  27. ^ «Часто задаваемые вопросы». reCAPTCHA.net. Архивировано из оригинала 16 июля 2012 года.
  28. ^ «reCAPTCHA: хватит спама, читайте книги» . Архивировано из оригинала 19 июня 2020 года . Проверено 14 января 2014 г.
  29. ^ «Руководство разработчика — reCAPTCHA». Google Inc. Архивировано из оригинала 24 ноября 2017 года . Проверено 14 января 2014 г.
  30. Гринберг, Энди (18 июня 2010 г.). «Эти тесты с зашифрованными словами для остановки спам-ботов сложны и для людей» . Форбс . Архивировано из оригинала 9 сентября 2017 года . Проверено 10 сентября 2017 г.
  31. ^ «Руководство по строгой проверке CAPTCHA» (PDF) . Архивировано (PDF) из оригинала 23 июля 2011 г. Проверено 31 января 2011 г.
  32. ^ «ReCAPTCHA Google разрушена новой атакой» . Регистр . Архивировано из оригинала 10 августа 2017 года . Проверено 10 августа 2017 г.
  33. ^ «Вмятина на reCAPTCHA Google» . Архивировано из оригинала 10 марта 2010 года . Проверено 31 января 2011 г.
  34. ^ "Динамики Def Con 18" . defcon.org. Архивировано из оригинала 20 октября 2010 года . Проверено 17 ноября 2010 г.
  35. ^ «Декодирование бумаги reCAPTCHA» . Чад Хоук. Архивировано из оригинала 19 августа 2010 года.
  36. ^ «Декодирование reCAPTCHA Power Point» . Чад Хоук. Архивировано из оригинала 24 октября 2010 года.
  37. ^ ab "Проект ходулист". Архивировано из оригинала 2 июля 2012 года . Проверено 28 мая 2012 г.
  38. ^ Клаудия Крус-Перес; Олег Старостенко; Фернандо Уседа-Понга; Висенте Аларкон-Акино; Леобардо Рейес-Кабрера (30 июня 2012 г.). «Взлом reCAPTCHA с непредсказуемым коллапсом: эвристическая сегментация и распознавание символов». В Карраско-Очоа — Хесус Ариэль; Мартинес-Тринидад, Хосе Франсиско; Ольвера Лопес, Хосе Артуро; Бойер, Ким Л. (ред.). Распознавание образов . Конспекты лекций по информатике. Том. 7329. Мексика. стр. 155–165. дои : 10.1007/978-3-642-31149-9_16. ISBN 978-3-642-31148-2. S2CID  29097170.{{cite book}}: CS1 maint: location missing publisher (link)
  39. ^ «Результаты опроса пользователей программы чтения с экрана № 4» . Архивировано из оригинала 10 декабря 2017 года . Проверено 19 апреля 2013 г.
  40. Харрис, Дэвид Л. (23 января 2015 г.). «В иске женщины из Массачусетса Google обвиняется в использовании бесплатной рабочей силы для расшифровки книг и газет». Бостонский деловой журнал . Архивировано из оригинала 28 апреля 2015 года . Проверено 4 сентября 2015 г.
  41. ^ «Нет CAPTCHA: еще одна уловка, придуманная Google, чтобы получить от вас бесплатную цифровую рабочую силу» . Архивировано из оригинала 12 ноября 2020 года . Проверено 3 декабря 2020 г.
  42. Тейлор, Крис (26 февраля 2024 г.). «Хватит разглашать данные вашего сайта!». Просопо .
  43. ^ «Переход с reCAPTCHA на hCaptcha» . Блог Cloudflare . 8 апреля 2020 года. Архивировано из оригинала 12 августа 2020 года . Проверено 18 июля 2020 г.
  44. ^ «Что такое CAPTCHA? - Справка администратора G Suite» . Архивировано из оригинала 6 августа 2020 года . Проверено 11 мая 2020 г.
  45. ^ «WCAG 1.1: Текстовые альтернативы [статья]» . 6 октября 2020 года. Архивировано из оригинала 26 ноября 2020 года . Проверено 10 декабря 2020 г.
  46. ^ «ReCaptcha чрезвычайно [sic] медленно затухает · Проблема № 268 · google/recaptcha» . Гитхаб . Архивировано из оригинала 14 октября 2020 года . Проверено 14 октября 2020 г.
  47. ^ «Mailhide: бесплатная защита от спама» . Архивировано из оригинала 2 января 2012 года . Проверено 15 мая 2011 г.
  48. ^ «Mailhide: Обслуживание прекращено» . Архивировано из оригинала 7 ноября 2012 года . Проверено 3 марта 2019 г.

дальнейшее чтение

Внешние ссылки