Amazon Mechanical Turk ( MTurk ) — это краудсорсинговый веб-сайт, с помощью которого компании могут нанимать удаленно работающих «краудворкеров» для выполнения отдельных задач по требованию, которые компьютеры в настоящее время не могут выполнить по такой же экономичной цене. Он работает под управлением Amazon Web Services и принадлежит Amazon . [1] Работодатели, известные как заказчики, размещают задания, известные как задачи человеческого интеллекта (HIT), такие как определение определенного контента на изображении или видео, написание описаний продуктов или ответы на вопросы опроса. Работники, в просторечии известные как туркеры или краудворкеры , просматривают существующие задания и выполняют их в обмен на плату, установленную заказчиком. Для размещения заданий заказчики используют открытый интерфейс прикладного программирования (API) или более ограниченный сайт MTurk Requester. [2] По состоянию на апрель 2019 года [обновлять]заказчики могли зарегистрироваться из 49 одобренных стран. [3]
Сервис был задуман Венки Харинарайаном в патентном раскрытии США в 2001 году. [4] Amazon ввел термин «искусственный интеллект» для процессов, которые передают некоторые части компьютерной программы на аутсорсинг людям, для тех задач, которые люди выполняют гораздо быстрее, чем компьютеры. Утверждается [ кем? ] , что Джефф Безос был ответственным за предложение о разработке Amazon's Mechanical Turk для реализации этого процесса. [5]
Название Mechanical Turk было навеяно « The Turk », шахматным автоматом XVIII века, созданным Вольфгангом фон Кемпеленом , который гастролировал по Европе и победил Наполеона Бонапарта и Бенджамина Франклина . Позже выяснилось, что эта «машина» была не автоматом, а человеком -шахматистом, спрятанным в шкафу под доской и управляющим движениями гуманоидного манекена. Аналогично, онлайн-сервис Mechanical Turk использует удаленный человеческий труд, скрытый за компьютерным интерфейсом, чтобы помочь работодателям выполнять задачи, которые невозможны с использованием настоящей машины.
MTurk был запущен публично 2 ноября 2005 года. Его пользовательская база быстро росла. В начале-середине ноября 2005 года существовали десятки тысяч заданий, все из которых были загружены в систему самой Amazon для некоторых ее внутренних задач, требующих человеческого интеллекта. Типы HIT расширились, включив транскрибирование, рейтинг, тегирование изображений, опросы и письмо.
В марте 2007 года сообщалось о более чем 100 000 работников в более чем 100 странах. [6] Это число увеличилось до более чем 500 000 зарегистрированных работников из более чем 190 стран в январе 2011 года. [7] В том же году Techlist опубликовал интерактивную карту, указывающую местонахождение 50 000 своих работников MTurk по всему миру. [8] К 2018 году исследования показали, что, хотя на платформе в любое время было доступно более 100 000 работников, только около 2 000 из них активно работали. [9]
Пользователь Mechanical Turk может быть либо «Работником» (подрядчиком), либо «Запросчиком» (работодателем). Работники имеют доступ к панели, которая отображает три раздела: общий доход, статус HIT и итоговые значения HIT. Работники устанавливают свои собственные часы и не обязаны принимать какие-либо конкретные задания.
Amazon классифицирует Workers как подрядчиков, а не как сотрудников, и не платит налоги на заработную плату. Классификация Workers как подрядчиков позволяет Amazon избегать таких вещей, как минимальная заработная плата , сверхурочные и компенсация работникам — это обычная практика среди платформ «экономики свободного заработка». Работники по закону обязаны сообщать о своих доходах как о доходах от самозанятости.
В 2013 году средняя заработная плата за выполнение нескольких микрозадач, если они выполнялись быстро, составляла около одного доллара в час, при этом каждая задача в среднем стоила несколько центов. [10] Однако подсчет среднего почасового заработка людей на сайте микрозадач чрезвычайно сложен, и несколько источников данных показывают средний почасовой заработок в диапазоне от 5 до 9 долларов в час [11] [12] [13] [14] среди значительного числа работников, в то время как наиболее опытные, активные и квалифицированные работники могут зарабатывать более 20 долларов в час. [15]
Работники могут иметь почтовый адрес в любой точке мира. Оплата за выполнение задач может быть произведена на Amazon.com с помощью подарочного сертификата (подарочные сертификаты являются единственным вариантом оплаты, доступным для международных работников, за исключением Индии) или может быть переведена на банковский счет работника в США.
Заявители могут попросить Worker выполнить квалификацию, прежде чем приступить к выполнению задачи, и они могут установить тест, предназначенный для проверки квалификации. Они также могут принять или отклонить результат, отправленный Worker, что влияет на репутацию Worker. По состоянию на апрель 2019 года [обновлять]Requesters платили Amazon минимальную комиссию в размере 20% от цены успешно выполненных работ, с увеличенными суммами за дополнительные услуги [ необходимо разъяснение ] . [6] Requesters могут использовать API Amazon Mechanical Turk для программной интеграции результатов работы непосредственно в свои бизнес-процессы и системы. Когда работодатели настраивают работу, они должны указать
а также конкретные детали работы, которую они хотят выполнить.
С момента создания платформы работники в основном находились в Соединенных Штатах [16], а их демографические показатели в целом были схожи с общей численностью интернет-пользователей в США [17]. В пределах США работники довольно равномерно распределены по штатам, пропорционально доле каждого штата в населении США. [18] По состоянию на 2019 год [обновлять]от 15 до 30 тысяч человек в США завершали как минимум один HIT каждый месяц, и около 4500 новых людей присоединялись к MTurk каждый месяц. [19]
Денежные выплаты для индийских рабочих были введены в 2010 году, что обновило демографические данные рабочих, которые, однако, в основном оставались в Соединенных Штатах. [20] Веб-сайт, показывающий демографические данные рабочих в мае 2015 года, показал, что 80% рабочих находились в Соединенных Штатах, а оставшиеся 20% находились в других странах мира, большинство из которых находились в Индии. [21] В мае 2019 года приблизительно 60% находились в США, 40% в других странах (примерно 30% в Индии). [22] В начале 2023 года около 90% рабочих были из США и около половины оставшихся из Индии. [23]
С 2010 года [обновлять]многочисленные исследователи изучали жизнеспособность Mechanical Turk для набора субъектов для экспериментов в области социальных наук. Исследователи в целом обнаружили, что хотя выборки респондентов, полученные через Mechanical Turk, не полностью соответствуют всем соответствующим характеристикам населения США, они также не являются дико нерепрезентативными. [24] [25] В результате ежегодно публикуются тысячи статей, которые опираются на данные, полученные от работников Mechanical Turk, в том числе сотни в ведущих академических журналах.
Проблема использования MTurk для исследований с участием людей заключается в поддержании качества данных. Исследование, опубликованное в 2021 году, показало, что типы подходов к контролю качества, используемые исследователями (например, проверка на наличие ботов, пользователей VPN или работников, готовых предоставить нечестные ответы), могут существенно влиять на результаты опроса. Они продемонстрировали это посредством воздействия на три распространенных инструмента скрининга поведенческого/психического здоровья. [26] Несмотря на то, что управление качеством данных требует работы со стороны исследователей, существует большой объем исследований, показывающих, как собирать высококачественные данные с помощью MTurk. [27] Стоимость использования MTurk значительно ниже, чем многих других способов проведения опросов, поэтому многие исследователи продолжают его использовать.
Общее мнение исследователей заключается в том, что эта служба лучше всего подходит для набора разнообразной выборки; она менее успешна в исследованиях, требующих более точно определенных групп населения или репрезентативной выборки населения в целом. [28] Было опубликовано много статей о демографии населения MTurk. [18] [29] [30] Работники MTurk, как правило, моложе, более образованны, более либеральны и немного менее богаты, чем население США в целом. [31]
Алгоритмы контролируемого машинного обучения требуют больших объемов данных, аннотированных человеком, для успешного обучения. Исследователи машинного обучения наняли рабочих через Mechanical Turk для создания наборов данных, таких как SQuAD, набор данных с ответами на вопросы . [32]
С 2007 года [обновлять]сервис использовался для поиска известных пропавших людей. Впервые это использование было предложено во время поиска Джеймса Кима , но его тело было найдено до того, как был достигнут какой-либо технический прогресс. Тем летом на своей яхте исчез компьютерный ученый Джим Грей , а Вернер Фогельс из Amazon , его личный друг, договорился с DigitalGlobe , который предоставляет спутниковые данные для Google Maps и Google Earth , чтобы разместить недавние фотографии островов Фараллон на Mechanical Turk. Статья на первой странице Digg привлекла 12 000 поисковиков, которые работали со специалистами по обработке изображений над теми же данными. Поиск оказался безуспешным. [33]
В сентябре 2007 года аналогичная схема была повторена при поиске летчика Стива Фоссета . Спутниковые данные были разделены на секции по 85 квадратных метров (910 квадратных футов), и пользователям Mechanical Turk было предложено помечать изображения с «посторонними объектами», которые могли быть местом крушения или другими доказательствами, которые следует изучить более внимательно. [34] Этот поиск также не увенчался успехом. Спутниковые снимки в основном были в радиусе 50 миль, [35] но место крушения в конечном итоге было найдено туристами примерно через год, в 65 милях. [36]
MTurk также использовался как инструмент для художественного творчества. Одним из первых художников, работавших с Mechanical Turk, был Xtine Burrough с The Mechanical Olympics (2008), [37] [38] Endless Om (2015) и Mediations on Digital Labor (2015). [39] Другой работой была Ten Thousand Cents (2008) художника Аарона Коблина. [ необходимо дополнительное объяснение ]
Программисты разработали расширения браузера и скрипты, призванные упростить процесс выполнения заданий. Amazon заявил, что они не одобряют скрипты, которые полностью автоматизируют процесс и исключают человеческий фактор. Это связано с опасениями, что процесс выполнения задачи — например, ответ на опрос — может быть сфальсифицирован случайными ответами, а полученные собранные данные могут оказаться бесполезными. [40] Аккаунты, использующие так называемых автоматизированных ботов, были запрещены. Существуют сервисы, которые расширяют возможности MTurk. [ требуется разъяснение ]
Amazon предоставляет интерфейс прикладного программирования (API) для системы MTurk. API MTurk позволяет программисту отправлять задания, получать выполненную работу и одобрять или отклонять эту работу. [41] В 2017 году Amazon запустила поддержку AWS Software Development Kits (SDK), что позволило сделать девять новых SDK доступными для пользователей MTurk. [ важность? ] MTurk доступен через API из следующих языков: Python, JavaScript, Java, .NET, Go, Ruby, PHP или C++. [42] Веб-сайты и веб-сервисы могут использовать API для интеграции работы MTurk в другие веб-приложения, предоставляя пользователям альтернативы интерфейсу, который Amazon создал для этих функций.
Amazon Mechanical Turk предоставляет платформу для обработки изображений, что является задачей, хорошо подходящей для человеческого интеллекта. Заявители создали задачи, в которых работникам предлагается маркировать объекты, найденные на изображении, выбирать наиболее релевантную картинку в группе картинок, проверять неприемлемый контент, классифицировать объекты на спутниковых снимках или оцифровывать текст с изображений, таких как отсканированные формы, заполненные вручную. [43]
Компании с большими онлайн-каталогами используют Mechanical Turk для выявления дубликатов и проверки данных записей товаров. Например: удаление дубликатов в списках справочника желтых страниц, проверка данных ресторана (например, номер телефона и часы работы) и поиск контактной информации на веб-страницах (например, имя автора и адрес электронной почты). [10] [43]
Диверсификация и масштаб персонала Mechanical Turk позволяют собирать информацию в больших масштабах, что было бы сложно вне крауд-платформы. Mechanical Turk позволяет запрашивающим собирать большое количество ответов на различные типы опросов, от базовых демографических до академических исследований. Другие варианты использования включают написание комментариев, описаний и записей в блогах на веб-сайтах и поиск элементов данных или определенных полей в крупных правительственных и юридических документах. [43]
Компании используют краудфандинговую работу Mechanical Turk для понимания и реагирования на различные типы данных. Обычные применения включают редактирование и транскрипцию подкастов, перевод и сопоставление результатов поисковой системы. [10] [43]
Валидность исследования, проведенного с участием рабочей группы Mechanical Turk, уже давно является предметом споров среди экспертов. [44] Во многом это связано с тем, что вопросы валидности [45] сложны: они включают не только вопросы о том, были ли методы исследования подходящими и было ли исследование хорошо выполнено, но и вопросы о цели проекта, о том, как исследователи использовали MTurk, кто был выбран и какие выводы были сделаны.
Большинство экспертов сходятся во мнении, что MTurk лучше подходит для некоторых типов исследований, чем для других. MTurk, по-видимому, хорошо подходит для вопросов, которые стремятся понять, связаны ли две или более вещей друг с другом (так называемые корреляционные исследования; например, счастливые люди более здоровы?), и вопросов, которые пытаются показать, что одна вещь вызывает другую (экспериментальные исследования; например, счастье делает людей более здоровыми). К счастью, эти категории охватывают большую часть исследований, проводимых учеными-бихевиористами, и большинство корреляционных и экспериментальных результатов, обнаруженных в национальных репрезентативных выборках, воспроизводятся на MTurk. [46]
Тип исследования, который не очень подходит для MTurk, часто называют «описательным исследованием». Описательное исследование стремится описать, как или что люди думают, чувствуют или делают; одним из примеров является опрос общественного мнения. MTurk не очень подходит для такого исследования, потому что он не выбирает репрезентативную выборку из общей популяции. Вместо этого MTurk — это невероятностная, [ жаргон ] удобная выборка. Описательное исследование лучше всего проводить с вероятностной, репрезентативной выборкой популяции, которую исследователи хотят понять. По сравнению с общей популяцией, люди на MTurk моложе, более образованны, более либеральны и менее религиозны. [47] [18] [30]
Mechanical Turk подвергся критике со стороны журналистов и активистов за его взаимодействие с рабочей силой и ее использование. Ученый-компьютерщик Джарон Ланье отметил, что дизайн Mechanical Turk «позволяет вам думать о людях как о компонентах программного обеспечения» таким образом, что это вызывает «ощущение магии, как будто вы можете просто вытащить результаты из облака по невероятно низкой цене». [48] Похожая точка зрения высказывается в книге Ghostwork Мэри Л. Грей и Сиддхарта Сури. [49] [ важность? ]
Критики MTurk утверждают, что рабочие вынуждены работать на сайте из-за нестабильных экономических условий, а затем эксплуатируются заказчиками с низкой заработной платой и отсутствием власти, когда возникают споры. Статья журналистки Аланы Семуэлс «Интернет открывает новый вид плохо оплачиваемого ада» в The Atlantic является типичной для такой критики MTurk. [50]
Некоторые [ чьи? ] научные работы получили результаты, которые поддерживают или служат основой для таких распространенных критических замечаний, [51] но другие противоречат им. [52] В недавнем академическом комментарии утверждалось, что участники исследования на таких сайтах, как MTurk, должны быть четко предупреждены об обстоятельствах, при которых им впоследствии может быть отказано в оплате по этическим соображениям, [53] даже если такие заявления не могут снизить уровень небрежных ответов. [54]
В статье, опубликованной командой CloudResearch [14], показано, что только около 7% людей на MTurk рассматривают выполнение HIT как что-то похожее на постоянную работу. Большинство людей сообщают, что MTurk — это способ заработать деньги в свободное время или в качестве подработки. В 2019 году типичный работник тратил от пяти до восьми часов в неделю и зарабатывал около 7 долларов в час. Работники, включенные в выборку, не сообщали о жестоком обращении со стороны запрашивающих лиц [ необходимо разъяснение ] ; они сообщили, что доверяют запрашивающим лицам больше, чем работодателям за пределами MTurk. Аналогичные выводы были представлены в обзоре MTurk организацией Fair Crowd Work, коллективом крауд-работников и профсоюзов. [55] [ ненадежный источник? ]
Минимальная оплата, которую Amazon позволяет за задание, составляет один цент. Поскольку задания обычно простые и повторяющиеся, большинство заданий оплачиваются всего в несколько центов, [56] но на сайте есть и хорошо оплачиваемые задания.
Многие критические замечания в адрес MTurk связаны с тем, что большинство заданий предлагают низкую заработную плату. Кроме того, рабочие считаются независимыми подрядчиками, а не сотрудниками. Независимые подрядчики не защищены Законом о справедливых трудовых стандартах или другим законодательством, защищающим права работников. [ Для США ] Работники на MTurk должны конкурировать с другими за хорошие возможности HIT, а также тратить время на поиск заданий и других действий, за которые им не платят.
Низкая оплата, предлагаемая за многие задачи, вызвала критику Mechanical Turk за эксплуатацию и невыплату работникам компенсации за истинную ценность выполненной ими задачи. [57] Одно исследование 3,8 миллионов задач, выполненных 2767 работниками, показало, что «рабочие получали среднюю почасовую заработную плату около 2 долларов в час», а 4% работников зарабатывали более 7,25 долларов в час. [58]
Исследовательский центр Pew и Международное бюро труда опубликовали данные, согласно которым в 2015 году люди зарабатывали около 5 долларов в час. [12] [59] Исследование, посвященное работникам в США, показало, что средняя заработная плата составляет не менее 5,70 долларов в час, [60] а данные исследования CloudResearch выявили среднюю заработную плату около 6,61 доллара в час. [14] Некоторые данные свидетельствуют о том, что очень активные и опытные люди могут зарабатывать 20 долларов в час и более. [61]
Журнал Nation сообщил в 2014 году, что некоторые запрашивающие использовали работников, заставляя их выполнять задания, а затем отклоняли их заявки, чтобы не платить им. [62] Имеющиеся данные указывают на то, что отказы случаются довольно редко. Работники сообщают, что небольшое меньшинство их HIT отклонялось, возможно, всего 1%. [14]
В скандале с данными Facebook–Cambridge Analytica Mechanical Turk был одним из средств тайного сбора частной информации для огромной базы данных. [63] Система платила людям доллар или два за установку приложения, подключенного к Facebook , и ответы на личные вопросы. Задание по опросу, как работа по найму, не использовалось для демографического или психологического исследовательского проекта, как могло показаться. Вместо этого целью было заставить работника раскрыть личную информацию о личности работника, которая еще не была собрана Facebook или Mechanical Turk.
Другие критиковали рынок за то, что он не позволяет работникам вести переговоры с работодателями. В ответ на критику уклонения от уплаты и отсутствия представительства группа разработала стороннюю платформу Turkopticon, которая позволяет работникам оставлять отзывы о своих работодателях. Это позволяет работникам избегать потенциально недобросовестных работ и рекомендовать лучших работодателей. [64] [65] Другая платформа Dynamo позволяет работникам собирать [ необходимо разъяснение ] анонимно и организовывать кампании по улучшению своей рабочей среды, такие как Guidelines for Academic Requesters и Dear Jeff Bezos Campaign. [66] [67] [68] [69] Amazon усложнила для работников регистрацию в Dynamo, закрыв учетную запись запроса, которая предоставляла работникам требуемый код для членства в Dynamo. Работники создали сторонние плагины для определения более высокооплачиваемых задач, но Amazon обновил свой веб-сайт, чтобы предотвратить работу этих плагинов. [70] Работники жаловались, что платежная система Amazon иногда перестает работать. [70]
Mechanical Turk в некоторых отношениях сопоставим с ныне прекращенным сервисом Google Answers . Однако Mechanical Turk — это более общая торговая площадка , которая потенциально может помочь распределить любые рабочие задачи по всему миру. Collaborative Human Interpreter (CHI) Филиппа Ленссена также предложил использовать распределенный человеческий интеллект, чтобы помочь компьютерным программам выполнять задачи, которые компьютеры не могут хорошо выполнять. MTurk можно использовать в качестве исполнительного механизма для CHI. [ необходима цитата ]
В 2014 году российский поисковый гигант Яндекс запустил похожую систему под названием «Толока», которая похожа на «Механического турка». [71]
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь ){{cite book}}
: CS1 maint: location missing publisher (link){{cite journal}}
: Цитировать журнал требует |journal=
( помощь ){{cite journal}}
: CS1 maint: DOI inactive as of September 2024 (link)