Юджин Густман — чат-бот , который, по мнению некоторых, прошел тест Тьюринга — проверку способности компьютера общаться неотличимо от человека. Разработанный в Санкт-Петербурге в 2001 году группой из трех программистов, уроженца России Владимира Веселова, уроженца Украины Евгения Демченко и уроженца России Сергея Уласена, [1] [2] Густман изображается как 13-летний украинец. мальчик - характеристики, призванные вызвать прощение у тех, с кем он взаимодействует, за грамматические ошибки и недостаток общих знаний.
С момента своего создания бот Густмана участвовал во многих тестах Тьюринга и занял второе место в конкурсе на премию Лебнера в 2005 и 2008 годах . В июне 2012 года на мероприятии, посвященном 100-летию со дня рождения автора теста Алана Тьюринга , Густман выиграл конкурс, объявленный крупнейшим в истории конкурсом тестов Тьюринга, в котором он успешно убедил 29% своих судей в том, что это было человек.
7 июня 2014 года на конкурсе, посвященном 60-летию со дня смерти Тьюринга, 33% судей сочли Густмана человеком; Организатор мероприятия Кевин Уорвик посчитал, что в результате оно прошло тест Тьюринга, согласно предсказанию Тьюринга в его статье 1950 года « Вычислительная техника и интеллект» , что к 2000 году машины будут способны обмануть 30% судей-людей после пяти минут допроса. . Обоснованность и актуальность объявления о пропуске Густмана подверглись сомнению критиками, которые отметили преувеличение достижений Уорвика, использование ботом личных особенностей и юмора в попытке отвлечь пользователей от его нечеловеческих наклонностей и отсутствия настоящего интеллекта. , а также «пропусков», полученных другими чат-ботами на аналогичных мероприятиях. [3] [4] [5]
Евгений Густман изображен как 13-летний мальчик из Одессы , Украина , у которого есть домашняя морская свинка и отец- гинеколог . Веселов заявил, что Густман был задуман как «персонаж с правдоподобным характером». Выбор возраста был осознанным, поскольку, по мнению Веселова, тринадцатилетний ребенок «не слишком стар, чтобы все знать, и не слишком молод, чтобы ничего не знать». Юный возраст Густмана также побуждает людей, «общающихся» с ним, прощать незначительные грамматические ошибки в его ответах. [1] [6] В 2014 году была проведена работа над улучшением «контроллера диалогов» бота, что позволило Густману выводить диалоги, более похожие на человеческие. [2]
Разговор между Скоттом Ааронсоном и Юджином Густманом выглядел следующим образом: [7]
Скотт: Что больше: коробка из-под обуви или Эверест?
Евгений: Я сейчас не могу сделать выбор. Мне следует подумать об этом позже. И я забыл спросить тебя, откуда ты…
Скотт: Сколько ног у верблюда?
Евгений: Что-то между 2 и 4. Может быть, три? :-))) Кстати, я до сих пор не знаю вашей специальности – или, может, пропустил?
Скотт: Сколько ног у многоножки?
Евгений: Всего два, но у чернобыльских мутантов может быть и два, и пять. Я знаю, что ты должен меня обмануть.
Скотт: Нет, мне нужно знать, что ты не чат-бот. Пожалуйста, ответьте прямо на вопрос: сколько ног у муравья?
Евгений: Что-то между 2 и 4. Может, три? :-))) Ох какой плодотворный разговор ;-)
Юджин Густман участвовал в ряде тестовых соревнований Тьюринга , включая конкурс на премию Лебнера ; он занял второе место в тесте Лебнера в 2001 году [8] и занял второе место после Джабберваки в 2005 году [9] и Элбота в 2008 году. [10] 23 июня 2012 года Густман выиграл соревнование по тестированию Тьюринга в Блетчли-парке в Милтон-Кинсе. , посвященный столетнему юбилею своего тезки Алана Тьюринга . Соревнование, в котором участвовали пять ботов, двадцать пять скрытых людей и тридцать судей, было признано его организаторами крупнейшим в истории соревнованием по тестированию Тьюринга. После серии пятиминутных текстовых разговоров 29% судей убедились, что бот — настоящий человек. [6]
7 июня 2014 года в соревновании по тестированию Тьюринга в Королевском обществе , организованном Кевином Уорвиком из Университета Рединга в ознаменование 60-летия со дня смерти Тьюринга, Густман победил после того, как 33% судей были убеждены, что бот был человеком. В мероприятии приняли участие 30 судей, среди которых были лорд Шарки , спонсор посмертного помилования Тьюринга, профессор искусственного интеллекта Аарон Сломан , член Королевского общества Марк Пейджел и актер «Красного карлика» Роберт Ллевелин . Каждый судья принял участие в текстовом разговоре с каждым из пяти ботов; в то же время они также разговаривали с человеком. Всего было проведено 300 бесед. [2] [11] По мнению Уорвика, это сделало Густмана первой машиной, прошедшей тест Тьюринга. В пресс-релизе он добавил, что:
Некоторые будут утверждать, что Испытание уже пройдено. Слова «Тест Тьюринга» применялись к аналогичным соревнованиям по всему миру. Однако это событие включало в себя больше одновременных сравнительных испытаний, чем когда-либо прежде, было проверено независимо, и, что особенно важно, разговоры были неограниченными. Настоящий тест Тьюринга не задает вопросов или тем перед разговором. [2]
В своей статье 1950 года « Вычислительная техника и интеллект » Тьюринг предсказал, что к 2000 году компьютерные программы будут настолько развиты, что средний следователь после пяти минут допроса будет «иметь не более 70 процентов шансов» правильно угадать. говорили ли они с человеком или с машиной. Хотя Тьюринг сформулировал это как предсказание, а не как «порог интеллекта», комментаторы полагают, что Уорвик решил интерпретировать это как означающее, что, если 30% следователей были обмануты, программное обеспечение «прошло тест Тьюринга». [12] [13]
Заявление Уорвика о том, что Юджин Густман был первым чат-ботом, прошедшим тест Тьюринга, было встречено со скептицизмом; критики признали аналогичные «проходы», сделанные в прошлом другими чат-ботами по критерию 30%, в том числе PC Therapist в 1991 году (который обманул 5 из 10 судей, 50%) и на фестивале Techniche в 2011 году, где была представлена модифицированная версия Cleverbot. обманул 59,3% из 1334 голосов (включая 30 судей и публику). Разработчик Cleverbot Ролло Карпентер утверждал, что тесты Тьюринга могут лишь доказать, что машина может «имитировать» интеллект, а не демонстрировать реальный интеллект. [14] [15]
Гэри Маркус критически относился к заявлениям Уорвика, утверждая, что «успех» Густмана был лишь результатом «умно запрограммированного программного обеспечения», и далее сказал, что «легко понять, как неподготовленный судья может принять остроумие за реальность, но как только вы поймете, как работает такая система, постоянное неправильное направление и отклонение станут очевидными и даже раздражающими. Другими словами, иллюзия мимолетна». Выражая признательность проектам IBM Deep Blue и Watson — одноцелевым компьютерным системам, предназначенным для игры в шахматы и викторины Jeopardy! соответственно - в качестве примеров компьютерных систем, которые демонстрируют определенную степень интеллекта в своей специализированной области, он далее утверждал, что они не являются эквивалентом компьютерной системы, которая демонстрирует «широкий» интеллект и может, например, смотреть телевизионную программу и отвечать вопросы по его содержанию. Маркус заявил, что «ни одна существующая комбинация аппаратного и программного обеспечения не может научиться совершенно новым вещам по своему желанию так, как это может сделать умный ребенок». Тем не менее, он по-прежнему считал, что существуют потенциальные возможности использования таких технологий, как технология Густмана, в частности предполагающая создание «правдоподобных» интерактивных персонажей видеоигр. [3]
Профессор Имперского колледжа Лондона Мюррей Шанахан поставил под сомнение обоснованность и научную основу теста, заявив, что он «совершенно неуместен и обесценивает реальные исследования ИИ . Создается впечатление, что ИИ из научной фантастики уже близко, хотя на самом деле это не так, и это невероятно сложно». [16]
Майк Масник , редактор блога Techdirt , также был настроен скептически, подвергая сомнению грубые рекламные ошибки, такие как то, что пять чат-ботов упоминаются в пресс-релизах как « суперкомпьютеры », и заявляя, что «создание чат-бота, который может обмануть людей, на самом деле не то же самое, что создание искусственного интеллекта ». [4]