AlphaGo — это компьютерная программа , которая играет в настольную игру Go . [1] Она была разработана базирующейся в Лондоне компанией DeepMind Technologies, [2] приобретенной дочерней компанией Google . Последующие версии AlphaGo становились все более мощными, включая версию, которая соревновалась под названием Master . [3] После ухода из соревновательной игры, AlphaGo Master была заменена еще более мощной версией, известной как AlphaGo Zero , которая была полностью самообучающейся, без обучения на человеческих играх. Затем AlphaGo Zero была обобщена в программу, известную как AlphaZero , которая играла в дополнительные игры, включая шахматы и сёги . AlphaZero, в свою очередь, была заменена программой, известной как MuZero , которая обучается без обучения правилам.
AlphaGo и его последователи используют алгоритм поиска по дереву Монте-Карло для поиска ходов на основе знаний, ранее полученных с помощью машинного обучения , в частности, искусственной нейронной сети ( метод глубокого обучения ) путем обширного обучения, как из человеческой, так и из компьютерной игры. [4] Нейронная сеть обучается определять лучшие ходы и процент выигрышей этих ходов. Эта нейронная сеть повышает силу поиска по дереву, что приводит к более сильному выбору ходов в следующей итерации.
В октябре 2015 года в матче против Фань Хуэя оригинальная AlphaGo стала первой компьютерной программой для игры в го, которая победила профессионального игрока в го без гандикапа на полноразмерной доске 19×19. [5] [6] В марте 2016 года она победила Ли Седоля в матче из пяти игр , что стало первым случаем, когда компьютерная программа для игры в го победила профессионала с 9-м даном без гандикапа. [7] Хотя она проиграла Ли Седолю в четвертой игре, Ли сдался в финальной игре, дав окончательный счет 4 игры к 1 в пользу AlphaGo. В знак признания победы AlphaGo была награждена почетным 9-м даном Корейской ассоциацией бадук . [8] Подготовка и матч-вызов с Ли Седолем были задокументированы в документальном фильме, также под названием AlphaGo , [9] режиссером которого был Грег Кос. Победа AlphaGo была выбрана журналом Science в качестве одного из финалистов премии «Прорыв года» 22 декабря 2016 года. [10]
На саммите Future of Go 2017 года мастер - версия AlphaGo победила Кэ Цзе , игрока номер один в мире на тот момент, в матче из трех игр , после чего Китайская ассоциация вэйци присвоила AlphaGo профессиональный 9-й дан . [11]
После матча между AlphaGo и Кэ Цзе, DeepMind прекратила разработку AlphaGo, продолжив исследования ИИ в других областях. [12] Самостоятельно разработанная AlphaGo Zero одержала победу со счетом 100–0 над ранней конкурентной версией AlphaGo, а ее преемник AlphaZero к концу 2010-х годов считался лучшим игроком в го в мире. [13] [14]
Считается, что Го гораздо сложнее для компьютеров, чем другие игры, такие как шахматы , поскольку его стратегическая и эстетическая природа затрудняет непосредственное построение функции оценки, а его гораздо больший фактор ветвления делает недопустимо сложным использование традиционных методов ИИ, таких как альфа-бета-обрезка , обход дерева и эвристический поиск. [5] [15]
Почти через два десятилетия после того, как компьютер IBM Deep Blue победил чемпиона мира по шахматам Гарри Каспарова в матче 1997 года , сильнейшие программы Го, использующие методы искусственного интеллекта , достигли лишь любительского уровня 5-го дана [ 4 ] и все равно не смогли победить профессионального игрока Го без гандикапа [5] [6] [16] В 2012 году программа Zen , работающая на кластере из четырех ПК, дважды победила Масаки Такемию ( 9 пенсов ) с гандикапом в пять и четыре камня [17] В 2013 году Crazy Stone победила Ёсио Исиду (9 пенсов) с гандикапом в четыре камня [18]
По словам Дэвида Сильвера из DeepMind , исследовательский проект AlphaGo был сформирован около 2014 года для проверки того, насколько хорошо нейронная сеть, использующая глубокое обучение, может конкурировать в Го. [19] AlphaGo представляет собой значительное улучшение по сравнению с предыдущими программами Го. В 500 играх против других доступных программ Го, включая Crazy Stone и Zen, AlphaGo, запущенная на одном компьютере, выиграла все, кроме одной. [20] В аналогичном матче AlphaGo, запущенная на нескольких компьютерах, выиграла все 500 игр, сыгранных против других программ Го, и 77% игр, сыгранных против AlphaGo, запущенной на одном компьютере. Распределенная версия в октябре 2015 года использовала 1202 ЦП и 176 ГП . [4]
В октябре 2015 года распределенная версия AlphaGo победила чемпиона Европы по го Фань Хуэя [21] , профессионала, обладателя второго дана (из возможных 9 данов), со счетом 5:0. [6] [22] Это был первый случай, когда компьютерная программа для го победила профессионального игрока-человека на полноразмерной доске без гандикапа. [23] Объявление этой новости было отложено до 27 января 2016 года, чтобы совпасть с публикацией статьи в журнале Nature [4], описывающей используемые алгоритмы. [6]
AlphaGo играл с южнокорейским профессиональным игроком в го Ли Седолем , занимающим 9-й дан, одним из лучших игроков в го, [16] [ нужно обновление ] в пяти играх, которые состоялись в отеле Four Seasons в Сеуле , Южная Корея, 9, 10, 12, 13 и 15 марта 2016 года, [24] [25] которые транслировались в прямом эфире. [26] Из пяти игр AlphaGo выиграла четыре игры, а Ли выиграл четвертую игру, что сделало его единственным игроком-человеком, который победил AlphaGo во всех 74 официальных играх. [27] AlphaGo работала на облачных вычислениях Google с серверами, расположенными в Соединенных Штатах. [28] В матче использовались китайские правила с 7,5-очковым коми , и у каждой стороны было два часа времени на обдумывание плюс три 60-секундных периода бёёми . [29] Версия AlphaGo, играющая против Ли, использовала такое же количество вычислительной мощности, что и в матче с Фань Хуэем. [30] The Economist сообщил, что он использовал 1920 центральных процессоров и 280 графических процессоров . [31] На момент игры Ли Седоль имел второе по величине количество побед в международных чемпионатах по го в мире после южнокорейского игрока Ли Чанхо, который удерживал титул чемпиона мира в течение 16 лет. [32] Поскольку не существует единого официального метода ранжирования в международном го , рейтинги могут различаться в разных источниках. Хотя иногда он занимал первое место, некоторые источники оценивали Ли Седоль как четвертого лучшего игрока в мире в то время. [33] [34] AlphaGo не был специально обучен для игры с Ли и не был разработан для соревнования с какими-либо конкретными игроками-людьми.
Первые три игры были выиграны AlphaGo после сдачи Ли. [35] [36] Однако Ли победил AlphaGo в четвертой игре, выиграв из-за сдачи на 180-м ходу. Затем AlphaGo продолжила добиваться четвертой победы, выиграв пятую игру из-за сдачи. [37]
Приз составил 1 миллион долларов США. Поскольку AlphaGo выиграла четыре из пяти игр, а значит и серию, приз будет передан благотворительным организациям, включая ЮНИСЕФ . [38] Ли Седоль получил 150 000 долларов за участие во всех пяти играх и дополнительно 20 000 долларов за победу в 4-й игре. [29]
В июне 2016 года на презентации, состоявшейся в университете в Нидерландах, Аджа Хуан, один из команды Deep Mind, сообщил, что они исправили логическую слабость, возникшую во время 4-й игры матча между AlphaGo и Ли, и что после хода 78 (который многие профессионалы окрестили « божественным ходом »), игра будет играть так, как и предполагалось, и сохранит преимущество черных. До хода 78 AlphaGo лидировала на протяжении всей игры, но ход Ли заставил вычислительные мощности программы отвлечься и запутаться. [39] Хуан объяснил, что сеть политик AlphaGo по поиску наиболее точного порядка ходов и продолжения не направляла AlphaGo точно, чтобы сделать правильное продолжение после хода 78, поскольку ее сеть значений не определила 78-й ход Ли как наиболее вероятный, и поэтому, когда ход был сделан, AlphaGo не смогла сделать правильную корректировку логического продолжения. [40]
29 декабря 2016 года на сервере Tygem появился новый аккаунт под названием «Magister» (на китайской версии сервера он отображается как «Magist») из Южной Кореи, который начал играть в игры с профессиональными игроками. 30 декабря он сменил имя аккаунта на «Master», а 1 января 2017 года перешёл на сервер FoxGo. 4 января DeepMind подтвердил, что и «Magister», и «Master» были сыграны в обновлённой версии AlphaGo под названием AlphaGo Master . [41] [42] По состоянию на 5 января 2017 года онлайн-рекорд AlphaGo Master составлял 60 побед и 0 поражений, [43] включая три победы над лучшим игроком в го, Кэ Цзе , [44] которого заранее проинформировали, что Master — это версия AlphaGo. [43] После поражения от Мастера Гу Ли предложил вознаграждение в размере 100 000 юаней (14 400 долларов США) первому игроку-человеку, который сможет победить Мастера. [42] Мастер играл в темпе 10 игр в день. Многие быстро заподозрили, что это игрок ИИ из-за малого или полного отсутствия отдыха между играми. Среди его противников были многие чемпионы мира, такие как Кэ Цзе , Пак Чон Хван , Юта Ияма , Туо Цзяси , Ми Юйтин , Ши Юэ , Чэнь Яое , Ли Цинчэн, Гу Ли , Чан Хао, Тан Вэйсин, Фань Тинъюй , Чжоу Жуйян , Цзян Вэйцзе , Чоу Чуньсун , Ким Джи Сок , Кан Дон Юн , Пак Ён Хун и Вон Сон Джин ; национальные чемпионы или финалисты чемпионатов мира, такие как Лянь Сяо , Тан Сяо , Мэн Тайлин, Дан Ифэй, Хуан Юнсонг, Ян Динсинь , Гу Цзыхао, Шин Джинсо, Чо Хан-сын и Ан Сонджун. Все 60 игр, за исключением одной, были быстрыми играми с тремя 20 или 30 секундными байоми . Мастер предложил продлить байоми до одной минуты, играя с Не Вэйпином, учитывая его возраст. После победы в своей 59-й игре Мастер показал себя в чате, чтобы контролироваться доктором Аджа Хуангом из команды DeepMind, [45] затем изменил свое гражданство на Соединенное Королевство. После того, как эти игры были завершены, соучредитель DeepMind , Демис Хассабис, написал в твиттере: «Мы с нетерпением ждем возможности сыграть в несколько официальных полноценных игр позже [в 2017 году] в сотрудничестве с организациями и экспертами по го». [41] [42]
Эксперты по го были впечатлены производительностью программы и ее нечеловеческим стилем игры; Кэ Цзе заявил, что «После того, как человечество потратило тысячи лет на совершенствование своей тактики, компьютеры говорят нам, что люди совершенно неправы... Я бы даже сказал, что ни один человек не коснулся грани истины го». [43]
На саммите «Будущее го», который состоялся в Учжэне в мае 2017 года, мастер AlphaGo сыграл три игры с Кэ Цзе, игроком номер 1 в мире, а также две игры с несколькими ведущими китайскими профессионалами, одну парную игру в го и одну против команды из пяти игроков-людей. [46]
Google DeepMind предложила победителю матча из трех игр между Кэ Цзе и Мастером приз в размере 1,5 миллиона долларов, а проигравшая сторона получила 300 000 долларов. [47] [48] Мастер выиграл все три игры против Кэ Цзе, [49] [50] после чего Китайская ассоциация вэйци присудила AlphaGo профессиональный 9-й дан. [11]
После победы в трехматчевом матче против Кэ Цзе, самого рейтингового игрока в го в мире, AlphaGo ушла в отставку. DeepMind также распустила команду, работавшую над игрой, чтобы сосредоточиться на исследованиях ИИ в других областях. [12] После саммита Deepmind опубликовала 50 полных матчей AlphaGo против AlphaGo в качестве подарка сообществу го. [51]
Команда AlphaGo опубликовала статью в журнале Nature 19 октября 2017 года, представив AlphaGo Zero, версию без человеческих данных и более сильную, чем любая предыдущая версия, побеждающая чемпионов-людей. [52] Играя против самой себя, AlphaGo Zero превзошла силу AlphaGo Lee за три дня, выиграв 100 игр против 0, достигла уровня AlphaGo Master за 21 день и превзошла все старые версии за 40 дней. [53]
В статье, опубликованной на arXiv 5 декабря 2017 года, DeepMind заявила, что она обобщила подход AlphaGo Zero в единый алгоритм AlphaZero, который в течение 24 часов достиг сверхчеловеческого уровня игры в шахматы , сёги и го , победив программы-чемпионы мира, Stockfish , Elmo и 3-дневную версию AlphaGo Zero в каждом случае. [54]
11 декабря 2017 года DeepMind выпустила обучающий инструмент AlphaGo на своем сайте [55] для анализа выигрышных ставок в различных дебютах го , рассчитанных AlphaGo Master . [56] Обучающий инструмент собирает 6000 дебютов го из 230 000 человеческих игр, каждая из которых проанализирована с 10 000 000 симуляций AlphaGo Master. Многие из дебютов включают предложения ходов человека. [56]
Ранняя версия AlphaGo была протестирована на оборудовании с различным количеством ЦП и ГП , работающих в асинхронном или распределенном режиме. На каждый ход отводилось две секунды на обдумывание. Ниже приведены итоговые рейтинги Эло . [4] В матчах с большим временем на ход достигаются более высокие рейтинги.
В мае 2016 года Google представила собственное фирменное оборудование « тензорные процессоры », которые, как она заявила, уже были развернуты в нескольких внутренних проектах Google, включая матч AlphaGo против Ли Седоля. [57] [58]
В Future of Go Summit в мае 2017 года DeepMind раскрыла, что версия AlphaGo, использованная на этом саммите, была AlphaGo Master , [59] [60] и сообщила, что измерила силу разных версий программного обеспечения. AlphaGo Lee, версия, использованная против Lee, могла дать AlphaGo Fan, версии, использованной в AlphaGo против Fan Hui, три камня, а AlphaGo Master была даже на три камня сильнее. [61]
По состоянию на 2016 год алгоритм AlphaGo использует комбинацию машинного обучения и методов поиска по дереву в сочетании с обширным обучением, как с помощью человеческой, так и компьютерной игры. Он использует поиск по дереву Монте-Карло , руководствуясь «сетью значений» и «сетью политик», обе реализованы с использованием технологии глубоких нейронных сетей . [5] [4] Ограниченное количество предварительной обработки обнаружения игровых признаков (например, для выделения того, соответствует ли ход шаблону накаде ) применяется к входным данным перед их отправкой в нейронные сети. [4] Сети представляют собой сверточные нейронные сети с 12 слоями, обученные с помощью обучения с подкреплением . [64]
Нейронные сети системы изначально были созданы на основе человеческого игрового опыта. AlphaGo изначально обучали имитировать человеческую игру, пытаясь соответствовать ходам опытных игроков из записанных исторических игр, используя базу данных из около 30 миллионов ходов. [21] После того, как он достиг определенного уровня мастерства, его обучали дальше, заставляя играть большое количество игр против других экземпляров самого себя, используя обучение с подкреплением для улучшения своей игры. [5] Чтобы избежать «неуважительной» траты времени своего противника, программа специально запрограммирована на сдачу, если ее оценка вероятности победы падает ниже определенного порога; для матча с Ли порог сдачи был установлен на уровне 20%. [65]
Тоби Мэннинг, судья матча AlphaGo против Фань Хуэй, описал стиль программы как «консервативный». [66] Стиль игры AlphaGo решительно отдает предпочтение большей вероятности победы с меньшим количеством очков, чем меньшей вероятности победы с большим количеством очков. [19] Его стратегия максимизации вероятности победы отличается от того, что склонны делать игроки-люди, а именно максимизации территориального выигрыша, и объясняет некоторые из его странно выглядящих ходов. [67] Он делает много начальных ходов, которые никогда или редко делались людьми. Он любит использовать удары плечом , особенно если противник слишком сконцентрирован. [68]
Победа AlphaGo в марте 2016 года стала важной вехой в исследованиях искусственного интеллекта. [69] Ранее го считалась сложной задачей в машинном обучении, которая, как ожидалось, будет вне досягаемости технологий того времени. [69] [70] [71] Большинство экспертов считали, что программа го, столь мощная, как AlphaGo, появится не раньше, чем через пять лет; [72] некоторые эксперты считали, что пройдет не менее десятилетия, прежде чем компьютеры победят чемпионов по го. [4] [73] [74] Большинство наблюдателей в начале матчей 2016 года ожидали, что Ли победит AlphaGo. [69]
С такими играми, как шашки (которые были « решены » командой игроков в шашки Chinook ), шахматы, а теперь и го, в котором победили компьютеры, победы в популярных настольных играх больше не могут служить важными вехами для искусственного интеллекта, как это было раньше. Мюррей Кэмпбелл из Deep Blue назвал победу AlphaGo «концом эпохи... настольные игры более или менее закончены, и пора двигаться дальше». [69]
По сравнению с Deep Blue или Watson , базовые алгоритмы AlphaGo потенциально более универсальны и могут быть свидетельством того, что научное сообщество делает успехи в направлении искусственного интеллекта общего назначения . [19] [75] Некоторые комментаторы считают, что победа AlphaGo дает обществу хорошую возможность начать подготовку к возможному будущему влиянию машин с интеллектом общего назначения . Как отметил предприниматель Гай Сатер, AlphaGo умеет только играть в го и не обладает интеллектом общего назначения; «[Она] не могла просто проснуться однажды утром и решить, что хочет научиться пользоваться огнестрельным оружием». [69] Исследователь ИИ Стюарт Рассел сказал, что системы ИИ, такие как AlphaGo, прогрессировали быстрее и стали более мощными, чем ожидалось, и поэтому мы должны разработать методы, чтобы гарантировать, что они «оставаются под контролем человека». [76] Некоторые ученые, такие как Стивен Хокинг , предупреждали (в мае 2015 года перед матчами), что некоторые будущие самосовершенствующиеся ИИ могут обрести реальный общий интеллект, что приведет к неожиданному захвату ИИ ; Другие ученые не согласны: эксперт по искусственному интеллекту Жан-Габриэль Ганасия считает, что «Такие вещи, как « здравый смысл »… никогда не будут воспроизводимыми» [77] , и говорит: «Я не понимаю, почему мы должны говорить о страхах. Напротив, это вселяет надежды во многих областях, таких как здравоохранение и исследование космоса». [76] Специалист по информатике Ричард Саттон сказал: «Я не думаю, что люди должны бояться… но я думаю, что люди должны обращать внимание». [78]
В Китае AlphaGo стал « моментом спутника », который помог убедить китайское правительство отдать приоритет и значительно увеличить финансирование искусственного интеллекта. [79]
В 2017 году команда DeepMind AlphaGo получила первую медаль IJCAI Marvin Minsky за выдающиеся достижения в области ИИ. «AlphaGo — это замечательное достижение и прекрасный пример того, для признания чего была учреждена медаль Минского», — сказал профессор Майкл Вулдридж , председатель Комитета по наградам IJCAI. «Что особенно впечатлило IJCAI, так это то, что AlphaGo достигает того, чего она делает, с помощью блестящего сочетания классических методов ИИ, а также современных методов машинного обучения, с которыми так тесно связан DeepMind. Это захватывающая дух демонстрация современного ИИ, и мы рады возможности отметить ее этой наградой». [80]
Го — популярная игра в Китае, Японии и Корее, и матчи 2016 года посмотрели, возможно, сто миллионов человек по всему миру. [69] [81] Многие ведущие игроки в го охарактеризовали нетрадиционную игру AlphaGo как, казалось бы, сомнительные ходы, которые поначалу сбивали с толку зрителей, но обретали смысл задним числом: [73] «Все, кроме самых лучших игроков в го, создают свой стиль, подражая лучшим игрокам. Кажется, у AlphaGo есть совершенно оригинальные ходы, которые она создает сама». [69] AlphaGo, казалось, неожиданно стала намного сильнее, даже по сравнению с матчем в октябре 2015 года [82] , где компьютер впервые победил профессионала в го без преимущества гандикапа. [83] На следующий день после первого поражения Ли Чон Ахрам, ведущий корреспондент по го одной из крупнейших ежедневных газет Южной Кореи, сказал: «Прошлая ночь была очень мрачной... Многие люди пили алкоголь». [84] Корейская ассоциация бадук , организация, которая курирует профессионалов го в Южной Корее, присвоила AlphaGo почетный 9-й дан за проявление творческих навыков и содействие прогрессу игры. [85]
Китаец Кэ Цзе , 18-летний игрок, которого в то время считали лучшим игроком в го в мире, [33] [86] изначально утверждал, что сможет победить AlphaGo, но отказался играть против него из-за страха, что он «скопирует мой стиль». [86] По мере развития матчей Кэ Цзе колебался, заявляя, что «весьма вероятно, что я (могу) проиграть» после анализа первых трех матчей, [87] но вновь обретая уверенность после того, как AlphaGo проявила недостатки в четвертом матче. [88]
Тоби Мэннинг, судья матча AlphaGo против Фань Хуэя, и Хаджин Ли, генеральный секретарь Международной федерации го , считают, что в будущем игроки в го будут получать помощь от компьютеров, чтобы узнать, что они сделали неправильно в играх, и улучшить свои навыки. [83]
После второй игры Ли сказал, что он «лишился дара речи»: «С самого начала матча я ни разу не мог одержать верх хотя бы на один ход. Это была полная победа AlphaGo». [89] Ли извинился за свои поражения, заявив после третьей игры, что «я недооценил возможности AlphaGo и чувствовал себя бессильным». [69] Он подчеркнул, что поражение было «поражением Ли Седоля», а «не поражением человечества». [27] [77] Ли сказал, что его окончательное поражение от машины было «неизбежным», но заявил, что «роботы никогда не поймут красоту игры так же, как мы, люди». [77] Ли назвал свою победу в четвертой игре «бесценной победой, которую я (не) променял бы ни на что». [27]
На Rotten Tomatoes документальный фильм имеет средний рейтинг 100% на основе 10 рецензий. [90]
Майкл Рехтшаффен из Los Angeles Times дал документальному фильму положительную рецензию и сказал: «Это помогает делу, когда у вас есть группа интересных человеческих субъектов, таких как тихий Седоль, который так же интенсивно размышляет, как и сама игра, в противовес энергичному, обаятельному Фань Хуэю, чемпиону Европы из Парижа, который принимает предложение стать консультантом команды DeepMind после того, как потерпел деморализующую потерю от ИИ». Он также упомянул, что благодаря страсти Фолькера Бертельманна из Hauschka, продюсера фильма, этот документальный фильм показывает много неожиданных сцен, включая стратегические и философские компоненты. [91] (Рехтшаффен, 2017 Джон Дефоре из The Hollywood Reporter написал, что этот документальный фильм — «увлекательный документальный фильм о спортивном соперничестве с элементами искусственного интеллекта». «В конце концов, наблюдатели задаются вопросом, не убьет ли странная интуиция AlphaGo го как интеллектуальное занятие, а изменит ли ее курс, заставив исследователей игры рассматривать ее с новых точек зрения. Так что, возможно, еще не время приветствовать наших компьютерных повелителей, и это не произойдет еще какое-то время — может быть, они научат нас мыслить лучше, прежде чем превратить нас в своих рабов». [92]
Грег Кос, режиссер фильма, сказал: «Сложность игры Го в сочетании с технической глубиной новой технологии, такой как искусственный интеллект, казалось, может создать непреодолимый барьер для такого фильма. Тот факт, что я был так невинно не осведомлен о Го и AlphaGo, на самом деле оказался полезным. Это позволило мне подойти к действию и интервью с чистым любопытством, тем, которое помогает сделать любой предмет эмоционально доступным». Кос также сказал, что «В отличие от человеческих персонажей фильма, которые превращают свои любопытные поиски знаний в эпическое зрелище с большими экзистенциальными последствиями, которые осмеливаются рисковать своей репутацией и гордостью, чтобы оспорить это любопытство, ИИ, возможно, еще не обладает способностью сопереживать. Но он может научить нас глубоким вещам о нашей человечности — тому, как мы играем в настольные игры, как мы думаем, чувствуем и растем. Это глубокая, обширная предпосылка, но я надеюсь, что, поделившись ею, мы сможем открыть в себе что-то, чего мы никогда раньше не видели». [93]
Хаджин Ли, бывший профессиональный игрок в го, описала этот документальный фильм как «прекрасно снятый». Помимо самой истории, чувства и атмосфера также были переданы с помощью различных сценических схем. Например, крупные планы Ли Седоля, когда он понимает, что ИИ AlphaGo разумен, атмосферная сцена страдания и скорби корейского комментатора после первого поражения и напряжение, сохраняющееся в комнате. Документальный фильм также рассказывает историю, описывая предысторию технологии AlphaGo и обычаи корейского сообщества го. Она предлагает некоторые области, которые следует осветить дополнительно. Например, детали ИИ до AlphaGo, уверенность и гордость профессиональных игроков в го и смещение перспективы на ИИ Go между и после матча, как «Если бы можно было что-то добавить, я бы включила информацию о примитивном уровне лучших ИИ Go до AlphaGo и больше о жизни и гордости профессиональных игроков в го, чтобы предоставить больше контекста для уверенности Ли Седоля перед матчем и меняющегося восприятия AlphaGo игроками в го по мере продвижения матча». [94] (Ли, 2017).
Фань Хуэй, профессиональный игрок в го и бывший игрок AlphaGo, сказал, что «DeepMind обучил AlphaGo, показав ему много сильных любительских игр в го, чтобы развить его понимание того, как играет человек, прежде чем бросить ему вызов, чтобы он сыграл версии самого себя тысячи раз, новая форма обучения с подкреплением, которая дала ему возможность соперничать с опытным человеком. История была создана, и столетия полученных знаний были перевернуты в процессе. Программа была свободна, чтобы изучить игру самостоятельно. [95]
Джеймс Винсент, репортер The Verge, комментирует: «Она подталкивает и подкалывает зрителей недвусмысленными эмоциональными сигналами, как это делают реалити-шоу. «Теперь вы должны нервничать; теперь вы должны чувствовать облегчение». Кадры AlphaGo медленно фиксируют момент, когда Ли Седоль осознает истинную силу искусственного интеллекта AlphaGo. В первой игре у него было больше опыта, чем у его запрограммированного человеком искусственного интеллекта, поэтому он думал, что будет легко победить искусственный интеллект. Однако динамика ранней игры оказалась не такой, как он ожидал. Проиграв первый матч, он стал еще более нервным и потерял уверенность. После этого он отреагировал на атаки, заявив, что просто хотел выиграть матч, непреднамеренно проявив свой гнев и действуя необычным образом. Кроме того, он тратит 12 минут на один ход, в то время как AlphaGo требуется всего полторы минуты, чтобы ответить. AlphaGo взвешивает каждую альтернативу одинаково и последовательно. Никакой реакции на бой Ли. Вместо этого игра продолжается, как будто его там не было.
Джеймс также сказал, что «достаточно сказать, что человечество действительно нанесет по крайней мере один удар по машинам, посредством так называемого «божественного хода» Ли». «Скорее всего, силы автоматизации, с которыми мы столкнемся, будут безличными и непостижимыми. Они придут в форме звездных рейтингов, против которых мы не сможем возражать, и алгоритмов, которые мы не сможем полностью понять. Решение проблем ИИ займет перспективу, выходящую за рамки отдельных сражений. AlphaGo стоит посмотреть, потому что он поднимает эти вопросы» [96] (Винсент, 2017)
Мюррей Шанахан, профессор когнитивной робототехники в Имперском колледже Лондона, критикует, что «Го — это необычная игра, но она представляет то, что мы можем сделать с ИИ во всех видах других сфер», — говорит Мюррей Шанахан, профессор когнитивной робототехники в Имперском колледже Лондона и старший научный сотрудник DeepMind. «Точно так же, как в Го есть всевозможные области возможностей, которые не были открыты, мы никогда не могли представить себе потенциал для открытия лекарств и других материалов». [95]
Facebook также работает над собственной системой игры в Го darkforest , также основанной на объединении машинного обучения и поиска по дереву Монте-Карло . [66] [97] Несмотря на то, что она является сильным игроком против других компьютерных программ Го, по состоянию на начало 2016 года она еще не побеждала профессионального игрока-человека. [98] Darkforest проиграла CrazyStone и Zen и, по оценкам, имеет такую же силу, как CrazyStone и Zen. [99]
DeepZenGo , система, разработанная при поддержке сайта для обмена видео Dwango и Токийского университета , проиграла со счетом 2–1 в ноябре 2016 года мастеру го Чо Чикуну , который является рекордсменом по наибольшему количеству побед в го в Японии. [100] [101]
В статье 2018 года в журнале Nature подход AlphaGo упоминается как основа для нового способа вычисления потенциальных молекул фармацевтических препаратов. [102] [103] Системы, состоящие из поиска по дереву Монте-Карло , управляемого нейронными сетями, с тех пор были исследованы для широкого спектра приложений. [104]
AlphaGo Master (белые) против Tang Weixing (31 декабря 2016 г.), AlphaGo победила по причине отказа. White 36 получила широкую похвалу.
Документальный фильм AlphaGo [9] [90] вселил надежду, что Ли Седоль и Фань Хуэй извлекли бы пользу из своего опыта игры в AlphaGo, но по состоянию на май 2018 года [update]их рейтинги мало изменились; Ли Седоль занимал 11-е место в мире, а Фань Хуэй — 545-е. [105] 19 ноября 2019 года Ли объявил о своем уходе из профессиональной игры, заявив, что он никогда не сможет стать лучшим игроком в го из-за растущего доминирования искусственного интеллекта. Ли назвал их «сущностью, которую невозможно победить». [106]
AlphaGo Lee... 12 сверточных слоев
100 миллионов человек посмотрели матчи AlphaGo-Lee, сказал г-н Хассабис.
{{cite news}}
: CS1 maint: numeric names: authors list (link)