Deep Blue была экспертной системой для игры в шахматы, работающей на уникальном специально созданном суперкомпьютере IBM . Это был первый компьютер, выигравший игру, и первый, выигравший матч против действующего чемпиона мира при обычном контроле времени. Разработка началась в 1985 году в Университете Карнеги-Меллона под названием ChipTest . Затем он переехал в IBM, где был сначала переименован в Deep Thought , а затем в 1989 году снова в Deep Blue. Впервые он сыграл с чемпионом мира Гарри Каспаровым в матче из шести партий в 1996 году, где проиграл четыре партии двум. Он был модернизирован в 1997 году, и в повторном матче из шести партий он победил Каспарова, выиграв две партии и сыграв вничью три. Победа Deep Blue считается важной вехой в истории искусственного интеллекта и стала предметом нескольких книг и фильмов.
Будучи докторантом в Университете Карнеги-Меллона , Фэн-сюн Сю начал разработку шахматного суперкомпьютера под названием ChipTest . Машина выиграла Североамериканский чемпионат по компьютерным шахматам в 1987 году, а Сю и его команда выпустили преемника, Deep Thought , в 1988 году. [2] [3] Получив докторскую степень в 1989 году, Сю и Мюррей Кэмпбелл присоединились к IBM Research, чтобы продолжить свой проект по созданию машины, которая могла бы победить чемпиона мира по шахматам. [4] Их коллега Томас Анантараман ненадолго присоединился к ним в IBM, прежде чем уйти в финансовую сферу и быть замененным программистом Артуром Джозефом Хоаном. [5] [6] Джерри Броди, давний сотрудник IBM Research, впоследствии присоединился к команде в 1990 году. [7]
После поражения Deep Thought в двух играх от Каспарова в 1989 году, IBM провела конкурс на переименование шахматной машины: победившим названием стало «Deep Blue», предложенное Питером Фицхью Брауном , [8] это была игра с прозвищем IBM «Big Blue». [a] После того, как уменьшенная версия Deep Blue сыграла с гроссмейстером Джоэлом Бенджамином , [10] Сюй и Кэмпбелл решили, что Бенджамин был тем экспертом, которого они искали для помощи в разработке дебютной книги Deep Blue , поэтому наняли его для помощи в подготовке матчей Deep Blue против Гарри Каспарова. [11] В 1995 году прототип Deep Blue сыграл в восьмом чемпионате мира по шахматам с участием компьютеров , сыграв вничью в Wchess, прежде чем в конечном итоге проиграл Фрицу в пятом раунде, несмотря на то, что играл белыми . [12]
Сегодня одна из двух стоек, из которых состоял Deep Blue, хранится в Национальном музее американской истории , ранее она была представлена на выставке, посвященной информационному веку , [13] в то время как другая стойка была приобретена Музеем компьютерной истории в 1997 году и представлена в галерее «Искусственный интеллект и робототехника» выставки Revolution. [14] О Deep Blue было написано несколько книг, среди которых « Behind Deep Blue: Building the Computer that Defeated the World Chess Champion» разработчика Deep Blue Фэн-сюн Сю. [15]
После поражения своего предшественника Deep Thought в 1989 году от Гарри Каспарова , Deep Blue сыграл с Каспаровым ещё дважды. В первой игре первого матча, который прошёл с 10 по 17 февраля 1996 года, Deep Blue стал первой машиной, выигравшей шахматную партию против действующего чемпиона мира с обычным контролем времени . Однако Каспаров выиграл три и сыграл вничью две из следующих пяти игр, победив Deep Blue со счётом 4–2 в конце матча. [16]
Аппаратное обеспечение Deep Blue впоследствии было модернизировано, [3] [17] [b] удвоив свою скорость, прежде чем оно снова столкнулось с Каспаровым в мае 1997 года, когда оно выиграло матч-реванш из шести партий со счетом 3½–2½. Deep Blue выиграла решающую игру после того, как Каспаров не смог обеспечить свою позицию в дебюте, тем самым став первой компьютерной системой, победившей действующего чемпиона мира в матче со стандартным контролем времени шахматного турнира. [19] [20] Версия Deep Blue, победившая Каспарова в 1997 году, обычно искала на глубину от шести до восьми ходов, а в некоторых ситуациях и до двадцати и более ходов. [21] Дэвид Леви и Монти Ньюборн подсчитали, что каждый дополнительный слой (полхода) прямого понимания увеличивает силу игры от 50 до 70 очков Эло . [22]
На 44-м ходу первой партии их второго матча, неизвестном Каспарову, ошибка в коде Deep Blue привела к тому, что он вошел в непреднамеренный цикл , из которого он вышел, сделав случайно выбранный допустимый ход. [23] Каспаров не принял эту возможность во внимание и ошибочно приписал, казалось бы, бессмысленный ход «высшему интеллекту». [20] Впоследствии у Каспарова ухудшилась производительность в следующей игре, [23] хотя он отрицает, что это было связано с беспокойством после непостижимого хода Deep Blue. [24]
После своего поражения Каспаров сказал, что иногда он видел необычную креативность в ходах машины, предполагая, что во время второй игры люди-шахматисты вмешались от имени машины. IBM отрицала это, заявив, что единственное вмешательство человека произошло между играми. [25] [26] Каспаров потребовал реванша, но IBM разобрала Deep Blue после его победы и отказалась от реванша. [27] Правила позволяли разработчикам изменять программу между играми, возможность, которую, как они сказали, они использовали, чтобы укрепить слабые стороны в игре компьютера, которые были выявлены в ходе матча. Каспаров запросил распечатки файлов журнала машины, но IBM отказалась, хотя позже компания опубликовала журналы в Интернете. [28]
Турнир 1997 года присудил команде Deep Blue первый приз в размере 700 000 долларов, а Каспарову — второй приз в размере 400 000 долларов. Университет Карнеги — Меллона присудил команде Deep Blue дополнительный приз в размере 100 000 долларов — приз, учрежденный профессором компьютерных наук Эдвардом Фредкиным в 1980 году за первую компьютерную программу, победившую действующего чемпиона мира по шахматам. [29]
Каспаров изначально назвал Deep Blue «инопланетным противником», но позже принизил его, заявив, что он «такой же умный, как ваш будильник». [30] По словам Мартина Эмиса , два гроссмейстера, игравших на Deep Blue, сошлись во мнении, что это было «как стена, надвигающаяся на вас». [31] [32] У Сю были права на использование дизайна Deep Blue независимо от IBM, но он также независимо отклонил предложение Каспарова о реванше. [33] В 2003 году документальный фильм « Игра окончена: Каспаров и машина» расследовал заявления Каспарова о мошенничестве IBM. В фильме некоторые интервьюируемые описывают инвестиции IBM в Deep Blue как попытку повысить стоимость ее акций. [34]
После победы Deep Blue специалист по искусственному интеллекту Омар Сайед разработал новую игру Arimaa , которая должна была быть очень простой для людей, но очень сложной для освоения компьютерами; [35] [36] однако в 2015 году компьютеры доказали свою способность побеждать сильных игроков в Arimaa. [37] После победы Deep Blue специалисты по информатике разработали программное обеспечение для других сложных настольных игр с конкурентными сообществами. Серия AlphaGo ( AlphaGo , AlphaGo Zero , AlphaZero ) победила лучших игроков в го в 2016–2017 годах. [38] [39]
Ученые-компьютерщики, такие как разработчик Deep Blue Кэмпбелл, считали, что игра в шахматы является хорошим показателем эффективности искусственного интеллекта, и, победив чемпиона мира по шахматам, IBM показала, что они достигли значительного прогресса. [3] Deep Blue также ответственна за популярность использования игр в качестве средства отображения для искусственного интеллекта, как в случаях IBM Watson или AlphaGo . [40]
В то время как Deep Blue, с его способностью оценивать 200 миллионов позиций в секунду, [41] был первым компьютером, который столкнулся с чемпионом мира по шахматам в формальном матче, [3] это была экспертная система последнего поколения , полагающаяся на правила и переменные, определенные и настроенные шахматными мастерами и компьютерными учеными. Напротив, современные шахматные движки, такие как Leela Chess Zero, обычно используют системы машинного обучения с подкреплением , которые обучают нейронную сеть игре, разрабатывая собственную внутреннюю логику, а не полагаясь на правила, определенные экспертами-людьми. [38]
В матче в ноябре 2006 года между Deep Fritz и чемпионом мира по шахматам Владимиром Крамником программа работала на компьютерной системе, содержащей двухъядерный процессор Intel Xeon 5160 , способный оценивать только 8 миллионов позиций в секунду, но просматривающий среднюю глубину от 17 до 18 полуходов в миттельшпиле благодаря эвристике ; она выиграла со счетом 4–2. [42] [43]
Оценочная функция Deep Blue изначально была написана в обобщенной форме со многими параметрами, которые нужно было определить (например, насколько важна безопасная позиция короля по сравнению с преимуществом пространства в центре и т. д.). Значения этих параметров определялись путем анализа тысяч игр мастеров. Затем оценочная функция была разделена на 8000 частей, многие из которых были разработаны для специальных позиций. Дебютная книга включала более 4000 позиций и 700000 игр гроссмейстеров , в то время как база данных эндшпилей содержала множество эндшпилей с шестью фигурами и все эндшпили с пятью и менее фигурами. Дополнительная база данных, называемая «расширенной книгой», суммирует все партии, сыгранные гроссмейстерами. Система объединяет свою поисковую способность в 200 миллионов шахматных позиций в секунду с суммарной информацией в расширенной книге для выбора дебютных ходов. [44]
Перед вторым матчем правила программы были доработаны гроссмейстером Джоэлем Бенджамином . Библиотека дебютов была предоставлена гроссмейстерами Мигелем Ильескасом , Джоном Федоровичем и Ником де Фирмианом . [45] Когда Каспаров попросил разрешить ему изучить другие игры, сыгранные Deep Blue, чтобы лучше понять своего противника, IBM отказала, что заставило Каспарова изучить множество популярных шахматных игр для ПК, чтобы ознакомиться с игровым процессом на компьютере. [46]
Deep Blue использовала пользовательские чипы VLSI для распараллеливания алгоритма поиска альфа-бета , [47] пример символического ИИ . [48] Система получила свою игровую мощь в основном от вычислительной мощности грубой силы . Это был массивно-параллельный суперкомпьютер IBM RS/6000 SP с 30 процессорами PowerPC 604e и 480 пользовательскими 600 нм CMOS VLSI «шахматными чипами», разработанными для выполнения шахматной экспертной системы, а также FPGA, предназначенными для исправления VLSI (которые в конечном итоге остались неиспользованными), все размещенные в двух корпусах. Шахматный чип состоит из четырех частей: генератора ходов, стека интеллектуальных ходов, функции оценки и управления поиском. Генератор ходов представляет собой комбинационную логическую схему 8x8, шахматную доску в миниатюре. [49] [50] [51] [52]
Его шахматная программа была написана на языке C и работала под управлением операционной системы AIX . Она могла оценивать 200 миллионов позиций в секунду, что в два раза быстрее версии 1996 года.
В 1997 году Deep Blue снова был модернизирован и стал 259-м самым мощным суперкомпьютером согласно списку TOP500 , достигнув 11,38 GFLOPS на параллельном высокопроизводительном тесте LINPACK. [53]
{{cite conference}}
: CS1 maint: неподходящий URL ( ссылка )