stringtranslate.com

Рэй Соломонов

Рэй Соломонов (25 июля 1926 – 7 декабря 2009) [1] [2] был американским математиком, который изобрел алгоритмическую вероятность , [3] свою Общую теорию индуктивного вывода (также известную как универсальный индуктивный вывод), [4] и был основоположником алгоритмической теории информации . [5] Он был создателем отрасли искусственного интеллекта, основанной на машинном обучении , предсказании и вероятности . Он распространил первый отчет о несемантическом машинном обучении в 1956 году .

Соломонов впервые описал алгоритмическую вероятность в 1960 году, опубликовав теорему, положившую начало колмогоровской теории сложности и алгоритмической теории информации . Впервые он описал эти результаты на конференции в Калифорнийском технологическом институте в 1960 году [7] и в докладе «Предварительный отчет по общей теории индуктивного вывода» в феврале 1960 года. [8] Более полно он разъяснил эти идеи в своих публикациях 1964 года «Формальная теория индуктивного вывода», часть I [9] и часть II. [10]

Алгоритмическая вероятность представляет собой математически формализованную комбинацию бритвы Оккама , [11] [12] [13] [14] и принципа множественных объяснений. [15] Это машинно-независимый метод присвоения значения вероятности каждой гипотезе (алгоритму/программе), который объясняет данное наблюдение, при этом простейшая гипотеза (самая короткая программа) имеет наибольшую вероятность, а все более сложные гипотезы получают все более малые вероятности. .

Соломонов основал теорию универсального индуктивного вывода , которая опирается на прочные философские основы [4] и уходит корнями в колмогоровскую теорию сложности и алгоритмическую теорию информации . Теория использует алгоритмическую вероятность в байесовской структуре. Универсальный априор берется над классом всех вычислимых мер; ни одна гипотеза не будет иметь нулевую вероятность. Это позволяет использовать правило Байеса (причинно-следственной связи) для прогнозирования наиболее вероятного следующего события в серии событий и его вероятности. [10]

Хотя он наиболее известен благодаря алгоритмической теории вероятностей и своей общей теории индуктивного вывода , за свою жизнь он сделал много других важных открытий, большинство из которых были направлены на достижение его цели в области искусственного интеллекта: разработать машину, которая могла бы решать сложные задачи с использованием вероятностных методов.

История жизни до 1964 г.

Рэй Соломонов родился 25 июля 1926 года в Кливленде, штат Огайо , в семье еврейских русских иммигрантов Филиппа Джулиуса и Сары Машман Соломонов. Он учился в средней школе Гленвилля, которую окончил в 1944 году. В 1944 году он поступил на службу в ВМС США в качестве инструктора по электронике. В 1947–1951 годах он учился в Чикагском университете , обучаясь у таких профессоров, как Рудольф Карнап и Энрико Ферми , и окончил его со степенью магистра физики в 1951 году.

С самых ранних лет им двигала чистая радость математических открытий и желание исследовать места, где еще никто не бывал. [16] В возрасте 16 лет, в 1942 году, он начал искать общий метод решения математических задач.

В 1952 году он встретил Марвина Мински , Джона Маккарти и других, интересующихся машинным интеллектом. В 1956 году Мински, Маккарти и другие организовали Дартмутскую летнюю исследовательскую конференцию по искусственному интеллекту , на которой Соломонов был одним из первых 10 приглашенных — он, Маккарти и Мински были единственными, кто остался на все лето. Именно благодаря этой группе искусственный интеллект впервые был назван наукой. Компьютеры того времени могли решать весьма специфические математические задачи, но не более того. Соломонов хотел заняться более серьезным вопросом: как сделать машины более разумными и как компьютеры могут использовать вероятность для этой цели.

История работы до 1964 г.

Он написал три статьи, две вместе с Анатолем Рапопортом , в 1950–52 годах [17] , которые считаются самым ранним статистическим анализом сетей.

Он был одним из 10 участников Летнего исследовательского проекта по искусственному интеллекту в Дартмуте в 1956 году . Он написал и распространил среди присутствующих доклад: «Машина индуктивного вывода». [6] Оно рассматривало машинное обучение как вероятностное, с упором на важность обучающих последовательностей и на использование частей предыдущих решений проблем при построении пробных решений для новых проблем. Он опубликовал версию своих результатов в 1957 году. [18] Это были первые статьи по вероятностному машинному обучению.

В конце 1950-х годов он изобрел вероятностные языки и связанные с ними грамматики. [19] Вероятностный язык присваивает значение вероятности каждой возможной строке.

Обобщение концепции вероятностных грамматик привело его к открытию в 1960 году «Алгоритмической вероятности и общей теории индуктивного вывода».

До 1960-х годов обычный метод расчета вероятности основывался на частоте: отношение положительных результатов к общему числу испытаний. В своей публикации 1960 года и, более полно, в публикациях 1964 года Соломонов серьёзно пересмотрел это определение вероятности. Он назвал эту новую форму вероятности «алгоритмической вероятностью» и показал, как использовать ее для предсказания в своей теории индуктивного вывода. В рамках этой работы он заложил философскую основу для использования правила причинно-следственной связи Байеса для прогнозирования.

Основная теорема того, что позже было названо колмогоровской сложностью , была частью его общей теории. В 1960 году он начинает: «Рассмотрим очень длинную последовательность символов... Мы будем считать такую ​​последовательность символов «простой» и имеющей высокую априорную вероятность, если существует очень краткое описание этой последовательности – используя, конечно, какой-то предусмотренный метод описания. Точнее, если мы используем только символы 0 и 1 для выражения нашего описания, мы присвоим вероятность 2 - N последовательности символов, если ее кратчайшее возможное двоичное описание содержит N цифры». [20]

Вероятность указана применительно к конкретной универсальной машине Тьюринга . Соломонов показал и в 1964 году доказал, что выбор машины, хотя она и может добавить постоянный коэффициент, не сильно изменит отношения вероятностей. Эти вероятности не зависят от машины.

В 1965 году российский математик Колмогоров независимо опубликовал аналогичные идеи. Когда ему стало известно о работах Соломонова, он признал Соломонова, и в течение нескольких лет работы Соломонова были более известны в Советском Союзе, чем в западном мире. Однако в научном сообществе было принято мнение, что этот тип сложности связан с Колмогоровым, которого больше интересовала случайность последовательности. Алгоритмическая вероятность и универсальная индукция (Соломонова) стали ассоциироваться с Соломоновым, который занимался предсказанием — экстраполяцией последовательности.

Позже в той же публикации 1960 года Соломонов описывает свое расширение теории единственного кратчайшего кода. Это алгоритмическая вероятность. Он утверждает: «Казалось бы, если существует несколько различных методов описания последовательности, каждому из этих методов следует придать некоторый вес при определении вероятности этой последовательности». [21] Затем он показывает, как эту идею можно использовать для создания универсального априорного распределения вероятностей и как она позволяет использовать правило Байеса в индуктивном выводе. Индуктивный вывод, складывая предсказания всех моделей, описывающих конкретную последовательность, с использованием подходящих весов, основанных на длинах этих моделей, позволяет получить распределение вероятностей для расширения этой последовательности. Этот метод предсказания с тех пор стал известен как индукция Соломонова .

Он расширил свою теорию, опубликовав ряд отчетов, предшествовавших публикациям в 1964 году. В статьях 1964 года дается более подробное описание алгоритмической вероятности и индукции Соломонова, представляя пять различных моделей, включая модель, широко называемую универсальным распределением.

История работы с 1964 по 1984 год.

Другие ученые, принимавшие участие в Летней конференции в Дартмуте 1956 года (например, Ньюэлл и Саймон ), разрабатывали раздел искусственного интеллекта, который использовал машины, управляемые правилами «если-то», основанными на фактах. Соломонов развивал раздел искусственного интеллекта, специализирующийся на вероятности и предсказаниях; его особый взгляд на ИИ описывал машины, управляемые алгоритмическим распределением вероятностей. Машина генерирует теории вместе со связанными с ними вероятностями для решения проблем и по мере развития новых проблем и теорий обновляет распределение вероятностей для теорий.

В 1968 году он нашел доказательство эффективности алгоритмической вероятности [22] , но, в основном из-за отсутствия общего интереса в то время, опубликовал его только 10 лет спустя. В своем докладе он опубликовал доказательство теоремы о сходимости.

В годы, прошедшие после открытия алгоритмической вероятности, он сосредоточился на том, как использовать эту вероятность и индукцию Соломонова в реальном прогнозировании и решении проблем для ИИ. Он также хотел понять более глубокие последствия этой вероятностной системы.

Одним из важных аспектов алгоритмической вероятности является то, что она полна и неисчислима.

В отчете 1968 года он показывает, что алгоритмическая вероятность полна ; то есть, если в массиве данных есть какая-либо описуемая регулярность, алгоритмическая вероятность в конечном итоге обнаружит эту закономерность, требуя относительно небольшой выборки этих данных. Алгоритмическая вероятность - единственная вероятностная система, которая, как известно, является полной в этом смысле. Как необходимое следствие его полноты, оно неисчислимо . Неисчислимость заключается в том, что некоторые алгоритмы (подмножество частично рекурсивных) никогда не могут быть вычислены полностью, поскольку это заняло бы слишком много времени. Но эти программы, по крайней мере, будут признаны возможными решениями. С другой стороны, любая вычислимая система неполна . За пределами пространства поиска этой системы всегда будут описания, которые никогда не будут признаны или рассмотрены, даже через бесконечное количество времени. Вычислимые модели прогнозирования скрывают этот факт, игнорируя такие алгоритмы.

Во многих своих статьях он описывал, как искать решения проблем, а в 1970-х и начале 1980-х годов разработал, по его мнению, лучший способ обновления машины.

Однако использование вероятности в ИИ не было полностью гладким. В первые годы существования ИИ значимость вероятности была проблематичной. Многие представители сообщества искусственного интеллекта считали, что вероятность непригодна для использования в их работе. В области распознавания образов действительно использовалась определенная форма вероятности, но поскольку не было широко обоснованной теории того, как включить вероятность в любую область ИИ, в большинстве областей она вообще не использовалась.

Однако были такие исследователи, как Перл и Питер Чизмэн, которые утверждали, что вероятность можно использовать в искусственном интеллекте.

Примерно в 1984 году на ежегодном собрании Американской ассоциации искусственного интеллекта (AAAI) было решено, что вероятность никоим образом не имеет отношения к ИИ.

Сформировалась группа протеста, и в следующем году на встрече AAAI состоялся семинар, посвященный «Вероятности и неопределенности в ИИ». Этот ежегодный семинар продолжается и по сей день. [23]

В рамках протеста на первом семинаре Соломонов выступил с докладом о том, как применить универсальное распределение к проблемам искусственного интеллекта [24]. Это была ранняя версия системы, которую он разрабатывал с тех пор.

В этом отчете он описал разработанную им технику поиска. В задачах поиска лучший порядок поиска — это время , где — время, необходимое для проверки испытания, и — вероятность успеха этого испытания. Он назвал это «концептуальным размером скачка» проблемы. Техника поиска Левина приближается к этому порядку [25] , поэтому Соломонов, изучавший работу Левина, назвал эту технику поиска Lsearch.

История работы — последние годы

В других статьях он исследовал, как ограничить время, необходимое для поиска решений, описывая поиск, ограниченный ресурсами. Пространство поиска ограничено доступным временем или стоимостью вычислений, а не вырезанием пространства поиска, как это делается в некоторых других методах прогнозирования, таких как минимальная длина описания.

На протяжении всей своей карьеры Соломонов интересовался потенциальными преимуществами и опасностями ИИ, обсуждая их во многих своих опубликованных отчетах. В 1985 году он проанализировал вероятную эволюцию ИИ, дав формулу, предсказывающую, когда он достигнет «точки бесконечности». [26] Эта работа является частью истории мысли о возможной технологической сингулярности .

Первоначально методы алгоритмической индукции экстраполировали упорядоченные последовательности строк. Требовались методы для работы с другими видами данных.

В отчете 1999 года [27] универсальное распределение и связанные с ним теоремы сходимости обобщаются на неупорядоченные наборы строк, а в отчете 2008 года [28] на неупорядоченные пары строк.

В 1997, [29] 2003 и 2006 годах он показал, что неисчислимость и субъективность являются необходимыми и желательными характеристиками любой высокопроизводительной индукционной системы.

В 1970 году он основал собственную компанию Oxbridge Research и продолжал там свои исследования, за исключением периодов в других учреждениях, таких как Массачусетский технологический институт, Саарский университет в Германии и Институт искусственного интеллекта Далле Молле в Лугано, Швейцария. В 2003 году он стал первым лауреатом Колмогоровской премии Исследовательского центра компьютерного обучения в Ройал Холлоуэй Лондонского университета, где он прочитал первую Колмогоровскую лекцию. Совсем недавно Соломонов был приглашенным профессором в CLRC.

В 2006 году он выступил на конференции AI@50 «Дартмутская конференция по искусственному интеллекту: следующие пятьдесят лет», посвященной пятидесятилетию первоначальной летней исследовательской группы в Дартмуте. Соломонов был одним из пяти первых участников, присутствовавших на мероприятии.

В феврале 2008 года он выступил с основным докладом на конференции «Современные тенденции в теории и применении компьютерных наук» (CTTACS), проходившей в Университете Нотр-Дам в Ливане. После этого он прочитал короткую серию лекций и начал исследования новых приложений алгоритмической вероятности.

Алгоритмическая вероятность и индукция Соломонова имеют много преимуществ для искусственного интеллекта. Алгоритмическая вероятность дает чрезвычайно точные оценки вероятности. Эти оценки могут быть пересмотрены надежным методом, чтобы они оставались приемлемыми. Он использует время поиска очень эффективно. Помимо оценок вероятности, алгоритмическая вероятность «имеет для ИИ еще одно важное значение: разнообразие моделей дает нам много разных способов понять наши данные;

Описание жизни и работы Соломонова до 1997 года находится в «Открытие алгоритмической вероятности», Журнал компьютерных и системных наук, том 55, № 1, стр. 73–88, август 1997 года. остальные, упомянутые здесь, доступны на его сайте на странице публикаций.

В статье, опубликованной в год его смерти, в журнальной статье говорилось о Соломонове: «Очень традиционный учёный понимает свою науку, используя единую «современную парадигму» — способ понимания, который наиболее популярен в настоящее время. Более творческий подход ученый понимает свою науку во многих отношениях и может легче создавать новые теории, новые способы понимания, когда «нынешняя парадигма» больше не соответствует текущим данным». [30]

Смотрите также

Рекомендации

  1. ^ «Рэй Соломонов, 1926–2009 «Третья конференция по общему искусственному интеллекту».
  2. Маркофф, Джон (9 января 2010 г.). «Рэй Соломонов, пионер искусственного интеллекта, умер в возрасте 83 лет» . Нью-Йорк Таймс . Проверено 11 января 2009 г.
  3. ^ Витаньи, Пол; Легг, Шейн; Хаттер, Маркус (2007). «Алгоритмическая вероятность». Схоларпедия . 2 (8): 2572. Бибкод : 2007SchpJ...2.2572H. doi : 10.4249/scholarpedia.2572 . hdl : 1885/15013 .
  4. ^ аб Сэмюэл Ратманнер и Маркус Хаттер . Философский трактат универсальной индукции. Энтропия, 13(6):1076–1136, 2011.
  5. ^ Витаньи, П. «Некролог: Рэй Соломонов, отец-основатель алгоритмической теории информации»
  6. ^ ab «Машина индуктивного вывода», Дартмутский колледж, Нью-Хэмпшир, версия от 14 августа 1956 г. (сканированная копия оригинала в формате PDF)
  7. ^ Документ с конференции «Мозговые системы и компьютеры», Калифорнийский технологический институт, 8–11 февраля 1960 г., цитируется в «Формальной теории индуктивного вывода, часть 1, 1964 г., стр. 1.
  8. ^ Соломонов Р., «Предварительный отчет по общей теории индуктивного вывода», Отчет V-131, Zator Co., Кембридж, Массачусетс. 4 февраля 1960 г., редакция от ноября 1960 г.
  9. ^ Соломонов, Р., «Формальная теория индуктивного вывода, Часть I», Информация и контроль , Том 7, № 1, стр. 1–22, март 1964 г.
  10. ^ Аб Соломонов, Р., «Формальная теория индуктивного вывода, Часть II», Информация и контроль , Том 7, № 2, стр. 224–254, июнь 1964 г.
  11. ^ Индукция: от Колмогорова и Соломонова до Де Финетти и обратно к Колмогорову Дж. Дж. МакКолл - Метроэкономика, 2004 - Интернет-библиотека Wiley.
  12. ^ Основы бритвы Оккама и экономности в обучении на сайте ricoh.com D Stork - Семинар NIPS 2001, 2001 г.
  13. ^ Бритва Оккама как формальная основа физической теории с сайта arxiv.org А.Н. Соклаков - Foundations of Physics Letters, 2002 - Springer
  14. ^ За пределами теста Тьюринга с сайта uclm.es Дж. ЭРНАНДЕС-ОРАЛЛО - Журнал логики, языка и…, 2000 - dsi.uclm.es
  15. ^ Мин Ли и Пол Витаньи, Введение в колмогоровскую сложность и ее приложения. Спрингер-Верлаг, Нью-Йорк, 2008, стр. 339 и далее.
  16. ^ Эстин, AE (1989-12-07), «Римское правительство и политика, 200-134 до н.э.», Кембриджская древняя история , Cambridge University Press, стр. 163–196, doi : 10.1017/chol9780521234481.007, ISBN 978-1-139-05436-2
  17. ^ «Точный метод расчета связности случайных сетей», Бюллетень математической биофизики , том 14, с. 153, 1952.
  18. ^ Машина индуктивного вывода», Отчет конференции IRE, Раздел теории информации, Часть 2, стр. 56–62. (версия в формате PDF)
  19. ^ «Отчет о ходе работы над машинами, которые научатся переводить языки и извлекать информацию», «Достижения в области документации и библиотечного дела», том III, часть. 2, стр. 941–953. (Материалы конференции в сентябре 1959 г.)
  20. ^ «Предварительный отчет по общей теории индуктивного вывода», 1960 стр. 1
  21. ^ «Предварительный отчет об общей теории индуктивного вывода», 1960, стр. 17
  22. ^ «Системы индукции, основанные на сложности, сравнения и теоремы сходимости» IEEE Trans. по теории информации Vol. ИТ-24, № 4, стр. 422–432, июль 1978 г. (pdf-версия)
  23. ^ «Универсальное распределение и машинное обучение», Колмогоровская лекция, 27 февраля 2003 г., Royal Holloway, Univ. Лондона. Компьютерный журнал, Том 46, № 6, 2003 г.
  24. ^ «Применение алгоритмической вероятности к проблемам искусственного интеллекта», в Канале и Леммере (ред.), Неопределенность в искусственном интеллекте, Elsevier Science Publishers BV, стр. 473–491, 1986.
  25. ^ Левин, Л.А., «Универсальные задачи поиска», в «Проблемах передачи информации», 9, стр. 115–116, 1973.
  26. ^ «Временная шкала искусственного интеллекта: размышления о социальных эффектах», Управление человеческими системами, том 5, стр. 149–153, 1985 (версия в формате PDF)
  27. ^ «Два вида вероятностной индукции», The Computer Journal, Том 42, № 4, 1999. (версия в формате PDF)
  28. ^ «Три вида вероятностной индукции, универсальные распределения и теоремы сходимости» 2008. (версия в формате PDF)
  29. ^ «Открытие вероятности алгоритмов», Журнал компьютерных и системных наук, том 55, № 1, стр. 73–88 (версия в формате PDF)
  30. ^ «Алгоритмическая вероятность, теория и приложения», В книге «Теория информации и статистическое обучение», редакторы Фрэнк Эммерт-Страйб и Матиас Демер, Springer Science and Business Media, 2009, стр. 11

Внешние ссылки