Элиэзер Юдковский

Элиэзер С. Юдковски ( / ˌ ɛ l i ˈ ɛ z ər ˌ j ʌ d ˈ k aʊ s k i / EH -lee- EH -zər YUD - KOW -skee ; ^[1] родился 11 сентября 1979 г.) — американец исследователь искусственного интеллекта ^[2]^[3]^[4]^[5] и писатель по теории принятия решений и этике , наиболее известный благодаря популяризации идей, связанных с дружественным искусственным интеллектом , ^[6]^[7] включая идею о том, что «не существует» пожарная сигнализация» для ИИ. ^[5] Он является основателем и научным сотрудником Научно-исследовательского института машинного интеллекта (MIRI), частной исследовательской некоммерческой организации, базирующейся в Беркли, Калифорния . ^[8] Его работа о перспективе безудержного взрыва интеллекта повлияла на вышедшую в 2014 году книгу философа Ника Бострома «Суперинтеллект: пути, опасности, стратегии» . ^[9]

Работа в области безопасности искусственного интеллекта

Целевое обучение и стимулы в программных системах

Взгляды Юдковски на проблемы безопасности, которые будут создавать будущие поколения систем искусственного интеллекта, обсуждаются в учебнике для студентов Стюарта Рассела и Питера Норвига «Искусственный интеллект: современный подход» . Отмечая сложность формального определения целей общего назначения вручную, Рассел и Норвиг цитируют предложение Юдковски о том, что автономные и адаптивные системы должны разрабатываться так, чтобы со временем обучаться правильному поведению:

Юдковский (2008) ^[10] более подробно описывает, как создать дружественный ИИ . Он утверждает, что дружелюбие (желание не причинять вред людям) должно быть заложено с самого начала, но дизайнеры должны осознавать, что их собственные разработки могут быть ошибочными, а также то, что робот будет учиться и развиваться с течением времени. Таким образом, задача заключается в разработке механизма — разработать механизм развития ИИ в рамках системы сдержек и противовесов и предоставить системам полезные функции, которые останутся дружественными перед лицом таких изменений. ^[6]

В ответ на проблему инструментальной конвергенции , заключающуюся в том, что автономные системы принятия решений с плохо разработанными целями по умолчанию будут иметь стимулы плохо обращаться с людьми, Юдковский и другие исследователи MIRI рекомендовали провести работу по определению программных агентов, которые сходятся в безопасном поведении по умолчанию, даже если их цели указаны неверно. ^[11]^[7]

Прогнозирование возможностей

В сценарии взрыва интеллекта , предложенном И. Дж. Гудом , рекурсивно самосовершенствующиеся системы искусственного интеллекта быстро переходят от нечеловеческого общего интеллекта к сверхразумному . В книге Ника Бострома «Суперинтеллект: пути, опасности, стратегии» 2014 года подробно излагаются аргументы Гуда, а также цитируется Юдковски о риске того, что антропоморфизация передовых систем искусственного интеллекта приведет к тому, что люди неправильно поймут природу интеллектуального взрыва. «ИИ может совершить явно резкий скачок в интеллекте исключительно в результате антропоморфизма, человеческой склонности думать о «деревенском идиоте» и «Эйнштейне» как о крайних точках шкалы интеллекта, а не как о почти неразличимых точках на шкале интеллекта. -в общем." ^[6]^[10]^[12]

В книге «Искусственный интеллект: современный подход » Рассел и Норвиг выдвигают возражение, что существуют известные пределы интеллектуального решения проблем из теории сложности вычислений ; Если существуют строгие ограничения на эффективность алгоритмов в решении различных задач, взрыв интеллекта может быть невозможен. ^[6]

Время , статья

В статье для журнала Time в 2023 году Юдковский обсудил риск, связанный с искусственным интеллектом, и предложил действия, которые можно предпринять для его ограничения, включая полную остановку разработки ИИ, ^[13]^[14] или даже «уничтожение ] мошеннический центр обработки данных в результате авиаудара». ^[5] Статья помогла вывести дискуссию о совместимости ИИ в мейнстрим, побудив репортера задать президенту Джо Байдену вопрос о безопасности ИИ на брифинге для прессы. ^[2]

Рациональное письмо

В период с 2006 по 2009 год Юдковски и Робин Хэнсон были основными авторами Overcoming Bias , блога по когнитивным и социальным наукам, спонсируемого Институтом будущего человечества Оксфордского университета. В феврале 2009 года Юдковски основал LessWrong , «блог сообщества, посвященный совершенствованию искусства человеческой рациональности». ^[15]^{[16] С тех пор} журнал Overcoming Bias стал личным блогом Хэнсона.

Более 300 сообщений Юдковского в блогах по философии и науке (первоначально написанные на LessWrong и Overcoming Bias ) были выпущены MIRI в виде электронной книги Rationality: From AI to Zombies в 2015 году. ^[17] MIRI также опубликовала электронную книгу Юдковского « Неадекватное равновесие» в 2017 году. о социальной неэффективности. ^[18]

Юдковский также написал несколько художественных произведений. Его роман -фанфик «Гарри Поттер и методы рационального мышления» использует элементы сюжета из серии книг Джоан Роулинг о Гарри Поттере для иллюстрации научных тем. ^[15]^[19] Житель Нью-Йорка описал «Гарри Поттера и методы рационального мышления » как пересказ оригинала Роулинг «в попытке объяснить волшебство Гарри с помощью научного метода». ^[20]

Личная жизнь

Юдковский — самоучка ^[21] и не учился в средней школе или колледже. ^[22] Он был воспитан как современный ортодоксальный еврей , но не идентифицирует себя с религиозной точки зрения как еврей. ^[23]^[24]

Научные публикации

Юдковский, Элиезер (2007). «Уровни организации общей разведки» (PDF) . Общий искусственный интеллект . Берлин: Шпрингер.
Юдковский, Элиэзер (2008). «Когнитивные искажения, потенциально влияющие на оценку глобальных рисков» (PDF) . В Бостроме, Ник ; Чиркович, Милан (ред.). Глобальные катастрофические риски . Издательство Оксфордского университета. ISBN 978-0199606504.
Юдковский, Элиэзер (2008). «Искусственный интеллект как положительный и отрицательный фактор глобального риска» (PDF) . В Бостроме, Ник ; Чиркович, Милан (ред.). Глобальные катастрофические риски . Издательство Оксфордского университета. ISBN 978-0199606504.
Юдковский, Элиезер (2011). «Сложные системы ценностей в дружественном искусственном интеллекте» (PDF) . Общий искусственный интеллект: 4-я Международная конференция AGI 2011, Маунтин-Вью, Калифорния, США, 3–6 августа 2011 г. Берлин: Шпрингер.
Юдковский, Элиезер (2012). «Дружественный искусственный интеллект». В Эдеме Аммон; Мур, Джеймс; Сёракер, Джон; и другие. (ред.). Гипотезы сингулярности: научная и философская оценка . Коллекция «Границы». Берлин: Шпрингер. стр. 181–195. дои : 10.1007/978-3-642-32560-1_10. ISBN 978-3-642-32559-5.
Бостром, Ник ; Юдковский, Элиезер (2014). «Этика искусственного интеллекта» (PDF) . На франкском языке Кейт; Рэмси, Уильям (ред.). Кембриджский справочник по искусственному интеллекту . Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-87142-6.
ЛаВиктуар, Патрик; Фалленштейн, Беня; Юдковский, Элиэзер; Барас, Михай; Кристиано, Пол; Херрешофф, Марчелло (2014). «Программное равновесие в дилемме узника посредством теоремы Лёба». Мультиагентное взаимодействие без предварительной координации: материалы семинара AAAI-14 . Публикации АААИ. Архивировано из оригинала 15 апреля 2021 года . Проверено 16 октября 2015 г.
Соареш, Нейт; Фалленштейн, Беня; Юдковский, Элиезер (2015). «Исправляемость» (PDF) . Семинары AAAI: Семинары на двадцать девятой конференции AAAI по искусственному интеллекту, Остин, Техас, 25–26 января 2015 г. Публикации АААИ.

Смотрите также

Примечания

^ Или Соломон

Внешние ссылки

В Wikiquote есть цитаты, связанные с Элиэзером Юдковским .

Викискладе есть медиафайлы, связанные с Элиэзером Юдковским.

Официальный веб-сайт
Рациональность: от искусственного интеллекта к зомби (вся книга онлайн)