OpenAI — американская исследовательская организация в области искусственного интеллекта (ИИ), основанная в декабре 2015 года. Она исследует искусственный интеллект с целью разработки «безопасного и полезного» общего искусственного интеллекта , который она определяет как «высокоавтономные системы, которые превосходят людей в большинстве экономически ценных задач». ". [4] Являясь одной из ведущих организаций AI Spring , [5] [6] [7] она разработала несколько крупных языковых моделей , усовершенствованные модели генерации изображений, а ранее выпустила модели с открытым исходным кодом. [8] [9] Выпуск ChatGPT положил начало весне искусственного интеллекта. [10]
В состав организации входят некоммерческая организация OpenAI, Inc. [11] , зарегистрированная в Делавэре , и ее коммерческая дочерняя компания OpenAI Global, LLC . [12] Его основали Илья Суцкевер , Грег Брокман , Тревор Блэквелл , Вики Чунг, Андрей Карпати , Дюрк Кингма, Джессика Ливингстон , Джон Шульман, Памела Вагата и Войцех Заремба , а Сэм Альтман и Илон Маск были первыми членами совета директоров. . [13] [14] [15] Microsoft предоставила OpenAI Global LLC инвестиции в размере 1 миллиарда долларов США в 2019 году и инвестиции в размере 10 миллиардов долларов США в 2023 году, [16] [17] значительную часть инвестиций в виде вычислительных ресурсов на базе Microsoft. Облачный сервис Azure . [18]
17 ноября 2023 года совет директоров отстранил Альтмана от должности генерального директора, а Брокман был отстранен от поста председателя, а затем ушел с поста президента. Четыре дня спустя оба вернулись после переговоров с правлением, и большинство членов правления подали в отставку. В состав нового первоначального совета директоров вошел бывший со -генеральный директор Salesforce Брет Тейлор . [19] Также было объявлено, что у Microsoft будет место в совете директоров без права голоса. [20]
В декабре 2015 года Сэм Альтман, Грег Брокман, Рид Хоффман , Джессика Ливингстон , Питер Тиль , Илон Маск , Amazon Web Services (AWS), Infosys и YC Research объявили [21] о создании OpenAI и пообещали вложить в это предприятие более 1 миллиарда долларов. . Фактическая общая сумма пожертвований до 2019 года составляла всего $130 млн. [12] Согласно расследованию, проведенному TechCrunch , Маск был ее крупнейшим донором, в то время как YC Research вообще ничего не вносила. [22] Организация заявила, что будет «свободно сотрудничать» с другими учреждениями и исследователями, сделав свои патенты и исследования открытыми для общественности. [23] [24] Штаб-квартира OpenAI находится в здании Pioneer Building в районе Мишн, Сан-Франциско . [25] [26]
Как сообщает Wired , Брокман встретился с Йошуа Бенджио , одним из «отцов-основателей» глубокого обучения , и составил список «лучших исследователей в этой области». [27] Брокман смог нанять девять из них в качестве первых сотрудников в декабре 2015 года. [27] В 2016 году OpenAI платила зарплаты на корпоративном уровне (а не на некоммерческом уровне), но не платила исследователям искусственного интеллекта зарплаты, сопоставимые с зарплатами в компании Фейсбук или Гугл . [27]
Питер Ли из Microsoft заявил, что затраты на ведущего исследователя искусственного интеллекта превышают затраты на лучшего перспективного защитника НФЛ . [27] Потенциал и миссия OpenAI привлекли этих исследователей в фирму; Сотрудник Google заявил, что готов покинуть Google и перейти в OpenAI «отчасти из-за очень сильной группы людей и, в очень большой степени, из-за ее миссии». [27] Брокман заявил, что «лучшее, что я мог себе представить, — это приблизить человечество к созданию настоящего ИИ безопасным способом». [27] Соучредитель OpenAI Войцех Заремба заявил, что он отклонил «граничное с безумием» предложение, в два-три раза превышающее его рыночную стоимость, и вместо этого присоединился к OpenAI. [27]
В апреле 2016 года OpenAI выпустила публичную бета-версию OpenAI Gym, своей платформы для исследований в области обучения с подкреплением . [28] Nvidia подарила OpenAI свой первый суперкомпьютер DGX-1 в августе 2016 года, чтобы помочь компании обучать более крупные и сложные модели искусственного интеллекта с возможностью сокращения времени обработки с шести дней до двух часов. [29] [30] В декабре 2016 года OpenAI выпустила «Universe», программную платформу для измерения и тренировки общего интеллекта ИИ в мировых играх, веб-сайтах и других приложениях. [31] [32] [33] [34]
В 2017 году OpenAI потратила 7,9 миллиона долларов, или четверть своих функциональных расходов, только на облачные вычисления. [35] Для сравнения, общие расходы DeepMind в 2017 году составили 442 миллиона долларов . Летом 2018 года для простого обучения ботов OpenAI для Dota 2 потребовалось арендовать у Google 128 000 процессоров и 256 графических процессоров на несколько недель.
В 2018 году Маск ушел со своего места в совете директоров, сославшись на «потенциальный будущий конфликт [интересов] » с его ролью генерального директора Tesla из-за разработки Tesla ИИ для беспилотных автомобилей. [36] Сэм Альтман утверждает, что Маск считал, что OpenAI отстает от других игроков, таких как Google, и Маск вместо этого предложил самому взять на себя управление OpenAI, но совет директоров отклонил это предложение. Впоследствии Маск покинул OpenAI, но заявил, что остается донором, но после своего ухода не сделал никаких пожертвований. [37]
В феврале 2019 года был анонсирован GPT-2 , который привлек большое внимание благодаря своей способности генерировать текст, похожий на человеческий. [38]
В 2019 году OpenAI перешла от некоммерческой к «ограниченной» коммерческой, при этом прибыль была ограничена в 100 раз больше любой инвестиции. [39] По мнению OpenAI, модель ограниченной прибыли позволяет OpenAI Global LLC легально привлекать инвестиции от венчурных фондов и, кроме того, предоставлять сотрудникам доли в компании. [40] Многие ведущие исследователи работают в Google Brain , DeepMind или Facebook , которые предлагают опционы на акции, которые некоммерческая организация не смогла бы сделать. [41] До перехода публичное раскрытие информации о вознаграждении высших сотрудников OpenAI было обязательным по закону. [42]
Затем компания распределила акции среди своих сотрудников и стала партнером Microsoft, [43] объявив об инвестиционном пакете в компанию в размере 1 миллиарда долларов. С тех пор системы OpenAI работают на суперкомпьютерной платформе Microsoft на базе Azure . [44] [45] [46]
Затем OpenAI Global LLC объявила о своем намерении коммерчески лицензировать свои технологии. [47] Планировалось потратить 1 миллиард долларов «в течение пяти лет, а возможно, и гораздо быстрее». [48] Альтман заявил, что даже миллиарда долларов может оказаться недостаточно, и что лаборатории в конечном итоге может потребоваться «больше капитала, чем когда-либо собирала любая некоммерческая организация» для создания общего искусственного интеллекта. [49]
Переход от некоммерческой компании к компании с ограниченной прибылью был воспринят со скептицизмом Ореном Эциони из некоммерческого Института Аллена по искусственному интеллекту , который согласился с тем, что привлечь ведущих исследователей в некоммерческую организацию сложно, но заявил: «Я не согласен с представлением о том, что некоммерческая организация может «Не конкурирую» и указал на успешные малобюджетные проекты OpenAI и других. «Если бы больше и лучше финансировалось всегда было лучше, то IBM по-прежнему была бы номером один».
Некоммерческая организация OpenAI, Inc. является единственным держателем контрольного пакета акций OpenAI Global LLC, которая, несмотря на то, что является коммерческой компанией, сохраняет формальную фидуциарную ответственность перед некоммерческим уставом OpenAI, Inc. Большинству членов совета директоров OpenAI, Inc. запрещено иметь финансовые доли в OpenAI Global LLC. [40] Кроме того, миноритарные члены, владеющие долей в OpenAI Global LLC, лишены права некоторых голосов из-за конфликта интересов. [41] Некоторые исследователи утверждают, что переход OpenAI Global LLC на коммерческий статус несовместим с заявлениями OpenAI о «демократизации» ИИ. [50]
В 2020 году OpenAI анонсировала GPT-3 — языковую модель, обученную на больших наборах интернет-данных. GPT-3 предназначен для ответа на вопросы на естественном языке, но он также может переводить между языками и связно генерировать импровизированный текст. Компания также объявила, что связанный API, названный просто «API», станет сердцем ее первого коммерческого продукта. [51]
В 2021 году OpenAI представила DALL-E , специализированную модель глубокого обучения, способную генерировать сложные цифровые изображения из текстовых описаний, используя вариант архитектуры GPT-3. [52]
В декабре 2022 года OpenAI получила широкое освещение в СМИ после запуска бесплатной предварительной версии ChatGPT , своего нового чат-бота с искусственным интеллектом на основе GPT-3.5. По данным OpenAI, за первые пять дней на предварительную версию подписалось более миллиона человек. [53] Согласно анонимным источникам, на которые цитировалось Reuters в декабре 2022 года, OpenAI Global LLC прогнозировала выручку в размере 200 миллионов долларов в 2023 году и 1 миллиард долларов в 2024 году. [54]
В январе 2023 года OpenAI Global LLC вела переговоры о финансировании, которое оценило бы компанию в 29 миллиардов долларов, что вдвое превышает ее стоимость в 2021 году. [55] 23 января 2023 года Microsoft объявила о новых инвестициях в размере 10 миллиардов долларов США в OpenAI Global LLC на несколько лет, частично необходимых для использования службы облачных вычислений Microsoft Azure . [56] [57] Слухи об этой сделке предполагают, что Microsoft может получить 75% прибыли OpenAI до тех пор, пока она не обеспечит возврат инвестиций и 49% акций компании. [58] Считается, что эти инвестиции являются частью усилий Microsoft по интеграции ChatGPT OpenAI в поисковую систему Bing. Google анонсировал аналогичное приложение искусственного интеллекта ( Bard ) после запуска ChatGPT, опасаясь, что ChatGPT может поставить под угрозу место Google как источника информации. [59] [60]
7 февраля 2023 года Microsoft объявила, что встраивает технологию искусственного интеллекта на той же основе, что и ChatGPT, в Microsoft Bing , Edge , Microsoft 365 и другие продукты. [61]
3 марта 2023 года Рид Хоффман подал в отставку со своего места в совете директоров, сославшись на желание избежать конфликта интересов с его инвестициями в компании, занимающиеся искусственным интеллектом через Greylock Partners , и сооснованием AI-стартапа Inflection AI . Хоффман остался в совете директоров Microsoft, крупного инвестора OpenAI. [62]
14 марта 2023 года OpenAI выпустила GPT-4 как в качестве API (со списком ожидания), так и в качестве функции ChatGPT Plus. [63]
22 мая 2023 года Сэм Альтман, Грег Брокман и Илья Суцкевер опубликовали рекомендации по управлению сверхинтеллектом . [64] Они считают, что сверхразум может появиться в течение следующих 10 лет, что обеспечит «значительно более процветающее будущее» и что «учитывая возможность экзистенциального риска, мы не можем просто реагировать». Они предлагают создать международную наблюдательную организацию, подобную МАГАТЭ, для надзора за системами ИИ, превышающими определенный порог возможностей, предполагая, что относительно слабые системы ИИ с другой стороны не должны чрезмерно регулироваться. Они также призывают к большему количеству исследований в области технической безопасности сверхразумов и просят усилить координацию, например, посредством запуска правительствами совместного проекта, частью которого «становятся многие текущие усилия». [64] [65]
В августе 2023 года было объявлено, что OpenAI приобрела нью-йоркский стартап Global Illumination, компанию, которая использует искусственный интеллект для разработки цифровой инфраструктуры и креативных инструментов. [66]
21 сентября 2023 года Microsoft начала ребрендинг всех вариантов своего Copilot на Microsoft Copilot , включая бывший Bing Chat и Microsoft 365 Copilot . [67] В декабре 2023 года этой стратегии последовали путем добавления MS-Copilot ко многим установкам Windows 11 и Windows 10 , а также отдельного приложения Microsoft Copilot, выпущенного для Android [68] и впоследствии выпущенного для iOS . [69]
В октябре 2023 года Сэм Альтман и Пэн Сяо, генеральный директор эмиратской ИИ-фирмы G42 , объявили, что Open AI позволит G42 развернуть технологию Open AI. [70]
6 ноября 2023 года OpenAI запустила GPT, позволяющую людям создавать индивидуальные версии ChatGPT для конкретных целей, что еще больше расширяет возможности приложений ИИ в различных отраслях. [71] 14 ноября 2023 г. OpenAI объявила, что временно приостановила регистрацию новых пользователей ChatGPT Plus из-за высокого спроса. [72] Доступ для новых подписчиков вновь открылся через месяц, 13 декабря. [73]
17 ноября 2023 года Сэм Альтман был отстранен от должности генерального директора по решению совета директоров (в состав которого входили Хелен Тонер , Илья Суцкевер, Адам Д'Анджело и Таша МакКоли) из-за отсутствия доверия к нему, а его должность занял технический директор Мира Мурати . временный генеральный директор. Грег Брокман, президент OpenAI, был отстранен от должности председателя правления. [74] [75] Брокман подал в отставку с поста президента компании вскоре после объявления и сообщил некоторые подробности событий, произошедших перед его уходом. [76] [77] За этим последовала отставка трех старших исследователей OpenAI: директора по исследованиям и руководителя GPT-4 Якуба Пачоцкого, руководителя отдела рисков ИИ Александра Мадри и исследователя Шимона Сидора. [78] [79]
Сообщается, что 18 ноября 2023 года велись разговоры о возвращении Альтмана к своей роли генерального директора на фоне давления на совет директоров со стороны таких инвесторов, как Microsoft и Thrive Capital , которые осудили уход Альтмана. [80] Хотя сам Альтман высказался за возвращение в OpenAI, он заявил, что рассматривает возможность создания новой компании и привлечения к себе бывших сотрудников OpenAI, если переговоры не увенчаются успехом. [81] Если Альтман вернется, члены совета согласились, что они «в принципе» уйдут из компании. [82] 19 ноября 2023 года переговоры с Альтманом о возвращении в компанию провалились, и Мурати был заменен Эмметом Широм, который занял пост временного генерального директора. [83] Совет первоначально связался с генеральным директором Anthropic Дарио Амодеи, который был бывшим руководителем OpenAI, чтобы заменить Альтмана, и предложил слияние , оба предложения были отклонены. [84]
20 ноября 2023 года генеральный директор Microsoft Сатья Наделла объявил, что Альтман и Брокман присоединятся к компании, чтобы возглавить новую исследовательскую группу в области передового искусственного интеллекта, и заявили, что они по-прежнему привержены OpenAI, несмотря на поворот событий. [85] Партнерство не было завершено, поскольку Альтман дал совету директоров еще одну возможность вести переговоры с ним. [86] Около 738 из 770 сотрудников OpenAI, включая Мурати и Суцкевера, подписали открытое письмо, в котором заявили, что уйдут с работы и присоединятся к Microsoft, если совет директоров не наймет повторно Альтмана на должность генерального директора, а затем уйдет в отставку. [87] [88] Инвесторы рассматривали возможность принятия судебных мер против членов совета директоров в ответ на потенциальные массовые отставки и отстранение Альтмана. [89] В ответ руководство OpenAI разослало сотрудникам внутреннюю памятку, в которой говорилось, что переговоры с Альтманом и советом директоров возобновляются и займут некоторое время. [90]
21 ноября 2023 года, после продолжающихся переговоров, Альтман и Брокман вернулись в компанию на свои прежние должности вместе с обновленным советом директоров, состоящим из новых членов Брета Тейлора (в качестве председателя) и Лоуренса Саммерса , при этом остался Д'Анджело. [91] 22 ноября 2023 года появились сообщения, предполагающие, что увольнение Сэма Альтмана из OpenAI может быть связано с его предполагаемым неправильным выполнением значительного прорыва в секретном проекте организации под кодовым названием Q*. По словам источников в OpenAI, Q* направлен на развитие способностей ИИ к логическому и математическому рассуждению и, как сообщается, предполагает выполнение математических действий на уровне учащихся начальной школы. [92] [93] [94] Обеспокоенность по поводу реакции Альтмана на это событие, особенно в отношении потенциальных последствий открытия для безопасности, как сообщается, была высказана совету директоров компании незадолго до его увольнения. [95] [96] 29 ноября 2023 года OpenAI объявила, что анонимный сотрудник Microsoft присоединился к совету директоров в качестве члена без права голоса для наблюдения за деятельностью компании. [97]
В январе 2024 года OpenAI объявила о формировании новой команды коллективного согласования, которая будет стремиться реализовать идеи общественности о том, как гарантировать, что ее модели «соответствуют ценностям человечества». Этот шаг был связан с публичной программой, запущенной в мае 2023 года. Компания хотела, чтобы программа рассматривалась отдельно от ее коммерческих начинаний. Этот шаг произошел на фоне пристального внимания со стороны регулирующих органов по всему миру. [98]
Также в январе 2024 года OpenAI объявила о партнерстве с Университетом штата Аризона , впервые с колледжем, которое позволит этому учреждению иметь полный доступ к ChatGPT Enterprise. АГУ планировал включить его, среди прочего, в курсы, репетиторство и исследования. [99]
Ключевые сотрудники:
Правление некоммерческой организации OpenAI: [97]
Индивидуальные инвесторы: [100]
Корпоративные инвесторы:
Некоторые ученые, такие как Стивен Хокинг и Стюарт Рассел , выражают обеспокоенность тем, что, если продвинутый ИИ когда-нибудь обретет способность перепроектировать себя со все возрастающей скоростью, неудержимый « интеллектуальный взрыв » может привести к вымиранию человечества . Соучредитель Маск характеризует ИИ как «самую большую экзистенциальную угрозу человечеству». [107]
Маск и Альтман заявили, что они частично мотивированы опасениями по поводу безопасности ИИ и экзистенциального риска, связанного с общим искусственным интеллектом . [108] [109] OpenAI заявляет, что «трудно представить, насколько ИИ человеческого уровня может принести пользу обществу», и что столь же трудно понять, «насколько он может нанести вред обществу, если он будет построен или использован неправильно». [24] Исследования по безопасности нельзя безопасно откладывать: «из-за удивительной истории ИИ трудно предсказать, когда ИИ человеческого уровня может оказаться в пределах досягаемости». [110] OpenAI заявляет, что ИИ «должен быть продолжением индивидуальной человеческой воли и, в духе свободы, распространяться как можно более широко и равномерно». [24] Сопредседатель Сэм Альтман ожидает, что рассчитанный на десятилетия проект превзойдет человеческий интеллект. [111]
Вишал Сикка , бывший генеральный директор Infosys, заявил, что «открытость», при которой усилия «приведут к результатам в целом в интересах человечества», является фундаментальным требованием для его поддержки, и что OpenAI «очень хорошо согласуется с нашими давними традициями». ценности» и их «стремление выполнять целенаправленную работу». [112] Кейд Мец из Wired предполагает, что такие корпорации, как Amazon, могут быть мотивированы желанием использовать программное обеспечение и данные с открытым исходным кодом, чтобы уравнять правила игры с такими корпорациями, как Google и Facebook, которые владеют огромными запасами закрытых данных. Альтман заявляет, что компании Y Combinator поделятся своими данными с OpenAI. [111]
В первые годы перед своим уходом в 2018 году Маск задал вопрос: «Что мы можем сделать лучше всего, чтобы обеспечить хорошее будущее? Мы могли бы сидеть в стороне, или мы могли бы поощрять регулирующий надзор, или мы могли бы участвовать с правом структура с людьми, которые глубоко заботятся о разработке ИИ безопасным и полезным для человечества способом». Маск признал, что «всегда существует некоторый риск того, что, пытаясь продвигать (дружественный) ИИ, мы можем создать то, что нас беспокоит»; тем не менее, лучшая защита — это «дать возможность как можно большему количеству людей иметь ИИ. Если у каждого есть способности ИИ, то не существует ни одного человека или небольшой группы людей, которые могли бы обладать сверхсилой ИИ». [100]
Противоречивая стратегия Маска и Альтмана, направленная на снижение риска того, что ИИ нанесет общий вред, путем предоставления ИИ всем, вызывает споры среди тех, кто обеспокоен экзистенциальным риском, исходящим от искусственного интеллекта. Философ Ник Бостром скептически относится к подходу Маска: «Если у вас есть кнопка, которая может причинить миру плохие вещи, вы не захотите раздавать ее всем». [109] Во время разговора о технологической сингулярности в 2016 году Альтман сказал, что «мы не планируем публиковать весь наш исходный код», и упомянул о плане «позволить широким слоям населения мира выбирать представителей в новый совет управления». Грег Брокман заявил: «Наша цель сейчас… сделать все возможное. Это немного расплывчато». [113]
И наоборот, первоначальное решение OpenAI отказаться от GPT-2 примерно в 2019 году из-за желания «проявить осторожность» в случае потенциального неправильного использования подверглось критике со стороны сторонников открытости. Делип Рао, эксперт по генерации текста, заявил: «Я не думаю, что [OpenAI] потратил достаточно времени, чтобы доказать, что [GPT-2] действительно опасен». Другие критики утверждали, что открытая публикация необходима для повторения результатов исследования и разработки контрмер. [114]
Совсем недавно, в 2022 году, OpenAI опубликовала свой подход к проблеме выравнивания . Они ожидают, что привести ОИИ в соответствие с человеческими ценностями, вероятно, сложнее, чем привести в соответствие существующие системы ИИ: «Несогласованный ОИИ может представлять существенные риски для человечества, а решение проблемы согласования ОИИ может быть настолько трудным, что потребуется совместная работа всего человечества». Они исследуют, как лучше использовать обратную связь от людей для обучения систем искусственного интеллекта. Они также рассматривают возможность использования ИИ для постепенной автоматизации исследований по выравниванию. [115] После реорганизации в ноябре 2023 года возвращение Альтмана на пост генерального директора и состав нового совета директоров без Суцкевера указывают на вероятный сдвиг стратегии в сторону усиления бизнес-ориентации и снижения влияния осторожных людей в OpenAI. [116]
OpenAI утверждает, что разработала способ использования GPT-4, своей флагманской модели генеративного искусственного интеллекта, для модерации контента [117] , что облегчает нагрузку на команды людей.
По состоянию на 2021 год [update]исследования OpenAI были сосредоточены на обучении с подкреплением (RL). [118] OpenAI рассматривается как важный конкурент DeepMind . [119]
Анонсированный в 2016 году, Gym стремится предоставить легко реализуемый эталон общего интеллекта в самых разных средах — аналогичный, но более широкий, чем ImageNet Large Scale Visual Recognition Challenge , используемый в исследованиях контролируемого обучения . Он надеется стандартизировать определение среды в исследовательских публикациях по ИИ, чтобы опубликованные исследования стало легче воспроизводить. [28] [120] Проект утверждает, что предоставляет пользователю простой интерфейс. По состоянию на июнь 2017 года Gym можно использовать только с Python . [121] По состоянию на сентябрь 2017 года сайт документации Gym не обслуживался, и вместо этого активная работа была сосредоточена на его странице GitHub . [122] [ нужен неосновной источник ]
Выпущенный в 2017 году, RoboSumo представляет собой виртуальный мир , в котором гуманоидные роботы-агенты, обучающиеся метаобучению , изначально не знают, как даже ходить, но перед ними поставлена цель научиться двигаться и выталкивать противостоящего агента с ринга. [123] Благодаря этому состязательному процессу обучения агенты учатся адаптироваться к меняющимся условиям; когда агент затем удаляется из этой виртуальной среды и помещается в новую виртуальную среду с сильным ветром, агент пытается оставаться в вертикальном положении, что позволяет предположить, что он научился балансировать в обобщенном виде. [123] [124] Игорь Мордач из OpenAI утверждает, что конкуренция между агентами может создать интеллектуальную «гонку вооружений», которая может повысить способность агента функционировать даже вне контекста конкуренции. [123]
OpenAI Five — это команда из пяти ботов , курируемых OpenAI, используемых в соревновательной видеоигре Dota 2 « пять на пять» , которые учатся играть против игроков-людей на высоком уровне навыков исключительно с помощью алгоритмов проб и ошибок. Прежде чем стать командой из пяти человек, первая публичная демонстрация произошла на The International 2017 , ежегодном премьерном турнире чемпионата по игре, где Dendi , профессиональный украинский игрок, проиграл боту в живом матче один на один. [125] [126] После матча технический директор Грег Брокман объяснил, что бот учился, играя против самого себя в течение двух недель в режиме реального времени , и что обучающее программное обеспечение было шагом в направлении создания программного обеспечения, которое может решать сложные задачи, такие как хирург. [127] [128] Система использует форму обучения с подкреплением , поскольку боты со временем учатся, играя против самих себя сотни раз в день в течение месяцев, и получают вознаграждение за такие действия, как убийство врага и достижение целей на карте. [129] [130] [131]
К июню 2018 года возможности ботов расширились и теперь они могут играть всей командой из пяти человек, и они смогли побеждать команды любителей и полупрофессиональных игроков. [132] [129] [133] [134] На The International 2018 OpenAI Five сыграла два показательных матча против профессиональных игроков, но в итоге проиграла обе игры. [135] [136] [137] В апреле 2019 года OpenAI Five победила OG , действующих на тот момент чемпионов мира по игре, со счетом 2:0 в показательном матче в Сан-Франциско. [138] [139] Последнее публичное выступление ботов состоялось позже в том же месяце, когда они сыграли в общей сложности 42 729 игр в четырехдневном открытом онлайн-соревновании, выиграв 99,4% этих игр. [140]
Механизмы OpenAI Five в боте-игроке Dota 2 демонстрируют проблемы систем искусственного интеллекта в многопользовательских онлайн-играх на боевой арене (MOBA) и то, как OpenAI Five продемонстрировала использование агентов глубокого обучения с подкреплением (DRL) для достижения сверхчеловеческой компетентности в матчах Dota 2. [141]
Gym Retro, выпущенная в 2018 году, представляет собой платформу для исследований в области видеоигр с подкреплением обучения (RL). [142] Gym Retro используется для исследования алгоритмов RL и изучения обобщения. Предыдущие исследования RL были сосредоточены в основном на оптимизации агентов для решения отдельных задач. Gym Retro дает возможность делать обобщения между играми со схожими концепциями, но разным внешним видом.
В 2018 году OpenAI запустила игру «Дебаты», которая учит машины обсуждать игрушечные проблемы перед судьей-человеком. Цель состоит в том, чтобы исследовать, может ли такой подход помочь в проверке решений ИИ и в разработке объяснимого ИИ . [143] [144]
Разработанный в 2018 году, Dactyl использует машинное обучение для обучения Shadow Hand , человекоподобной руки робота, манипулированию физическими объектами. [145] Он полностью обучается посредством моделирования, используя те же алгоритмы RL и обучающий код, что и OpenAI Five. OpenAI решил проблему объектной ориентации, используя рандомизацию предметной области — подход моделирования, который предоставляет учащемуся разнообразный опыт, а не пытается соответствовать реальности. Установка Dactyl, помимо камер отслеживания движения, также включает камеры RGB , позволяющие роботу манипулировать произвольным объектом, видя его. В 2018 году OpenAI показала, что система способна манипулировать кубом и восьмиугольной призмой. [146]
В 2019 году OpenAI продемонстрировала, что Dactyl может собирать кубик Рубика . Робот смог решить головоломку в 60% случаев. Такие объекты, как кубик Рубика, представляют собой сложную физику, которую труднее моделировать. OpenAI добилась этого, повысив устойчивость Dactyl к возмущениям с помощью автоматической рандомизации доменов (ADR), подхода моделирования, позволяющего создавать все более сложные среды. ADR отличается от ручной рандомизации доменов тем, что не требуется, чтобы человек указывал диапазоны рандомизации. [147]
В июне 2020 года OpenAI анонсировала многоцелевой API , который, по ее словам, предназначен «для доступа к новым моделям ИИ, разработанным OpenAI», чтобы позволить разработчикам использовать его для «любых задач ИИ на английском языке». [148] [149]
Компания выпустила несколько генеративных моделей. [150]
Оригинальная статья о генеративном предварительном обучении языковой модели на основе преобразователя была написана Алеком Рэдфордом и его коллегами и опубликована в виде препринта на веб-сайте OpenAI 11 июня 2018 года. [151] Она показала, как генеративная модель языка способна приобретать мировые знания и обрабатывать долгосрочные зависимости путем предварительного обучения на разнообразном корпусе с длинными участками непрерывного текста.
Генеративный предварительно обученный трансформатор 2 («GPT-2») — это неконтролируемая языковая модель преобразователя , преемница исходной модели GPT OpenAI («GPT-1»). GPT-2 был анонсирован в феврале 2019 года, и первоначально публике были представлены лишь ограниченные демонстрационные версии. Полная версия GPT-2 не была сразу выпущена из-за опасений по поводу возможного неправомерного использования, в том числе приложениями для написания фейковых новостей . [152] Некоторые эксперты выразили скептицизм по поводу того, что GPT-2 представляет собой серьезную угрозу.
В ответ на GPT-2 Институт искусственного интеллекта Аллена ответил инструментом для обнаружения «нейронных фейковых новостей». [153] Другие исследователи, такие как Джереми Ховард, предупреждали о «технологии, позволяющей полностью заполнить Твиттер, электронную почту и Интернет разумно звучащей, соответствующей контексту прозой, которая заглушит всю остальную речь и ее будет невозможно отфильтровать». . [154] В ноябре 2019 года OpenAI выпустила полную версию языковой модели GPT-2. [155] На нескольких веб-сайтах размещаются интерактивные демонстрации различных экземпляров ГПТ-2 и других моделей трансформаторов. [156] [157] [158]
Авторы GPT-2 утверждают, что языковые модели без присмотра подходят для обучения общего назначения, что иллюстрируется тем, что GPT-2 достигает высочайшей точности и сложности в 7 из 8 задач с нулевым выстрелом (т. е. модель не подвергалась дальнейшему обучению ни для одной задачи). -конкретные примеры ввода-вывода).
Корпус, на котором он обучался, под названием WebText, содержит чуть более 8 миллионов документов, что в общей сложности составляет 40 гигабайт текста с URL-адресов , опубликованных в материалах Reddit , получивших как минимум 3 голоса «за» . Это позволяет избежать определенных проблем с кодированием словаря с помощью токенов слов с помощью кодирования пар байтов . Это позволяет представлять любую строку символов путем кодирования как отдельных символов, так и многосимвольных токенов. [159]
Генеративный предварительно обученный [a] Transformer 3 (GPT-3), впервые описанный в мае 2020 года, представляет собой неконтролируемую языковую модель преобразователя и преемницу GPT-2. [161] [162] [163] OpenAI заявила, что полная версия GPT-3 содержит 175 миллиардов параметров , [163] на два порядка больше, чем 1,5 миллиарда параметров [164] в полной версии GPT-2 (хотя GPT Также были обучены 3 модели всего со 125 миллионами параметров). [165]
OpenAI заявила, что GPT-3 успешно справляется с некоторыми задачами « метаобучения ». Он может обобщить назначение одной пары ввода-вывода. В выпуске GPT-3 приводится пример перевода и межъязыкового переноса обучения между английским и румынским, а также между английским и немецким языками. [163]
GPT-3 значительно улучшил результаты тестов по сравнению с GPT-2. OpenAI предупредила, что такое масштабирование языковых моделей может приблизиться или столкнуться с фундаментальными ограничениями возможностей прогнозирующих языковых моделей. [166] Предварительное обучение GPT-3 потребовало нескольких тысяч петафлопс/с-дней [b] вычислений по сравнению с десятками петафлопс/с-дней для полной модели GPT-2. [163] Как и ее предшественница, [152] обученная модель GPT-3 не была сразу опубликована из-за возможного злоупотребления, хотя OpenAI планировала разрешить доступ через платный облачный API после двухмесячного бесплатного закрытого бета-тестирования, которое началось в июне 2020 года. [148] [168]
23 сентября 2020 г. лицензия на GPT-3 была предоставлена исключительно Microsoft. [169] [170]
Codex, анонсированный в середине 2021 года, является потомком GPT-3, который дополнительно прошел обучение на коде из 54 миллионов репозиториев GitHub [171] [172] и является ИИ, лежащим в основе инструмента автодополнения кода GitHub Copilot . [172] В августе 2021 года API был выпущен в закрытой бета-версии. [173] По данным OpenAI, модель может создавать рабочий код более чем на дюжине языков программирования, наиболее эффективно на Python. [171]
Было поднято несколько проблем, связанных с сбоями, недостатками дизайна и уязвимостями безопасности. [174] [175]
GitHub Copilot был обвинен в распространении кода, защищенного авторским правом, без указания автора или лицензии. [176]
OpenAI объявила, что собирается прекратить поддержку Codex API начиная с 23 марта 2023 года. [177]
Whisper, выпущенный в 2022 году, представляет собой модель распознавания речи общего назначения. [178] Он обучается на большом наборе данных разнообразного аудио, а также представляет собой многозадачную модель, которая может выполнять многоязычное распознавание речи, а также перевод речи и идентификацию языка. [179]
14 марта 2023 года OpenAI объявила о выпуске генеративного предварительно обученного трансформатора 4 (GPT-4), способного принимать ввод текста или изображений. [180] OpenAI объявила, что обновленная технология прошла симулированный экзамен на адвоката в юридической школе, набрав около 10% лучших участников теста; напротив, предыдущая версия, GPT-3.5, набрала около нижних 10%. GPT-4 также может читать, анализировать или генерировать до 25 000 слов текста, а также писать код на всех основных языках программирования. [181]
Наблюдатели сообщили, что версия ChatGPT с использованием GPT-4 является улучшением предыдущей версии, основанной на GPT-3.5, с оговоркой, что GPT-4 сохраняет некоторые проблемы предыдущих версий. [182] GPT-4 также способен принимать изображения в качестве входных данных в ChatGPT. [183] OpenAI отказалась раскрыть различные технические подробности и статистику о GPT-4, например точный размер модели. [184]
MuseNet, выпущенная в 2019 году, представляет собой глубокую нейронную сеть, обученную прогнозировать последующие музыкальные ноты в музыкальных файлах MIDI . Он может генерировать песни с 10 инструментами в 15 стилях. По данным The Verge , песня, созданная MuseNet, имеет тенденцию начинаться разумно, но затем, чем дольше она играет, впадает в хаос. [185] [186] В поп-культуре первые применения этого инструмента были использованы еще в 2020 году в интернет-психологическом триллере « Бен утонул» для создания музыки для главного героя. [187] [188]
Выпущенный в 2020 году Jukebox представляет собой алгоритм с открытым исходным кодом для создания музыки с вокалом. После обучения на 1,2 миллионах сэмплов система принимает жанр, исполнителя и фрагмент текста и выводит образцы песен. OpenAI заявила, что песни «демонстрируют местную музыкальную последовательность [и] следуют традиционным образцам аккордов», но признала, что в песнях отсутствуют «знакомые более крупные музыкальные структуры, такие как повторяющиеся припевы», и что «существует значительный разрыв» между музыкальным автоматом и музыкой, созданной человеком. . The Verge заявила: «Это технологически впечатляет, даже если результаты звучат как мягкие версии песен, которые могут показаться знакомыми», в то время как Business Insider заявил, что «на удивление, некоторые из получившихся песен запоминаются и звучат вполне законно». [189] [190] [191]
Выпущенный в 2020 году альбом Microscope [192] представляет собой набор визуализаций каждого значимого слоя и нейрона восьми моделей нейронных сетей, которые часто изучаются на предмет интерпретируемости. [193] Микроскоп был создан для легкого анализа особенностей, которые формируются внутри этих нейронных сетей. Включенные модели: AlexNet , VGG 19, различные версии Inception и разные версии CLIP Resnet . [194]
Представленная в 2021 году модель DALL-E представляет собой модель-трансформер, которая создает изображения на основе текстовых описаний. [195]
CLIP, также представленный в 2021 году, классифицирует изображения с помощью текстовых описаний. [196] DALL-E использует версию GPT-3 с 12 миллиардами параметров для интерпретации входных данных естественного языка (таких как «зеленый кожаный кошелек в форме пятиугольника» или «изометрический вид грустной капибары») и генерации соответствующих изображений. Он может создавать изображения как реалистичных объектов («витраж с изображением синей клубники»), так и объектов, не существующих в реальности («куб с фактурой дикобраза»). По состоянию на март 2021 г. API или код недоступны.
В апреле 2022 года OpenAI анонсировала DALL-E 2 — обновленную версию модели с более реалистичными результатами. [197] В декабре 2022 года OpenAI опубликовала на GitHub программное обеспечение для Point-E, новой элементарной системы преобразования текстового описания в трехмерную модель. [198]
В сентябре 2023 года OpenAI анонсировала DALL-E 3, более мощную модель, которая лучше способна генерировать изображения на основе сложных описаний без ручного быстрого проектирования и отображать сложные детали, такие как руки и текст. [199] В октябре он был представлен публике как функция ChatGPT Plus. [200]
ChatGPT, запущенный в ноябре 2022 года, представляет собой инструмент искусственного интеллекта, созданный на базе GPT-3 и обеспечивающий диалоговый интерфейс, позволяющий пользователям задавать вопросы на естественном языке . Затем система отвечает ответом в течение нескольких секунд. ChatGPT достиг 1 миллиона пользователей через 5 дней после запуска. [201] [202]
С 2023 года ChatGPT Plus представляет собой версию ChatGPT с поддержкой GPT-4 [203] , доступную за абонентскую плату в размере 20 долларов США в месяц [204] (исходная версия поддерживается GPT-3.5). [205] OpenAI также делает GPT-4 доступным избранной группе кандидатов через список ожидания API GPT-4; [206] после принятия за доступ взимается дополнительная плата в размере 0,03 доллара США за 1000 токенов в исходном тексте, предоставленном модели («подсказка»), и 0,06 доллара США за 1000 токенов, которые генерирует модель («завершение»). к версии модели с контекстным окном на 8192 токена; для контекстного окна с 32768 токенами цены удваиваются. [207]
В мае 2023 года OpenAI запустила пользовательский интерфейс ChatGPT для App Store на iOS, а позднее, в июле 2023 года, для Play Store на Android. [208] Приложение поддерживает синхронизацию истории чата и голосовой ввод (с использованием Whisper , модели распознавания речи OpenAI ). [209] [208] [210] В сентябре 2023 года OpenAI объявила, что ChatGPT «теперь может видеть, слышать и говорить». Пользователи ChatGPT Plus могут загружать изображения, а пользователи мобильных приложений могут общаться с чат-ботом. [211] [212]
В октябре 2023 года последняя модель генерации изображений OpenAI, DALL-E 3 , была интегрирована в ChatGPT Plus и ChatGPT Enterprise. При интеграции используется ChatGPT для написания подсказок для DALL-E, основанных на разговоре с пользователями. [213] [214]
Запуск GPT Store OpenAI, первоначально запланированный к запуску в 2023 году, теперь отложен на нераскрытую дату в начале 2024 года, что, вероятно, связано со сменой руководства в ноябре после первоначального объявления. [215]
В январе 2023 года OpenAI подверглась критике за передачу аннотаций наборов данных , включая токсичный [ требуется определение ] контент , компании Sama , базирующейся в Сан-Франциско, но нанимающей работников в Кении . Эти аннотации использовались для обучения модели искусственного интеллекта обнаружению токсичности, которую затем можно было использовать для фильтрации токсичного контента, в частности, из обучающих данных и выходных данных ChatGPT. Но эти фрагменты текста обычно содержали подробные описания различных видов насилия, в том числе сексуального. Четверо сотрудников Sama, опрошенные Time, назвали себя психически травмированными. OpenAI платила Sama 12,50 долларов за час работы, а Sama перераспределяла своим комментаторам сумму, эквивалентную 1,32–2,00 доллара в час после уплаты налогов. Представитель Sama заявил, что эти 12,50 долларов также покрывают другие неявные затраты, среди которых расходы на инфраструктуру, обеспечение качества и управление. [216]
В марте 2023 года компанию также раскритиковали за раскрытие особенно небольшого количества технических подробностей о таких продуктах, как GPT-4, что противоречит ее первоначальному стремлению к открытости и затрудняет независимым исследователям возможность воспроизвести ее работу и разработать меры безопасности. OpenAI оправдала этот стратегический поворот соображениями конкурентоспособности и безопасности. Главный научный сотрудник OpenAI Илья Суцкевер в 2023 году утверждал, что открывать все более функциональные модели с открытым исходным кодом становится все более рискованным, ожидая, что причины безопасности отказа от открытого исходного кода наиболее мощных моделей ИИ станут «очевидными» через несколько лет. [217]
В июле 2023 года на OpenAI подали в суд за нарушение авторских прав авторы Сара Сильверман , Мэтью Баттерик , Пол Трамбле и Мона Авад . [218] [219] [220] The New York Times также планировала подать иск, который был подан в конце декабря. 2023. [219] [221] В сентябре 2023 года 17 авторов, в том числе Джордж Р.Р. Мартин , Джон Гришэм , Джоди Пиколт и Джонатан Франзен , присоединились к Гильдии авторов в подаче коллективного иска против OpenAI, утверждая, что технология компании использовалась незаконно. их защищенная авторским правом работа. [222] [223]
В августе 2023 года на OpenAI подали в суд за нарушение Общих правил ЕС по защите данных. [224] [225] В апреле 2023 года Европейский совет по защите данных ЕС (EDPB) сформировал специальную рабочую группу по ChatGPT, «чтобы способствовать сотрудничеству и обмену информацией о возможные принудительные меры, предпринимаемые органами по защите данных», на основе «принудительных действий, предпринятых итальянским органом по защите данных против Open AI в отношении службы Chat GPT». [226]
В ноябре 2023 года руководство OpenAI и его студентов-магистров обвинили в дегуманизации палестинцев. [227] [228] [229]
OpenAI незаметно сняла запрет на использование ChatGPT для «военных и военных целей». До 10 января «политика использования» OpenAI включала запрет на «деятельность, сопряженную с высоким риском физического вреда, включая», в частности, «разработку оружия» и «военную и военную деятельность». Новые правила запрещают «использовать наш сервис, чтобы причинить вред себе или другим», а также «разрабатывать или использовать оружие». [230] [231]
Для сравнения, в 2022 году выручка составила всего 28 миллионов долларов, в основном от продажи доступа к программному обеспечению искусственного интеллекта... Убытки OpenAI примерно удвоились и составили примерно 540 миллионов долларов в прошлом году, когда она разработала ChatGPT...
Вместо этого Соединенные Штаты создали новую область доминирования, на которую остальной мир смотрит со смесью благоговения, зависти и негодования: искусственный интеллект... От моделей ИИ и исследований до облачных вычислений и венчурного капитала, американские компании, Университеты и исследовательские лаборатории – и их филиалы в странах-союзниках – похоже, имеют огромное преимущество как в разработке передового искусственного интеллекта, так и в его коммерциализации.
Стоимость венчурных инвестиций в стартапы в области искусственного интеллекта в США превышает аналогичные показатели остального мира вместе взятых.
{{cite web}}
: CS1 maint: multiple names: authors list (link)Создано в сотрудничестве и исключительно для OpenAI.
Суперкомпьютер Microsoft OpenAI имеет 285 000 процессорных ядер и 10 000 графических процессоров.
Это одна из пяти самых быстрых систем в мире.
{{cite web}}
: CS1 maint: multiple names: authors list (link)Некоторые в OpenAI считают, что Q* (произносится как Q-Star) может стать прорывом в поиске стартапом так называемого общего искусственного интеллекта (AGI), сообщил агентству Reuters один из собеседников.
OpenAI определяет AGI как автономные системы, которые превосходят людей в большинстве экономически ценных задач.
Альтман сказал, что они ожидают, что этот десятилетний проект превзойдет человеческий интеллект.
Почему OpenAI решила выпустить API вместо того, чтобы открывать исходный код моделей?
Есть три основные причины, по которым мы это сделали.
Во-первых, коммерциализация технологии помогает нам оплачивать наши текущие исследования в области искусственного интеллекта, безопасность и политику.
Во-вторых, многие модели, лежащие в основе API, очень велики, поэтому для их разработки и развертывания требуется большой опыт, а их эксплуатация обходится очень дорого.
Это затрудняет получение выгоды от базовой технологии для кого-либо, кроме крупных компаний.
Мы надеемся, что API сделает мощные системы искусственного интеллекта более доступными для небольших предприятий и организаций.
В-третьих, модель API позволяет нам легче реагировать на неправомерное использование технологии.
Поскольку трудно предсказать последующие варианты использования наших моделей, по своей сути безопаснее выпустить их через API и расширить доступ с течением времени, чем выпускать модель с
открытым исходным кодом
, где доступ нельзя регулировать, если окажется, что в ней есть вредоносные приложения. .
Если вы когда-нибудь хотели опробовать хваленый набор инструментов машинного обучения OpenAI, это стало намного проще.
Компания выпустила API, который позволяет разработчикам использовать свои инструменты искусственного интеллекта «практически для любой задачи на английском языке».
Интуиция, лежащая в основе предварительно обученных языковых моделей, заключается в создании черного ящика, который понимает язык, и затем его можно попросить выполнить любую конкретную задачу на этом языке.
GPT-2, представляет собой преобразователь параметров 1,5B.
Так как мы увеличиваем емкость более чем на два порядка от ГПТ-2 до ГПТ-3
Петафлопс/с-день (pfs-день) состоит из выполнения 10
15
операций нейронной сети в секунду в течение одного дня, или всего около 10
20
операций.
Результат вычисления времени служит для умственного удобства, аналогично киловатт-часам для энергии.
{{cite web}}
: CS1 maint: archived copy as title (link)