OpenAI — американская исследовательская организация в области искусственного интеллекта (ИИ), основанная в декабре 2015 года со штаб-квартирой в Сан-Франциско, Калифорния. Её миссия заключалась в разработке «безопасного и полезного» общего искусственного интеллекта (AGI), который она определяла как «высокоавтономные системы, превосходящие людей в большинстве экономически ценных работ». [5] Как ведущая организация в продолжающемся буме ИИ , [6] OpenAI известна семейством больших языковых моделей GPT , серией моделей преобразования текста в изображение DALL-E и моделью преобразования текста в видео под названием Sora . [7] [8] Выпуск ChatGPT в ноябре 2022 года считается катализатором широкого интереса к генеративному ИИ .
Организация состояла из некоммерческой организации OpenAI, Inc. [ 9], зарегистрированной в штате Делавэр , и ее коммерческой дочерней компании, созданной в 2019 году, OpenAI Global, LLC. [10] Microsoft владела примерно 49% капитала OpenAI , инвестировав 13 миллиардов долларов США. [11] Она также предоставляет вычислительные ресурсы OpenAI через свою облачную платформу Microsoft Azure . [12]
В 2023 и 2024 годах OpenAI столкнулась с многочисленными исками о предполагаемом нарушении авторских прав против авторов и медиакомпаний, чьи работы использовались для обучения некоторых продуктов OpenAI. В ноябре 2023 года совет директоров OpenAI отстранил Сэма Альтмана от должности генерального директора, сославшись на отсутствие доверия к нему, а затем восстановил его в должности пять дней спустя после переговоров, приведших к реорганизации совета директоров. Многие исследователи безопасности ИИ покинули OpenAI в 2024 году. [13] [14]
В декабре 2015 года OpenAI была основана Сэмом Альтманом , Илоном Маском , Ильей Суцкевером , Грегом Брокманом , Тревором Блэквеллом , Вики Чунгом, Андреем Карпати , Дёрком Кингмой, Джоном Шульманом, Памелой Вагата и Войцехом Зарембой , а Сэм Альтман и Илон Маск были сопредседателями. В общей сложности 1 миллиард долларов в качестве капитала пообещали Сэм Альтман, Грег Брокман, Илон Маск, Рид Хоффман , Джессика Ливингстон , Питер Тиль , Amazon Web Services (AWS), Infosys и YC Research . [15] [16] Фактическая собранная общая сумма взносов составила всего 130 миллионов долларов до 2019 года. [10] Согласно расследованию, проведенному TechCrunch , Маск был ее крупнейшим спонсором, в то время как YC Research вообще ничего не внесла. [17] Организация заявила, что будет «свободно сотрудничать» с другими учреждениями и исследователями, сделав свои патенты и исследования открытыми для общественности. [18] [19] Первоначально OpenAI управлялся из гостиной Брокмана. [20] Позднее ее штаб-квартира была размещена в здании Pioneer Building в районе Mission District, Сан-Франциско . [21] [22]
По данным Wired , Брокман встретился с Йошуа Бенджио , одним из «отцов-основателей» глубокого обучения , и составил список «лучших исследователей в этой области». [23] Брокман смог нанять девять из них в качестве первых сотрудников в декабре 2015 года. [23] В 2016 году OpenAI выплачивала зарплаты на корпоративном уровне (а не на уровне некоммерческих организаций), но не выплачивала исследователям ИИ зарплаты, сопоставимые с зарплатами Facebook или Google . [23]
Питер Ли из Microsoft заявил, что стоимость ведущего исследователя ИИ превышает стоимость перспективного квотербека НФЛ . [23] Потенциал и миссия OpenAI привлекли этих исследователей в фирму; сотрудник Google сказал, что он был готов уйти из Google ради OpenAI «отчасти из-за очень сильной группы людей и, в очень большой степени, из-за ее миссии». [23] Брокман заявил, что «лучшее, что я мог себе представить, — это приблизить человечество к созданию настоящего ИИ безопасным способом». [23] Соучредитель OpenAI Войцех Заремба заявил, что он отклонил «граничащие с безумием» предложения в два-три раза превышающие его рыночную стоимость, чтобы вместо этого присоединиться к OpenAI. [23]
В апреле 2016 года OpenAI выпустила публичную бета-версию «OpenAI Gym», своей платформы для исследований в области обучения с подкреплением . [24] В августе 2016 года Nvidia подарила OpenAI свой первый суперкомпьютер DGX-1 , чтобы помочь ей обучать более крупные и сложные модели ИИ с возможностью сокращения времени обработки с шести дней до двух часов. [25] [26] В декабре 2016 года OpenAI выпустила «Universe», программную платформу для измерения и обучения общего интеллекта ИИ по всему миру, предлагая игры, веб-сайты и другие приложения. [27] [28] [29] [30]
В 2017 году OpenAI потратила 7,9 млн долларов, или четверть своих функциональных расходов, только на облачные вычисления. [31] Для сравнения, общие расходы DeepMind в 2017 году составили 442 млн долларов. Летом 2018 года для простого обучения ботов Dota 2 от OpenAI потребовалась аренда 128 000 процессоров и 256 графических процессоров у Google на несколько недель.
В 2018 году Маск ушел со своего места в совете директоров, сославшись на «возможный будущий конфликт [интересов] » с его ролью генерального директора Tesla из-за разработки Tesla ИИ для беспилотных автомобилей. [32] Сэм Альтман утверждает, что Маск считал, что OpenAI отстал от других игроков, таких как Google, и вместо этого Маск предложил самому взять OpenAI на себя, что совет отклонил. Впоследствии Маск покинул OpenAI.
В феврале 2019 года был анонсирован GPT-2 , который привлек внимание своей способностью генерировать текст, похожий на человеческий. [33]
В 2019 году OpenAI перешла из некоммерческой организации в «ограниченную» коммерческую организацию, при этом прибыль была ограничена 100-кратным размером любых инвестиций. [34] По данным OpenAI, модель ограниченной прибыли позволяет OpenAI Global, LLC законно привлекать инвестиции из венчурных фондов и, кроме того, предоставлять сотрудникам доли в компании. [35] Многие ведущие исследователи работают в Google Brain , DeepMind или Facebook , которые предлагают опционы на акции, которые некоммерческая организация не смогла бы себе позволить. [36] До перехода публичное раскрытие информации о вознаграждении ведущих сотрудников OpenAI было обязательным по закону. [37]
Затем компания распределила акции среди своих сотрудников и заключила партнерское соглашение с Microsoft, [38] объявив об инвестиционном пакете в размере 1 млрд долларов в компанию. С тех пор системы OpenAI работают на суперкомпьютерной платформе на базе Azure от Microsoft. [39] [40] [41]
Затем OpenAI Global, LLC объявила о своем намерении выдать коммерческую лицензию на свои технологии. [42] Она планировала потратить 1 миллиард долларов «в течение пяти лет, а возможно, и гораздо быстрее». [43] Альтман заявил, что даже миллиарда долларов может оказаться недостаточно, и что лаборатории в конечном итоге может потребоваться «больше капитала, чем когда-либо привлекала любая некоммерческая организация» для достижения общего искусственного интеллекта. [44]
Орен Этциони из некоммерческой организации Allen Institute for AI скептически отнесся к переходу от некоммерческой организации к компании с ограниченной прибылью . Он согласился, что переманивать лучших исследователей в некоммерческую организацию сложно, но заявил: «Я не согласен с мнением, что некоммерческая организация не может конкурировать», и указал на успешные малобюджетные проекты OpenAI и других. «Если бы больше и лучше финансируемая организация всегда была лучше, то IBM все равно была бы номером один».
Некоммерческая организация OpenAI, Inc. является единственным контролирующим акционером OpenAI Global, LLC, которая, несмотря на то, что является коммерческой компанией, сохраняет формальную фидуциарную ответственность перед уставом некоммерческой организации OpenAI, Inc. Большинству членов совета директоров OpenAI, Inc. запрещено иметь финансовые доли в OpenAI Global, LLC. [35] Кроме того, миноритарные члены, имеющие долю в OpenAI Global, LLC, лишены права голоса из-за конфликта интересов. [36] Некоторые исследователи утверждают, что переход OpenAI Global, LLC на коммерческий статус не соответствует заявлениям OpenAI о «демократизации» ИИ. [45]
В 2020 году OpenAI анонсировала GPT-3 , языковую модель, обученную на больших интернет-наборах данных. GPT-3 нацелена на ответы на вопросы на естественном языке, но она также может переводить между языками и связно генерировать импровизированный текст. Она также анонсировала, что связанный API, названный просто «API», станет основой ее первого коммерческого продукта. [46]
Одиннадцать сотрудников покинули OpenAI, в основном в период с декабря 2020 года по январь 2021 года, чтобы основать Anthropic . [47]
В 2021 году OpenAI представила DALL-E — специализированную модель глубокого обучения, способную генерировать сложные цифровые изображения из текстовых описаний, используя вариант архитектуры GPT-3. [48]
В декабре 2022 года OpenAI получила широкое освещение в СМИ после запуска бесплатной предварительной версии ChatGPT , своего нового чат-бота на основе искусственного интеллекта на основе GPT-3.5. По данным OpenAI, предварительная версия получила более миллиона подписок в течение первых пяти дней. [49] Согласно анонимным источникам, на которые ссылалось Reuters в декабре 2022 года, OpenAI Global, LLC прогнозировала доход в размере 200 миллионов долларов в 2023 году и 1 миллиард долларов в 2024 году. [50]
В январе 2023 года OpenAI Global, LLC вела переговоры о финансировании, которое оценило бы компанию в 29 миллиардов долларов, что вдвое больше ее стоимости в 2021 году. [51] 23 января 2023 года Microsoft объявила о новых инвестициях в размере 10 миллиардов долларов США в OpenAI Global, LLC в течение нескольких лет, частично необходимых для использования сервиса облачных вычислений Microsoft Azure . [52] [53] Слухи об этой сделке предполагали, что Microsoft может получать 75% прибыли OpenAI, пока не получит возврат инвестиций и 49% акций компании. [54] Считается, что эти инвестиции являются частью усилий Microsoft по интеграции ChatGPT OpenAI в поисковую систему Bing. Google анонсировала аналогичное приложение ИИ ( Bard ) после запуска ChatGPT, опасаясь, что ChatGPT может поставить под угрозу место Google как источника информации. [55] [56]
7 февраля 2023 года компания Microsoft объявила, что она разрабатывает технологию искусственного интеллекта на той же основе, что и ChatGPT, для Microsoft Bing , Edge , Microsoft 365 и других продуктов. [57]
3 марта 2023 года Рид Хоффман ушел со своего места в совете директоров, сославшись на желание избежать конфликта интересов с его инвестициями в компании ИИ через Greylock Partners и его соучредителем стартапа ИИ Inflection AI . Хоффман остался в совете директоров Microsoft, крупного инвестора OpenAI. [58]
14 марта 2023 года OpenAI выпустила GPT-4 как API (со списком ожидания) и как функцию ChatGPT Plus. [59]
22 мая 2023 года Сэм Альтман, Грег Брокман и Илья Суцкевер опубликовали рекомендации по управлению сверхразумом . [60] Они считают, что сверхразум может появиться в течение следующих 10 лет, что позволит «значительно более благополучное будущее», и что «учитывая возможность экзистенциального риска, мы не можем просто реагировать». Они предлагают создать международную организацию по надзору, похожую на МАГАТЭ, для надзора за системами ИИ выше определенного порога возможностей, предполагая, что относительно слабые системы ИИ с другой стороны не должны чрезмерно регулироваться. Они также призывают к проведению дополнительных исследований технической безопасности сверхразумов и просят о большей координации, например, посредством запуска правительствами совместного проекта, частью которого «станут многие текущие усилия». [60] [61]
В июле 2023 года OpenAI запустил проект по супервыравниванию, целью которого является найти в течение 4 лет способ выравнивания будущих суперинтеллектов путем автоматизации исследований выравнивания с использованием ИИ. [62]
В августе 2023 года было объявлено, что OpenAI приобрела нью-йоркский стартап Global Illumination, компанию, которая использует ИИ для разработки цифровой инфраструктуры и креативных инструментов. [63]
21 сентября 2023 года Microsoft начала переименовывать все варианты своего Copilot в Microsoft Copilot , включая бывший Bing Chat и Microsoft 365 Copilot . [64] Эта стратегия была реализована в декабре 2023 года путем добавления MS-Copilot во многие установки Windows 11 и Windows 10 , а также отдельного приложения Microsoft Copilot, выпущенного для Android [65] и одного, выпущенного для iOS впоследствии. [66]
В октябре 2023 года Сэм Альтман и Пэн Сяо, генеральный директор эмиратской компании G42 , занимающейся разработкой искусственного интеллекта , объявили, что Open AI позволит G42 внедрить технологию Open AI. [67]
6 ноября 2023 года OpenAI запустила GPT, позволяя отдельным лицам создавать индивидуальные версии ChatGPT для определенных целей, что еще больше расширяет возможности приложений ИИ в различных отраслях. [68] 14 ноября 2023 года OpenAI объявила о временной приостановке новых регистраций на ChatGPT Plus из-за высокого спроса. [69] Доступ для новых подписчиков был возобновлен через месяц, 13 декабря. [70]
16 января 2024 года в ответ на пристальное внимание со стороны регулирующих органов по всему миру OpenAI объявила о формировании новой команды по коллективному согласованию, которая будет стремиться внедрять идеи общественности для обеспечения того, чтобы ее модели «соответствовали ценностям человечества». Этот шаг был сделан в рамках ее публичной программы, запущенной в мае 2023 года. Компания объяснила, что программа будет отделена от ее коммерческих начинаний. [71] 18 января 2024 года OpenAI объявила о партнерстве с Университетом штата Аризона , которое предоставит ей полный доступ к ChatGPT Enterprise. ASU планирует внедрить эту технологию в различные аспекты своей деятельности, включая курсы, репетиторство и исследования. Это первое партнерство OpenAI с образовательным учреждением. [72]
В феврале 2024 года Комиссия по ценным бумагам и биржам США , как сообщается, расследовала деятельность OpenAI на предмет использования внутренних коммуникаций компании, осуществляемых Альтманом, для введения инвесторов в заблуждение; расследование заявлений Альтмана, начатое прокуратурой Южного Нью-Йорка в ноябре предыдущего года, продолжалось. [73] [74]
15 февраля 2024 года OpenAI анонсировала модель преобразования текста в видео под названием Sora , которую она планирует выпустить для публики в неуказанную дату. [75] В настоящее время она доступна для красных команд для управления критическим вредом и рисками. [76]
29 февраля 2024 года Илон Маск подал в суд на OpenAI и ее генерального директора Сэма Альтмана , обвинив их в том, что они ставят прибыль выше общественного блага, что противоречит изначальной миссии OpenAI [10] по разработке ИИ на благо человечества. [77] В иске упоминалось изменение политики OpenAI после партнерства с Microsoft, что поставило под сомнение ее приверженность открытому исходному коду и вызвало дебаты по поводу этики ИИ и прибыли. [78] В сообщении в блоге OpenAI заявила, что «Илон понимал, что миссия не подразумевает открытый исходный код ИИ». [79] В служебной записке они также отрицали, что являются фактическим дочерним предприятием Microsoft. [80]
11 марта 2024 года в иске в суд OpenAI заявила, что «прекрасно справляется без Илона Маска» после того, как он покинул компанию в 2018 году. Они также отреагировали на иск Маска, назвав претензии миллиардера «бессвязными», «легкомысленными», «экстраординарными» и «выдумкой». [81] 11 июня 2024 года Маск неожиданно отозвал иск. [82] 5 августа 2024 года Маск возобновил иск против Альтмана и других, утверждая, что Альтман утверждал, что OpenAI будет основана как некоммерческая организация. [83] [84]
15 мая 2024 года Илья Суцкевер ушел из OpenAI и был заменен Якубом Пахоцки на должность главного научного сотрудника. [85] Несколько часов спустя Ян Лейке , другой соруководитель группы по супервыравниванию, объявил о своем уходе, сославшись на подрыв безопасности и доверия к руководству OpenAI. [86] Их уход, а также уход нескольких исследователей из группы, привели к тому, что OpenAI поглотила работу команды в других областях исследований и официально закрыла группу по супервыравниванию. [87] По словам источников, опрошенных Fortune , обещание OpenAI выделить 20% своих вычислительных мощностей проекту по супервыравниванию не было выполнено. [88]
19 мая 2024 года Reddit и OpenAI объявили о партнерстве по интеграции контента Reddit в продукты OpenAI, включая ChatGPT . Это сотрудничество позволяет OpenAI получать доступ к API данных Reddit , предоставляя структурированный контент в реальном времени для улучшения инструментов ИИ и взаимодействия пользователей с сообществами Reddit. Кроме того, Reddit планирует разработать новые функции на базе ИИ для пользователей и модераторов , использующих платформу OpenAI. Партнерство соответствует обязательствам Reddit по обеспечению конфиденциальности, соблюдению его Политики публичного контента и существующих Условий API данных, которые ограничивают коммерческое использование без одобрения. OpenAI также будет выступать в качестве рекламного партнера Reddit. [89]
22 мая 2024 года OpenAI заключила соглашение с News Corp об интеграции новостного контента из The Wall Street Journal , The New York Post , The Times и The Sunday Times в свою платформу ИИ. Между тем, другие издания, такие как The New York Times, решили подать в суд на OpenAI и Microsoft за нарушение авторских прав в связи с использованием их контента для обучения моделей ИИ. [90]
29 мая 2024 года Axios сообщила, что OpenAI подписала соглашения с Vox Media и The Atlantic об обмене контентом для повышения точности моделей ИИ, таких как ChatGPT, путем включения надежных источников новостей, что решает проблемы дезинформации ИИ. [91] Обеспокоенность по поводу решения выразили журналисты, в том числе работающие в изданиях, а также профсоюзы изданий. Vox Union заявил: «Как журналисты и работники, мы серьезно обеспокоены этим партнерством, которое, по нашему мнению, может негативно повлиять на членов нашего профсоюза, не говоря уже о хорошо документированных этических и экологических проблемах, связанных с использованием генеративного ИИ». [92]
Группа из девяти нынешних и бывших сотрудников OpenAI обвинила компанию в том, что она ставит прибыль выше безопасности, использует ограничительные соглашения, чтобы замалчивать опасения, и действует слишком быстро, неадекватно управляя рисками. Они призывают к большей прозрачности, защите осведомителей и законодательному регулированию разработки ИИ. [93]
10 июня 2024 года на WWDC 2024 было объявлено , что OpenAI заключила партнерское соглашение с Apple Inc. для внедрения функций ChatGPT в Apple Intelligence и iPhone . [94]
13 июня 2024 года OpenAI объявила, что Пол Накасоне , бывший глава АНБ, присоединяется к совету директоров компании. Накасоне также присоединился к подкомитету по безопасности компании. [95]
24 июня 2024 года OpenAI приобрела Multi, стартап, управляющий платформой для совместной работы на базе Zoom . [96]
В июле 2024 года агентство Reuters сообщило, что OpenAI работает над проектом под кодовым названием «Strawberry» (ранее известный как Q*), направленным на улучшение возможностей рассуждений ИИ. Сообщается, что проект стремится дать ИИ возможность планировать заранее, автономно перемещаться по Интернету и проводить «глубокие исследования». [97] [98] Проект был официально запущен 12 сентября и назван o1 . [99]
5 августа TechCrunch сообщил, что соучредитель OpenAI Джон Шульман покинул компанию, чтобы присоединиться к конкурирующему стартапу ИИ Anthropic . Шульман назвал причиной своего решения желание глубже сосредоточиться на исследованиях выравнивания ИИ. Кроме того, президент и соучредитель OpenAI Грег Брокман уходит в длительный отпуск до конца года. [100]
В сентябре 2024 года руководитель отдела глобальных связей OpenAI Анна Маканджу выразила поддержку подходу Великобритании к регулированию ИИ во время своих показаний в Комитете по коммуникациям и цифровым технологиям Палаты лордов, заявив, что компания выступает за «умное регулирование» и рассматривает белую книгу Великобритании по ИИ как позитивный шаг на пути к ответственному развитию ИИ. [101]
25 сентября главный технический директор OpenAI (CTO) Мира Мурати объявила о своем уходе из компании, чтобы «высвободить время и пространство для собственных исследований». [102] Ранее сообщалось, что Мурати была среди тех, кто выразил Совету директоров обеспокоенность по поводу Альтмана. [103]
В октябре 2024 года OpenAI привлекла $6,6 млрд от инвесторов, что потенциально оценивает компанию в $157 млрд и укрепляет ее статус одной из самых ценных частных фирм в мире. Финансирование привлекло возвращающиеся венчурные компании, такие как Thrive Capital и Khosla Ventures , а также крупного спонсора Microsoft и новых инвесторов Nvidia и Softbank . [104] Финансовый директор OpenAI Сара Фрайар сообщила сотрудникам, что за финансированием последует тендерное предложение по выкупу акций , хотя подробности еще не определены. Thrive Capital инвестировала около $1,2 млрд с возможностью получения дополнительных $1 млрд в случае достижения целевых показателей выручки. Apple, несмотря на первоначальный интерес, не участвовала в этом раунде финансирования. [105]
Также в октябре 2024 года издание The Intercept сообщило, что инструменты OpenAI считаются «необходимыми» для миссии AFRICOM и включены в договорное соглашение «Исключение из справедливой возможности» между Министерством обороны и Microsoft. [106]
Источники: [10] [112]
Некоторые ученые, такие как Стивен Хокинг и Стюарт Рассел , выразили опасения, что если продвинутый ИИ получит возможность перестраивать себя с постоянно увеличивающейся скоростью, неудержимый « взрыв интеллекта » может привести к вымиранию человечества . Соучредитель Маск характеризует ИИ как «крупнейшую экзистенциальную угрозу» человечества. [114]
Маск и Альтман заявили, что они частично мотивированы опасениями по поводу безопасности ИИ и экзистенциального риска от общего искусственного интеллекта . [115] [116] OpenAI заявляет, что «трудно понять, насколько ИИ человеческого уровня может принести пользу обществу», и что столь же трудно понять, «насколько он может навредить обществу, если будет построен или использован неправильно». [19] Исследования в области безопасности нельзя безопасно откладывать: «из-за удивительной истории ИИ трудно предсказать, когда ИИ человеческого уровня может оказаться в пределах досягаемости». [117] OpenAI заявляет, что ИИ «должен быть продолжением индивидуальной человеческой воли и, в духе свободы, быть максимально широко и равномерно распределенным». [19] Сопредседатель Сэм Альтман ожидает, что этот проект, рассчитанный на десятилетия, превзойдет человеческий интеллект. [118]
Вишал Сикка , бывший генеральный директор Infosys, заявил, что «открытость», при которой начинание «будет давать результаты в целом в интересах человечества», является основополагающим требованием для его поддержки; и что OpenAI «очень хорошо согласуется с нашими давними ценностями» и их «стремлением выполнять целенаправленную работу». [119] Кейд Метц из Wired предположил, что такие корпорации, как Amazon, могут быть мотивированы желанием использовать программное обеспечение и данные с открытым исходным кодом, чтобы уравнять игровое поле с такими корпорациями, как Google и Facebook, которые владеют огромными запасами закрытых данных. Альтман заявил, что компании Y Combinator будут делиться своими данными с OpenAI. [118]
В первые годы перед своим уходом в 2018 году Маск задался вопросом: «Что мы можем сделать лучше всего, чтобы обеспечить хорошее будущее? Мы могли бы сидеть в стороне или поощрять регулирующий надзор, или же мы могли бы участвовать в правильной структуре с людьми, которые глубоко заботятся о разработке ИИ таким образом, чтобы это было безопасно и полезно для человечества». Он признал, что «всегда есть некоторый риск того, что, фактически пытаясь продвигать (дружественный) ИИ, мы можем создать то, что нас беспокоит»; но тем не менее, лучшей защитой было бы «предоставить как можно большему числу людей возможность иметь ИИ. Если у всех есть способности ИИ, то нет ни одного человека или небольшой группы людей, которые могли бы обладать сверхспособностью ИИ». [107]
Контринтуитивная стратегия Маска и Альтмана — попытка уменьшить вред от ИИ, предоставив всем доступ к нему — вызывает споры среди тех, кто обеспокоен экзистенциальным риском от ИИ. Философ Ник Бостром сказал: «Если у вас есть кнопка, которая может сделать плохие вещи для мира, вы не хотите давать ее всем». [116] Во время разговора о технологической сингулярности в 2016 году Альтман сказал: «Мы не планируем публиковать весь наш исходный код» и упомянул план «позволить широким слоям мира избирать представителей в новый совет управления». Грег Брокман заявил: «Наша цель сейчас... сделать лучшее, что можно сделать. Это немного расплывчато». [120]
Напротив, первоначальное решение OpenAI приостановить GPT-2 около 2019 года из-за желания «ошибиться в сторону осторожности» в присутствии потенциального нецелевого использования подверглось критике со стороны сторонников открытости. Делип Рао, эксперт по генерации текста, заявил: «Я не думаю, что [OpenAI] потратила достаточно времени на доказательство того, что [GPT-2] на самом деле опасен». Другие критики утверждали, что открытая публикация была необходима для воспроизведения исследования и создания контрмер. [121]
Совсем недавно, в 2022 году, OpenAI опубликовал свой подход к проблеме выравнивания , предвидя, что выравнивание AGI с человеческими ценностями, вероятно, будет сложнее, чем выравнивание текущих систем ИИ: «Несогласованный AGI может представлять существенные риски для человечества[,], а решение проблемы выравнивания AGI может быть настолько сложным, что потребует совместной работы всего человечества». Они заявили, что намерены изучить, как лучше использовать обратную связь от человека для обучения систем ИИ и как безопасно использовать ИИ для постепенной автоматизации исследований выравнивания. [122] Некоторые наблюдатели считают, что реорганизация компании в ноябре 2023 года, включая возвращение Альтмана на пост генерального директора и изменения в ее совете директоров, указывает на вероятный сдвиг в сторону бизнес-фокуса и снижения влияния «осторожных людей» в OpenAI. [123]
В начале исследования OpenAI включали множество проектов, ориентированных на обучение с подкреплением (RL). [124] OpenAI рассматривался как важный конкурент DeepMind . [125]
Анонсированная в 2016 году библиотека Gym представляет собой библиотеку Python с открытым исходным кодом , предназначенную для облегчения разработки алгоритмов обучения с подкреплением. Она была направлена на стандартизацию определения сред в исследованиях ИИ, что делает опубликованные исследования более воспроизводимыми [24] [126] и предоставляет пользователям простой интерфейс для взаимодействия с этими средами. В 2022 году новые разработки Gym были перемещены в библиотеку Gymnasium. [127] [128]
Выпущенный в 2018 году Gym Retro представляет собой платформу для исследований обучения с подкреплением (RL) в видеоиграх, [129] использующую алгоритмы RL и обобщение исследований. Предыдущие исследования RL были сосредоточены в основном на оптимизации агентов для решения отдельных задач. Gym Retro дает возможность обобщать между играми со схожими концепциями, но разным внешним видом.
Выпущенный в 2017 году, RoboSumo представляет собой виртуальный мир , в котором человекоподобные метаобучающиеся роботы-агенты изначально не знают, как даже ходить, но им даны цели научиться двигаться и выталкивать противостоящего агента с ринга. [130] Благодаря этому состязательному процессу обучения агенты учатся адаптироваться к изменяющимся условиям. Когда агента затем удаляют из этой виртуальной среды и помещают в новую виртуальную среду с сильным ветром, агент напрягается, чтобы оставаться в вертикальном положении, что предполагает, что он научился балансировать обобщенным образом. [130] [131] Игорь Мордач из OpenAI утверждал, что конкуренция между агентами может создать «гонку вооружений» интеллекта, которая может повысить способность агента функционировать даже вне контекста конкуренции. [130]
OpenAI Five — это команда из пяти ботов , курируемых OpenAI, используемых в соревновательной видеоигре Dota 2 «пять на пять », которые учатся играть против игроков-людей на высоком уровне мастерства исключительно с помощью алгоритмов проб и ошибок. Прежде чем стать командой из пяти человек, первая публичная демонстрация состоялась на The International 2017 , ежегодном чемпионате-премьере по игре, где Dendi , профессиональный украинский игрок, проиграл боту в живом матче один на один. [132] [133] После матча технический директор Грег Брокман объяснил, что бот учился, играя сам с собой в течение двух недель в реальном времени , и что обучающее программное обеспечение стало шагом в направлении создания программного обеспечения, которое может справляться со сложными задачами, как хирург. [134] [135] Система использует форму обучения с подкреплением , поскольку боты со временем учатся, играя против себя сотни раз в день в течение месяцев, и вознаграждаются за такие действия, как убийство врага и взятие целей на карте. [136] [137] [138]
К июню 2018 года возможности ботов расширились, и они смогли играть вместе как полноценная команда из пяти человек, и они смогли победить команды любителей и полупрофессиональных игроков. [139] [136] [140] [141] На The International 2018 OpenAI Five сыграли в двух выставочных матчах против профессиональных игроков, но в итоге проиграли обе игры. [142] [143] [144] В апреле 2019 года OpenAI Five победили OG , действующих чемпионов мира по игре на тот момент, со счетом 2:0 в живом выставочном матче в Сан-Франциско. [145] [146] Последнее публичное появление ботов состоялось позже в том же месяце, где они сыграли в 42 729 играх в четырехдневном открытом онлайн-соревновании, выиграв 99,4% этих игр. [147]
Механизмы OpenAI Five в боте-игроке Dota 2 демонстрируют проблемы систем искусственного интеллекта в многопользовательских играх в жанре онлайн-боевой арены (MOBA) и то, как OpenAI Five продемонстрировала использование агентов глубокого обучения с подкреплением (DRL) для достижения сверхчеловеческих способностей в матчах Dota 2. [148]
Разработанный в 2018 году, Dactyl использует машинное обучение для обучения Shadow Hand , человекоподобной руки робота, для манипулирования физическими объектами. [149] Он обучается полностью в симуляции, используя те же алгоритмы RL и обучающий код, что и OpenAI Five. OpenAI решил проблему ориентации объектов, используя рандомизацию доменов , подход к моделированию, который подвергает обучающегося разнообразному опыту, а не пытается подогнать его под реальность. Установка для Dactyl, помимо наличия камер отслеживания движения, также имеет RGB- камеры, позволяющие роботу манипулировать произвольным объектом, видя его. В 2018 году OpenAI показала, что система способна манипулировать кубом и восьмиугольной призмой. [150]
В 2019 году OpenAI продемонстрировала, что Dactyl может собрать кубик Рубика . Робот смог решить головоломку в 60% случаев. Такие объекты, как кубик Рубика, представляют сложную физику, которую сложнее моделировать. OpenAI добилась этого, повысив устойчивость Dactyl к возмущениям с помощью автоматической рандомизации доменов (ADR), подхода к моделированию, заключающегося в создании все более сложных сред. ADR отличается от ручной рандомизации доменов тем, что не требует участия человека для указания диапазонов рандомизации. [151]
В июне 2020 года OpenAI анонсировала многоцелевой API , который, по ее словам, предназначен «для доступа к новым моделям ИИ, разработанным OpenAI», чтобы разработчики могли обращаться к нему для «любой англоязычной задачи ИИ». [152] [153]
Компания популяризировала генеративные предварительно обученные трансформаторы (GPT). [154]
Оригинальная статья о генеративном предварительном обучении языковой модели на основе трансформатора была написана Алеком Рэдфордом и его коллегами и опубликована в виде препринта на веб-сайте OpenAI 11 июня 2018 года. [155] В ней показано, как генеративная модель языка может приобретать знания о мире и обрабатывать долгосрочные зависимости путем предварительного обучения на разнообразном корпусе с длинными отрезками непрерывного текста.
Generative Pre-trained Transformer 2 («GPT-2») — это неконтролируемая модель языка трансформатора и преемник оригинальной модели GPT («GPT-1») OpenAI. GPT-2 был анонсирован в феврале 2019 года, и изначально для публики были выпущены только ограниченные демонстрационные версии. Полная версия GPT-2 не была немедленно выпущена из-за опасений по поводу возможного неправомерного использования, включая приложения для написания фейковых новостей . [156] Некоторые эксперты выразили скептицизм в отношении того, что GPT-2 представляет собой значительную угрозу.
В ответ на GPT-2 Институт искусственного интеллекта Аллена выпустил инструмент для обнаружения «нейронных фейковых новостей». [157] Другие исследователи, такие как Джереми Ховард, предупреждали о «технологии, которая полностью заполнит Twitter, электронную почту и веб разумно звучащей, соответствующей контексту прозой, которая заглушит всю остальную речь и будет невозможна для фильтрации». [158] В ноябре 2019 года OpenAI выпустила полную версию языковой модели GPT-2. [159] На нескольких веб-сайтах размещены интерактивные демонстрации различных экземпляров GPT-2 и других моделей-трансформеров. [160] [161] [162]
Авторы GPT-2 утверждают, что неконтролируемые языковые модели являются универсальными обучающимися системами, что подтверждается тем, что GPT-2 достигает высочайшей точности и точности в 7 из 8 задач с нулевым результатом (т. е. модель не проходила дальнейшего обучения на каких-либо примерах ввода-вывода, специфичных для конкретной задачи).
Корпус, на котором он был обучен, называется WebText и содержит около 40 гигабайт текста из URL-адресов, которые были опубликованы в Reddit и получили не менее 3 положительных голосов . Он избегает определенных проблем кодирования словаря с помощью токенов слов, используя кодирование пар байтов . Это позволяет представлять любую строку символов путем кодирования как отдельных символов, так и токенов из нескольких символов. [163]
Впервые описанный в мае 2020 года, Generative Pre-trained [a] Transformer 3 (GPT-3) представляет собой неконтролируемую языковую модель трансформатора и преемника GPT-2. [164] [165] [166] OpenAI заявила, что полная версия GPT-3 содержала 175 миллиардов параметров , [166] что на два порядка больше, чем 1,5 миллиарда [167] в полной версии GPT-2 (хотя модели GPT-3 с всего лишь 125 миллионами параметров также были обучены). [168]
OpenAI заявил, что GPT-3 успешно справился с определенными задачами « мета-обучения » и смог обобщить цель одной пары ввода-вывода. В документе о выпуске GPT-3 были приведены примеры перевода и кросс-лингвистического переноса обучения между английским и румынским языками, а также между английским и немецким языками. [166]
GPT-3 значительно улучшила результаты тестов по сравнению с GPT-2. OpenAI предупредила, что такое масштабирование языковых моделей может приближаться или сталкиваться с фундаментальными ограничениями возможностей предиктивных языковых моделей. [169] Предварительное обучение GPT-3 потребовало несколько тысяч петафлоп/с-дней [b] вычислений по сравнению с десятками петафлоп/с-дней для полной модели GPT-2. [166] Как и ее предшественник, [156] обученная модель GPT-3 не была немедленно выпущена для общественности из-за опасений возможного злоупотребления, хотя OpenAI планировала разрешить доступ через платный облачный API после двухмесячной бесплатной закрытой бета-версии, которая началась в июне 2020 года. [152] [171]
23 сентября 2020 года GPT-3 была лицензирована исключительно для Microsoft. [172] [173]
Codex, анонсированный в середине 2021 года, является потомком GPT-3, который дополнительно был обучен на коде из 54 миллионов репозиториев GitHub, [174] [175] и является ИИ, лежащим в основе инструмента автодополнения кода GitHub Copilot . [175] В августе 2021 года API был выпущен в закрытой бета-версии. [176] По данным OpenAI, модель может создавать работающий код на более чем дюжине языков программирования, наиболее эффективно на Python. [174]
Было отмечено несколько проблем с глюками, недостатками дизайна и уязвимостями безопасности. [177] [178]
GitHub Copilot обвиняется в распространении кода, защищенного авторским правом, без указания автора или лицензии. [179]
OpenAI объявила, что прекратит поддержку Codex API 23 марта 2023 года. [180]
14 марта 2023 года OpenAI объявила о выпуске Generative Pre-trained Transformer 4 (GPT-4), способного принимать текстовые или графические входные данные. [181] Они объявили, что обновленная технология прошла смоделированный экзамен на адвоката в юридической школе, набрав около 10% лучших результатов среди сдавших тест. (Для сравнения, GPT-3.5 набрал около 10% худших результатов.) Они заявили, что GPT-4 также может читать, анализировать или генерировать до 25 000 слов текста и писать код на всех основных языках программирования. [182]
Наблюдатели сообщили, что итерация ChatGPT с использованием GPT-4 была улучшением предыдущей итерации на основе GPT-3.5, с оговоркой, что GPT-4 сохранил некоторые проблемы более ранних версий. [183] GPT-4 также способен принимать изображения в качестве входных данных для ChatGPT. [184] OpenAI отказалась раскрывать различные технические подробности и статистику о GPT-4, такие как точный размер модели. [185]
13 мая 2024 года OpenAI анонсировала и выпустила GPT-4o , который может обрабатывать и генерировать текст, изображения и аудио. [186] GPT-4o достигла передовых результатов в голосовых, многоязычных и визуальных тестах, установив новые рекорды в распознавании и переводе аудиоречи. [187] [188] Он набрал 88,7% в тесте Massive Multitask Language Understanding ( MMLU ) по сравнению с 86,5% у GPT-4. [189]
18 июля 2024 года OpenAI выпустила GPT-4o mini, уменьшенную версию GPT-4o, заменяющую GPT-3.5 Turbo в интерфейсе ChatGPT. Его API стоит $0,15 за миллион входных токенов и $0,60 за миллион выходных токенов по сравнению с $5 и $15 соответственно для GPT-4o. OpenAI ожидает, что он будет особенно полезен для предприятий, стартапов и разработчиков, стремящихся автоматизировать сервисы с помощью агентов ИИ. [190]
12 сентября 2024 года OpenAI выпустила модели o1-preview и o1-mini, которые были разработаны так, чтобы им требовалось больше времени для обдумывания ответов, что приводит к более высокой точности. Эти модели особенно эффективны в задачах науки, кодирования и рассуждений и были доступны участникам ChatGPT Plus и Team. [191] [192]
Представленная в 2021 году модель CLIP (Contrastive Language–Image Pre-training) — это модель, которая обучена анализировать семантическое сходство между текстом и изображениями. Ее можно использовать, в частности, для классификации изображений. [193]
Представленная в 2021 году, DALL-E представляет собой модель Transformer, которая создает изображения из текстовых описаний. [194] DALL-E использует версию GPT-3 с 12 миллиардами параметров для интерпретации входных данных на естественном языке (например, «зеленый кожаный кошелек в форме пятиугольника» или «изометрический вид грустной капибары») и генерации соответствующих изображений. Она может создавать изображения реалистичных объектов («витраж с изображением синей клубники»), а также объектов, которые не существуют в реальности («куб с текстурой дикобраза»). По состоянию на март 2021 года API или код недоступны.
В апреле 2022 года OpenAI анонсировала DALL-E 2, обновленную версию модели с более реалистичными результатами. [195] В декабре 2022 года OpenAI опубликовала на GitHub программное обеспечение для Point-E, новую элементарную систему для преобразования текстового описания в трехмерную модель. [196]
В сентябре 2023 года OpenAI анонсировала DALL-E 3 — более мощную модель, способную лучше генерировать изображения из сложных описаний без ручного проектирования подсказок и отображать сложные детали, такие как руки и текст. [197] Она была выпущена для публики как функция ChatGPT Plus в октябре. [198]
Sora — это модель преобразования текста в видео , которая может генерировать видео на основе коротких описательных подсказок [199] , а также расширять существующие видео вперед или назад во времени. [200] Она может генерировать видео с разрешением до 1920x1080 или 1080x1920. Максимальная длина генерируемых видео неизвестна.
Команда разработчиков Sora назвала его в честь японского слова «небо», чтобы обозначить его «безграничный творческий потенциал». [199] Технология Sora является адаптацией технологии, лежащей в основе модели преобразования текста в изображение DALL·E 3. [ 201] OpenAI обучила систему, используя общедоступные видео, а также защищенные авторским правом видео, лицензированные для этой цели, но не раскрыла количество или точные источники видео. [199]
OpenAI продемонстрировала публике несколько видеороликов высокой четкости , созданных Sora , 15 февраля 2024 года, заявив, что она может генерировать видеоролики продолжительностью до одной минуты. Она также поделилась техническим отчетом, освещающим методы, используемые для обучения модели, и ее возможности. [201] Она признала некоторые из своих недостатков, включая трудности с имитацией сложной физики. [202] Уилл Дуглас Хэвен из MIT Technology Review назвал демонстрационные видеоролики «впечатляющими», но отметил, что они, должно быть, были тщательно отобраны и, возможно, не отражают типичный результат Sora. [201]
Несмотря на скептицизм некоторых академических лидеров после публичной демонстрации Sora, известные деятели индустрии развлечений проявили значительный интерес к потенциалу технологии. В интервью актер/режиссер Тайлер Перри выразил свое удивление способностью технологии генерировать реалистичное видео из текстовых описаний, упомянув ее потенциал для революции в повествовании и создании контента. Он сказал, что его волнение по поводу возможностей Sora было настолько сильным, что он решил приостановить планы по расширению своей киностудии в Атланте . [203]
Выпущенная в 2022 году, Whisper представляет собой универсальную модель распознавания речи. [204] Она обучена на большом наборе данных разнообразного аудио и также является многозадачной моделью, которая может выполнять многоязычное распознавание речи, а также перевод речи и идентификацию языка. [205]
Выпущенная в 2019 году, MuseNet представляет собой глубокую нейронную сеть, обученную предсказывать последующие музыкальные ноты в музыкальных файлах MIDI . Она может генерировать песни с 10 инструментами в 15 стилях. По данным The Verge , песня, сгенерированная MuseNet, имеет тенденцию начинаться разумно, но затем, чем дольше она воспроизводится, тем больше она превращается в хаос. [206] [207] В поп-культуре первые применения этого инструмента были использованы еще в 2020 году для интернет-психологического триллера Ben Drowned , чтобы создать музыку для главного персонажа. [208] [209]
Выпущенный в 2020 году, Jukebox — это алгоритм с открытым исходным кодом для генерации музыки с вокалом. После обучения на 1,2 миллионах образцов система принимает жанр, исполнителя и фрагмент текста и выводит образцы песен. OpenAI заявила, что песни «демонстрируют локальную музыкальную связность [и] следуют традиционным схемам аккордов», но признала, что песням не хватает «знакомых более крупных музыкальных структур, таких как повторяющиеся припевы», и что «существует значительный разрыв» между Jukebox и музыкой, созданной человеком. The Verge заявила: «Это технологически впечатляет, даже если результаты звучат как сентиментальные версии песен, которые могут показаться знакомыми», в то время как Business Insider заявила: «Удивительно, но некоторые из полученных песен цепляют и звучат правдоподобно». [210] [211] [212]
В 2018 году OpenAI запустил игру Debate Game, которая обучает машины обсуждать игрушечные проблемы перед судьей-человеком. Цель состоит в том, чтобы исследовать, может ли такой подход помочь в аудите решений ИИ и в разработке объяснимого ИИ . [213] [214]
Выпущенный в 2020 году, Microscope [215] представляет собой набор визуализаций каждого значимого слоя и нейрона восьми моделей нейронных сетей, которые часто изучаются с точки зрения интерпретируемости. [216] Microscope был создан для легкого анализа особенностей, которые формируются внутри этих нейронных сетей. Включенные модели: AlexNet , VGG-19 , различные версии Inception и различные версии CLIP Resnet . [217]
Запущенный в ноябре 2022 года, ChatGPT представляет собой инструмент искусственного интеллекта, созданный на основе GPT-3, который обеспечивает диалоговый интерфейс, позволяющий пользователям задавать вопросы на естественном языке . Затем система отвечает в течение нескольких секунд. ChatGPT достиг 1 миллиона пользователей через 5 дней после запуска. [218] [219]
По состоянию на 2023 год ChatGPT Plus представляет собой версию ChatGPT, поддерживаемую GPT-4 [220], доступную за абонентскую плату в размере 20 долларов США в месяц [221] (исходная версия поддерживается GPT-3.5). [222] OpenAI также делает GPT-4 доступным для избранной группы заявителей через свой список ожидания API GPT-4; [223] после принятия взимается дополнительная плата в размере 0,03 доллара США за 1000 токенов в исходном тексте, предоставленном модели («запрос»), и 0,06 доллара США за 1000 токенов, которые генерирует модель («завершение»), за доступ к версии модели с контекстным окном на 8192 токенов ; для контекстного окна на 32768 токенов цены удваиваются. [224]
В мае 2023 года OpenAI запустила пользовательский интерфейс для ChatGPT для App Store на iOS, а позднее в июле 2023 года для Play Store на Android. [225] Приложение поддерживает синхронизацию истории чата и голосовой ввод (с использованием Whisper , модели распознавания речи OpenAI ). [226] [225] [227] В сентябре 2023 года OpenAI объявила, что ChatGPT «теперь может видеть, слышать и говорить». Пользователи ChatGPT Plus могут загружать изображения, а пользователи мобильных приложений могут разговаривать с чат-ботом. [228] [229]
В октябре 2023 года последняя модель генерации изображений OpenAI, DALL-E 3 , была интегрирована в ChatGPT Plus и ChatGPT Enterprise. Интеграция использует ChatGPT для написания подсказок для DALL-E, руководствуясь беседой с пользователями. [230] [231]
GPT Store от OpenAI, запуск которого изначально был запланирован на 2023 год, теперь отложен до нераскрытой даты в начале 2024 года, что, вероятно, связано со сменой руководства в ноябре после первоначального объявления. [232]
Растет обеспокоенность по поводу потребления энергии генеративным ИИ, включая ChatGPT. В сентябре 2024 года Microsoft заключила сделку с Constellation Energy о повторном открытии атомной электростанции Three Mile Island для подачи электроэнергии в ее центры обработки данных, работающие на основе ИИ. [233]
SearchGPT, прототип поисковой системы , разработанный OpenAI, был представлен 25 июля 2024 года с первоначальным ограниченным релизом для 10 000 тестовых пользователей. Он сочетает в себе традиционные функции поисковой системы с генеративными возможностями ИИ. [234] [235]
Stargate — потенциальный суперкомпьютер с искусственным интеллектом , разрабатываемый Microsoft и OpenAI. [236] Stargate разработан как часть более масштабного проекта центра обработки данных, который может потребовать от Microsoft инвестиций в размере до 100 миллиардов долларов. [237]
Сообщается, что Stargate является частью серии строительных проектов, связанных с ИИ, запланированных на ближайшие несколько лет компаниями Microsoft и OpenAI. [237] Суперкомпьютеры будут построены в пять этапов. [236] Четвертый этап должен состоять из меньшего суперкомпьютера OpenAI, запуск которого запланирован примерно на 2026 год. [236] Stargate является пятым и последним этапом программы, на его завершение уйдет пять-шесть лет, а запуск запланирован примерно на 2028 год. [237]
Искусственный интеллект Stargate планируется разместить на миллионах специальных серверных чипов. [237] Центр обработки данных суперкомпьютера будет построен в США на 700 акрах земли. [237] Планируемое потребление энергии составит 5 гигаватт, для чего он может использовать ядерную энергию . [237] Название «Stargate» — дань уважения научно-фантастическому фильму 1994 года «Stargate» . [237]
17 ноября 2023 года Сэм Альтман был отстранён от должности генерального директора, когда совет директоров (состоящий из Хелен Тонер , Ильи Суцкевера , Адама Д'Анджело и Таши Макколи) выразил ему недоверие. Главный технический директор Мира Мурати заняла пост временного генерального директора. Грег Брокман , президент OpenAI, также был отстранён от должности председателя совета директоров [238] [239] и вскоре после этого подал в отставку с поста президента компании. [240] Впоследствии в отставку ушли три старших исследователя OpenAI: директор по исследованиям и руководитель GPT-4 Якуб Пачоцки, руководитель отдела рисков ИИ Александр Мадри и исследователь Шимон Сидор. [241] [242]
18 ноября 2023 года, как сообщается, ходили разговоры о возвращении Альтмана на пост генерального директора на фоне давления, оказанного на совет директоров такими инвесторами, как Microsoft и Thrive Capital , которые возражали против ухода Альтмана. [243] Хотя сам Альтман высказался в пользу возвращения в OpenAI, с тех пор он заявил, что рассматривает возможность создания новой компании и привлечения бывших сотрудников OpenAI с собой, если переговоры о его восстановлении не увенчаются успехом. [244] Члены совета директоров «в принципе» согласились уйти в отставку, если Альтман вернется. [245] 19 ноября 2023 года переговоры с Альтманом о возвращении провалились, и Мурати был заменен Эмметом Широм в качестве временного генерального директора. [246] Первоначально совет директоров связался с генеральным директором Anthropic Дарио Амодеи (бывшим руководителем OpenAI) по поводу замены Альтмана и предложил слияние двух компаний, но оба предложения были отклонены. [247]
20 ноября 2023 года генеральный директор Microsoft Сатья Наделла объявил, что Альтман и Брокман присоединятся к Microsoft, чтобы возглавить новую передовую исследовательскую группу по искусственному интеллекту, но добавил, что они по-прежнему привержены OpenAI, несмотря на недавние события. [248] Перед тем, как партнерство с Microsoft было окончательно оформлено, Альтман дал совету директоров еще одну возможность провести с ним переговоры. [249] Около 738 из 770 сотрудников OpenAI, включая Мурати и Суцкевера, подписали открытое письмо, в котором заявили, что уволятся и присоединятся к Microsoft, если совет директоров не наймет Альтмана повторно, а затем уйдет в отставку. [250] [251] Это побудило инвесторов OpenAI также рассмотреть возможность подачи судебного иска против совета директоров. [252] В ответ руководство OpenAI разослало сотрудникам внутреннюю служебную записку, в которой говорилось, что переговоры с Альтманом и советом директоров возобновились и займут некоторое время. [253]
21 ноября 2023 года, после длительных переговоров, Альтман и Брокман вернулись в компанию на свои прежние должности вместе с реконструированным советом директоров, состоящим из новых членов Брета Тейлора (в качестве председателя) и Лоуренса Саммерса , а Д'Анджело остался. [254] 22 ноября 2023 года появились сообщения о том, что увольнение Сэма Альтмана из OpenAI могло быть связано с его предполагаемым неправильным обращением со значительным прорывом в секретном проекте организации под кодовым названием Q*. По словам источников в OpenAI, Q* направлен на развитие возможностей ИИ в области логических и математических рассуждений и, как сообщается, включает выполнение математических вычислений на уровне учеников начальной школы. [255] [256] [257] Сообщается, что опасения по поводу реакции Альтмана на это развитие событий, особенно в отношении потенциальных последствий открытия для безопасности, были высказаны совету директоров компании незадолго до увольнения Альтмана. [258] 29 ноября 2023 года OpenAI объявила, что анонимный сотрудник Microsoft вошел в совет директоров в качестве члена без права голоса для наблюдения за деятельностью компании; [259] Microsoft вышла из состава совета директоров в июле 2024 года. [260]
В январе 2023 года OpenAI подверглась критике за передачу аннотации наборов данных на аутсорсинг Sama , компании из Сан-Франциско, которая нанимала рабочих в Кении . Эти аннотации использовались для обучения модели ИИ для обнаружения токсичности, которую затем можно было использовать для модерации токсичного контента , в частности, из данных обучения и выходных данных ChatGPT. Однако эти фрагменты текста обычно содержали подробные описания различных видов насилия, включая сексуальное насилие. Расследование показало, что OpenAI начала отправлять фрагменты данных в Sama еще в ноябре 2021 года. Четверо сотрудников Sama, опрошенных Time, описали себя как психически травмированных. OpenAI платила Sama 12,50 долларов за час работы, а Sama перераспределяла эквивалент от 1,32 до 2,00 долларов в час после уплаты налогов среди своих аннотаторов. Представитель Sama сказал, что 12,50 долларов также покрывали другие неявные расходы, среди которых были расходы на инфраструктуру, обеспечение качества и управление. [261]
В марте 2023 года компания также подверглась критике за раскрытие крайне малого количества технических подробностей о таких продуктах, как GPT-4, что противоречит ее изначальной приверженности открытости и затрудняет для независимых исследователей воспроизведение ее работы и разработку мер безопасности. OpenAI сослалась на проблемы конкурентоспособности и безопасности, чтобы оправдать этот стратегический поворот. Бывший главный научный сотрудник OpenAI Илья Суцкевер утверждал в 2023 году, что открытие исходного кода все более эффективных моделей становится все более рискованным, и что причины безопасности, по которым не открывать исходный код самых мощных моделей ИИ, станут «очевидными» через несколько лет. [262]
17 мая 2024 года в статье Vox сообщалось, что OpenAI просит уходящих сотрудников подписать пожизненное соглашение о недопустимости унижения, запрещающее им критиковать OpenAI или признавать существование соглашения. Дэниел Кокотайло, бывший сотрудник, публично заявил, что он лишился своего уставного капитала в OpenAI, чтобы уйти, не подписав соглашение. [263] [264] Сэм Альтман заявил, что он не знал о положении об аннулировании капитала, и что OpenAI никогда не применяла его для аннулирования уставного капитала любого сотрудника. [265] Vox опубликовал просочившиеся документы и электронные письма, оспаривающие это утверждение. [266] 23 мая 2024 года OpenAI отправила меморандум об освобождении бывших сотрудников от соглашения. [267]
В июле 2023 года авторы Сара Сильверман , Мэтью Баттерик , Пол Тремблей и Мона Авад подали в суд на OpenAI за нарушение авторских прав. [268] [269] [270] В сентябре 2023 года 17 авторов, включая Джорджа Р. Р. Мартина , Джона Гришэма , Джоди Пиколт и Джонатана Франзена , присоединились к Гильдии авторов , чтобы подать коллективный иск против OpenAI, утверждая, что технология компании незаконно использует их работу, защищенную авторским правом. [271] [272] The New York Times также подала в суд на компанию в конце декабря 2023 года. [269] [273] В мае 2024 года выяснилось, что OpenAI уничтожила свои обучающие наборы данных Books1 и Books2, которые использовались при обучении GPT-3 и которые, по мнению Гильдии авторов, содержали более 100 000 книг, защищенных авторским правом. [274]
В 2021 году OpenAI разработала инструмент распознавания речи под названием Whisper. OpenAI использовала его для транскрибирования более миллиона часов видео YouTube в текст для обучения GPT-4. Автоматизированная транскрипция видео YouTube вызвала обеспокоенность у сотрудников OpenAI относительно потенциальных нарушений условий обслуживания YouTube, которые запрещают использование видео для приложений, независимых от платформы, а также любой тип автоматизированного доступа к его видео. Несмотря на эти опасения, проект продолжался при заметном участии президента OpenAI Грега Брокмана . Полученный набор данных оказался полезным для обучения GPT-4. [275]
В феврале 2024 года The Intercept, а также Raw Story и Alternate Media Inc. подали иск против OpenAI по поводу нарушения авторских прав. [276] [277] Говорят, что иск наметил новую правовую стратегию для издателей, работающих только в цифровом формате, подать в суд на OpenAI. [278]
30 апреля 2024 года восемь газет подали иск в Южном округе Нью-Йорка против OpenAI и Microsoft, заявив о незаконном сборе их статей, защищенных авторским правом. Среди подавших иск изданий были The Mercury News , The Denver Post , The Orange County Register , St. Paul Pioneer Press , Chicago Tribune , Orlando Sentinel , Sun Sentinel и New York Daily News . [279]
В апреле 2023 года Европейский совет по защите данных (EDPB) ЕС сформировал специальную целевую группу по ChatGPT «для содействия сотрудничеству и обмена информацией о возможных мерах принудительного характера, принимаемых органами по защите данных» на основе «мер принудительного характера, принимаемых итальянским органом по защите данных против Open AI в отношении сервиса Chat GPT». [280]
В конце апреля 2024 года NOYB подала жалобу в австрийское Datenschutzbehörde на OpenAI за нарушение Европейского общего регламента по защите данных . Текст, созданный с помощью ChatGPT, содержал ложную дату рождения живого человека, не предоставляя ему возможности увидеть персональные данные, используемые в процессе. Запрос на исправление ошибки был отклонен. Кроме того, ни получатели работы ChatGPT, ни использованные источники не могли быть предоставлены, заявила OpenAI. [281]
OpenAI тихо удалила свой запрет на использование ChatGPT для «военных и военных целей». До 10 января 2024 года ее «политика использования» включала запрет на «деятельность, которая имеет высокий риск физического вреда, включая», в частности, «разработку оружия» и «военные и военные цели». Ее новая политика запрещает «[использование] нашего сервиса для причинения вреда себе или другим» и «разработки или использования оружия». [282] [283] Как один из отраслевых партнеров, OpenAI предоставляет степень магистра права для конкурса Artificial Intelligence Cyber Challenge (AIxCC), спонсируемого Агентством перспективных исследовательских проектов Министерства обороны (DARPA) и Агентством перспективных исследовательских проектов в области здравоохранения для защиты программного обеспечения, критически важного для американцев. [284] В октябре 2024 года The Intercept сообщил, что инструменты OpenAI считаются «необходимыми» для миссии AFRICOM и включены в договорное соглашение «Исключение из справедливой возможности» между Министерством обороны и Microsoft. [106]
В мае 2024 года OpenAI удалила аккаунты, которые использовались поддерживаемыми государством операциями влияния, такими как китайский Spamouflage и российский Doppelganger . [285] [286] OpenAI запретила доступ к своим сервисам из Китая в июле 2024 года. [287]
В июне 2023 года в иске утверждалось, что OpenAI без согласия и регистрации в качестве брокера данных извлекла 300 миллиардов слов из интернета. Иск был подан в Сан-Франциско , Калифорния , шестнадцатью анонимными истцами. Они также утверждали, что OpenAI и ее партнер, а также клиент Microsoft продолжают незаконно собирать и использовать персональные данные миллионов потребителей по всему миру для обучения моделей искусственного интеллекта. [288]
Для сравнения, в 2022 году выручка составила всего 28 миллионов долларов, в основном от продажи доступа к ее программному обеспечению ИИ... Убытки OpenAI примерно удвоились до примерно 540 миллионов долларов в прошлом году, поскольку компания разработала ChatGPT...
Создано в сотрудничестве с OpenAI и исключительно для нее
OpenAI от Microsoft имеет 285 000 ядер ЦП, 10 000 графических процессоров. Это одна из пяти самых быстрых систем в мире.
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка )Альтман сказал, что они ожидают, что этот проект, рассчитанный на десятилетия, превзойдет человеческий интеллект.
Команда, которая поддерживала Gym с 2021 года, перенесла всю будущую разработку в Gymnasium, замену Gym (импортировать Gymnasium как Gym), и Gym не будет получать никаких будущих обновлений.
OpenAI решила выпустить API вместо того, чтобы открыть исходный код моделей?
Мы сделали это по трем основным причинам. Во-первых, коммерциализация технологии помогает нам оплачивать наши текущие исследования ИИ, безопасность и усилия по политике. Во-вторых, многие модели, лежащие в основе API, очень большие, требуют большого опыта для разработки и развертывания и делают их очень дорогими в эксплуатации. Это затрудняет получение выгоды от базовой технологии кем-либо, кроме крупных компаний. Мы надеемся, что API сделает мощные системы ИИ более доступными для малого бизнеса и организаций. В-третьих, модель API позволяет нам легче реагировать на неправильное использование технологии. Поскольку сложно предсказать дальнейшие варианты использования наших моделей, по сути, безопаснее выпускать их через API и расширять доступ с течением времени, чем выпускать модель
с открытым исходным кодом
, доступ к которой нельзя будет скорректировать, если выяснится, что она имеет вредоносные приложения.
Если вы когда-либо хотели попробовать хваленый набор инструментов машинного обучения OpenAI, это стало намного проще. Компания выпустила API, который позволяет разработчикам вызывать ее инструменты ИИ для "практически любой задачи на английском языке".
GPT-2, представляет собой 1,5B параметрический преобразователь
Поскольку мы увеличиваем емкость более чем на два порядка от GPT-2 до GPT-3
/с-день (пфс-день) состоит из выполнения 10
15
операций нейронной сети в секунду в течение одного дня или в общей сложности около 10
20
операций. Произведение времени вычислений служит для ментального удобства, аналогичного кВт-ч для энергии.
{{cite web}}
: CS1 maint: архивная копия как заголовок ( ссылка ){{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite news}}
: CS1 maint: несколько имен: список авторов ( ссылка )в OpenAI считают, что Q* (произносится как Q-Star) может стать прорывом в поисках стартапом того, что известно как искусственный общий интеллект (AGI), сказал один из людей Reuters. OpenAI определяет AGI как автономные системы, которые превосходят людей в большинстве экономически ценных задач.
…Authors Guild заявила, что … наборы данных, вероятно, содержали «более 100 000 опубликованных книг» … что является центральным в ее утверждениях о том, что OpenAI использовала материалы, защищенные авторским правом, для обучения моделей ИИ
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка )