stringtranslate.com

ДАЛЛ-И

DALL·E , DALL·E 2 и DALL·E 3 — это модели преобразования текста в изображение, разработанные OpenAI с использованием методологий глубокого обучения для создания цифровых изображений из описаний на естественном языке , называемых « подсказками ».

DALL·E 3 был выпущен в составе ChatGPT для клиентов ChatGPT Plus и ChatGPT Enterprise в октябре 2023 года [1] и стал доступен через API OpenAI [2] и платформу «Labs», предоставленную в начале ноября. [3] Microsoft реализовала эту модель в инструменте Bing Image Creator и планирует внедрить ее в свое приложение Designer. [4]

История и предыстория

DALL·E был раскрыт OpenAI в сообщении в блоге 5 января 2021 года и использует версию GPT-3 [5] , модифицированную для генерации изображений.

6 апреля 2022 года OpenAI анонсировала DALL·E 2, преемника, предназначенного для создания более реалистичных изображений с более высоким разрешением, которые «могут сочетать концепции, атрибуты и стили». [6] 20 июля 2022 года DALL·E 2 вступил в фазу бета-тестирования: приглашения были разосланы 1 миллиону человек, включенных в список ожидания; [7] пользователи могут бесплатно создавать определенное количество изображений каждый месяц и приобретать больше. [8] Ранее доступ для предварительного просмотра исследования был ограничен предварительно выбранными пользователями из соображений этики и безопасности. [9] [10] 28 сентября 2022 года DALL·E 2 был открыт для всех, и требование о списке ожидания было снято. [11] В сентябре 2023 года OpenAI анонсировала свою последнюю модель изображения DALL·E 3, способную понимать «значительно больше нюансов и деталей», чем предыдущие версии. [12] В начале ноября 2022 года OpenAI выпустила DALL·E 2 в качестве API , позволяющего разработчикам интегрировать модель в свои собственные приложения. Microsoft представила реализацию DALL·E 2 в своем приложении Designer и инструменте Image Creator, включенном в Bing и Microsoft Edge . [13] API работает на основе цены за изображение, причем цены варьируются в зависимости от разрешения изображения. Скидки за оптовые продажи доступны компаниям, работающим с корпоративной командой OpenAI. [14]

Название программного обеспечения представляет собой смесь имен анимированного робота Pixar, персонажа ВАЛЛ-И , и испанского художника-сюрреалиста Сальвадора Дали . [15] [5]

Технологии

Первая модель генеративного предварительно обученного трансформатора (GPT) была первоначально разработана OpenAI в 2018 году [16] с использованием архитектуры Transformer . Первая итерация, GPT-1, [17] была расширена до производства GPT-2 в 2019 году; [18] в 2020 году его снова масштабировали для производства GPT-3 со 175 миллиардами параметров. [19] [5] [20]

Модель DALL·E представляет собой мультимодальную реализацию GPT-3 [21] с 12 миллиардами параметров [5] , которая «заменяет текст пикселями», обученную на парах текст-изображение из Интернета. [22] В деталях, входными данными для модели Transformer является последовательность токенизированных заголовков изображений, за которыми следуют токенизированные фрагменты изображений. Подпись к изображению написана на английском языке, маркирована парой байтов (размер словаря 16384) и может иметь длину до 256 токенов. Каждое изображение представляет собой изображение RGB размером 256×256, разделенное на участки 32×32 по 4×4 каждый. Затем каждый патч преобразуется дискретным вариационным автокодировщиком в токен (размер словаря 8192).

DALL·E был разработан и анонсирован публике совместно с CLIP (предварительная тренировка по контрастному языку и изображению). [22] CLIP — это отдельная модель, основанная на нулевом обучении , которая была обучена на 400 миллионах пар изображений с текстовыми подписями, взятых из Интернета. [5] [22] [23] Его роль состоит в том, чтобы «понять и ранжировать» выходные данные DALL·E, предсказывая, какой заголовок из списка из 32 768 подписей, случайно выбранных из набора данных (из которых один был правильным ответом), наиболее подходит для изображение. Эта модель используется для фильтрации большего исходного списка изображений, созданных DALL·E, для выбора наиболее подходящих результатов. [15] [22]

DALL·E 2 использует 3,5 миллиарда параметров — меньше, чем его предшественник. [24] DALL·E 2 использует диффузионную модель, основанную на встраиваниях изображений CLIP, которые во время вывода генерируются из вложений текста CLIP с помощью предшествующей модели. [24]

Предварительная тренировка контрастного языка и изображения (CLIP)

Предварительное обучение контрастному языку-образу [25] — это метод обучения пары моделей. Одна модель принимает фрагмент текста и выводит один вектор. Другой принимает изображение и выводит один вектор.

Чтобы обучить такую ​​пару моделей, нужно начать с подготовки большого набора данных пар изображений и подписей, а затем выбрать пакеты размером . Пусть выходные данные моделей текста и изображения будут соответственно . Убыток, понесенный по этой партии, составит:

Выпущенные модели были обучены на наборе данных «WebImageText», содержащем 400 миллионов пар подписей к изображениям. Общее количество слов аналогично WebText, который содержит около 40 ГБ текста.

Возможности

DALL·E может создавать изображения в различных стилях, включая фотореалистичные изображения, картины и смайлы . [5] Он может «манипулировать и переставлять» объекты на своих изображениях, [5] и может правильно размещать элементы дизайна в новых композициях без явных инструкций. Том Данн, пишущий для BoingBoing , заметил: «Например, когда его просят нарисовать редис дайкон, сморкающийся, потягивающий латте или катающийся на одноколесном велосипеде, DALL·E часто рисует носовой платок, руки и ноги в подходящих местах». [26] DALL·E продемонстрировал способность «заполнять пробелы», чтобы получить соответствующие детали без конкретных подсказок, например, добавляя рождественские образы к подсказкам, обычно связанным с празднованием, [27] и соответствующим образом размещал тени к изображениям, в которых не упоминалось их. [28] Кроме того, DALL·E демонстрирует широкое понимание визуальных и дизайнерских тенденций. [ нужна цитата ]

DALL·E может создавать изображения для широкого спектра произвольных описаний с разных точек зрения [29] лишь с редкими сбоями. [15] Марк Ридл, доцент Технологической школы интерактивных вычислений Джорджии , обнаружил, что DALL-E может смешивать концепции (описываемые как ключевой элемент человеческого творчества ). [30] [31]

Его способности к визуальному мышлению достаточны для решения матриц Ворона (визуальные тесты, которые часто назначают людям для измерения интеллекта). [32] [33]

Изображение точного текста, созданное DALL·E 3 на основе текстовой подсказки «Иллюстрация авокадо, сидящего в кресле терапевта и говорящего: «Я чувствую себя таким пустым внутри» с дыркой размером с косточку в центре. Терапевт, ложка, записывает».

DALL·E 3 следует сложным подсказкам с большей точностью и детальностью, чем его предшественники, и способен генерировать более связный и точный текст. [34] [12] DALL·E 3 интегрирован в ChatGPT Plus. [12]

Модификация изображения

Две «вариации» « Девушки с жемчужной сережкой» , созданные с помощью DALL·E 2.

Учитывая существующее изображение, DALL·E 2 может создавать «вариации» изображения как отдельные выходные данные на основе оригинала, а также редактировать изображение, чтобы изменить или расширить его. «Закрашивание» и «закрашивание» в DALL·E 2 используют контекст изображения для заполнения недостающих областей с использованием носителя, соответствующего оригиналу, согласно заданной подсказке.

Например, это можно использовать для вставки нового объекта в изображение или расширения изображения за пределы исходных границ. [35] Согласно OpenAI, «Outpainting учитывает существующие визуальные элементы изображения, включая тени, отражения и текстуры, для сохранения контекста исходного изображения». [36]

Технические ограничения

Понимание языка DALL·E 2 имеет ограничения. Иногда невозможно отличить «Жёлтую книгу и красную вазу» от «Красной книги и жёлтой вазы» или «Панду, делающую латте-арт» от «Латте-арт панды». [37] Он генерирует изображения «космонавта верхом на лошади», когда ему предоставляется подсказка «лошадь верхом на космонавте». [38] Он также не может генерировать правильные изображения в различных обстоятельствах. Запрос более трех объектов, отрицаний, чисел и связных предложений может привести к ошибкам, а признаки объекта могут появиться не на том объекте. [29] Дополнительные ограничения включают обработку текста, которая, даже при наличии разборчивых букв, почти всегда приводит к бреду, похожему на сон, и ограниченную способность обрабатывать научную информацию, такую ​​как астрономия или медицинские изображения. [39]

Этические проблемы

Зависимость DALL·E 2 от общедоступных наборов данных влияет на результаты и в некоторых случаях приводит к алгоритмической предвзятости , например, к генерированию большего числа мужчин, чем женщин, для запросов, в которых не упоминается пол. [40] Данные обучения DALL·E 2 были отфильтрованы для удаления изображений насилия и сексуального характера, но было обнаружено, что в некоторых случаях это увеличивает предвзятость, например, снижает частоту появления женщин. [41] OpenAI предполагает, что это может быть связано с тем, что женщины с большей вероятностью подвергались сексуализации в обучающих данных, что приводило к влиянию фильтра на результаты. [41] В сентябре 2022 года OpenAI подтвердила The Verge , что DALL·E незаметно вставляет фразы в запросы пользователя, чтобы устранить предвзятость результатов; например, «черный мужчина» и «азиатская женщина» вставляются в подсказки, в которых не указан пол или раса. [42]

Проблема DALL·E 2 и подобных моделей генерации изображений заключается в том, что они могут использоваться для распространения дипфейков и других форм дезинформации. [43] [44] В попытке смягчить это программное обеспечение отклоняет запросы с участием общественных деятелей и загрузки, содержащие человеческие лица. [45] Запросы, содержащие потенциально нежелательный контент, блокируются, а загруженные изображения анализируются на предмет обнаружения оскорбительных материалов. [46] Недостатком фильтрации на основе подсказок является то, что ее легко обойти, используя альтернативные фразы, которые приводят к аналогичному результату. Например, слово «кровь» фильтруется, а «кетчуп» и «красная жидкость» — нет. [47] [46]

Еще одна проблема, связанная с DALL·E 2 и подобными моделями, заключается в том, что из-за своей точности и популярности они могут вызвать технологическую безработицу среди художников, фотографов и графических дизайнеров. [48] ​​[49] DALL·E 3 предназначен для того, чтобы запретить пользователям создавать произведения искусства в стиле ныне живущих художников. [12]

Прием

Изображения, созданные DALL·E по запросу: «иллюстрация молодого редиса дайкона в пачке, выгуливающего собаку».

Большая часть освещения DALL·E сосредоточена на небольшом подмножестве «сюрреалистических» [22] или «причудливых» [30] результатов. Результат DALL-E для «иллюстрации молодого редиса дайкона в пачке, выгуливающего собаку» был упомянут в статьях из Input , [50] NBC , [51] Nature , [52] и других публикаций. [5] [53] [54] Также широко освещалась его продукция «кресло в форме авокадо». [22] [31]

ExtremeTech заявила, что «вы можете попросить у DALL·E изображение телефона или пылесоса за определенный период времени, и он поймет, как эти объекты изменились». [27] Engadget также отметил свою необычную способность «понимать, как телефоны и другие объекты меняются с течением времени». [28]

Согласно MIT Technology Review , одной из целей OpenAI было «дать языковым моделям лучшее понимание повседневных концепций, которые люди используют для понимания вещей». [22]

Инвесторы с Уолл-стрит положительно восприняли проект DALL·E 2, а некоторые фирмы считают, что он может стать поворотным моментом для будущей многотриллионной отрасли. К середине 2019 года OpenAI уже получила более 1 миллиарда долларов финансирования от Microsoft и Khosla Ventures, [55] [56] [57] , а в январе 2023 года, после запуска DALL·E 2 и ChatGPT, получила дополнительно 10 миллиардов долларов. при финансировании от Microsoft. [58]

Японское аниме- сообщество негативно отреагировало на DALL·E 2 и подобные модели. [59] [60] [61] Художники обычно выдвигают два аргумента против программного обеспечения. Во-первых, искусство ИИ не является искусством, поскольку оно не создается человеком с намерением. «Сопоставление изображений, созданных с помощью ИИ, с их собственными работами унижает достоинство и подрывает время и навыки, которые затрачиваются на их искусство. сеть». [7] Во-вторых, проблемы с законом об авторском праве и моделями преобразования текста в изображение. OpenAI не опубликовала информацию о том, какие наборы данных использовались для обучения DALL·E 2, что вызвало обеспокоенность некоторых, что работы художников использовались для обучения без разрешения. Законы об авторском праве, касающиеся этих тем, на данный момент не дают окончательных результатов. [8]

После интеграции DALL·E 3 в Bing Chat и ChatGPT Microsoft и OpenAI столкнулись с критикой за чрезмерную фильтрацию контента, причем критики заявили, что DALL·E подвергся «лоботомии». [62] В качестве доказательства была приведена пометка изображений, созданных по таким запросам, как «человек ломает серверную стойку кувалдой». Сообщается, что в первые дни после запуска фильтрация была усилена до такой степени, что изображения, созданные с помощью некоторых предложенных Bing подсказок, блокировались. [62] [63] TechRadar утверждает, что слишком большая осторожность может ограничить ценность DALL·E как творческого инструмента. [63]

Реализации с открытым исходным кодом

Поскольку OpenAI не опубликовала исходный код ни для одной из трех моделей, было предпринято несколько попыток создать реализации DALL·E с открытым исходным кодом. [64] [65] Выпущенный в 2022 году на платформе Hugging Face 's Spaces, Craiyon (ранее DALL·E Mini, пока OpenAI не запросила изменение названия в июне 2022 года) представляет собой модель искусственного интеллекта, основанную на оригинальном DALL·E, который был обучен на нефильтрованных данных из Интернета. Он привлек значительное внимание средств массовой информации в середине 2022 года после своего выпуска из-за своей способности создавать юмористические образы. [66] [67] [68]

Смотрите также

Рекомендации

  1. Дэвид, Эмилия (20 сентября 2023 г.). «OpenAI выпускает третью версию DALL·E». Грань . Архивировано из оригинала 20 сентября 2023 года . Проверено 21 сентября 2023 г.
  2. ^ «Платформа OpenAI». платформа.openai.com . Архивировано из оригинала 20 марта 2023 года . Проверено 10 ноября 2023 г.
  3. Найлз, Рэймонд (10 ноября 2023 г.) [Обновлено на этой неделе]. «ДАЛЛ-Э 3 API». Справочный центр OpenAI . Архивировано из оригинала 10 ноября 2023 года . Проверено 10 ноября 2023 г.
  4. Мехди, Юсуф (21 сентября 2023 г.). «Анонсируем Microsoft Copilot, вашего повседневного помощника в области искусственного интеллекта». Официальный блог Microsoft . Архивировано из оригинала 21 сентября 2023 года . Проверено 21 сентября 2023 г.
  5. ↑ abcdefgh Джонсон, Хари (5 января 2021 г.). «OpenAI представляет DALL-E для генерации изображений из текста». ВенчурБит. Архивировано из оригинала 5 января 2021 года . Проверено 5 января 2021 г.
  6. ^ "ДАЛЛ·И 2". ОпенАИ . Архивировано из оригинала 6 апреля 2022 года . Проверено 6 июля 2022 г.
  7. ^ ab «DALL·E теперь доступен в бета-версии» . ОпенАИ . 20 июля 2022 года. Архивировано из оригинала 20 июля 2022 года . Проверено 20 июля 2022 г.
  8. ↑ Аб Аллин, Бобби (20 июля 2022 г.). «Сюрреалистично или слишком реально? Потрясающий инструмент искусственного интеллекта DALL·E выводит изображения на более широкую сцену». ЭНЕРГЕТИЧЕСКИЙ ЯДЕРНЫЙ РЕАКТОР . Архивировано из оригинала 20 июля 2022 года . Проверено 20 июля 2022 г.
  9. ^ "Список ожидания DALL·E" . labs.openai.com . Архивировано из оригинала 4 июля 2022 года . Проверено 6 июля 2022 г.
  10. ^ «От младенцев Trump Nevermind до глубоких фейков: DALL·E и этика искусства искусственного интеллекта» . хранитель . 18 июня 2022 года. Архивировано из оригинала 6 июля 2022 года . Проверено 6 июля 2022 г.
  11. ^ «DALL·E теперь доступен без списка ожидания» . ОпенАИ . 28 сентября 2022 года. Архивировано из оригинала 4 октября 2022 года . Проверено 5 октября 2022 г.
  12. ^ abcd "ДАЛЛ·Е 3". ОпенАИ . Архивировано из оригинала 20 сентября 2023 года . Проверено 21 сентября 2023 г.
  13. ^ «API DALL·E теперь доступен в общедоступной бета-версии» . ОпенАИ . 3 ноября 2022 года. Архивировано из оригинала 19 ноября 2022 года . Проверено 19 ноября 2022 г.
  14. Виггерс, Кайл (3 ноября 2022 г.). «Теперь каждый может создавать приложения, использующие DALL·E 2 для создания изображений». ТехКранч . Архивировано из оригинала 19 ноября 2022 года . Проверено 19 ноября 2022 г.
  15. ↑ abc Колдьюи, Девин (5 января 2021 г.). «DALL-E OpenAI создает правдоподобные изображения буквально всего, о чем вы его просите». Архивировано из оригинала 6 января 2021 года . Проверено 5 января 2021 г.
  16. ^ Рэдфорд, Алек; Нарасимхан, Картик; Салиманс, Тим; Суцкевер, Илья (11 июня 2018 г.). «Улучшение понимания языка посредством генеративной предварительной подготовки» (PDF) . ОпенАИ . п. 12. Архивировано (PDF) из оригинала 26 января 2021 года . Проверено 23 января 2021 г.
  17. ^ «От GPT-1 до GPT-4: объяснение и сравнение каждой из моделей OpenAI GPT» . 11 апреля 2023 года. Архивировано из оригинала 15 апреля 2023 года . Проверено 29 апреля 2023 г.
  18. ^ Рэдфорд, Алек; Ву, Джеффри; Дитя, Ревон; Луан, Дэвид; Амодей, Дарио; Суцкевер, Илуа (14 февраля 2019 г.). «Языковые модели предназначены для многозадачного обучения без присмотра» (PDF) . cdn.openai.com . 1 (8). Архивировано (PDF) из оригинала 6 февраля 2021 года . Проверено 19 декабря 2020 г.
  19. ^ Браун, Том Б.; Манн, Бенджамин; Райдер, Ник; Суббия, Мелани; Каплан, Джаред; Дхаривал, Прафулла; Нилакантан, Арвинд; Шьям, Пранав; Састри, Гириш; Аскелл, Аманда; Агарвал, Сандхини; Герберт-Восс, Ариэль; Крюгер, Гретхен; Хениган, Том; Дитя, Ревон; Рамеш, Адитья; Зиглер, Дэниел М.; Ву, Джеффри; Зима, Клеменс; Гессен, Кристофер; Чен, Марк; Сиглер, Эрик; Литвин, Матеуш; Грей, Скотт; Шахматы, Бенджамин; Кларк, Джек; Бернер, Кристофер; МакКэндлиш, Сэм; Рэдфорд, Алек; Суцкевер, Илья; Амодей, Дарио (22 июля 2020 г.). «Языковые модели изучаются немногими». arXiv : 2005.14165 [cs.CL].
  20. ^ Рамеш, Адитья; Павлов Михаил; Гох, Габриэль; Грей, Скотт; Восс, Челси; Рэдфорд, Алек; Чен, Марк; Суцкевер, Илья (24 февраля 2021 г.). «Генерация текста в изображение с нулевым выстрелом». arXiv : 2102.12092 [cs.LG].
  21. ^ Тамкин, Алекс; Брандейдж, Майлз; Кларк, Джек; Гангули, Дип (2021). «Понимание возможностей, ограничений и социального воздействия моделей большого языка». arXiv : 2102.02503 [cs.CL].
  22. ^ abcdefg Heaven, Уилл Дуглас (5 января 2021 г.). «Это кресло из авокадо может стать будущим искусственного интеллекта». Обзор технологий MIT. Архивировано из оригинала 5 января 2021 года . Проверено 5 января 2021 г.
  23. ^ «ИИ 'DALL·E' генерирует изображение из всего, что вы описываете» . Engadget . 6 января 2021 года. Архивировано из оригинала 27 января 2021 года . Проверено 18 июля 2022 г.
  24. ^ аб Рамеш, Адитья; Дхаривал, Прафулла; Никол, Алекс; Чу, Кейси; Чен, Марк (12 апреля 2022 г.). «Иерархическая генерация текстовых условных изображений с помощью CLIP Latents». arXiv : 2204.06125 [cs.CV].
  25. ^ Рэдфорд, Алек; Ким, Чон Ук; Халси, Крис; Рамеш, Адитья; Гох, Габриэль; Агарвал, Сандхини; Састри, Гириш; Аскелл, Аманда; Мишкин, Памела; Кларк, Джек; Крюгер, Гретхен; Суцкевер, Илья (2021). «Изучение переносимых визуальных моделей под контролем естественного языка». arXiv : 2103.00020 [cs.CV].
  26. Данн, Том (10 февраля 2021 г.). «Эта нейронная сеть искусственного интеллекта превращает текстовые подписи в произведения искусства, как медуза Пикачу». БоингБоинг . Архивировано из оригинала 22 февраля 2021 года . Проверено 2 марта 2021 г.
  27. ↑ Аб Уитвам, Райан (6 января 2021 г.). «DALL-E» OpenAI генерирует изображения из текстовых описаний». ЭкстримТех . Архивировано из оригинала 28 января 2021 года . Проверено 2 марта 2021 г.
  28. ↑ Аб Дент, Стив (6 января 2021 г.). «Приложение DALL-E OpenAI генерирует изображения только на основе описания». Engadget . Архивировано из оригинала 27 января 2021 года . Проверено 2 марта 2021 г.
  29. ^ аб Маркус, Гэри; Дэвис, Эрнест; Ааронсон, Скотт (2 мая 2022 г.). «Очень предварительный анализ DALL-E 2». arXiv : 2204.13807 [cs.CV].
  30. ↑ Аб Шид, Сэм (8 января 2021 г.). «Почему все говорят о генераторе изображений, выпущенном лабораторией искусственного интеллекта, поддерживаемой Илоном Маском». CNBC . Архивировано из оригинала 16 июля 2022 года . Проверено 2 марта 2021 г.
  31. ^ аб Уэйкфилд, Джейн (6 января 2021 г.). «ИИ рисует редиску в пачке, выгуливающую собаку». Британская радиовещательная корпорация . Архивировано из оригинала 2 марта 2021 года . Проверено 3 марта 2021 г.
  32. Марковиц, Дейл (10 января 2021 г.). «Вот как работает волшебный генератор изображений DALL-E от OpenAI». TheNextWeb . Архивировано из оригинала 23 февраля 2021 года . Проверено 2 марта 2021 г.
  33. ^ «DALL·E: Создание изображений из текста» . ОпенАИ . 5 января 2021 года. Архивировано из оригинала 27 марта 2021 года . Проверено 13 августа 2022 г.
  34. Эдвардс, Бендж (20 сентября 2023 г.). «Новый генератор изображений AI от OpenAI расширяет границы детализации и обеспечивает быструю точность». Арс Техника . Архивировано из оригинала 21 сентября 2023 года . Проверено 21 сентября 2023 г.
  35. Колдьюи, Девин (6 апреля 2022 г.). «Новый инструмент OpenAI рисует что угодно, больше и лучше, чем когда-либо». ТехКранч . Архивировано из оригинала 6 мая 2023 года . Проверено 26 ноября 2022 г.
  36. ^ "DALL·E: Знакомство с перерисовкой" . ОпенАИ . 31 августа 2022 года. Архивировано из оригинала 26 ноября 2022 года . Проверено 26 ноября 2022 г.
  37. ^ Сахария, Читван; Чан, Уильям; Саксена, Саураб; Ли, Лала; Ванг, Джей; Дентон, Эмили; Гасемипур, Сейед Камьяр Сейед; Аян, Бурджу Карагол; Махдави, С. Сара; Лопес, Рафа Гонтихо; Салиманс, Тим (23 мая 2022 г.). «Фотореалистичные модели распространения текста в изображение с глубоким пониманием языка». arXiv : 2205.11487 [cs.CV].
  38. Маркус, Гэри (28 мая 2022 г.). «Лошадь едет космонавта». Дорога к искусственному интеллекту, которому мы можем доверять . Архивировано из оригинала 19 июня 2022 года . Проверено 18 июня 2022 г.
  39. Стрикленд, Элиза (14 июля 2022 г.). «Неудачи DALL·E 2 — самое интересное в этом». IEEE-спектр . Архивировано из оригинала 15 июля 2022 года . Проверено 16 августа 2022 г.
  40. СТРИКЛЕНД, ЭЛИЗА (14 июля 2022 г.). «Неудачи DALL-E 2 — самое интересное в этом». IEEE-спектр . Архивировано из оригинала 15 июля 2022 года . Проверено 15 июля 2022 г.
  41. ^ ab «DALL·E 2 Меры по снижению риска перед тренировкой» . ОпенАИ . 28 июня 2022 года. Архивировано из оригинала 19 июля 2022 года . Проверено 18 июля 2022 г.
  42. Джеймс Винсент (29 сентября 2022 г.). «Генератор изображений OpenAI DALL·E доступен для использования всем сразу же». Грань . Архивировано из оригинала 29 сентября 2022 года . Проверено 29 сентября 2022 г.
  43. Тейлор, Джош (18 июня 2022 г.). «От младенцев Trump Nevermind до глубоких фейков: DALL-E и этика искусства искусственного интеллекта». Хранитель . Архивировано из оригинала 6 июля 2022 года . Проверено 2 августа 2022 г.
  44. Найт, Уилл (13 июля 2022 г.). «Когда ИИ создает искусство, люди дают творческую искру». Проводной . Архивировано из оригинала 2 августа 2022 года . Проверено 2 августа 2022 г.
  45. Роуз, Янус (24 июня 2022 г.). «DALL-E теперь создает реалистичные лица фальшивых людей» . Порок . Архивировано из оригинала 30 июля 2022 года . Проверено 2 августа 2022 г.
  46. ^ ab OpenAI (19 июня 2022 г.). «Предварительная версия DALL·E 2 — риски и ограничения». Гитхаб . Архивировано из оригинала 2 августа 2022 года . Проверено 2 августа 2022 г.
  47. Лейн, Лаура (1 июля 2022 г.). «ДАЛЛ-И, сделай мне еще одного Пикассо, пожалуйста». Житель Нью-Йорка . Архивировано из оригинала 2 августа 2022 года . Проверено 2 августа 2022 г.
  48. Голдман, Шэрон (26 июля 2022 г.). «OpenAI: Убьет ли DALL·E 2 творческую карьеру?». Архивировано из оригинала 15 августа 2022 года . Проверено 16 августа 2022 г.
  49. Блейн, Лоз (29 июля 2022 г.). «DALL-E 2: инструмент мечты и экзистенциальная угроза для художников». Архивировано из оригинала 17 августа 2022 года . Проверено 16 августа 2022 г.
  50. Касана, Мехрин (7 января 2021 г.). «Этот ИИ превращает текст в сюрреалистическое искусство, основанное на предложениях». Вход. Архивировано из оригинала 29 января 2021 года . Проверено 2 марта 2021 г.
  51. Эренкранц, Мелани (27 января 2021 г.). «Вот DALL-E: алгоритм научился рисовать все, что вы ему скажете». Новости Эн-Би-Си . Архивировано из оригинала 20 февраля 2021 года . Проверено 2 марта 2021 г.
  52. Стоув, Эмма (5 февраля 2021 г.). «Цирк тихоходок и древо жизни — лучшие научные снимки января». Природа . Архивировано из оригинала 8 марта 2021 года . Проверено 2 марта 2021 г.
  53. Найт, Уилл (26 января 2021 г.). «Этот ИИ может перейти от «искусства» к управлению беспилотным автомобилем». Проводной . Архивировано из оригинала 21 февраля 2021 года . Проверено 2 марта 2021 г.
  54. Мец, Рэйчел (2 февраля 2021 г.). «Редиска в пачке гуляет с собакой? Этот ИИ умеет ее очень хорошо рисовать». Си-Эн-Эн. Архивировано из оригинала 16 июля 2022 года . Проверено 2 марта 2021 г.
  55. Лесвинг, Киф (8 октября 2022 г.). «Почему Кремниевая долина так взволнована неуклюжими рисунками, сделанными искусственным интеллектом». CNBC . Архивировано из оригинала 29 июля 2023 года . Проверено 1 декабря 2022 г.
  56. Этерингтон, Даррелл (22 июля 2019 г.). «Microsoft инвестирует 1 миллиард долларов в OpenAI в рамках нового многолетнего партнерства». ТехКранч . Архивировано из оригинала 22 июля 2019 года . Проверено 21 сентября 2023 г.
  57. ^ «Первый венчурный спонсор OpenAI высказывает мнение о генеративном искусственном интеллекте» Fortune . Архивировано из оригинала 23 октября 2023 года . Проверено 21 сентября 2023 г.
  58. ^ Мец, Кейд; Вайзе, Карен (23 января 2023 г.). «Microsoft инвестирует 10 миллиардов долларов в OpenAI, создателя ChatGPT». Нью-Йорк Таймс . ISSN  0362-4331. Архивировано из оригинала 21 сентября 2023 года . Проверено 21 сентября 2023 г.
  59. ^ «Искусство, созданное искусственным интеллектом, вызывает яростную реакцию японского аниме-сообщества» . Остальной мир . 27 октября 2022 года. Архивировано из оригинала 31 декабря 2022 года . Проверено 3 января 2023 г.
  60. Руз, Кевин (2 сентября 2022 г.). «Картина, созданная искусственным интеллектом, получила художественную премию. Художники недовольны». Нью-Йорк Таймс . ISSN  0362-4331. Архивировано из оригинала 31 мая 2023 года . Проверено 3 января 2023 г.
  61. Доус, Райан (15 декабря 2022 г.). «Реакция ArtStation усиливается после реакции протеста в области искусства ИИ» . Новости ИИ . Архивировано из оригинала 3 января 2023 года . Проверено 3 января 2023 г.
  62. ↑ Аб Корден, Джез (8 октября 2023 г.). «В течение нескольких дней создание образа Bing Dall-E 3 было отличным, но теперь Microsoft предсказуемо провела его лоботомию». Центр Windows . Архивировано из оригинала 10 октября 2023 года . Проверено 11 октября 2023 г.
  63. ^ аб Аллан, Даррен (9 октября 2023 г.). «Microsoft использует Bing AI Image Creator – и результаты не имеют особого смысла». ТехРадар . Архивировано из оригинала 10 октября 2023 года . Проверено 11 октября 2023 г.
  64. Сахар Мор, Stripe (16 апреля 2022 г.). «Как DALL-E 2 может решить серьезные проблемы компьютерного зрения». ВенчурБит . Архивировано из оригинала 24 мая 2022 года . Проверено 15 июня 2022 г.
  65. jina-ai/dalle-flow, Jina AI, 17 июня 2022 г., заархивировано из оригинала 17 июня 2022 г. , получено 17 июня 2022 г.
  66. Карсон, Эрин (14 июня 2022 г.). «Все, что нужно знать о Dall-E Mini, потрясающем создателе искусственного интеллекта». CNET . Архивировано из оригинала 15 июня 2022 года . Проверено 15 июня 2022 г.
  67. ^ Шредер, Одра (9 июня 2022 г.). «Программа искусственного интеллекта DALL-E mini вызывает поистине проклятые образы». Ежедневная точка . Архивировано из оригинала 10 июня 2022 года . Проверено 15 июня 2022 г.
  68. Диас, Ана (15 июня 2022 г.). «Люди используют DALL-E mini, чтобы создавать мемы-мерзости вроде мопса Пикачу». Полигон . Архивировано из оригинала 15 июня 2022 года . Проверено 15 июня 2022 г.

Внешние ссылки