Искусство искусственного интеллекта — это любое визуальное произведение искусства , созданное с помощью программ искусственного интеллекта (ИИ), таких как модели преобразования текста в изображение . [1]
Художники начали создавать искусство искусственного интеллекта в середине-конце 20 века, когда была основана эта дисциплина. В начале 21 века доступность художественных инструментов искусственного интеллекта для широкой публики возросла, что открыло возможности для использования за пределами академических кругов и профессиональных художников. На протяжении всей своей истории искусство искусственного интеллекта вызывало множество философских проблем, в том числе связанных с авторским правом, обманом и его влиянием на традиционных художников, включая их доходы.
Концепция автоматизированного искусства восходит, по крайней мере, к автоматам древнегреческой цивилизации , где такие изобретатели, как Дедал и Герой Александрийский, были описаны как создатели машин, способных писать текст, генерировать звуки и воспроизводить музыку. [2] [3] Традиция творческих автоматов процветала на протяжении всей истории, например, автомат Майярде , созданный в начале 1800-х годов. [4]
Академическая дисциплина искусственного интеллекта была основана на исследовательском семинаре Дартмутского колледжа в 1956 году и за прошедшие десятилетия пережила несколько волн развития и оптимизма. [5] С момента своего основания исследователи в этой области выдвигали философские и этические аргументы о природе человеческого разума и последствиях создания искусственных существ с интеллектом, подобным человеческому; эти вопросы ранее исследовались мифами , художественной литературой и философией , начиная с античности. [6]
С момента создания искусственного интеллекта в 1950-х годах художники и исследователи использовали искусственный интеллект для создания художественных произведений. Эти работы иногда называли алгоритмическим искусством , [7] компьютерным искусством , цифровым искусством или новыми медиа . [8]
Одной из первых значительных художественных систем искусственного интеллекта является AARON , разработанная Гарольдом Коэном в конце 1960-х годов в Калифорнийском университете в Сан-Диего. [9] AARON является наиболее ярким примером искусства искусственного интеллекта в эпоху программирования GOFAI из-за использования символического подхода, основанного на правилах, для создания технических изображений. [10] Коэн разработал AARON с целью кодирования процесса рисования. В своей примитивной форме ААРОН создавал простые черно-белые рисунки. Позже Коэн закончил рисунки, раскрасив их. С годами он также начал разрабатывать способ рисования ААРОНОМ. Коэн разработал AARON для рисования с использованием специальных кистей и красок, которые были выбраны самой программой без посредничества Коэна. [11] ААРОН был выставлен в 1972 году в Музее искусств округа Лос-Анджелес . [12]
И в 1991, и в 1992 году Карл Симс получил награду Golden Nica на Prix Ars Electronica за свои 3D-анимационные видеоролики с использованием искусственного интеллекта с использованием искусственной эволюции. [13] [14] [15]
В 2001 году Скотт Дрейвс получил приз Fundacion Telefonica Life 4.0 [16] за проект Electric Sheep , который использовал искусственный интеллект для создания бесконечной анимации, обучаясь у своей аудитории.
В 2009 году Эрик Милликин получил Пулитцеровскую премию вместе с несколькими другими наградами за свое искусство искусственного интеллекта, которое критиковало коррупцию в правительстве Детройта и привело к тому, что мэра города отправили в тюрьму. [17] [18] [19]
В 2014 году Ян Гудфеллоу и его коллеги из Университета Монреаля разработали генеративно-состязательную сеть (GAN) — тип глубокой нейронной сети , способной учиться имитировать статистическое распределение входных данных, таких как изображения. GAN использует «генератор» для создания новых изображений и «дискриминатор», чтобы решить, какие созданные изображения считаются успешными. [20] В отличие от предыдущего алгоритмического искусства, которое следовало правилам, закодированным вручную, генеративно-состязательные сети могли изучать конкретную эстетику, анализируя набор данных примеров изображений. [7]
В 2015 году команда Google выпустила DeepDream — программу, которая использует сверточную нейронную сеть для поиска и улучшения закономерностей в изображениях с помощью алгоритмической парейдолии . [21] [22] [23] В результате этого процесса создаются намеренно чрезмерно обработанные изображения, напоминающие сон, напоминающие психоделический опыт . [24]
В 2018 году в аукционном доме Christie's в Нью-Йорке прошла аукционная распродажа произведений искусства искусственного интеллекта, где произведение искусства искусственного интеллекта Эдмона де Белами (каламбур от имени Гудфеллоу) было продано за 432 500 долларов, что почти в 45 раз превысило его оценку в 7 000–10 000 долларов. . Работа была создана парижским коллективом Obvious . [25] [26] [27] Веб-сайт Artbreeder , запущенный в 2018 году, использует модели StyleGAN и BigGAN [28] [29] , позволяющие пользователям создавать и изменять изображения, такие как лица, пейзажи и картины. [30]
В 2019 году Стефани Динкинс получила награду Creative Capital за создание развивающегося искусственного интеллекта, основанного на «интересах и культуре (культурах) цветных людей». [31] Также в 2019 году Сугвен Чанг получила премию Lumen Prize за свои выступления с роботизированной рукой, которая использует искусственный интеллект, чтобы попытаться рисовать так же, как Чанг. [32]
В 2020-х годах трендом стали модели преобразования текста в изображение , которые генерируют изображения на основе подсказок . [33]
В 2021 году, используя модели Transformer , используемые в GPT-2 и GPT-3 , OpenAI выпустила серию изображений, созданных с помощью модели AI преобразования текста в изображение DALL-E . [34] Позже, в 2021 году, EleutherAI выпустила VQGAN+CLIP с открытым исходным кодом, [35] основанную на модели CLIP OpenAI . [36]
В 2022 году был выпущен Midjourney [37] , за ним последовали Imagen и Parti от Google Brain , анонсированные в мае 2022 года, NUWA-Infinity от Microsoft , [38] [33] и выпущенный исходный код Stable Diffusion . в августе 2022 года. [39] [40] [41] Stability.ai имеет веб-интерфейс Stable Diffusion под названием DreamStudio, [42] плагины для Krita , Photoshop , Blender и GIMP , [43] а также веб-интерфейс Automatic1111. пользовательский интерфейс с открытым исходным кодом . [44] [45] [46] Основная предварительно обученная модель Stable Diffusion размещена на Hugging Face Hub . [47]
Было разработано множество механизмов для создания искусств ИИ, включая процедурную генерацию изображений на основе правил с использованием математических шаблонов, алгоритмы, имитирующие мазки кисти и другие нарисованные эффекты, а также алгоритмы глубокого обучения, такие как генеративно-состязательные сети (GAN) и трансформаторы . Несколько компаний выпустили приложения, которые превращают фотографии в художественные изображения в стиле известных наборов картин. [48] [49]
Существует множество других программ для создания произведений искусства с использованием искусственного интеллекта, включая простые мобильные приложения, ориентированные на потребителя, и ноутбуки Jupyter , для эффективной работы которых требуются мощные графические процессоры . [50] Дополнительные функции включают в себя«Текстовая инверсия», которая означает возможность использования предоставленных пользователем концепций (например, объекта или стиля), полученных из нескольких изображений. С помощью текстовой инверсии новое персонализированное искусство может быть создано из связанных слов (ключевых слов, которые были присвоены изученному, часто абстрактному, понятию) [51] [52] и расширений/ тонкой настройки модели (см. также: Бут Мечты ).
Выставка «Мыслящие машины: искусство и дизайн в эпоху компьютеров, 1959–1989» в МоМА представила обзор приложений искусственного интеллекта в искусстве, архитектуре и дизайне. Выставки, демонстрирующие использование искусственного интеллекта для создания произведений искусства, включают благотворительный фонд Google в 2016 году и аукцион в Gray Area Foundation в Сан-Франциско, где художники экспериментировали с алгоритмом DeepDream , а также выставку 2017 года «Нечеловеческое: искусство в эпоху искусственного интеллекта», которая проходил в Лос-Анджелесе и Франкфурте. Весной 2018 года Ассоциация вычислительной техники посвятила выпуск журнала теме компьютеров и искусства. В июне 2018 года в Центре искусства и технологий Билла состоялась премьера произведения искусства «Дуэт человека и машины», позволяющего зрителям взаимодействовать с искусственным интеллектом. Австрийский Ars Electronica и Музей прикладного искусства в Вене открыли выставки, посвященные искусственному интеллекту, в 2019 году. Фестиваль Ars Electronica 2019 года «Из коробки» исследовал роль искусства в устойчивой общественной трансформации.
Примеры такого расширения могут включать, например, расширение некоммерческих нишевых жанров (обычными примерами являются производные от киберпанка , такие как соларпанк ) любителями, новые развлечения, новые творческие детские игры, [ необходимы дополнительные ссылки ] очень быстрое прототипирование, [53] рост искусства -обеспечение доступности [53] и художественного результата в зависимости от усилий и/или затрат и/или времени [53] – например, посредством создания черновиков, вдохновения, доработок черновиков и компонентов изображения ( Inpainting ).
Сгенерированные изображения иногда используются в качестве эскизов [54] или недорогих экспериментов [55] или иллюстрации идей на этапе проверки концепции – дополнительные функциональные возможности или улучшения могут также относиться к ручному редактированию после создания (шлифовке или художественному использованию) искусство на основе подсказок [ необходимы дополнительные ссылки ] (например, последующая настройка с помощью редактора изображений). [55]
Подсказки для некоторых моделей преобразования текста в изображение могут также включать изображения, ключевые слова и настраиваемые параметры, такие как художественный стиль , который часто используется с помощью таких ключевых фраз, как «в стиле [имя художника]» в подсказке [56] и /или выбор широкого эстетического/художественного стиля. [57] [54] Существуют платформы для обмена, обмена, поиска, разветвления/уточнения и/или совместной работы над подсказками для создания конкретных изображений с помощью генераторов изображений. [58] [59] [60] [61] Подсказки часто публикуются вместе с изображениями на веб-сайтах для обмена изображениями , таких как Reddit и веб-сайты, посвященные искусству искусственного интеллекта. Подсказка не является полным вводом, необходимым для создания изображения: дополнительные входные данные, которые определяют сгенерированное изображение, включают выходное разрешение, случайное начальное число и параметры случайной выборки. [62]
Синтетические медиа , в том числе искусство искусственного интеллекта, были описаны в 2022 году как крупная технологическая тенденция, которая повлияет на бизнес в ближайшие годы. [53] «Синтография» — это предложенный термин для обозначения практики создания изображений, похожих на фотографии, с использованием ИИ. [63]
Ученые-правоведы, художники и медиакорпорации рассматривают правовые и этические последствия искусства искусственного интеллекта с 20-го века.
В 1985 году профессор права интеллектуальной собственности Памела Самуэльсон утверждала, что авторские права США на произведения искусства, созданные алгоритмически, должны быть переданы пользователю компьютерной программы. [64] В статье Florida Law Review за 2019 год представлены три точки зрения на этот вопрос. В первом случае правообладателем станет сам искусственный интеллект. Для этого в раздел 101 Закона США об авторском праве необходимо внести поправки, определяющие «автора» как физическое лицо или компьютер. Во втором случае, согласно аргументу Самуэльсона, владельцем авторских прав будет пользователь, программист или компания, занимающаяся искусственным интеллектом. Это было бы расширением доктрины «работы по найму», согласно которой право собственности на авторские права передается «работодателю». В третьей ситуации передача авторских прав никогда не произойдет, и такие произведения будут находиться в общественном достоянии , поскольку передача авторских прав требует акта авторства. [65]
В 2022 году, совпав с ростом доступности услуг по созданию изображений с помощью искусственного интеллекта потребительского уровня, возобновилась популярная дискуссия по поводу законности и этики искусства, созданного с помощью искусственного интеллекта. Особую проблему вызывает использование произведений искусства, защищенных авторским правом, в наборах данных для обучения ИИ : в сентябре 2022 года Рима Селхи из Общества авторского права дизайнеров и художников заявила, что «не существует никаких гарантий, позволяющих художникам идентифицировать произведения в базах данных, которые используются». и отказаться». [66] Некоторые утверждают, что изображения, созданные с помощью этих моделей, могут иметь сверхъестественное сходство с дошедшими до нас произведениями искусства, иногда включая остатки подписи оригинального художника. [66] [67] В декабре 2022 года пользователи платформы портфолио ArtStation устроили онлайн-протест против несогласованного использования их произведений искусства в наборах данных: это привело к тому, что такие сервисы, как «Я прошел обучение?», стали более популярными. , а также некоторые художественные онлайн-платформы, обещающие предложить свои собственные варианты отказа. [68] По данным Бюро регистрации авторских прав США , программы искусственного интеллекта не могут защищать авторские права, [69] [70] [71] решение, оставленное в силе на уровне Федерального округа по состоянию на август 2023 года, последовало за обоснованием спора об авторских правах на селфи обезьяны . [72]
Проблема многих популярных художественных программ с искусственным интеллектом заключается в том, что они генерируют изображения на основе работ художников без их согласия. [73] В январе 2023 года три художника — Сара Андерсен , Келли МакКернан и Карла Ортис — подали иск о нарушении авторских прав против Stability AI , Midjourney и DeviantArt , утверждая, что по закону требуется получить согласие художников, прежде чем обучать нейронные сети на их работы, и что эти компании нарушили права миллионов художников, сделав это в отношении пяти миллиардов изображений, взятых из Интернета. [74] В июле 2023 года окружной судья США Уильям Оррик был склонен отклонить большую часть иска, поданного Андерсеном, МакКернаном и Ортисом, но разрешил им подать новую жалобу. [75]
Также в 2023 году Getty Images подала в суд на Stability AI за использование ее изображений в обучающих данных. [76]
В марте 2024 года Теннесси принял Закон об ЭЛВИСе , который запрещает использование искусственного интеллекта для имитации голоса музыканта без разрешения. [77] Месяц спустя в том же году Адам Шифф представил Закон о раскрытии авторских прав на генеративный ИИ. В случае принятия он потребует от компаний, занимающихся ИИ, представлять в Реестр авторских прав работы, защищенные авторским правом, в своих наборах данных , прежде чем выпускать новые системы генеративного ИИ. [78]
По мере того, как программное обеспечение для создания изображений с использованием искусственного интеллекта, такое как Stable Diffusion и DALL-E, продолжает развиваться и распространяться, потенциальные проблемы и опасения, которые эти системы создают для творчества и артистизма, растут. [79] В 2022 году художники, работающие в различных средствах массовой информации, выразили обеспокоенность по поводу влияния генеративного искусственного интеллекта на их способность зарабатывать деньги, особенно если изображения на основе ИИ начнут заменять художников, работающих в сфере иллюстрации и дизайна. [80] [81] В августе 2022 года цифровой художник Р. Дж. Палмер заявил: «Я мог бы легко представить себе сценарий, в котором с помощью ИИ один художник или арт-директор мог бы заменить 5-10 художников начального уровня... Я видел многие авторы, публикующиеся самостоятельно, и им подобные говорят, как здорово, что им не придется нанимать художника». [67] Ученые Цзян и др. Поддержите эту обеспокоенность по поводу потери рабочих мест в творческих областях, заявив: «Лидеры таких компаний, как Open AI и Stability AI, открыто заявили, что они ожидают, что генеративные системы искусственного интеллекта неизбежно заменят креативщиков», и добавив, что «Это перемещение рабочей силы очевидно во всех творческих отраслях». . Например, согласно статье «Остальный мир», рекрутер из китайской игровой индустрии заметил сокращение количества вакансий иллюстраторов на 70%, отчасти из-за широкого использования генераторов изображений; Сообщается, что другая студия в Китае уволила треть своих иллюстраторов дизайна персонажей». [79]
Изображения на основе искусственного интеллекта стали более распространенными на арт-рынках и в поисковых системах, поскольку системы преобразования текста в изображения на основе искусственного интеллекта обучаются на основе уже существующих художественных изображений, иногда без согласия оригинального художника, что позволяет программному обеспечению имитировать стили конкретных художников. [79] [82] Например, польский цифровой художник Грег Рутковски заявил, что его работы труднее искать в Интернете, поскольку многие изображения в результатах созданы с помощью искусственного интеллекта специально для имитации его стиля. [40] Кроме того, некоторые обучающие базы данных, на которых основаны системы искусственного интеллекта, недоступны для общественности, что делает невозможным узнать, в какой степени их обучающие данные содержат изображения, защищенные авторским правом. Например, инструмент, созданный Саймоном Уиллисоном, позволил людям искать 0,5% обучающих данных для Stable Diffusion V1.1, то есть 12 миллионов из 2,3 миллиардов экземпляров из LAION 2B. Художница Карен Халлион обнаружила, что их изображения, защищенные авторским правом, использовались в качестве обучающих данных без их согласия. [79]
Способность художественного программного обеспечения на основе искусственного интеллекта имитировать или создавать художественный стиль также вызывает опасения по поводу злого умысла или жадности. [79] [83] [84] Произведения искусства, созданные с помощью искусственного интеллекта, такие как Théâtre d'Opéra Spatial , иллюстрация искусственного интеллекта для преобразования текста в изображение , получившая главный приз на конкурсе цифрового искусства в августе 2022 года на Ярмарке штата Колорадо, начали подавлять художественные конкурсы и другие форумы, предназначенные для маленьких художников. [79] [83] [84] Короткометражный фильм Netflix « Собака и мальчик» , выпущенный в январе 2023 года, вызвал негативную реакцию в Интернете из-за использования искусства искусственного интеллекта для создания фонового изображения фильма. [85]
Победитель конкурса Sony World Photography Awards 2023 года в категории «творческое открытие» Борис Эльдагсен после победы заявил, что его работа на самом деле была создана искусственным интеллектом. Фотограф Фероз Хан прокомментировал Би-би-си, что Эльдагсен «ясно показал, что даже опытных фотографов и искусствоведов можно обмануть». [86] Затронуты и более мелкие конкурсы; В 2023 году конкурс под названием « Конкурс обложек для самостоятельно опубликованных фэнтезийных блогов », проводимый автором Марком Лоуренсом , был отменен после того, как победившая работа предположительно представляла собой коллаж из изображений, созданных Midjourney. [87]
Более широкие проблемы выходят за рамки мира искусства. Как и в случае с другими видами манипуляций с фотографиями с начала 19-го века, некоторые люди в начале 21-го века были обеспокоены тем, что ИИ может использоваться для создания вводящего в заблуждение контента, известного как « дипфейки ». [88]
В мае 2023 года в социальных сетях, таких как Reddit и Twitter , внимание было обращено на созданное Midjourney изображение Папы Франциска в белом пуховике. [89] [90] Несколько фотографий, созданных искусственным интеллектом и изображающих вымышленный арест Дональда Трампа, также стали вирусными. [91] [92] Кроме того, созданное ИИ изображение нападения на Пентагон стало вирусным как часть ложной новости в Твиттере. [93]
Изображения, созданные с помощью искусственного интеллекта, вызвали опасения, что они могут нанести ущерб репутации художника. Художница Сара Андерсен скопировала свои работы, а затем использовала их для изображения неонацистской идеологии. Она заявила, что распространение языка ненависти в Интернете может быть усугублено использованием генераторов изображений. [79] Цзян и др. Также добавьте к этому мнению, заявив, что «инструменты, созданные на основе работ художников и позволяющие пользователям имитировать их стиль без их согласия или компенсации, могут нанести значительный репутационный ущерб [путем] распространения сообщений, которые они не одобряют». [79]
Еще одна серьезная проблема, возникающая в отношении изображений и произведений искусства, созданных ИИ, — это смещение выборки в данных обучения моделей, что приводит к дискриминационным выводам художественных моделей ИИ. В 2023 году исследователи Вашингтонского университета обнаружили доказательства расовой предвзятости в модели стабильной диффузии: изображения «человека» чаще всего соответствуют изображениям мужчин из Европы или Северной Америки. [94]
Исследователи из Hugging Face и Университета Карнеги-Меллон сообщили в статье 2023 года, что для создания одной тысячи изображений 1024x1024 с использованием базовой модели XL 1.0 от Stable Diffusion требуется 11,49 кВтч энергии и выделяется 1594 граммов углекислого газа , что примерно эквивалентно сжиганию среднего газа. -автомобиль на расстояние 4,1 мили. [95]
Изображения, созданные ИИ, заставляют многих художников беспокоиться о том, как общество ценит их и их продукцию. Художники опасаются, что производство ИИ приведет к обесцениванию традиционно созданного искусства, поскольку люди не смогут производить в масштабах и по цене модели ИИ. [96]
Системы искусственного интеллекта способны создавать дипфейковый контент, который часто рассматривается как вредный и оскорбительный. Создание дипфейков представляет риск для лиц, не давших на это согласия. [96] В основном это относится к порнографии из мести, когда материалы откровенно сексуального характера распространяются с целью унизить или причинить вред другому человеку.
Детская порнография, созданная с помощью ИИ, может представлять опасность для общества из-за своей противоправной природы. [97]
Системы искусственного интеллекта собирают данные для создания решений. При сборе данных из различных источников возникает вопрос, можно ли использовать данные для создания произведения. [98] Галантер ставит вопрос о том, как отдать должное посредством мыслительного процесса дифференциации художника и художественных влияний. [99]
Помимо создания оригинальных произведений искусства, были разработаны исследовательские методы с использованием ИИ для количественного анализа коллекций цифрового искусства. Это стало возможным благодаря масштабной оцифровке произведений искусства за последние несколько десятилетий. Хотя основная цель оцифровки заключалась в обеспечении доступности и изучения этих коллекций, использование искусственного интеллекта для их анализа открыло новые перспективы исследований. [100]
Два вычислительных метода: чтение с близкого расстояния и наблюдение с расстояния — типичные подходы, используемые для анализа оцифрованного искусства. [101] При внимательном чтении основное внимание уделяется конкретным визуальным аспектам одного произведения. Некоторые задачи, выполняемые машинами с помощью методов близкого чтения, включают аутентификацию художника и анализ мазков кисти или свойств текстуры. Напротив, с помощью методов удаленного просмотра можно статистически визуализировать сходство всей коллекции по определенному признаку. Общие задачи, связанные с этим методом, включают автоматическую классификацию, обнаружение объектов , мультимодальные задачи, открытие знаний в истории искусства и вычислительную эстетику. [100] В то время как дистанционное просмотр включает в себя анализ больших коллекций, внимательное чтение предполагает одно произведение искусства. [ нужна цитата ]
Исследователи также представили модели, прогнозирующие эмоциональные реакции на искусство, такие как ArtEmis, крупномасштабный набор данных с моделями машинного обучения, которые содержат эмоциональные реакции на визуальное искусство, а также прогнозирование эмоций по изображениям или тексту. [102]
По мнению CETINIC и SHE (2022), использование искусственного интеллекта для анализа уже существующих коллекций произведений искусства может дать свежий взгляд на развитие художественных стилей и выявление художественных влияний. Изучение существующего искусства с помощью ИИ также может помочь в организации художественных выставок и поддержать процесс принятия решений кураторов и историков искусства. [103]
Программы искусственного интеллекта могут автоматически генерировать новые изображения произведений искусства, аналогичные тем, которые были получены из образца. Людям в основном нужно просто вводить данные и различать выходные данные. Сочетание механизмов ИИ и механизмов создания произведений искусства позволяет ИИ создавать произведения. [104]
Синтетические изображения также можно использовать для обучения алгоритмов искусственного интеллекта для аутентификации произведений искусства и обнаружения подделок. [105]
Некоторые прототипы роботов могут создавать то, что можно считать формой искусства – например, динамических роботов-поваров , способных пробовать вкус и приспосабливаться. [106]
Помимо редактирования текстов, существует также писательство с помощью ИИ [107] (включая поддержку в создании вымышленных историй, например, помощь при писательском кризисе или вдохновении или переписывании фрагментов). [108] [109] [110] [111]
Генеративный ИИ также использовался в производстве видеоигр помимо изображений , особенно для дизайна уровней (например, для пользовательских карт ) и создания нового контента (например, для квестов, диалогов) или интерактивных историй в видеоиграх. [112] [113]
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка )