Многоагентная система ( МАС или «самоорганизующаяся система») — это компьютеризированная система, состоящая из нескольких взаимодействующих интеллектуальных агентов . [1] Многоагентные системы могут решать проблемы, которые сложно или невозможно решить отдельному агенту или монолитной системе . [2] Интеллект может включать методические , функциональные , процедурные подходы, алгоритмический поиск или обучение с подкреплением . [3] С достижениями в области больших языковых моделей (LLM) многоагентные системы на основе LLM стали новой областью исследований, обеспечивающей более сложные взаимодействия и координацию между агентами. [4]
Несмотря на значительное совпадение, многоагентная система не всегда совпадает с агентной моделью (ABM). Целью ABM является поиск объяснительного понимания коллективного поведения агентов (которые не обязательно должны быть «интеллектуальными»), подчиняющихся простым правилам, как правило, в естественных системах, а не при решении конкретных практических или инженерных задач. Терминология ABM, как правило, чаще используется в науке, а MAS — в инженерии и технологиях. [5] Приложения, в которых исследование многоагентных систем может обеспечить соответствующий подход, включают онлайн-торговлю, [6] реагирование на стихийные бедствия, [7] [8] наблюдение за целями [9] и моделирование социальной структуры. [10]
Концепция
Мультиагентные системы состоят из агентов и их окружения . Обычно исследования мультиагентных систем относятся к программным агентам . Однако агентами в мультиагентной системе могут быть как роботы, так и люди или человеческие команды. Мультиагентная система может содержать комбинированные команды человек-агент.
Агенты можно разделить на типы от простых до сложных. Категории включают:
Пассивные агенты [11] или «агенты без целей» (например, препятствие, яблоко или ключ в любой простой симуляции)
Активные агенты [11] с простыми целями (как птицы в стае или волки-овцы в модели «хищник-жертва» )
Когнитивные агенты (сложные вычисления)
Агентские среды можно разделить на:
Виртуальный
Дискретный
Непрерывный
Агентские среды также могут быть организованы в соответствии со свойствами, такими как доступность (возможно ли собрать полную информацию об окружающей среде), детерминизм (вызывает ли действие определенный эффект), динамика (сколько сущностей влияют на окружающую среду в данный момент), дискретность (конечно ли число возможных действий в окружающей среде), эпизодичность (влияют ли действия агента в определенные периоды времени на другие периоды) [12] и размерность (являются ли пространственные характеристики важными факторами окружающей среды и учитывает ли агент пространство при принятии решений). [13] Действия агентов обычно опосредуются через соответствующее промежуточное программное обеспечение. Это промежуточное программное обеспечение предлагает первоклассную абстракцию дизайна для многоагентных систем, предоставляя средства для управления доступом к ресурсам и координации агентов. [14]
Характеристики
Агенты в многоагентной системе имеют несколько важных характеристик: [15]
Автономность: агенты по крайней мере частично независимы, осознают себя, автономны.
Локальные представления: ни один агент не имеет полного глобального представления, или система слишком сложна для того, чтобы агент мог использовать такие знания
Децентрализация: ни один агент не назначается в качестве контролирующего (или система фактически сводится к монолитной системе) [16]
Самоорганизация и самонаправление
Многоагентные системы могут проявлять самоорганизацию , а также самонаправление и другие парадигмы управления и связанное с ними сложное поведение, даже если индивидуальные стратегии всех их агентов просты. [ необходима цитата ] Когда агенты могут обмениваться знаниями, используя любой согласованный язык, в рамках ограничений протокола связи системы, подход может привести к общему улучшению. Примерами языков являются язык манипуляции запросами знаний (KQML) или язык общения агентов (ACL).
Системные парадигмы
Многие MAS реализованы в компьютерном моделировании, пошаговом прохождении системы через дискретные «шаги времени». Компоненты MAS обычно взаимодействуют с помощью матрицы взвешенных запросов, например
Скорость-ОЧЕНЬ_ВАЖНО: мин=45 миль/ч, Длина пути-MEDIUM_IMPORTANCE: макс=60 ожидаемыйМакс=40, Макс-Вес-НЕВАЖНО Приоритет контракта-РЕГУЛЯРНЫЙ
и матрица взвешенного ответа, например
Скорость-мин:50, но только если погода солнечная, Длина пути: 25 для солнечной погоды / 46 для дождливой погоды Приоритет контракта-РЕГУЛЯРНЫЙ примечание — скорая помощь отменит этот приоритет, и вам придется подождать
Схема «вызов-ответ-контракт» распространена в системах MAS, где
Сначала раздается вопрос « Кто может? » .
Только соответствующие компоненты отвечают: « Я могу, по этой цене » .
Наконец, заключается контракт, обычно в несколько коротких этапов общения между сторонами,
также рассматриваются другие компоненты, развивающиеся «контракты» и наборы ограничений алгоритмов компонентов.
Другая парадигма, обычно используемая с MAS, — это « феромон », где компоненты оставляют информацию для других близлежащих компонентов. Эти феромоны могут испаряться/концентрироваться со временем, то есть их значения могут уменьшаться (или увеличиваться).
Характеристики
MAS склонны находить наилучшее решение своих проблем без вмешательства. Здесь есть большое сходство с физическими явлениями, такими как минимизация энергии, когда физические объекты стремятся достичь минимально возможной энергии в физически ограниченном мире. Например: многие автомобили, въезжающие в мегаполис утром, будут доступны для выезда из того же мегаполиса вечером.
Системы также имеют тенденцию предотвращать распространение неисправностей, самовосстанавливаться и быть отказоустойчивыми, в основном за счет избыточности компонентов.
Исследовать
Изучение многоагентных систем «занимается разработкой и анализом сложных архитектур решения проблем и управления ИИ как для одноагентных, так и для многоагентных систем». [17] Темы исследований включают:
агентно-ориентированная разработка программного обеспечения
научные сообщества (например, по биологическому стадному скоплению, эволюции языка и экономике) [19] [20]
надежность и отказоустойчивость
робототехника, [21] многороботные системы (МРС), роботизированные кластеры
Многоагентные системы также находят возможное применение в микроробототехнике [22] , где физическое взаимодействие между агентами используется для выполнения сложных задач, таких как манипулирование и сборка пассивных компонентов.
многоагентные системы на основе языковой модели [4]
Фреймворки
Появились фреймворки, реализующие общие стандарты (например, стандарты FIPA и OMG MASIF). [23] Эти фреймворки, например JADE , экономят время и помогают в стандартизации разработки MAS. [24]
В настоящее время, однако, ни один стандарт не поддерживается активно FIPA или OMG. Усилия по дальнейшей разработке программных агентов в промышленном контексте проводятся в техническом комитете IEEE IES по промышленным агентам. [25]
Благодаря достижениям в области больших языковых моделей (LLM), таких как ChatGPT , многоагентные фреймворки на основе LLM стали новой парадигмой для разработки многоагентных приложений, причем CAMEL [26] [4] от CAMEL-AI.org стал первым заметным фреймворком в этой области.
Приложения
MAS применяются не только в академических исследованиях, но и в промышленности. [27] MAS применяются в реальном мире для графических приложений, таких как компьютерные игры. Агентские системы использовались в фильмах. [28] Их широко пропагандируют для использования в сетевых и мобильных технологиях, для достижения автоматической и динамической балансировки нагрузки, высокой масштабируемости и самовосстанавливающихся сетей. Они используются для скоординированных систем обороны.
Другие приложения [29] включают транспорт , [30] логистику, [31] графику, производство, энергосистемы , [ 32] интеллектуальные сети [33] и ГИС .
Кроме того, многоагентные системы искусственного интеллекта (MAAI) используются для моделирования обществ, их цель - помочь в области климата, энергетики, эпидемиологии, управления конфликтами, жестокого обращения с детьми, .... [34] Некоторые организации, работающие над использованием моделей многоагентных систем, включают Центр моделирования социальных систем, Центр исследований в области социального моделирования, Центр моделирования политики, Общество моделирования и Международного моделирования. [34]
Движение транспортных средств с контролируемыми автономными транспортными средствами можно моделировать как многоагентную систему, включающую динамику толпы. [35]
Халлербах и др. обсудили применение подходов на основе агентов для разработки и проверки автоматизированных систем вождения с помощью цифрового двойника тестируемого транспортного средства и микроскопического моделирования дорожного движения на основе независимых агентов. [36] Waymo создала многоагентную среду моделирования Carcraft для тестирования алгоритмов для беспилотных автомобилей . [37] [38] Она моделирует взаимодействие между водителями-людьми, пешеходами и автоматизированными транспортными средствами. Поведение людей имитируется искусственными агентами на основе данных реального человеческого поведения.
^ Йоав Шохам, Кевин Лейтон-Браун. Многоагентные системы: алгоритмические, игровые и логические основы. Cambridge University Press, 2009. http://www.masfoundations.org/
^ Ху, Дж.; Тургут, А.; Леннокс, Б.; Арвин, Ф., «Надежная координация формирования роев роботов с нелинейной динамикой и неизвестными возмущениями: проектирование и эксперименты» Труды IEEE по схемам и системам II: Экспресс-краткие обзоры, 2021.
^ Стефано В. Альбрехт, Филиппос Кристианос, Лукас Шефер. Многоагентное обучение с подкреплением: основы и современные подходы. MIT Press, 2024. https://www.marl-book.com/
^ abc Ли, Гохао (2023). «Верблюд: коммуникативные агенты для исследования «разума» большой языковой модели общества» (PDF) . Достижения в области нейронных систем обработки информации . 36 : 51991–52008. doi :10.48550/arXiv.2303.17760. S2CID 257900712.
^ Ниази, Муаз; Хуссейн, Амир (2011). «Агентные вычисления от многоагентных систем до агентов-ориентированных моделей: визуальный обзор» (PDF) . Scientometrics . 89 (2): 479–499. arXiv : 1708.05872 . doi :10.1007/s11192-011-0468-9. hdl :1893/3378. S2CID 17934527.
^ Rogers, Alex; David, E.; Schiff, J.; Jennings, NR (2007). "The Effects of Proxy Bidding and Minimum Bid Increments within eBay Auctions". ACM Transactions on the Web . 1 (2): 9–es. CiteSeerX 10.1.1.65.4539 . doi :10.1145/1255438.1255441. S2CID 207163424. Архивировано из оригинала 2 апреля 2010 г. Получено 18 марта 2008 г.
^ Шурр, Натан; Марецкий, Януш; Тамбе, Милинд; Шерри, Пол; Касинадхуни, Нихил; Льюис, JP (2005). «Будущее реагирования на стихийные бедствия: люди, работающие в многоагентных группах с использованием DEFACTO». Архивировано (PDF) из оригинала 3 июня 2013 г. Проверено 8 января 2024 г.
^ Генч, Зулькуф и др. (2013). «Информационная инфраструктура на основе агентов для управления катастрофами» (PDF) . Интеллектуальные системы для управления кризисами . Конспект лекций по геоинформатике и картографии. стр. 349–355. doi :10.1007/978-3-642-33218-0_26. ISBN978-3-642-33217-3.
^ Ху, Джуньян; Бхоумик, Париджат; Ланзон, Александр (2020). «Распределенное адаптивное отслеживание формирования изменяющихся во времени групп для многоагентных систем с несколькими лидерами на направленных графах». Труды IEEE по управлению сетевыми системами . 7 : 140–150. doi : 10.1109/TCNS.2019.2913619 . S2CID 149609966.
^ Сан, Рон ; Навех, Айзек (30 июня 2004 г.). «Моделирование принятия организационных решений с использованием когнитивно реалистичной модели агента». Журнал искусственных обществ и социального моделирования .
^ Кубера, Йоанн; Матье, Филипп; Пико, Себастьен (2010), «Все может быть агентом!» (PDF) , Труды Девятой международной совместной конференции по автономным агентам и многоагентным системам (AAMAS'2010) : 1547–1548
^ Рассел, Стюарт Дж.; Норвиг , Питер (2003), Искусственный интеллект: современный подход (2-е изд.), Аппер Сэдл Ривер, Нью-Джерси: Prentice Hall, ISBN0-13-790395-2
^ Саламон, Томас (2011). Разработка моделей на основе агентов. Репин: Bruckner Publishing. стр. 22. ISBN978-80-904661-1-1.
^ Weyns, Danny; Omicini, Amdrea; Odell, James (2007). «Окружающая среда как первоклассная абстракция в многоагентных системах». Автономные агенты и многоагентные системы . 14 (1): 5–30. CiteSeerX 10.1.1.154.4480 . doi :10.1007/s10458-006-0012-0. S2CID 13347050.
^ Альбрехт, Стефано; Стоун, Питер (2017), «Мультиагентное обучение: основы и последние тенденции. Учебное пособие», конференция IJCAI-17 (PDF)
^ Cucker, Felipe; Steve Smale (2007). "The Mathematics of Emergence" (PDF) . Japanese Journal of Mathematics . 2 : 197–227. doi :10.1007/s11537-007-0647-x. S2CID 2637067 . Получено 9 июня 2008 г. .
^ Шен, Джеки (Цзяньхун) (2008). «Cucker–Smale Flocking under Hierarchical Leadership». SIAM J. Appl. Math . 68 (3): 694–719. arXiv : q-bio/0610048 . doi :10.1137/060673254. S2CID 14655317. Получено 9 июня 2008 г.
^ Ахмед, С.; Карсити, МН (2007), «Испытательный стенд для схем управления с использованием многоагентных неголономных роботов», Международная конференция IEEE по электроинформационным технологиям 2007 г., стр. 459, doi :10.1109/EIT.2007.4374547, ISBN978-1-4244-0940-2, S2CID 2734931
^ Ян, Лидонг; Ли, Чжан (2021). «Управление движением в магнитной микроробототехнике: от отдельных и множественных роботов до роев». Ежегодный обзор управления, робототехники и автономных систем . 4 : 509–534. doi :10.1146/annurev-control-032720-104318. S2CID 228892228.
^ "OMG Document – orbos/97-10-05 (Обновление пересмотренного представления MAF)". www.omg.org . Получено 19 февраля 2019 г. .
^ Ахмед, Салман; Карсити, Мохд Н.; Агустиаван, Герман (2007). «Структура разработки коллаборативных роботов с использованием управления с обратной связью» . Получено 8 января 2024 г.
^ "Технический комитет IEEE IES по промышленным агентам (TC-IA)". tcia.ieee-ies.org . Получено 19 февраля 2019 г. .
^ «CAMEL: Поиск закона масштабирования агентов. Первая и лучшая многоагентная структура».
^ Лейтан, Пауло; Карнускос, Стаматис (26 марта 2015 г.). Промышленные агенты: новые возможности применения программных агентов в промышленности . Лейтао, Пауло, Карнускос, Стаматис. Амстердам, Нидерланды. ISBN978-0128003411. OCLC 905853947.{{cite book}}: CS1 maint: location missing publisher (link)
^ "Film showcase". MASSIVE . Получено 28 апреля 2012 г. .
^ Лейтао, Пауло; Карнускос, Стаматис; Рибейро, Луис; Ли, Джей; Штрассер, Томас; Коломбо, Армандо В. (2016). «Умные агенты в промышленных киберфизических системах». Труды IEEE . 104 (5): 1086–1101. doi :10.1109/JPROC.2016.2521931. hdl : 10198/15438 . ISSN 0018-9219. S2CID 579475.
^ Сяо-Фэн Се, С. Смит, Г. Барлоу. Координация на основе расписания для управления транспортной сетью в реальном времени. Международная конференция по автоматизированному планированию и составлению расписаний (ICAPS), Сан-Паулу, Бразилия, 2012: 323–331.
^ Máhr, TS; Srour, J.; De Weerdt, M.; Zuidwijk, R. (2010). «Могут ли агенты соответствовать требованиям? Сравнительное исследование подхода к оптимизации на основе агентов и онлайн-оптимизации для решения проблемы перевозки с неопределенностью». Transportation Research Часть C: Новые технологии . 18 : 99–119. CiteSeerX 10.1.1.153.770 . doi :10.1016/j.trc.2009.04.018.
^ Каземи, Хамидреза; Лиаси, Саханд; Шейх-Эль-Эслами, Мохаммадказем (ноябрь 2018 г.). «Планирование расширения генерации с учетом динамики инвестиций участников рынка с использованием многоагентной системы». Конференция по интеллектуальным сетям 2018 г. (SGC) . стр. 1–6. doi :10.1109/SGC.2018.8777904. ISBN978-1-7281-1138-4. Получено 8 января 2024 г. .
^ Сингх, Виджай; Сэмюэл, Полсон (6 июня 2017 г.). «Распределенная многоагентная система управления частотой нагрузки для многозонной энергосистемы в интеллектуальной сети». IEEE Transactions on Industrial Electronics . 64 (6): 5151–5160. doi :10.1109/TIE.2017.2668983 . Получено 8 января 2024 г.
^ ab «ИИ может предсказать ваше будущее поведение с помощью новых мощных симуляций». New Scientist .
^ Гун, Сяоцянь; Херти, Майкл; Пикколи, Бенедетто; Висконти, Джузеппе (3 мая 2023 г.). «Динамика толпы: моделирование и управление многоагентными системами». Ежегодный обзор управления, робототехники и автономных систем . 6 (1): 261–282. doi : 10.1146/annurev-control-060822-123629 . ISSN 2573-5144.
^ Hallerbach, S.; Xia, Y.; Eberle, U.; Koester, F. (2018). «Идентификация критических сценариев для кооперативных и автоматизированных транспортных средств на основе моделирования». SAE International Journal of Connected and Automated Vehicles . 1 (2). SAE International: 93. doi :10.4271/2018-01-1066.
^ Madrigal, рассказ Алексис С. «Внутри секретного мира Waymo для обучения беспилотных автомобилей». The Atlantic . Получено 14 августа 2020 г.
^ Коннорс, Дж.; Грэм, С.; Майу, Л. (2018). «Киберсинтетическое моделирование для приложений «транспортное средство-транспортное средство». В Международной конференции по кибервойне и безопасности . Academic Conferences International Limited: 594-XI.
Шохам, Йоав; Лейтон-Браун, Кевин (2008). Многоагентные системы: алгоритмические, игровые и логические основы. Cambridge University Press . стр. 496. ISBN 978-0-521-89943-7.
Мамаду, Тадиу Коне; Симадзу, А.; Накадзима, Т. (август 2000 г.). «Современное состояние языков агентской коммуникации (ACL)». Системы знаний и информации . 2 (2): 1–26.
Хьюитт, Карл; Инман, Джефф (ноябрь–декабрь 1991 г.). «DAI Betwixt and Between: From "Intelligent Agents" to Open Systems Science» (PDF) . IEEE Transactions on Systems, Man, and Cybernetics . 21 (6): 1409–1419. doi :10.1109/21.135685. S2CID 39080989. Архивировано из оригинала (PDF) 31 августа 2017 г.
Кейл, Дэвид; Голдин, Дина (2006). Вейнс, Дэнни; Парунак, Ван; Мишель, Фабьен (ред.). Косвенное взаимодействие в средах для многоагентных систем. LNCS 3830. Том 3830. Springer . С. 68–87. doi :10.1007/11678809_5. ISBN 978-3-540-32614-4. {{cite book}}: |journal=проигнорировано ( помощь )
Серия Whitestein по технологиям программных агентов и автономным вычислениям , опубликованная Springer Science+Business Media Group
Саламон, Томас (2011). Разработка моделей на основе агентов: разработка компьютерных симуляций для лучшего понимания социальных процессов. Bruckner Publishing. ISBN 978-80-904661-1-1.
Рассел, Стюарт Дж.; Норвиг , Питер (2003), Искусственный интеллект: Современный подход (2-е изд.), Аппер Сэдл Ривер, Нью-Джерси: Prentice Hall, ISBN 0-13-790395-2