stringtranslate.com

Многоагентная система

Простой рефлекторный агент
Агент обучения

Многоагентная система ( МАС или «самоорганизующаяся система») — это компьютеризированная система, состоящая из нескольких взаимодействующих интеллектуальных агентов . [1] Многоагентные системы могут решать проблемы, которые сложно или невозможно решить отдельному агенту или монолитной системе . [2] Интеллект может включать методические , функциональные , процедурные подходы, алгоритмический поиск или обучение с подкреплением . [3] С достижениями в области больших языковых моделей (LLM) многоагентные системы на основе LLM стали новой областью исследований, обеспечивающей более сложные взаимодействия и координацию между агентами. [4]

Несмотря на значительное совпадение, многоагентная система не всегда совпадает с агентной моделью (ABM). Целью ABM является поиск объяснительного понимания коллективного поведения агентов (которые не обязательно должны быть «интеллектуальными»), подчиняющихся простым правилам, как правило, в естественных системах, а не при решении конкретных практических или инженерных задач. Терминология ABM, как правило, чаще используется в науке, а MAS — в инженерии и технологиях. [5] Приложения, в которых исследование многоагентных систем может обеспечить соответствующий подход, включают онлайн-торговлю, [6] реагирование на стихийные бедствия, [7] [8] наблюдение за целями [9] и моделирование социальной структуры. [10]

Концепция

Мультиагентные системы состоят из агентов и их окружения . Обычно исследования мультиагентных систем относятся к программным агентам . Однако агентами в мультиагентной системе могут быть как роботы, так и люди или человеческие команды. Мультиагентная система может содержать комбинированные команды человек-агент.

Агенты можно разделить на типы от простых до сложных. Категории включают:

Агентские среды можно разделить на:

Агентские среды также могут быть организованы в соответствии со свойствами, такими как доступность (возможно ли собрать полную информацию об окружающей среде), детерминизм (вызывает ли действие определенный эффект), динамика (сколько сущностей влияют на окружающую среду в данный момент), дискретность (конечно ли число возможных действий в окружающей среде), эпизодичность (влияют ли действия агента в определенные периоды времени на другие периоды) [12] и размерность (являются ли пространственные характеристики важными факторами окружающей среды и учитывает ли агент пространство при принятии решений). [13] Действия агентов обычно опосредуются через соответствующее промежуточное программное обеспечение. Это промежуточное программное обеспечение предлагает первоклассную абстракцию дизайна для многоагентных систем, предоставляя средства для управления доступом к ресурсам и координации агентов. [14]

Характеристики

Агенты в многоагентной системе имеют несколько важных характеристик: [15]

Самоорганизация и самонаправление

Многоагентные системы могут проявлять самоорганизацию , а также самонаправление и другие парадигмы управления и связанное с ними сложное поведение, даже если индивидуальные стратегии всех их агентов просты. [ необходима цитата ] Когда агенты могут обмениваться знаниями, используя любой согласованный язык, в рамках ограничений протокола связи системы, подход может привести к общему улучшению. Примерами языков являются язык манипуляции запросами знаний (KQML) или язык общения агентов (ACL).

Системные парадигмы

Многие MAS реализованы в компьютерном моделировании, пошаговом прохождении системы через дискретные «шаги времени». Компоненты MAS обычно взаимодействуют с помощью матрицы взвешенных запросов, например

Скорость-ОЧЕНЬ_ВАЖНО: мин=45 миль/ч, Длина пути-MEDIUM_IMPORTANCE: макс=60 ожидаемыйМакс=40, Макс-Вес-НЕВАЖНО Приоритет контракта-РЕГУЛЯРНЫЙ

и матрица взвешенного ответа, например

Скорость-мин:50, но только если погода солнечная, Длина пути: 25 для солнечной погоды / 46 для дождливой погоды Приоритет контракта-РЕГУЛЯРНЫЙ примечание — скорая помощь отменит этот приоритет, и вам придется подождать

Схема «вызов-ответ-контракт» распространена в системах MAS, где

также рассматриваются другие компоненты, развивающиеся «контракты» и наборы ограничений алгоритмов компонентов.

Другая парадигма, обычно используемая с MAS, — это « феромон », где компоненты оставляют информацию для других близлежащих компонентов. Эти феромоны могут испаряться/концентрироваться со временем, то есть их значения могут уменьшаться (или увеличиваться).

Характеристики

MAS склонны находить наилучшее решение своих проблем без вмешательства. Здесь есть большое сходство с физическими явлениями, такими как минимизация энергии, когда физические объекты стремятся достичь минимально возможной энергии в физически ограниченном мире. Например: многие автомобили, въезжающие в мегаполис утром, будут доступны для выезда из того же мегаполиса вечером.

Системы также имеют тенденцию предотвращать распространение неисправностей, самовосстанавливаться и быть отказоустойчивыми, в основном за счет избыточности компонентов.

Исследовать

Изучение многоагентных систем «занимается разработкой и анализом сложных архитектур решения проблем и управления ИИ как для одноагентных, так и для многоагентных систем». [17] Темы исследований включают:

Фреймворки

Появились фреймворки, реализующие общие стандарты (например, стандарты FIPA и OMG MASIF). [23] Эти фреймворки, например JADE , экономят время и помогают в стандартизации разработки MAS. [24]

В настоящее время, однако, ни один стандарт не поддерживается активно FIPA или OMG. Усилия по дальнейшей разработке программных агентов в промышленном контексте проводятся в техническом комитете IEEE IES по промышленным агентам. [25]

Благодаря достижениям в области больших языковых моделей (LLM), таких как ChatGPT , многоагентные фреймворки на основе LLM стали новой парадигмой для разработки многоагентных приложений, причем CAMEL [26] [4] от CAMEL-AI.org стал первым заметным фреймворком в этой области.

Приложения

MAS применяются не только в академических исследованиях, но и в промышленности. [27] MAS применяются в реальном мире для графических приложений, таких как компьютерные игры. Агентские системы использовались в фильмах. [28] Их широко пропагандируют для использования в сетевых и мобильных технологиях, для достижения автоматической и динамической балансировки нагрузки, высокой масштабируемости и самовосстанавливающихся сетей. Они используются для скоординированных систем обороны.

Другие приложения [29] включают транспорт , [30] логистику, [31] графику, производство, энергосистемы , [ 32] интеллектуальные сети [33] и ГИС .

Кроме того, многоагентные системы искусственного интеллекта (MAAI) используются для моделирования обществ, их цель - помочь в области климата, энергетики, эпидемиологии, управления конфликтами, жестокого обращения с детьми, .... [34] Некоторые организации, работающие над использованием моделей многоагентных систем, включают Центр моделирования социальных систем, Центр исследований в области социального моделирования, Центр моделирования политики, Общество моделирования и Международного моделирования. [34]

Движение транспортных средств с контролируемыми автономными транспортными средствами можно моделировать как многоагентную систему, включающую динамику толпы. [35] Халлербах и др. обсудили применение подходов на основе агентов для разработки и проверки автоматизированных систем вождения с помощью цифрового двойника тестируемого транспортного средства и микроскопического моделирования дорожного движения на основе независимых агентов. [36] Waymo создала многоагентную среду моделирования Carcraft для тестирования алгоритмов для беспилотных автомобилей . [37] [38] Она моделирует взаимодействие между водителями-людьми, пешеходами и автоматизированными транспортными средствами. Поведение людей имитируется искусственными агентами на основе данных реального человеческого поведения.

Смотрите также

Ссылки

  1. ^ Йоав Шохам, Кевин Лейтон-Браун. Многоагентные системы: алгоритмические, игровые и логические основы. Cambridge University Press, 2009. http://www.masfoundations.org/
  2. ^ Ху, Дж.; Тургут, А.; Леннокс, Б.; Арвин, Ф., «Надежная координация формирования роев роботов с нелинейной динамикой и неизвестными возмущениями: проектирование и эксперименты» Труды IEEE по схемам и системам II: Экспресс-краткие обзоры, 2021.
  3. ^ Стефано В. Альбрехт, Филиппос Кристианос, Лукас Шефер. Многоагентное обучение с подкреплением: основы и современные подходы. MIT Press, 2024. https://www.marl-book.com/
  4. ^ abc Ли, Гохао (2023). «Верблюд: коммуникативные агенты для исследования «разума» большой языковой модели общества» (PDF) . Достижения в области нейронных систем обработки информации . 36 : 51991–52008. doi :10.48550/arXiv.2303.17760. S2CID  257900712.
  5. ^ Ниази, Муаз; Хуссейн, Амир (2011). «Агентные вычисления от многоагентных систем до агентов-ориентированных моделей: визуальный обзор» (PDF) . Scientometrics . 89 (2): 479–499. arXiv : 1708.05872 . doi :10.1007/s11192-011-0468-9. hdl :1893/3378. S2CID  17934527.
  6. ^ Rogers, Alex; David, E.; Schiff, J.; Jennings, NR (2007). "The Effects of Proxy Bidding and Minimum Bid Increments within eBay Auctions". ACM Transactions on the Web . 1 (2): 9–es. CiteSeerX 10.1.1.65.4539 . doi :10.1145/1255438.1255441. S2CID  207163424. Архивировано из оригинала 2 апреля 2010 г. Получено 18 марта 2008 г. 
  7. ^ Шурр, Натан; Марецкий, Януш; Тамбе, Милинд; Шерри, Пол; Касинадхуни, Нихил; Льюис, JP (2005). «Будущее реагирования на стихийные бедствия: люди, работающие в многоагентных группах с использованием DEFACTO». Архивировано (PDF) из оригинала 3 июня 2013 г. Проверено 8 января 2024 г.
  8. ^ Генч, Зулькуф и др. (2013). «Информационная инфраструктура на основе агентов для управления катастрофами» (PDF) . Интеллектуальные системы для управления кризисами . Конспект лекций по геоинформатике и картографии. стр. 349–355. doi :10.1007/978-3-642-33218-0_26. ISBN 978-3-642-33217-3.
  9. ^ Ху, Джуньян; Бхоумик, Париджат; Ланзон, Александр (2020). «Распределенное адаптивное отслеживание формирования изменяющихся во времени групп для многоагентных систем с несколькими лидерами на направленных графах». Труды IEEE по управлению сетевыми системами . 7 : 140–150. doi : 10.1109/TCNS.2019.2913619 . S2CID  149609966.
  10. ^ Сан, Рон ; Навех, Айзек (30 июня 2004 г.). «Моделирование принятия организационных решений с использованием когнитивно реалистичной модели агента». Журнал искусственных обществ и социального моделирования .
  11. ^ Кубера, Йоанн; Матье, Филипп; Пико, Себастьен (2010), «Все может быть агентом!» (PDF) , Труды Девятой международной совместной конференции по автономным агентам и многоагентным системам (AAMAS'2010) : 1547–1548
  12. ^ Рассел, Стюарт Дж.; Норвиг , Питер (2003), Искусственный интеллект: современный подход (2-е изд.), Аппер Сэдл Ривер, Нью-Джерси: Prentice Hall, ISBN 0-13-790395-2
  13. ^ Саламон, Томас (2011). Разработка моделей на основе агентов. Репин: Bruckner Publishing. стр. 22. ISBN 978-80-904661-1-1.
  14. ^ Weyns, Danny; Omicini, Amdrea; Odell, James (2007). «Окружающая среда как первоклассная абстракция в многоагентных системах». Автономные агенты и многоагентные системы . 14 (1): 5–30. CiteSeerX 10.1.1.154.4480 . doi :10.1007/s10458-006-0012-0. S2CID  13347050. 
  15. ^ Вулдридж, Майкл (2002). Введение в многоагентные системы . John Wiley & Sons . стр. 366. ISBN 978-0-471-49691-5.
  16. ^ Панайт, Ливиу; Люк, Шон (2005). «Кооперативное многоагентное обучение: современное состояние» (PDF) . Автономные агенты и многоагентные системы . 11 (3): 387–434. CiteSeerX 10.1.1.307.6671 . doi :10.1007/s10458-005-2631-2. S2CID  19706. 
  17. ^ "The Multi-Agent Systems Lab". Массачусетский университет в Амхерсте . Получено 16 октября 2009 г.
  18. ^ Альбрехт, Стефано; Стоун, Питер (2017), «Мультиагентное обучение: основы и последние тенденции. Учебное пособие», конференция IJCAI-17 (PDF)
  19. ^ Cucker, Felipe; Steve Smale (2007). "The Mathematics of Emergence" (PDF) . Japanese Journal of Mathematics . 2 : 197–227. doi :10.1007/s11537-007-0647-x. S2CID  2637067 . Получено 9 июня 2008 г. .
  20. ^ Шен, Джеки (Цзяньхун) (2008). «Cucker–Smale Flocking under Hierarchical Leadership». SIAM J. Appl. Math . 68 (3): 694–719. arXiv : q-bio/0610048 . doi :10.1137/060673254. S2CID  14655317. Получено 9 июня 2008 г.
  21. ^ Ахмед, С.; Карсити, МН (2007), «Испытательный стенд для схем управления с использованием многоагентных неголономных роботов», Международная конференция IEEE по электроинформационным технологиям 2007 г., стр. 459, doi :10.1109/EIT.2007.4374547, ISBN 978-1-4244-0940-2, S2CID  2734931
  22. ^ Ян, Лидонг; Ли, Чжан (2021). «Управление движением в магнитной микроробототехнике: от отдельных и множественных роботов до роев». Ежегодный обзор управления, робототехники и автономных систем . 4 : 509–534. doi :10.1146/annurev-control-032720-104318. S2CID  228892228.
  23. ^ "OMG Document – ​​orbos/97-10-05 (Обновление пересмотренного представления MAF)". www.omg.org . Получено 19 февраля 2019 г. .
  24. ^ Ахмед, Салман; Карсити, Мохд Н.; Агустиаван, Герман (2007). «Структура разработки коллаборативных роботов с использованием управления с обратной связью» . Получено 8 января 2024 г.
  25. ^ "Технический комитет IEEE IES по промышленным агентам (TC-IA)". tcia.ieee-ies.org . Получено 19 февраля 2019 г. .
  26. ^ «CAMEL: Поиск закона масштабирования агентов. Первая и лучшая многоагентная структура».
  27. ^ Лейтан, Пауло; Карнускос, Стаматис (26 марта 2015 г.). Промышленные агенты: новые возможности применения программных агентов в промышленности . Лейтао, Пауло, Карнускос, Стаматис. Амстердам, Нидерланды. ISBN 978-0128003411. OCLC  905853947.{{cite book}}: CS1 maint: location missing publisher (link)
  28. ^ "Film showcase". MASSIVE . Получено 28 апреля 2012 г. .
  29. ^ Лейтао, Пауло; Карнускос, Стаматис; Рибейро, Луис; Ли, Джей; Штрассер, Томас; Коломбо, Армандо В. (2016). «Умные агенты в промышленных киберфизических системах». Труды IEEE . 104 (5): 1086–1101. doi :10.1109/JPROC.2016.2521931. hdl : 10198/15438 . ISSN  0018-9219. S2CID  579475.
  30. ^ Сяо-Фэн Се, С. Смит, Г. Барлоу. Координация на основе расписания для управления транспортной сетью в реальном времени. Международная конференция по автоматизированному планированию и составлению расписаний (ICAPS), Сан-Паулу, Бразилия, 2012: 323–331.
  31. ^ Máhr, TS; Srour, J.; De Weerdt, M.; Zuidwijk, R. (2010). «Могут ли агенты соответствовать требованиям? Сравнительное исследование подхода к оптимизации на основе агентов и онлайн-оптимизации для решения проблемы перевозки с неопределенностью». Transportation Research Часть C: Новые технологии . 18 : 99–119. CiteSeerX 10.1.1.153.770 . doi :10.1016/j.trc.2009.04.018. 
  32. ^ Каземи, Хамидреза; Лиаси, Саханд; Шейх-Эль-Эслами, Мохаммадказем (ноябрь 2018 г.). «Планирование расширения генерации с учетом динамики инвестиций участников рынка с использованием многоагентной системы». Конференция по интеллектуальным сетям 2018 г. (SGC) . стр. 1–6. doi :10.1109/SGC.2018.8777904. ISBN 978-1-7281-1138-4. Получено 8 января 2024 г. .
  33. ^ Сингх, Виджай; Сэмюэл, Полсон (6 июня 2017 г.). «Распределенная многоагентная система управления частотой нагрузки для многозонной энергосистемы в интеллектуальной сети». IEEE Transactions on Industrial Electronics . 64 (6): 5151–5160. doi :10.1109/TIE.2017.2668983 . Получено 8 января 2024 г.
  34. ^ ab «ИИ может предсказать ваше будущее поведение с помощью новых мощных симуляций». New Scientist .
  35. ^ Гун, Сяоцянь; Херти, Майкл; Пикколи, Бенедетто; Висконти, Джузеппе (3 мая 2023 г.). «Динамика толпы: моделирование и управление многоагентными системами». Ежегодный обзор управления, робототехники и автономных систем . 6 (1): 261–282. doi : 10.1146/annurev-control-060822-123629 . ISSN  2573-5144.
  36. ^ Hallerbach, S.; Xia, Y.; Eberle, U.; Koester, F. (2018). «Идентификация критических сценариев для кооперативных и автоматизированных транспортных средств на основе моделирования». SAE International Journal of Connected and Automated Vehicles . 1 (2). SAE International: 93. doi :10.4271/2018-01-1066.
  37. ^ Madrigal, рассказ Алексис С. «Внутри секретного мира Waymo для обучения беспилотных автомобилей». The Atlantic . Получено 14 августа 2020 г.
  38. ^ Коннорс, Дж.; Грэм, С.; Майу, Л. (2018). «Киберсинтетическое моделирование для приложений «транспортное средство-транспортное средство». В Международной конференции по кибервойне и безопасности . Academic Conferences International Limited: 594-XI.

Дальнейшее чтение