stringtranslate.com

Оптимизация распределенных ограничений

Распределенная оптимизация ограничений ( DCOP или DisCOP ) — это распределенный аналог оптимизации ограничений . DCOP — это задача, в которой группа агентов должна распределенно выбирать значения для набора переменных таким образом, чтобы стоимость набора ограничений по переменным была минимизирована.

Распределенное удовлетворение ограничений — это фреймворк для описания проблемы в терминах ограничений, которые известны и применяются отдельными участниками (агентами). Ограничения описываются на некоторых переменных с предопределенными доменами и должны быть назначены одинаковым значениям разными агентами.

Задачи, определенные с помощью этой структуры, могут быть решены любым из алгоритмов, разработанных для нее.

Фреймворк использовался под разными названиями в 1980-х годах. Первое известное использование с текущим названием относится к 1990 году. [ необходима цитата ]

Определения

ДКСОП

Главными составляющими проблемы DCOP являются агенты и переменные . Важно, что каждая переменная принадлежит агенту; это то, что делает проблему распределенной. Формально DCOP — это кортеж , где:

Цель DCOP состоит в том, чтобы каждый агент присваивал значения связанным с ним переменным, чтобы либо минимизировать, либо максимизировать заданное назначение переменных.

Задания

Присвоение значения — это пара , где — элемент домена .

Частичное назначение — это набор назначений значений, где каждое появляется не более одного раза. Его также называют контекстом. Его можно рассматривать как функцию, отображающую переменные в DCOP в их текущие значения: Обратите внимание, что контекст по сути является частичным решением и не обязательно должен содержать значения для каждой переменной в задаче; следовательно, подразумевает, что агент еще не назначил значение переменной . Учитывая это представление, « домен » (то есть набор входных значений) функции можно рассматривать как набор всех возможных контекстов для DCOP. Поэтому в оставшейся части этой статьи мы можем использовать понятие контекста (то есть функции) в качестве входных данных для функции.f

Полное назначение — это назначение, в котором каждая переменная появляется ровно один раз, то есть все переменные назначены. Это также называется решением DCOP.

Оптимальным решением является полное задание, в котором целевая функция оптимизирована (т.е. максимизирована или минимизирована, в зависимости от типа задачи).

Примеры проблем

Различные проблемы из разных областей могут быть представлены в виде DCOP.

Раскраска распределенного графа

Задача раскраски графа заключается в следующем: дан граф и набор цветов , каждой вершине назначается цвет, таким образом, чтобы количество смежных вершин с одинаковым цветом было минимальным.

В качестве DCOP есть один агент на вершину, которому назначается выбор соответствующего цвета. У каждого агента есть одна переменная, чей связанный домен имеет кардинальность (есть одно значение домена для каждого возможного цвета). Для каждой вершины есть переменная с доменом . Для каждой пары смежных вершин есть ограничение стоимости 1, если обеим связанным переменным назначен один и тот же цвет: Таким образом, цель состоит в том, чтобы минимизировать .

Распределенная задача о множественном рюкзаке

Распределенный множественный вариант задачи о рюкзаке выглядит следующим образом: задан набор предметов различного объема и набор рюкзаков различной емкости, распределить каждый предмет по рюкзаку так, чтобы величина переполнения была минимизирована. Пусть будет набором предметов, будет набором рюкзаков, будет функцией, отображающей предметы в их объем, и будет функцией, отображающей рюкзаки в их емкости.

Чтобы закодировать эту задачу как DCOP, для каждого создайте одну переменную с соответствующим доменом . Затем для всех возможных контекстов : где представляет собой общий вес, назначенный контекстом рюкзаку :

Проблема распределения распределенных элементов

Задача распределения предметов заключается в следующем. Есть несколько предметов, которые должны быть разделены между несколькими агентами. У каждого агента своя оценка предметов. Цель состоит в оптимизации некоторой глобальной цели, такой как максимизация суммы полезностей или минимизация зависти. Задача распределения предметов может быть сформулирована как DCOP следующим образом. [2]

Другие приложения

DCOP применялся к другим проблемам, таким как:

Алгоритмы

Алгоритмы DCOP можно классифицировать несколькими способами: [3]

Например, ADOPT использует поиск по первому наилучшему варианту, асинхронную синхронизацию, связь точка-точка между соседними агентами в графе ограничений и дерево ограничений в качестве основной топологии связи.

Существуют также гибриды этих алгоритмов DCOP. Например, BnB-Adopt [3] изменяет стратегию поиска Adopt с поиска по лучшему совпадению на поиск по ветвям и границам в глубину.

Асимметричный DCOP

Асимметричный DCOP — это расширение DCOP, в котором стоимость каждого ограничения может быть разной для разных агентов. Вот некоторые примеры приложений: [13]

Одним из способов представления ADCOP является представление ограничений в виде функций:

Здесь для каждого ограничения существует не одна стоимость, а вектор стоимости — по одной для каждого агента, вовлеченного в ограничение. Вектор стоимости имеет длину k , если каждая переменная принадлежит разным агентам; если две или более переменных принадлежат одному агенту, то вектор стоимости короче — существует одна стоимость для каждого вовлеченного агента , а не для каждой переменной.

Подходы к решению ADCOP

Простой способ решения ADCOP — заменить каждое ограничение ограничением , которое равно сумме функций . Однако это решение требует, чтобы агенты раскрывали свои функции стоимости. Часто это нежелательно из-за соображений конфиденциальности. [14] [15] [16]

Другой подход называется Private Events as Variables (PEAV). [17] В этом подходе каждая переменная владеет, в дополнение к своим собственным переменным, также «зеркальными переменными» всех переменных, принадлежащих ее соседям в сети ограничений. Существуют дополнительные ограничения (со стоимостью бесконечности), которые гарантируют, что зеркальные переменные равны исходным переменным. Недостатком этого метода является то, что количество переменных и ограничений намного больше исходного, что приводит к более высокому времени выполнения.

Третий подход заключается в адаптации существующих алгоритмов, разработанных для DCOP, к структуре ADCOP. Это было сделано как для алгоритмов полного поиска, так и для алгоритмов локального поиска. [13]

Сравнение со стратегическими играми

Структура задачи ADCOP похожа на игровую концепцию одновременной игры . В обоих случаях есть агенты, которые контролируют переменные (в теории игр переменные — это возможные действия или стратегии агентов). В обоих случаях каждый выбор переменных разными агентами приводит к разным выплатам для каждого агента. Однако есть фундаментальное различие: [13]

Частичное сотрудничество

Существуют некоторые промежуточные модели, в которых агенты частично кооперативны : они готовы уменьшить свою полезность, чтобы помочь глобальной цели, но только если их собственные издержки не слишком высоки. Примером частично кооперативных агентов являются сотрудники фирмы. С одной стороны, каждый сотрудник хочет максимизировать свою собственную полезность; с другой стороны, они также хотят внести свой вклад в успех фирмы. Поэтому они готовы помогать другим или выполнять некоторые другие трудоемкие задачи, которые помогают фирме, пока это не слишком обременительно для них. Вот некоторые модели для частично кооперативных агентов: [18]

Решение таких частично кооперативных ADCOP требует адаптации алгоритмов ADCOP. [18]

Смотрите также

Примечания и ссылки

  1. ^ " " или "×" обозначает декартово произведение .
  2. ^ Нецер, Арнон; Майзелс, Амнон; Зиван, Ройе (2016-03-01). «Минимизация распределенной зависти для распределения ресурсов». Автономные агенты и многоагентные системы . 30 (2): 364–402. doi :10.1007/s10458-015-9291-7. ISSN  1387-2532. S2CID  13834856.
  3. ^ ab Yeoh, William; Felner, Ariel; Koenig, Sven (2008), "BnB-ADOPT: асинхронный алгоритм ветвей и границ DCOP", Труды Седьмой международной совместной конференции по автономным агентам и многоагентным системам , т. 2, стр. 591–8, ISBN 9780981738116
  4. ^ Хираяма, Кацутоши; Йоко, Макото (1997). "Распределенная проблема частичного удовлетворения ограничений". В Смолька, Герт (ред.). Принципы и практика программирования ограничений-CP97 . Конспект лекций по информатике. Том 1330. Берлин, Гейдельберг: Springer. стр. 222–236. doi :10.1007/BFb0017442. ISBN 978-3-540-69642-1.
  5. ^ Первоначально опубликованная версия Adopt была неинформированной, см. Modi, Pragnesh Jay; Shen, Wei-Min; Tambe, Milind; Yokoo, Makoto (2003), "Асинхронный полный метод для распределенной оптимизации ограничений" (PDF) , Труды второй международной совместной конференции по автономным агентам и многоагентным системам , ACM Press, стр. 161–168, архивировано из оригинала (PDF) 2019-11-04 , извлечено 2009-09-07. Первоначальная версия Adopt была позже расширена, чтобы быть информированной, то есть использовать оценки затрат на решение, чтобы сосредоточить свой поиск и работать быстрее, см. Ali, Syed; Koenig, Sven; Tambe, Milind (2005), "Preprocessing Techniques for Accelerating the DCOP Algorithm ADOPT" (PDF) , Труды четвертой международной совместной конференции по автономным агентам и многоагентным системам , ACM Press, стр. 1041–8, doi :10.1145/1082473.1082631, ISBN 1595930930, S2CID  10882572, заархивировано из оригинала (PDF) 2010-07-07 , извлечено 2009-09-07. Это расширение Adopt обычно используется как эталонная реализация Adopt.
  6. ^ Мацуи, Тосихиро; Мацуо, Хироши; Ивата, Акира (февраль 2005 г.), «Эффективный метод асинхронного распределенного алгоритма оптимизации ограничений» (PDF) , Труды по искусственному интеллекту и приложениям , стр. 727–732, CiteSeerX 10.1.1.408.7230 
  7. ^ Мейлер, Роджер; Лессер, Виктор (2004), «Решение задач оптимизации распределенных ограничений с использованием кооперативного посредничества» (PDF) , Труды Третьей международной совместной конференции по автономным агентам и многоагентным системам , IEEE Computer Society , стр. 438–445, ISBN 1581138644[ постоянная мертвая ссылка ‍ ]
  8. ^ Гриншпун, Таль; Зазон, Моше; Биншток, Максим; Мейселс, Амнон (2007), «Проблема завершения алгоритма APO» (PDF) , Труды Восьмого международного семинара по рассуждениям с распределенными ограничениями , стр. 117–124
  9. ^ Петку, Адриан; Фалтингс, Бой (август 2005 г.), «DPOP: масштабируемый метод оптимизации ограничений для нескольких агентов», Труды 19-й Международной совместной конференции по искусственному интеллекту, IJCAI 2005, Эдинбург, Шотландия, стр. 266-271
  10. ^ Чечетка, Антон; Сикара, Катя (май 2006 г.), «Поиск ветвей и границ без обязательств для оптимизации распределенных ограничений» (PDF) , Труды Пятой международной совместной конференции по автономным агентам и многоагентным системам , стр. 1427–9, doi :10.1145/1160633.1160900, ISBN 1595933034, S2CID  43918609
  11. ^ Чечетка, Антон; Сикара, Катя (март 2006 г.), «Алгоритм любого пространства для оптимизации распределенных ограничений» (PDF) , Труды весеннего симпозиума AAAI по распределенному управлению планами и расписаниями
  12. ^ Даффи, KR; Лейт, DJ (август 2013 г.), «Децентрализованное удовлетворение ограничений», IEEE/ACM Transactions on Networking , 21 (4): 1298–1308, arXiv : 1103.3240 , doi : 10.1109/TNET.2012.2222923, S2CID  11504393
  13. ^ abc Гриншпун, Т.; Грубштейн, А.; Зиван, Р.; Нецер, А.; Мейселс, А. (2013-07-30). «Асимметричные распределенные задачи оптимизации ограничений». Журнал исследований искусственного интеллекта . 47 : 613–647. arXiv : 1402.0587 . doi : 10.1613/jair.3945 . ISSN  1076-9757.
  14. ^ Гринштадт, Рэйчел; Пирс, Джонатан П.; Тамбе, Милинд (2006-07-16). «Анализ потери конфиденциальности при оптимизации распределенных ограничений». Труды 21-й Национальной конференции по искусственному интеллекту — Том 1. AAAI'06. Бостон, Массачусетс: AAAI Press: 647–653. ISBN 978-1-57735-281-5.
  15. ^ Махешваран, Раджив Т.; Пирс, Джонатан П.; Боуринг, Эмма; Варакантам, Прадип; Тамбе, Милинд (2006-07-01). «Потеря конфиденциальности в рассуждениях с распределенными ограничениями: количественная структура для анализа и ее применения». Автономные агенты и многоагентные системы . 13 (1): 27–60. doi :10.1007/s10458-006-5951-y. ISSN  1573-7454. S2CID  16962945.
  16. ^ Йоко, Макото; Сузуки, Котаро; Хираяма, Кацутоши (2002). «Безопасное распределенное удовлетворение ограничений: достижение соглашения без раскрытия частной информации». В Van Hentenryck, Pascal (ред.). Принципы и практика программирования ограничений – CP 2002. Конспект лекций по информатике. Том 2470. Берлин, Гейдельберг: Springer. стр. 387–401. doi :10.1007/3-540-46135-3_26. ISBN 978-3-540-46135-7.
  17. ^ Раджив Т. Махешваран, Милинд Тамбе, Эмма Боуринг, Джонатан П. Пирс, Прадип Варакантам (2004). «Перевод DCOP в реальный мир: эффективные комплексные решения для распределенного многособытийного планирования». www.computer.org . Получено 12 апреля 2021 г.{{cite web}}: CS1 maint: multiple names: authors list (link)
  18. ^ ab Zivan, Roie; Grubshtein, Alon; Friedman, Michal; Meisels, Amnon (2012-06-04). "Частичное сотрудничество в многоагентном поиске". Труды 11-й Международной конференции по автономным агентам и многоагентным системам - Том 3. AAMAS '12. 3. Валенсия, Испания: Международный фонд автономных агентов и многоагентных систем: 1267–1268. ISBN 978-0-9817381-3-0.

Книги и обзоры