Изучение оптимальной транспортировки и распределения ресурсов
В математике и экономике теория транспортировки или теория транспорта — это название, данное изучению оптимальной транспортировки и распределения ресурсов . Проблема была формализована французским математиком Гаспаром Монжем в 1781 году. [1]
В 1920-х годах А. Н. Толстой был одним из первых, кто исследовал транспортную задачу математически . В 1930 году в сборнике «Планирование перевозок» Том I для Народного комиссариата путей сообщения СССР он опубликовал статью «Способы нахождения минимального километража при перевозках грузов в пространстве». [2] [3]
Главные достижения в этой области были достигнуты во время Второй мировой войны советским математиком и экономистом Леонидом Канторовичем . [4] Следовательно, проблема в том виде, в котором она сформулирована, иногда известна как транспортная задача Монжа-Канторовича . [5] Формулировка транспортной задачи с помощью линейного программирования также известна как транспортная задача Хичкока - Купманса . [6]
Мотивация
Шахты и заводы
Предположим, что у нас есть набор шахт, добывающих железную руду, и набор заводов, которые используют железную руду, которую производят шахты. Предположим ради аргумента, что эти шахты и заводы образуют два непересекающихся подмножества и евклидовой плоскости . Предположим также, что у нас есть функция стоимости , так что это стоимость транспортировки одной партии железа из в . Для простоты мы игнорируем время, необходимое для выполнения транспортировки. Мы также предполагаем, что каждая шахта может снабжать только одну фабрику (без разделения поставок) и что каждой фабрике требуется ровно одна поставка для работы (фабрики не могут работать на половинной или двойной мощности). Сделав вышеуказанные предположения, транспортный план является биекцией . Другими словами, каждая шахта снабжает ровно одну целевую фабрику , и каждая фабрика снабжается ровно одной шахтой. Мы хотим найти оптимальный транспортный план , план , общая стоимость которого
является наименьшим из всех возможных планов транспортировки из в . Этот мотивирующий частный случай транспортной задачи является примером задачи назначения . Более конкретно, это эквивалентно поиску паросочетания с минимальным весом в двудольном графе .
Перемещение книг: важность функции стоимости
Следующий простой пример иллюстрирует важность функции стоимости при определении оптимального плана транспортировки. Предположим, что у нас есть книги одинаковой ширины на полке ( реальная линия ), расположенные в один непрерывный блок. Мы хотим переставить их в другой непрерывный блок, но сдвинув одну ширину книги вправо. Представляются два очевидных кандидата на оптимальный план транспортировки:
- переместить все книги на ширину одной книги вправо («много маленьких ходов»);
- переместите ширину самой левой книги вправо, а все остальные книги оставьте фиксированными («один большой ход»).
Если функция стоимости пропорциональна евклидову расстоянию ( для некоторых ), то эти два кандидата оба оптимальны. Если же, с другой стороны, мы выбираем строго выпуклую функцию стоимости, пропорциональную квадрату евклидова расстояния ( для некоторых ), то вариант «много маленьких ходов» становится единственным минимизатором.
Обратите внимание, что приведенные выше функции стоимости учитывают только горизонтальное расстояние, пройденное книгами, а не горизонтальное расстояние, пройденное устройством, используемым для подъема каждой книги и перемещения книги в положение. Если вместо этого рассматривается последнее, то из двух планов транспортировки второй всегда оптимален для евклидова расстояния, в то время как при наличии не менее 3 книг первый план транспортировки оптимален для квадрата евклидова расстояния.
Проблема Хичкока
Следующая формулировка транспортной задачи принадлежит Ф. Л. Хичкоку : [7]
- Предположим, что есть источники товара с единицами поставки в и приемники товара со спросом в . Если есть себестоимость единицы отгрузки из в , найдите поток, который удовлетворяет спрос со стороны поставок и минимизирует стоимость потока. Эта задача в логистике была рассмотрена DR Fulkerson [8] и в книге Flows in Networks (1962), написанной совместно с LR Ford Jr. [9]
Тьяллингу Купмансу также приписывают разработку основ транспортной экономики и распределения ресурсов.
Абстрактная формулировка проблемы
Формулировки Монжа и Канторовича
Проблема транспортировки, как она сформулирована в современной или более технической литературе, выглядит несколько иначе из-за развития римановой геометрии и теории меры . Пример шахт-фабрик, каким бы простым он ни был, является полезной точкой отсчета при рассмотрении абстрактного случая. В этой обстановке мы допускаем возможность того, что мы можем не захотеть держать все шахты и фабрики открытыми для бизнеса и позволить шахтам снабжать более одной фабрики, а фабрикам принимать железо из более чем одной шахты.
Пусть и будут двумя сепарабельными метрическими пространствами такими, что любая вероятностная мера на (или ) является мерой Радона (т.е. они являются пространствами Радона ). Пусть будет измеримой по Борелю функцией . При заданных вероятностных мерах на и на , формулировка Монжа оптимальной транспортной задачи заключается в поиске транспортной карты , реализующей инфимум
где обозначает перемещение вперед на . Карта , которая достигает этой нижней грани ( т.е. делает ее минимумом вместо нижней грани), называется «оптимальной транспортной картой».
Формулировка Монжа оптимальной транспортной задачи может быть некорректной, поскольку иногда не существует удовлетворяющего решения : например, это происходит, когда является мерой Дирака , но не является.
Мы можем улучшить это, приняв формулировку Канторовича для оптимальной транспортной задачи, которая заключается в нахождении вероятностной меры , достигающей инфимума
где обозначает набор всех вероятностных мер на с маргиналами на и на . Можно показать [10] , что минимизатор для этой задачи всегда существует, когда функция стоимости полунепрерывна снизу и является плотным набором мер (что гарантировано для пространств Радона и ). (Сравните эту формулировку с определением метрики Вассерштейна на пространстве вероятностных мер.) Формулировка градиентного спуска для решения задачи Монжа–Канторовича была дана Сигурдом Ангенентом , Стивеном Хакером и Алленом Танненбаумом . [11]
Формула двойственности
Минимум задачи Канторовича равен
где супремум пробегает все пары ограниченных и непрерывных функций и таких, что
Экономическая интерпретация
Экономическая интерпретация становится яснее, если знаки поменять местами. Пусть обозначает вектор характеристик работника, вектор характеристик фирмы и экономический выпуск, произведенный работником, сопоставленным с фирмой . Принимая во внимание и , задача Монжа–Канторовича переписывается следующим образом:
которая имеет двойственную :
где инфимум пробегает ограниченную и непрерывную функцию и . Если двойственная задача имеет решение, можно увидеть, что:
так что интерпретируется как равновесная заработная плата работника типа , а интерпретируется как равновесная прибыль фирмы типа . [12]
Решение проблемы
Оптимальная транспортировка по реальной линии
Для пусть обозначает совокупность вероятностных мер на , имеющих конечный -й момент . Пусть и пусть , где - выпуклая функция .
- Если не имеет атома , т. е. если кумулятивная функция распределения является непрерывной функцией , то является оптимальным транспортным отображением. Это единственное оптимальное транспортное отображение, если является строго выпуклым.
- У нас есть
Доказательство этого решения представлено в работе Рачева и Рюшендорфа (1998). [13]
Дискретная версия и формулировка линейного программирования
В случае, когда поля и дискретны, пусть
и будут вероятностными массами, соответственно назначенными и , и пусть будет вероятностью назначения . Целевая функция в основной задаче Канторовича тогда будет
и ограничение выражается как
и
Чтобы ввести это в задачу линейного программирования , нам нужно векторизовать матрицу , либо сложив ее столбцы, либо строки , мы называем эту операцию. В порядке по столбцам ограничения выше переписываются как
- и
где — произведение Кронекера , — матрица размера со всеми элементами из единиц, а — единичная матрица размера . В результате, устанавливая , формулировка задачи линейного программирования имеет вид
которые можно легко ввести в крупномасштабный решатель линейного программирования (см. главу 3.4 Galichon (2016) [12] ).
Полудискретный случай
В полудискретном случае и представляет собой непрерывное распределение по , в то время как представляет собой дискретное распределение, которое назначает массу вероятности месту . В этом случае мы можем видеть [14] , что прямая и двойственная задачи Канторовича соответственно сводятся к:
для прямой, где означает, что и , и:
для двойственной, что можно переписать как:
которая является конечномерной выпуклой задачей оптимизации, которая может быть решена стандартными методами, такими как градиентный спуск .
В случае, когда , можно показать, что множество назначенных определенному сайту является выпуклым многогранником. Полученная конфигурация называется диаграммой мощности . [15]
Квадратичный нормальный случай
Предположим частный случай , , и где обратим. Тогда имеем
Доказательство этого решения представлено в работе Галихона (2016). [12]
Сепарабельные гильбертовы пространства
Пусть — сепарабельное гильбертово пространство . Пусть обозначает совокупность вероятностных мер на , имеющих конечный -й момент; пусть обозначает те элементы, которые являются гауссовски регулярными : если — любая строго положительная гауссовская мера на и , то также.
Пусть , , для . Тогда задача Канторовича имеет единственное решение , и это решение индуцируется оптимальным транспортным отображением: т.е. существует борелевское отображение такое, что
Более того, если имеет ограниченную поддержку , то
для -почти всех для некоторого локально липшицевого , -вогнутого и максимального потенциала Канторовича . (Здесь обозначает производную Гато от .)
Энтропийная регуляризация
Рассмотрим вариант дискретной задачи выше, где мы добавили член энтропийной регуляризации к целевой функции основной задачи
Можно показать, что двойственная регуляризованная задача имеет вид
где, по сравнению с нерегуляризованной версией, «жесткое» ограничение в бывшей двойственной задаче ( ) было заменено «мягким» штрафом этого ограничения (суммой членов ). Условия оптимальности в двойственной задаче можно выразить как
- Уравнение 5.1:
- Уравнение 5.2:
Обозначая как матрицу члена , решение двойственной задачи эквивалентно поиску двух диагональных положительных матриц и соответствующих размеров и , таких, что и . Существование таких матриц обобщает теорему Синкхорна , и матрицы можно вычислить с помощью алгоритма Синкхорна–Кноппа [ 16] , который просто состоит из итеративного поиска для решения уравнения 5.1 и решения уравнения 5.2 . Таким образом, алгоритм Синкхорна–Кноппа является алгоритмом спуска по координатам для двойственной регуляризованной задачи.
Приложения
Оптимальный транспорт Монжа-Канторовича нашел широкое применение в различных областях. Среди них:
Смотрите также
На Викискладе есть медиафайлы по теме «Теория транспорта» .
Ссылки
- ^ Г. Монж. Мемуар о теории déblais et des remblais. Histoire de l'Académie Royale des Sciences de Paris, avec les Mémoires de Mathématique et de Physique pour la même année , страницы 666–704, 1781.
- ^ Шрийвер, Александр , Комбинаторная оптимизация, Берлин; Нью-Йорк: Springer, 2003. ISBN 3540443894 . См. п. 362
- ^ Айвор Граттан-Гиннесс, Айвор, Справочная энциклопедия истории и философии математических наук, том 1, JHU Press, 2003. См. стр. 831
- ↑ Л. Канторович, О перемещении масс, Доклады АН СССР, 37:199–201, 1942.
- ^ Седрик Виллани (2003). Темы в оптимальной транспортировке . Американское математическое общество. стр. 66. ISBN 978-0-8218-3312-4.
- ^ Singiresu S. Rao (2009). Engineering Optimization: Theory and Practice (4-е изд.). John Wiley & Sons. стр. 221. ISBN 978-0-470-18352-6.
- ^ Фрэнк Л. Хичкок (1941) «Распределение продукта из нескольких источников в многочисленные местоположения», MIT Journal of Mathematics and Physics 20:224–230 MR 0004469.
- ^ DR Fulkerson (1956) Транспортная проблема Хичкока, корпорация RAND.
- ^ LR Ford Jr. & DR Fulkerson (1962) § 3.1 в Flows in Networks , стр. 95, Princeton University Press
- ^ L. Ambrosio, N. Gigli & G. Savaré. Градиентные потоки в метрических пространствах и в пространстве вероятностных мер. Лекции по математике ETH Zürich, Birkhäuser Verlag, Базель. (2005)
- ^ Angenent, S.; Haker, S.; Tannenbaum, A. (2003). «Минимизация потоков для задачи Монжа–Канторовича». SIAM J. Math. Anal . 35 (1): 61–97. CiteSeerX 10.1.1.424.1064 . doi :10.1137/S0036141002410927.
- ^ abc Галихон, Альфред . Оптимальные методы транспортировки в экономике . Princeton University Press, 2016.
- ^ Рачев, Светлозар Т. и Людгер Рюшендорф. Проблемы массового транспорта: Том I: Теория . Том 1. Springer, 1998.
- ^ Сантамброджио, Филиппо. Оптимальный транспорт для прикладных математиков . Birkhäuser Basel, 2016. В частности, глава 6, раздел 4.2.
- ^ Ауренхаммер, Франц (1987), «Диаграммы мощности: свойства, алгоритмы и приложения», SIAM Journal on Computing , 16 (1): 78–96, doi :10.1137/0216006, MR 0873251.
- ^ Пейре, Габриэль и Марко Кутури (2019), «Вычислительный оптимальный транспорт: с приложениями к науке о данных», Основы и тенденции в машинном обучении: Том 11: № 5-6, стр. 355–607. DOI: 10.1561/2200000073.
- ^ Хакер, Стивен; Чжу, Лей; Танненбаум, Аллен; Ангенент, Сигурд (1 декабря 2004 г.). «Оптимальный массовый транспорт для регистрации и деформации». International Journal of Computer Vision . 60 (3): 225–240. CiteSeerX 10.1.1.59.4082 . doi :10.1023/B:VISI.0000036836.66311.97. ISSN 0920-5691. S2CID 13261370.
- ^ Glimm, T.; Oliker, V. (1 сентября 2003 г.). «Оптическое проектирование систем с одним отражателем и проблема переноса массы Монжа–Канторовича». Журнал математических наук . 117 (3): 4096–4108. doi :10.1023/A:1024856201493. ISSN 1072-3374. S2CID 8301248.
- ^ Касим, Мухаммад Фирмансья; Кёрворст, Люк; Ратан, Нарен; Садлер, Джеймс; Чен, Николас; Саверт, Александр; Тринес, Рауль; Бингем, Роберт; Берроуз, Филип Н. (16 февраля 2017 г.). «Количественная теневая съемка и протонная радиография для больших модуляций интенсивности». Physical Review E. 95 ( 2): 023306. arXiv : 1607.04179 . Bibcode : 2017PhRvE..95b3306K. doi : 10.1103/PhysRevE.95.023306. PMID 28297858. S2CID 13326345.
- ^ Метивье, Людовик (24 февраля 2016 г.). «Измерение несоответствия между сейсмограммами с использованием оптимального расстояния переноса: применение к полной инверсии формы волны». Geophysical Journal International . 205 (1): 345–377. Bibcode : 2016GeoJI.205..345M. doi : 10.1093/gji/ggw014 .
Дальнейшее чтение