stringtranslate.com

Теория транспорта (математика)

В математике и экономике теория транспортировки или теория транспорта — это название, данное изучению оптимальной транспортировки и распределения ресурсов . Проблема была формализована французским математиком Гаспаром Монжем в 1781 году. [1]

В 1920-х годах А. Н. Толстой был одним из первых, кто исследовал транспортную задачу математически . В 1930 году в сборнике «Планирование перевозок» Том I для Народного комиссариата путей сообщения СССР он опубликовал статью «Способы нахождения минимального километража при перевозках грузов в пространстве». [2] [3]

Главные достижения в этой области были достигнуты во время Второй мировой войны советским математиком и экономистом Леонидом Канторовичем . [4] Следовательно, проблема в том виде, в котором она сформулирована, иногда известна как транспортная задача Монжа-Канторовича . [5] Формулировка транспортной задачи с помощью линейного программирования также известна как транспортная задача Хичкока - Купманса . [6]

Мотивация

Шахты и заводы

Предположим, что у нас есть набор шахт, добывающих железную руду, и набор заводов, которые используют железную руду, которую производят шахты. Предположим ради аргумента, что эти шахты и заводы образуют два непересекающихся подмножества и евклидовой плоскости . Предположим также, что у нас есть функция стоимости , так что это стоимость транспортировки одной партии железа из в . Для простоты мы игнорируем время, необходимое для выполнения транспортировки. Мы также предполагаем, что каждая шахта может снабжать только одну фабрику (без разделения поставок) и что каждой фабрике требуется ровно одна поставка для работы (фабрики не могут работать на половинной или двойной мощности). Сделав вышеуказанные предположения, транспортный план является биекцией . Другими словами, каждая шахта снабжает ровно одну целевую фабрику , и каждая фабрика снабжается ровно одной шахтой. Мы хотим найти оптимальный транспортный план , план , общая стоимость которого

является наименьшим из всех возможных планов транспортировки из в . Этот мотивирующий частный случай транспортной задачи является примером задачи назначения . Более конкретно, это эквивалентно поиску паросочетания с минимальным весом в двудольном графе .

Перемещение книг: важность функции стоимости

Следующий простой пример иллюстрирует важность функции стоимости при определении оптимального плана транспортировки. Предположим, что у нас есть книги одинаковой ширины на полке ( реальная линия ), расположенные в один непрерывный блок. Мы хотим переставить их в другой непрерывный блок, но сдвинув одну ширину книги вправо. Представляются два очевидных кандидата на оптимальный план транспортировки:

  1. переместить все книги на ширину одной книги вправо («много маленьких ходов»);
  2. переместите ширину самой левой книги вправо, а все остальные книги оставьте фиксированными («один большой ход»).

Если функция стоимости пропорциональна евклидову расстоянию ( для некоторых ), то эти два кандидата оба оптимальны. Если же, с другой стороны, мы выбираем строго выпуклую функцию стоимости, пропорциональную квадрату евклидова расстояния ( для некоторых ), то вариант «много маленьких ходов» становится единственным минимизатором.

Обратите внимание, что приведенные выше функции стоимости учитывают только горизонтальное расстояние, пройденное книгами, а не горизонтальное расстояние, пройденное устройством, используемым для подъема каждой книги и перемещения книги в положение. Если вместо этого рассматривается последнее, то из двух планов транспортировки второй всегда оптимален для евклидова расстояния, в то время как при наличии не менее 3 книг первый план транспортировки оптимален для квадрата евклидова расстояния.

Проблема Хичкока

Следующая формулировка транспортной задачи принадлежит Ф. Л. Хичкоку : [7]

Предположим, что есть источники товара с единицами поставки в и приемники товара со спросом в . Если есть себестоимость единицы отгрузки из в , найдите поток, который удовлетворяет спрос со стороны поставок и минимизирует стоимость потока. Эта задача в логистике была рассмотрена DR Fulkerson [8] и в книге Flows in Networks (1962), написанной совместно с LR Ford Jr. [9]

Тьяллингу Купмансу также приписывают разработку основ транспортной экономики и распределения ресурсов.

Абстрактная формулировка проблемы

Формулировки Монжа и Канторовича

Проблема транспортировки, как она сформулирована в современной или более технической литературе, выглядит несколько иначе из-за развития римановой геометрии и теории меры . Пример шахт-фабрик, каким бы простым он ни был, является полезной точкой отсчета при рассмотрении абстрактного случая. В этой обстановке мы допускаем возможность того, что мы можем не захотеть держать все шахты и фабрики открытыми для бизнеса и позволить шахтам снабжать более одной фабрики, а фабрикам принимать железо из более чем одной шахты.

Пусть и будут двумя сепарабельными метрическими пространствами такими, что любая вероятностная мера на (или ) является мерой Радона (т.е. они являются пространствами Радона ). Пусть будет измеримой по Борелю функцией . При заданных вероятностных мерах на и на , формулировка Монжа оптимальной транспортной задачи заключается в поиске транспортной карты , реализующей инфимум

где обозначает перемещение вперед на . Карта , которая достигает этой нижней грани ( т.е. делает ее минимумом вместо нижней грани), называется «оптимальной транспортной картой».

Формулировка Монжа оптимальной транспортной задачи может быть некорректной, поскольку иногда не существует удовлетворяющего решения : например, это происходит, когда является мерой Дирака , но не является.

Мы можем улучшить это, приняв формулировку Канторовича для оптимальной транспортной задачи, которая заключается в нахождении вероятностной меры , достигающей инфимума

где обозначает набор всех вероятностных мер на с маргиналами на и на . Можно показать [10] , что минимизатор для этой задачи всегда существует, когда функция стоимости полунепрерывна снизу и является плотным набором мер (что гарантировано для пространств Радона и ). (Сравните эту формулировку с определением метрики Вассерштейна на пространстве вероятностных мер.) Формулировка градиентного спуска для решения задачи Монжа–Канторовича была дана Сигурдом Ангенентом , Стивеном Хакером и Алленом Танненбаумом . [11]

Формула двойственности

Минимум задачи Канторовича равен

где супремум пробегает все пары ограниченных и непрерывных функций и таких, что

Экономическая интерпретация

Экономическая интерпретация становится яснее, если знаки поменять местами. Пусть обозначает вектор характеристик работника, вектор характеристик фирмы и экономический выпуск, произведенный работником, сопоставленным с фирмой . Принимая во внимание и , задача Монжа–Канторовича переписывается следующим образом: которая имеет двойственную  : где инфимум пробегает ограниченную и непрерывную функцию и . Если двойственная задача имеет решение, можно увидеть, что: так что интерпретируется как равновесная заработная плата работника типа , а интерпретируется как равновесная прибыль фирмы типа . [12]

Решение проблемы

Оптимальная транспортировка по реальной линии

Для пусть обозначает совокупность вероятностных мер на , имеющих конечный -й момент . Пусть и пусть , где - выпуклая функция .

  1. Если не имеет атома , т. е. если кумулятивная функция распределения является непрерывной функцией , то является оптимальным транспортным отображением. Это единственное оптимальное транспортное отображение, если является строго выпуклым.
  2. У нас есть

Доказательство этого решения представлено в работе Рачева и Рюшендорфа (1998). [13]

Дискретная версия и формулировка линейного программирования

В случае, когда поля и дискретны, пусть и будут вероятностными массами, соответственно назначенными и , и пусть будет вероятностью назначения . Целевая функция в основной задаче Канторовича тогда будет

и ограничение выражается как

и

Чтобы ввести это в задачу линейного программирования , нам нужно векторизовать матрицу , либо сложив ее столбцы, либо строки , мы называем эту операцию. В порядке по столбцам ограничения выше переписываются как

и

где — произведение Кронекера , — матрица размера со всеми элементами из единиц, а — единичная матрица размера . В результате, устанавливая , формулировка задачи линейного программирования имеет вид

которые можно легко ввести в крупномасштабный решатель линейного программирования (см. главу 3.4 Galichon (2016) [12] ).

Полудискретный случай

В полудискретном случае и представляет собой непрерывное распределение по , в то время как представляет собой дискретное распределение, которое назначает массу вероятности месту . В этом случае мы можем видеть [14] , что прямая и двойственная задачи Канторовича соответственно сводятся к: для прямой, где означает, что и , и: для двойственной, что можно переписать как: которая является конечномерной выпуклой задачей оптимизации, которая может быть решена стандартными методами, такими как градиентный спуск .

В случае, когда , можно показать, что множество назначенных определенному сайту является выпуклым многогранником. Полученная конфигурация называется диаграммой мощности . [15]

Квадратичный нормальный случай

Предположим частный случай , , и где обратим. Тогда имеем

Доказательство этого решения представлено в работе Галихона (2016). [12]

Сепарабельные гильбертовы пространства

Пусть — сепарабельное гильбертово пространство . Пусть обозначает совокупность вероятностных мер на , имеющих конечный -й момент; пусть обозначает те элементы, которые являются гауссовски регулярными : если — любая строго положительная гауссовская мера на и , то также.

Пусть , , для . Тогда задача Канторовича имеет единственное решение , и это решение индуцируется оптимальным транспортным отображением: т.е. существует борелевское отображение такое, что

Более того, если имеет ограниченную поддержку , то

для -почти всех для некоторого локально липшицевого , -вогнутого и максимального потенциала Канторовича . (Здесь обозначает производную Гато от .)

Энтропийная регуляризация

Рассмотрим вариант дискретной задачи выше, где мы добавили член энтропийной регуляризации к целевой функции основной задачи

Можно показать, что двойственная регуляризованная задача имеет вид

где, по сравнению с нерегуляризованной версией, «жесткое» ограничение в бывшей двойственной задаче ( ) было заменено «мягким» штрафом этого ограничения (суммой членов ). Условия оптимальности в двойственной задаче можно выразить как

Уравнение 5.1:
Уравнение 5.2:

Обозначая как матрицу члена , решение двойственной задачи эквивалентно поиску двух диагональных положительных матриц и соответствующих размеров и , таких, что и . Существование таких матриц обобщает теорему Синкхорна , и матрицы можно вычислить с помощью алгоритма Синкхорна–Кноппа [ 16] , который просто состоит из итеративного поиска для решения уравнения 5.1 и решения уравнения 5.2 . Таким образом, алгоритм Синкхорна–Кноппа является алгоритмом спуска по координатам для двойственной регуляризованной задачи.

Приложения

Оптимальный транспорт Монжа-Канторовича нашел широкое применение в различных областях. Среди них:

Смотрите также

Ссылки

  1. ^ Г. Монж. Мемуар о теории déblais et des remblais. Histoire de l'Académie Royale des Sciences de Paris, avec les Mémoires de Mathématique et de Physique pour la même année , страницы 666–704, 1781.
  2. ^ Шрийвер, Александр , Комбинаторная оптимизация, Берлин; Нью-Йорк: Springer, 2003. ISBN  3540443894 . См. п. 362
  3. ^ Айвор Граттан-Гиннесс, Айвор, Справочная энциклопедия истории и философии математических наук, том 1, JHU Press, 2003. См. стр. 831
  4. Л. Канторович, О перемещении масс, Доклады АН СССР, 37:199–201, 1942.
  5. ^ Седрик Виллани (2003). Темы в оптимальной транспортировке . Американское математическое общество. стр. 66. ISBN 978-0-8218-3312-4.
  6. ^ Singiresu S. Rao (2009). Engineering Optimization: Theory and Practice (4-е изд.). John Wiley & Sons. стр. 221. ISBN 978-0-470-18352-6.
  7. ^ Фрэнк Л. Хичкок (1941) «Распределение продукта из нескольких источников в многочисленные местоположения», MIT Journal of Mathematics and Physics 20:224–230 MR 0004469.
  8. ^ DR Fulkerson (1956) Транспортная проблема Хичкока, корпорация RAND.
  9. ^ LR Ford Jr. & DR Fulkerson (1962) § 3.1 в Flows in Networks , стр. 95, Princeton University Press
  10. ^ L. Ambrosio, N. Gigli & G. Savaré. Градиентные потоки в метрических пространствах и в пространстве вероятностных мер. Лекции по математике ETH Zürich, Birkhäuser Verlag, Базель. (2005)
  11. ^ Angenent, S.; Haker, S.; Tannenbaum, A. (2003). «Минимизация потоков для задачи Монжа–Канторовича». SIAM J. Math. Anal . 35 (1): 61–97. CiteSeerX 10.1.1.424.1064 . doi :10.1137/S0036141002410927. 
  12. ^ abc Галихон, Альфред . Оптимальные методы транспортировки в экономике . Princeton University Press, 2016.
  13. ^ Рачев, Светлозар Т. и Людгер Рюшендорф. Проблемы массового транспорта: Том I: Теория . Том 1. Springer, 1998.
  14. ^ Сантамброджио, Филиппо. Оптимальный транспорт для прикладных математиков . Birkhäuser Basel, 2016. В частности, глава 6, раздел 4.2.
  15. ^ Ауренхаммер, Франц (1987), «Диаграммы мощности: свойства, алгоритмы и приложения», SIAM Journal on Computing , 16 (1): 78–96, doi :10.1137/0216006, MR  0873251.
  16. ^ Пейре, Габриэль и Марко Кутури (2019), «Вычислительный оптимальный транспорт: с приложениями к науке о данных», Основы и тенденции в машинном обучении: Том 11: № 5-6, стр. 355–607. DOI: 10.1561/2200000073.
  17. ^ Хакер, Стивен; Чжу, Лей; Танненбаум, Аллен; Ангенент, Сигурд (1 декабря 2004 г.). «Оптимальный массовый транспорт для регистрации и деформации». International Journal of Computer Vision . 60 (3): 225–240. CiteSeerX 10.1.1.59.4082 . doi :10.1023/B:VISI.0000036836.66311.97. ISSN  0920-5691. S2CID  13261370. 
  18. ^ Glimm, T.; Oliker, V. (1 сентября 2003 г.). «Оптическое проектирование систем с одним отражателем и проблема переноса массы Монжа–Канторовича». Журнал математических наук . 117 (3): 4096–4108. doi :10.1023/A:1024856201493. ISSN  1072-3374. S2CID  8301248.
  19. ^ Касим, Мухаммад Фирмансья; Кёрворст, Люк; Ратан, Нарен; Садлер, Джеймс; Чен, Николас; Саверт, Александр; Тринес, Рауль; Бингем, Роберт; Берроуз, Филип Н. (16 февраля 2017 г.). «Количественная теневая съемка и протонная радиография для больших модуляций интенсивности». Physical Review E. 95 ( 2): 023306. arXiv : 1607.04179 . Bibcode : 2017PhRvE..95b3306K. doi : 10.1103/PhysRevE.95.023306. PMID  28297858. S2CID  13326345.
  20. ^ Метивье, Людовик (24 февраля 2016 г.). «Измерение несоответствия между сейсмограммами с использованием оптимального расстояния переноса: применение к полной инверсии формы волны». Geophysical Journal International . 205 (1): 345–377. Bibcode : 2016GeoJI.205..345M. doi : 10.1093/gji/ggw014 .

Дальнейшее чтение