stringtranslate.com

Лемма Шепли–Фолкмана

Лемма Шепли–Фолкмана, изображенная диаграммой с двумя панелями, одна слева, другая справа. Левая панель отображает четыре множества, которые отображаются в массиве два на два. Каждое из множеств содержит ровно две точки, которые отображаются красным цветом. В каждом наборе две точки соединены розовым отрезком прямой, который является выпуклой оболочкой исходного множества. Каждое множество имеет ровно одну точку, обозначенную символом плюс. В верхней строке массива два на два символ плюс лежит внутри отрезка прямой; в нижней строке символ плюс совпадает с одной из красных точек. Это завершает описание левой панели диаграммы. Правая панель отображает сумму Минковского множеств, которая является объединением сумм, имеющих ровно одну точку из каждого множества слагаемых; для отображаемых наборов шестнадцать сумм являются различными точками, которые отображаются красным цветом: Правые красные точки суммы являются суммами левых красных точек слагаемых. Выпуклая оболочка шестнадцати красных точек закрашена розовым цветом. В розовой внутренней части правого набора сумм лежит ровно один плюс-символ, который является (уникальной) суммой плюс-символов с правой стороны. Сравнивая левый массив и правую панель, можно подтвердить, что правый плюс-символ действительно является суммой четырех плюс-символов из левых наборов, ровно двух точек из исходных невыпуклых наборов слагаемых и двух точек из выпуклых оболочек оставшихся наборов слагаемых.
Лемма Шепли–Фолкмана иллюстрируется сложением Минковского четырех множеств. Точка (+) в выпуклой оболочке суммы Минковского четырех невыпуклых множеств ( справа ) является суммой четырех точек (+) из (левых) множеств — двух точек в двух невыпуклых множествах плюс двух точек в выпуклых оболочках двух множеств. Выпуклые оболочки закрашены розовым цветом. Исходные множества имеют ровно две точки (показаны красными точками). [1]

Лемма Шепли –Фолкмана  — это результат в выпуклой геометрии , описывающий сложение Минковского множеств в векторном пространстве . Она названа в честь математиков Ллойда Шепли и Джона Фолкмана , но впервые была опубликована экономистом Россом М. Старром .

Интуитивно лемму можно понимать так: если число суммируемых множеств превышает размерность векторного пространства, то их сумма Минковского приблизительно выпукла. [1] [2]

Связанные результаты дают более точные утверждения о том, насколько близка аппроксимация. Например, теорема Шепли–Фолкмана дает верхнюю границу расстояния между любой точкой в ​​сумме Минковского и ее выпуклой оболочкой . Эта верхняя граница уточняется теоремой Шепли–Фолкмана–Старра (альтернативно, следствием Старра ). [3]

Лемма Шепли–Фолкмана имеет приложения в экономике , оптимизации и теории вероятностей . [3] В экономике ее можно использовать для распространения результатов, доказанных для выпуклых предпочтений, на невыпуклые предпочтения. В теории оптимизации ее можно использовать для объяснения успешного решения задач минимизации, которые являются суммами многих функций . [4] [5] В теории вероятности ее можно использовать для доказательства закона больших чисел для случайных множеств . [6]

Вводный пример

Множество является выпуклым , если каждый отрезок прямой, соединяющий две его точки, является подмножеством этого множества. Например, сплошной диск  является выпуклым множеством, а окружность — нет, поскольку отрезок прямой, соединяющий две различные точки,  не является подмножеством окружности. 

Выпуклая оболочка множества  Q — это наименьшее выпуклое множество, содержащее  Q. Это расстояние равно нулю тогда и только тогда, когда сумма выпукла.

Сложение Минковского — это сложение членов множества . Например, сложение множества, состоящего из целых чисел ноль и единица, с самим собой дает множество, состоящее из нуля, единицы и двойки:

Подмножество целых чисел {0, 1, 2} содержится в интервале действительных чисел  [0, 2], который является выпуклым. Лемма Шепли–Фолкмана подразумевает, что каждая точка в [0, 2] является суммой целого числа из {0, 1} и действительного числа из [0, 1]. [7]

Расстояние между выпуклым интервалом [0, 2] и невыпуклым множеством {0, 1, 2} равно половине

1/2 = |1 − 1/2| = |0 − 1/2| = |2 − 3/2| = |1 − 3/2|.

Однако расстояние между средней суммой Минковского

1/2 ( {0, 1} + {0, 1}) = {0, 1/2, 1}

и его выпуклая оболочка [0, 1] составляет всего 1/4, что составляет половину расстояния (1/2) между его слагаемым {0, 1} и [0, 1]. По мере того, как добавляется больше наборов, среднее значение их суммы «заполняет» его выпуклую оболочку: максимальное расстояние между средним значением и его выпуклой оболочкой приближается к нулю, поскольку среднее значение включает больше слагаемых . [7]

Предварительные

Лемма Шепли–Фолкмана основана на следующих определениях и результатах выпуклой геометрии .

Действительные векторные пространства

Действительное векторное пространство двух  измерений может быть задано декартовой системой координат , в которой каждая точка идентифицируется упорядоченной парой действительных чисел, называемых «координатами», которые условно обозначаются как  x и  y . Две точки в декартовой плоскости могут быть сложены покоординатно

( Икс 1у 1 ) + ( Икс 2у 2 ) знак равно ( Икс 1 + Икс 2 , у 1 + у 2 );

далее, точку можно умножить на каждое действительное число  λ покоординатно

λ  ( ху ) = ( λx , λy ).

В более общем смысле любое вещественное векторное пространство (конечной) размерности  можно рассматривать как множество всех -кортежей вещественных  чисел { ( v 1 , v 2 , . . . , v D )  } , на котором  определены две операции : сложение векторов и умножение на вещественное число . Для конечномерных векторных пространств операции сложения векторов и умножения вещественных чисел могут быть определены покоординатно, следуя примеру декартовой плоскости. [8]

Выпуклые множества

Отрезки линий проверяют, является ли подмножество выпуклым .

В вещественном векторном пространстве непустое множество  Q определяется как выпуклое , если для каждой пары его точек каждая точка на отрезке прямой , который их соединяет, все еще находится в  Q. Например, сплошной диск  является выпуклым, а круг — нет, потому что он не содержит отрезка прямой, соединяющего его точки  ; невыпуклое множество из трех целых чисел {0, 1, 2} содержится в интервале [0, 2], который является выпуклым. Например, сплошной куб является выпуклым; однако все, что является полым или вмятым, например, форма полумесяца , является невыпуклым. Пустое множество является выпуклым, либо по определению [9] , либо vacuously , в зависимости от автора. 

Более формально, множество  Q является выпуклым, если для всех точек  v 0 и  v 1 в  Q и для каждого действительного числа  λ в единичном интервале  [0,1] точка

(1 −  λv 0 + λv 1

является членом Q. 

По математической индукции множество  Q является выпуклым тогда и только тогда, когда каждая выпуклая комбинация членов  Q также принадлежит  Q. По определению, выпуклая комбинация индексированного подмножества { v 0v 1 , . . . ,  v D } векторного пространства — это любое взвешенное среднее  λ 0 v 0 + λ 1 v 1 + . . . + λ D v D , для некоторого индексированного множества неотрицательных действительных чисел { λ d }, удовлетворяющего уравнению  λ 0 + λ 1 + . . . + λ D  = 1. [10]

Определение выпуклого множества подразумевает, что пересечение двух выпуклых множеств является выпуклым множеством. В более общем смысле, пересечение семейства выпуклых множеств является выпуклым множеством. В частности, пересечение двух непересекающихся множеств является пустым множеством, которое является выпуклым. [9]

Выпуклая оболочка

Изображение сглаженного треугольника, похожего на треугольную (мексиканскую) лепешку или треугольный дорожный знак. Каждый из трех скругленных углов нарисован красной кривой. Остальные внутренние точки треугольной формы закрашены синим цветом.
В выпуклой оболочке красного множества каждая синяя точка представляет собой выпуклую комбинацию некоторых красных точек.

Для каждого подмножества  Q действительного векторного пространства его выпуклая оболочка  Conv( Q ) является минимальным выпуклым множеством, содержащим  Q . Таким образом, Conv( Q ) является пересечением всех выпуклых множеств, покрывающих  Q . Выпуклая оболочка множества может быть эквивалентно определена как множество всех выпуклых комбинаций точек в  Q . [11] Например, выпуклая оболочка множества целых чисел  {0,1} является замкнутым интервалом действительных чисел  [0,1], который содержит целые конечные точки. [7] Выпуклая оболочка единичной окружности является замкнутым единичным диском , который содержит единичную окружность.

дополнение Минковского

В неотрицательном квадранте декартовой плоскости показаны три квадрата.
Сложение множеств по Минковскому. Сумма квадратов и есть квадрат .

В любом векторном пространстве (или алгебраической структуре со сложением) сумма Минковского двух непустых множеств определяется как поэлементная операция (см. также [12] ). Например,

Эта операция явно коммутативна и ассоциативна на совокупности непустых множеств. Все такие операции распространяются вполне определенным образом на рекурсивные формы. По принципу индукции легко видеть, что [13]

Выпуклые оболочки сумм Минковского

Сложение Минковского хорошо ведет себя по отношению к взятию выпуклых оболочек. В частности, для всех подмножеств действительного векторного пространства, выпуклая оболочка их суммы Минковского является суммой Минковского их выпуклых оболочек. То есть,

И по индукции следует, что

для любых и непустых подмножеств , . [14] [15]

Заявления о трех основных результатах

Обозначение

— положительные целые числа.

— это размерность окружающего пространства .

являются непустыми, ограниченными подмножествами . Их также называют «слагаемыми». — это число слагаемых.

— сумма Минковского слагаемых.

— произвольный вектор в .

Лемма Шепли–Фолкмана

Так как , для любого существуют элементы такие, что . Лемма Шепли–Фолкмана уточняет это утверждение.

Лемма Шепли–Фолкмана  —  Для любого существуют элементы такие, что , и в большинстве слагаемых , в то время как остальные .

Например, каждая точка в является суммой элемента в и элемента в . [7]

Перетасовывая индексы при необходимости, это означает, что каждую точку можно разложить как

где для и для . Обратите внимание, что переиндексация зависит от точки . [16]

Лемму можно кратко сформулировать так:

Обращение леммы Шепли–Фолкмана

Обращение леммы Шепли–Фолкмана [17]  —  Если векторное пространство подчиняется лемме Шепли–Фолкмана для натурального числа  и для любого числа, меньшего  , то его размерность конечна, и в точности  .

В частности, лемма Шепли–Фолкмана требует, чтобы векторное пространство было конечномерным.

Теорема Шепли–Фолкмана

Шепли и Фолкман использовали свою лемму для доказательства следующей теоремы, которая количественно определяет разницу между и с помощью квадрата евклидова расстояния .

Для любого непустого подмножества и любой точки определим их квадрат евклидова расстояния как инфимум. И, в более общем смысле, для любых двух непустых подмножеств определим

Обратите внимание, что мы можем просто написать, где Аналогично,

Например,

Квадрат евклидова расстояния является мерой того, насколько «близки» два множества. В частности, если два множества компактны, то их квадрат евклидова расстояния равен нулю тогда и только тогда, когда они равны. Таким образом, мы можем количественно определить, насколько близко к выпуклости , путем верхней границы

Для любого ограниченного подмножества определим его описанный радиус как инфимум радиуса всех шаров, содержащих его (как показано на диаграмме). Более формально, Теперь мы можем сформулировать

Теорема Шепли–Фолкмана [18] [19]  — 

где мы используем обозначение , означающее «сумму наибольших членов».

Обратите внимание, что эта верхняя граница зависит от размерности окружающего пространства и формы слагаемых, но не от количества слагаемых.

Теорема Шепли–Фолкмана–Старра

Определим внутренний радиус ограниченного подмножества как инфимум такого, что для любого существует шар радиуса такой, что . [20]

Синий диск содержит красные точки. Меньший зеленый диск находится в самой большой вогнутости среди этих красных точек.
Радиус описанной окружности (синий) и внутренний радиус (зеленый) множества точек (темно-красного цвета, выпуклая оболочка которого показана более светлыми красными пунктирными линиями). Внутренний радиус меньше радиуса описанной окружности, за исключением подмножеств одного круга, для которых они равны.

Например, пусть — два вложенных друг в друга шара, тогда радиус описанной окружности равен радиусу , но ее внутренний радиус равен радиусу .

Так как для любого ограниченного подмножества следующая теорема является уточнением:

Теорема Шепли–Фолкмана–Старра [20] [21]  —  .

В частности, если у нас есть бесконечная последовательность непустых ограниченных подмножеств , и если существует такое , что внутренний радиус каждого из них ограничен сверху значением , то Это можно интерпретировать как утверждение, что до тех пор, пока у нас есть верхняя граница внутренних радиусов, выполнение «усреднения по Минковскому» будет приближать нас все ближе и ближе к выпуклому множеству.

Другие доказательства результатов

Было много доказательств этих результатов, от оригинального [20] до более поздних Эрроу и Хана , [22] Касселса , [23] Шнайдера, [24] и т. д. Абстрактное и элегантное доказательство Экланда [25] было расширено Артштейном. [26] Различные доказательства также появлялись в неопубликованных работах. [2] [27] Элементарное доказательство леммы Шепли–Фолкмана можно найти в книге Берцекаса [ 28] вместе с приложениями для оценки разрыва двойственности в разделимых задачах оптимизации и играх с нулевой суммой.

Обычные доказательства этих результатов неконструктивны: они устанавливают только существование представления, но не предоставляют алгоритм для вычисления представления. В 1981 году Старр опубликовал итерационный алгоритм для менее точной версии теоремы Шепли–Фолкмана–Старра. [29]

Доказательство результатов

Следующее доказательство леммы Шепли–Фолкмана взято из [30] Идея доказательства состоит в том, чтобы поднять представление от до , использовать теорему Каратеодори для конических оболочек , а затем вернуться обратно к .

Доказательство леммы Шепли–Фолкмана

Для каждого представим как , где — большое конечное число, и .

Теперь «поднимем» представление из в . Определим , где находится вектор в , имеющий 1 в координате и 0 во всех остальных координатах.

Благодаря этому у нас есть поднятое представление

То есть, находится в конической оболочке .

По теореме Каратеодори для конических оболочек мы имеем альтернативное представление

такие, что , и в большинстве из них ненулевые. Поскольку мы определили

это альтернативное представление также является представлением для .

Мы утверждаем, что для любого должно быть по крайней мере одно значение для которого отлично от нуля. Помните, что мы определили , элемент , как . В то же время, из поднятого представления , Мы отбрасываем все члены в правой части, для которых они равны нулю. Оставшиеся члены принимают вид , поэтому мы находим уравнение Из этого следует, что есть по крайней мере один элемент суммы в правой части, который отличен от нуля.

Объединяя тот факт, что для каждого значения существует ненулевое значение , а также тот факт, что не более , являются ненулевыми, мы приходим к выводу, что может быть не более , для которых не менее двух из являются ненулевыми.

Таким образом, мы получаем представление

где для большинства , термин не находится в .

Следующее «вероятностное» доказательство теоремы Шепли–Фолкмана–Старра взято из [23] .

Мы можем интерпретировать в вероятностных терминах: , поскольку для некоторого , мы можем определить случайный вектор , имеющий конечный носитель в , такой что , и .

Тогда естественно рассматривать «дисперсию» множества как При этом .

Доказательство

: Расширьте их определения.

: если тогда пусть имеет конечный носитель в такой, что . Теперь, поскольку ограничено в шаре радиуса с центром в некотором , имеем .

: использовать предыдущий результат.

Доказательство теоремы Шепли–Фолкмана–Старра

Достаточно показать .

, по лемме Шепли–Фолкмана существует представление , такое, что разбивает .

Теперь для каждого построим случайные векторы такие, что имеют конечный носитель на , причем , где — произвольное малое число.

Пусть все такие будут независимы. Тогда пусть . Поскольку каждый из них является детерминированным вектором, мы имеем

Поскольку это верно для произвольного , то имеем , и все готово.

История

Фотография Ллойда Шепли
Лауреат Нобелевской премии по экономике 2012 года Ллойд Шепли совместно с Джоном Фолкманом доказал лемму Шепли–Фолкмана . [1]

Лемма Ллойда Шепли и Джона Фолкмана была впервые опубликована экономистом Россом М. Старром , который исследовал существование экономических равновесий во время учебы у Кеннета Эрроу . [1] В своей статье Старр изучал выпуклую экономику, в которой невыпуклые множества были заменены их выпуклыми оболочками; Старр доказал, что выпуклая экономика имеет равновесия, которые близко аппроксимируются «квазиравновесиями» исходной экономики; более того, он доказал, что каждое квазиравновесие обладает многими оптимальными свойствами истинных равновесий, которые, как доказано, существуют для выпуклых экономик.

После статьи Старра 1969 года результаты Шепли–Фолкмана–Старра широко использовались для того, чтобы показать, что центральные результаты (выпуклой) экономической теории являются хорошими приближениями к большим экономикам с невыпуклостями; например, квазиравновесия близко приближают равновесия выпуклой экономики. «Вывод этих результатов в общей форме был одним из главных достижений послевоенной экономической теории», — писал Роджер Геснери . [31]

Тема невыпуклых множеств в экономике изучалась многими лауреатами Нобелевской премии : самим Шепли (2012), Эрроу (1972), Робертом Ауманн (2005), Жераром Дебре (1983), Тьяллингом Купмансом (1975), Полом Кругманом (2008) и Полом Самуэльсоном (1970); дополнительная тема выпуклых множеств в экономике подчеркивалась этими лауреатами, а также Леонидом Гурвицем , Леонидом Канторовичем (1975) и Робертом Солоу (1987).

Приложения

Лемма Шепли–Фолкмана позволяет исследователям распространять результаты для сумм Минковского выпуклых множеств на суммы общих множеств, которые не обязательно должны быть выпуклыми. Такие суммы множеств возникают в экономике , в математической оптимизации и в теории вероятностей ; в каждой из этих трех математических наук невыпуклость является важной особенностью приложений.

Экономика

Появляется неотрицательный квадрант декартовой плоскости. Синяя прямая наклонена вниз как секущая, соединяющая две точки, по одной на каждой из осей. Эта синяя линия касается красной кривой, которая касается ее в отмеченной точке, координаты которой обозначены Qx и Qy.
Потребитель предпочитает каждую корзину товаров на кривой безразличия  I 3 каждой корзине на   I 2. Корзина ( Q xQ y ), где бюджетная линия ( показана синим цветом ) поддерживает  I 2 , является оптимальной и также осуществимой, в отличие от любой корзины, лежащей на   I 3 , которая предпочтительна, но неосуществима.

В экономике предпочтения потребителя определяются по всем «корзинам» товаров. Каждая корзина представлена ​​в виде неотрицательного вектора, координаты которого представляют количество товаров. На этом наборе корзин кривая безразличия определяется для каждого потребителя; кривая безразличия потребителя содержит все корзины товаров, которые потребитель считает эквивалентными: То есть для каждой пары корзин на одной и той же кривой безразличия потребитель не предпочитает одну корзину другой. Через каждую корзину товаров проходит одна кривая безразличия. Множество предпочтений потребителя (относительно кривой безразличия) представляет собой объединение кривой безразличия и всех корзин товаров, которые потребитель предпочитает кривой безразличия. Предпочтения потребителя являются выпуклыми, если все такие множества предпочтений являются выпуклыми. [32]

Оптимальная корзина товаров возникает, когда бюджетная линия поддерживает набор предпочтений потребителя, как показано на диаграмме. Это означает, что оптимальная корзина находится на максимально возможной кривой безразличия, заданной бюджетной линией, которая определяется в терминах вектора цен и дохода потребителя (вектора запасов). Таким образом, набор оптимальных корзин является функцией цен , и эта функция называется спросом потребителя . Если набор предпочтений выпуклый, то при каждой цене спрос потребителя является выпуклым набором, например, уникальной оптимальной корзиной или отрезком линии корзин. [33]

Невыпуклые предпочтения

Изображение невыпуклого множества предпочтений с вогнутостью, не поддерживаемой бюджетной линией
Если предпочтения потребителя имеют вогнутости, потребитель может переключаться между двумя отдельными оптимальными корзинами.

Однако, если набор предпочтений невыпуклый , то некоторые цены определяют бюджетную линию, которая поддерживает две отдельные оптимальные корзины. Например, мы можем представить, что для зоопарков лев стоит столько же, сколько орел, и, кроме того, что бюджет зоопарка достаточен для одного орла или одного льва. Мы также можем предположить, что смотритель зоопарка рассматривает любое животное как одинаково ценное. В этом случае зоопарк купил бы либо одного льва, либо одного орла. Конечно, современный смотритель зоопарка не хочет покупать половину орла и половину льва (или грифона )! Таким образом, предпочтения смотрителя зоопарка невыпуклые: смотритель зоопарка предпочитает иметь любое животное, чем иметь любую строго выпуклую комбинацию обоих. [34]

Когда множество предпочтений потребителя невыпуклое, то (для некоторых цен) спрос потребителя не связан ; несвязанный спрос подразумевает некоторое прерывистое поведение потребителя, как это обсуждал Гарольд Хотеллинг :

Если рассматривать кривые безразличия для покупок как имеющие волнообразный характер, выпуклые к началу координат в некоторых областях и вогнутые в других, то мы вынуждены прийти к выводу, что только части, выпуклые к началу координат, можно считать имеющими какое-либо значение, поскольку другие по сути ненаблюдаемы. Их можно обнаружить только по разрывам, которые могут возникнуть в спросе при изменении ценовых соотношений, что приводит к резкому скачку точки касания через пропасть при повороте прямой линии. Но, хотя такие разрывы могут обнаружить существование пропастей, они никогда не могут измерить их глубину. Вогнутые части кривых безразличия и их многомерные обобщения, если они существуют, должны навсегда остаться в неизмеримой неизвестности. [35]

Трудности изучения невыпуклых предпочтений подчеркивались Германом Уолдом [36] и Полом Самуэльсоном , который писал, что невыпуклости «окутаны вечной тьмой...» [37] [a] по мнению Дайверта. [38]

Тем не менее, невыпуклые предпочтения были освещены с 1959 по 1961 год серией статей в The Journal of Political Economy  ( JPE ). Основными авторами были Фаррелл, [39] Батор, [40] Купманс , [41] и Ротенберг. [42] В частности, статья Ротенберга обсуждала приближенную выпуклость сумм невыпуклых множеств. [43] Эти статьи JPE стимулировали статью Ллойда Шепли и Мартина Шубика , которые рассматривали выпуклые потребительские предпочтения и вводили концепцию «приблизительного равновесия». [44] Статьи JPE и статья Шепли–Шубика повлияли на другое понятие «квазиравновесия», принадлежащее Роберту Ауманну . [45] [46]

Статья Старра 1969 года и современная экономика

Фотография Кеннета Эрроу
Кеннет Эрроу ( лауреат Нобелевской премии 1972 года ) помогал Россу М. Старру изучать невыпуклые экономики . [47]

Предыдущие публикации по невыпуклости и экономике были собраны в аннотированной библиографии Кеннета Эрроу . Он передал библиографию Старру , который тогда был студентом, зачисленным на (выпускной) курс математической экономики Эрроу. [47] В своей курсовой работе Старр изучал общие равновесия искусственной экономики, в которой невыпуклые предпочтения были заменены их выпуклыми оболочками. В выпуклой экономике при каждой цене совокупный спрос был суммой выпуклых оболочек потребительского спроса. Идеи Старра заинтересовали математиков Ллойда Шепли и Джона Фолкмана , которые доказали свои одноименные лемму и теорему в «частной переписке», о чем сообщалось в опубликованной статье Старра 1969 года. [1]

В своей публикации 1969 года Старр применил теорему Шепли–Фолкмана–Старра. Старр доказал, что «выпуклая» экономика имеет общие равновесия, которые можно близко аппроксимировать « квазиравновесиями » исходной экономики, когда число агентов превышает размерность товаров: Конкретно, Старр доказал, что существует по крайней мере одно квазиравновесие цен  p opt со следующими свойствами:

Старр установил, что

«в совокупности расхождение между распределением в фиктивной экономике, полученным путем [взятия выпуклых оболочек всех наборов потребления и производства], и некоторым распределением в реальной экономике ограничено способом, который не зависит от числа экономических агентов. Следовательно, средний агент испытывает отклонение от предполагаемых действий, которое исчезает по значимости, когда число агентов стремится к бесконечности». [49]

После статьи Старра 1969 года результаты теории Шепли–Фолкмана–Старра широко использовались в экономической теории. Роджер Геснери подытожил их экономические последствия: «Некоторые ключевые результаты, полученные при предположении о выпуклости, остаются (приблизительно) актуальными в обстоятельствах, когда выпуклость не выполняется. Например, в экономиках с большой потребительской стороной невыпуклости предпочтений не разрушают стандартные результаты». [50] «Вывод этих результатов в общей форме был одним из главных достижений послевоенной экономической теории», — писал Геснери. [31] Тема невыпуклых множеств в экономике изучалась многими лауреатами Нобелевской премии : Эрроу (1972), Роберт Ауманн (2005), Жерар Дебре (1983), Тьяллинг Купманс (1975), Пол Кругман (2008) и Пол Самуэльсон (1970); дополнительная тема выпуклых множеств в экономике была подчеркнута этими лауреатами, наряду с Леонидом Гурвичем , Леонидом Канторовичем (1975) и Робертом Солоу (1987). [51] Результаты Шепли–Фолкмана–Старра были представлены в экономической литературе: в микроэкономике , [52] в теории общего равновесия, [53] в экономике общественного сектора [54] (включая провалы рынка ), [55] , а также в теории игр , [56] в математической экономике , [57] и в прикладной математике (для экономистов). [58] [59] Результаты Шепли–Фолкмана–Старра также повлияли на экономические исследования с использованием теории меры и интеграции . [60]

Математическая оптимизация

График выпуклой функции, нарисованный черным цветом. Его эпиграф, область над графиком, закрашена сплошным зеленым цветом.
Функция является выпуклой , если область над ее графиком представляет собой выпуклое множество .

Лемма Шепли–Фолкмана использовалась для объяснения того, почему большие задачи минимизации с невыпуклостями могут быть почти решены (с помощью итерационных методов, доказательства сходимости которых изложены только для выпуклых задач ). Лемма Шепли–Фолкмана поощряла использование методов выпуклой минимизации в других приложениях с суммами многих функций. [61]

Предварительные сведения об теории оптимизации

Нелинейная оптимизация опирается на следующие определения функций :

График( f ) = { ( xf ( x ) ) }
График синусоидальной функции, которая периодически колеблется вверх и вниз между −1 и +1 с периодом 2π.
Функция синуса невыпуклая .​
Epi( f ) = {  ( xu ) :  f ( x ) ≤  u  } .

Например, квадратичная функция  f ( x ) =  x 2 является выпуклой, как и функция  абсолютного значения g ( x ) = | x |. Однако функция синуса (изображенная на рисунке) невыпукла на интервале  (0, π).

Аддитивные задачи оптимизации

Во многих задачах оптимизации целевая функция  f является разделимой : то есть f представляет собой сумму многих слагаемых-функций, каждая из которых имеет свой собственный аргумент:

f ( x ) = f (  ( x 1 , ..., x )  ) = Σ f n ( x n ).  

Например, задачи линейной оптимизации являются разделимыми. Имея разделимую задачу с оптимальным решением, мы фиксируем оптимальное решение

х мин  = ( х 1 , ...,  х ) мин

с минимальным значением  f ( x min ). Для этой разделимой задачи мы также рассматриваем оптимальное решение ( x minf ( x min ) ) " выпуклой задачи ", где берутся выпуклые оболочки графиков функций слагаемых. Такое оптимальное решение является пределом последовательности точек в выпуклой задаче

( x jf ( x j ) )  ∈  Σ Conv ( Graph( f n ) ) . [4] [б]

Конечно, данная оптимальная точка представляет собой сумму точек в графиках исходных слагаемых и небольшого числа выпуклых слагаемых по лемме Шепли–Фолкмана.

Этот анализ был опубликован Иваром Экландом в 1974 году для объяснения кажущейся выпуклости разделимых задач со многими слагаемыми, несмотря на невыпуклость задач слагаемых. В 1973 году молодой математик Клод Лемарешаль был удивлен своим успехом с выпуклыми методами минимизации для задач, которые, как было известно, были невыпуклыми; для минимизации нелинейных задач решение двойственной задачи не обязательно должно предоставлять полезную информацию для решения основной задачи, если только основная задача не является выпуклой и не удовлетворяет ограничению . Задача Лемарешаля была аддитивно разделимой, и каждая функция слагаемого была невыпуклой; тем не менее, решение двойственной задачи давало близкое приближение к оптимальному значению основной задачи. [63] [4] [64] Анализ Экленда объяснил успех методов выпуклой минимизации на больших и разделимых задачах, несмотря на невыпуклость функций слагаемых. Экленд и более поздние авторы утверждали, что аддитивная разделимость производила приблизительно выпуклую агрегатную задачу, даже несмотря на то, что функции слагаемых были невыпуклыми. Решающим шагом в этих публикациях является использование леммы Шепли–Фолкмана. [4] [64] [65] [c] Лемма Шепли–Фолкмана поощряла использование методов выпуклой минимизации на других приложениях с суммами многих функций. [4] [5] [58] [61]

Теория вероятностей и меры

Выпуклые множества часто изучаются с помощью теории вероятностей . Каждая точка в выпуклой оболочке ( непустого ) подмножества  Q конечномерного пространства является ожидаемым значением простого случайного вектора , который принимает свои значения в  Q , как следствие леммы Каратеодори . Таким образом, для непустого множества  Q совокупность ожидаемых значений простых, Q -значных случайных векторов равна  выпуклой оболочке Q ; это равенство подразумевает , что результаты Шепли–Фолкмана–Старра полезны в теории вероятностей. [67] С другой стороны, теория вероятностей предоставляет инструменты для исследования выпуклых множеств в целом и результатов Шепли–Фолкмана–Старра в частности. [68] Результаты Шепли–Фолкмана–Старра широко использовались в вероятностной теории случайных множеств , [69] например, для доказательства закона больших чисел , [6] [70] центральной предельной теоремы , [70] [71] и принципа больших уклонений . [72] Эти доказательства вероятностных предельных теорем использовали результаты Шепли–Фолкмана–Старра, чтобы избежать предположения, что все случайные множества выпуклы. 

Вероятностная мера — это конечная мера , и лемма Шепли–Фолкмана имеет приложения в теории не вероятностных мер, таких как теории объема и векторных мер . Лемма Шепли–Фолкмана позволяет уточнить неравенство Брунна–Минковского , которое ограничивает объем сумм в терминах объемов их множеств слагаемых. [73] Объем множества определяется в терминах меры Лебега , которая определена на подмножествах евклидова пространства . В продвинутой теории меры лемма Шепли–Фолкмана использовалась для доказательства теоремы Ляпунова , которая утверждает, что область значений векторной меры является выпуклой. [74] Здесь традиционный термин « область значений » (альтернативно, «изображение») — это множество значений, производимых функцией. Векторная мера — это векторнозначное обобщение меры; например, если  p 1 и  p 2 являются вероятностными мерами, определенными на одном и том же измеримом пространстве , то функция произведения  p 1  p 2 является векторной мерой, где  p 1  p 2 определяется для каждого события  ω как

( п 1  п 2 ) ( ω )= ( п 1 ( ω ),  п 2 ( ω ) ) .

Теорема Ляпунова использовалась в экономике , [45] [75] в теории управления ( «bang-bang» ) и в статистической теории . [76] Теорема Ляпунова была названа непрерывным аналогом леммы Шепли–Фолкмана, [3] которая сама была названа дискретным аналогом теоремы Ляпунова. [77]

Примечания

  1. ^ «Вечная тьма» описывает Ад в «Потерянном рае » Джона Мильтона , вогнутость которого сравнивается с Сербонским болотом в Книге II, строки 592–594:

    Пропасть глубокая, как Сербское болото
    между Дамиатой и горой Касий,
    где затонули целые армии.

    Описание вогнутости, данное Мильтоном, служит литературным эпиграфом , предваряющим седьмую главу Эрроу и Хана (1980, стр. 169) «Рынки с невыпуклыми предпочтениями и производством», в которой представлены результаты Старра (1969).
  2. ^ Предел последовательности является членом замыкания исходного множества , которое является наименьшим замкнутым множеством , содержащим исходное множество. Сумма Минковского двух замкнутых множеств не обязательно должна быть замкнутой, поэтому следующее включение может быть строгим
    Clos(P) + Clos(Q) ⊆ Clos( Clos(P) + Clos(Q) );
    включение может быть строгим даже для двух выпуклых замкнутых множеств слагаемых, согласно Рокафеллару (1997, стр. 49 и 75). Обеспечение замкнутости суммы множеств Минковского требует операции замыкания, которая добавляет пределы сходящихся последовательностей.
  3. ^ Aubin & Ekeland (1976) и Ekeland (1999, стр. 362–364) также рассмотрели выпуклое  замыкание проблемы невыпуклой минимизации — то есть проблему, определенную как замкнутая выпуклая оболочка надграфика исходной проблемы . Их исследование разрывов двойственности было расширено Ди Гульельмо до квазивыпуклого замыкания проблемы невыпуклой минимизации — то есть проблему, определенную как замкнутая выпуклая оболочка множеств нижнего уровня . [66]
  1. ^ abcde Старр (1969)
  2. ^ ab Howe (1979, стр. 1)
  3. ^ abc Старр (2008)
  4. ^ abcde Экеланд (1999, стр. 357–359): Опубликованное в первом английском издании 1976 года, приложение Экеланда доказывает лемму Шепли–Фолкмана, а также признает эксперименты Лемарешаля на стр. 373.
  5. ^ аб Берцекас (1996, стр. 364–381), признавая Экланда (1999) на странице 374 и Обина и Экланда (1976) на странице 381:

    Берцекас (1996, стр. 364–381) описывает применение двойственных методов Лагранжа к планированию работы электростанцийзадачи обязательств по единицам »), где невыпуклость возникает из-за целочисленных ограничений :

    Берцекас и др. (1983)

  6. ^ ab Artstein & Vitale (1975, стр. 881–882)
  7. ^ abcd Картер (2001, стр. 94)
  8. ^ Эрроу и Хан (1980, стр. 375)
  9. ^ ab Rockafellar (1997, стр. 10)
  10. Эрроу и Хан (1980, стр. 376), Рокафеллар (1997, стр. 10–11) и Грин и Хеллер (1981, стр. 37)
  11. Эрроу и Хан (1980, стр. 385) и Рокафеллар (1997, стр. 11–12)
  12. ^ Шнайдер (1993, стр. xi) и Рокафеллар (1997, стр. 16)
  13. ^ Рокафеллар (1997, стр. 17) и Старр (1997, стр. 78)
  14. ^ Шнайдер (1993, стр. 2–3)
  15. ^ Эрроу и Хан (1980, стр. 387)
  16. Старр (1969, стр. 35–36)
  17. ^ Шнайдер (1993, стр. 140) приписывает этот результат Борвейну и О'Брайену (1978)
  18. ^ Старр (1969, стр. 36)
  19. ^ Шнайдер (1993, стр. 129)
  20. ^ abc Starr (1969, стр. 37)
  21. ^ Шнайдер (1993, стр. 129–130)
  22. Эрроу и Хан (1980, стр. 392–395)
  23. ^ ab Cassels (1975, стр. 435–436)
  24. ^ Шнайдер (1993, стр. 128)
  25. ^ Экеланд (1999, стр. 357–359)
  26. ^ Артштейн (1980, стр. 180)
  27. ^ Андерсон, Роберт М. (14 марта 2005 г.). "1 Теорема Шепли–Фолкмана" (PDF) . Экономика 201B: Невыпуклые предпочтения и приближенные равновесия . Беркли, Калифорния: Экономический факультет Калифорнийского университета в Беркли. стр. 1–5 . Получено 1 января 2011 г. .
  28. ^ Берцекас, Димитрий П. (2009). Теория выпуклой оптимизации . Белмонт, Массачусетс: Athena Scientific. ISBN 978-1-886529-31-1.
  29. ^ Старр, Росс М. (1981). «Аппроксимация точек выпуклой оболочки суммы множеств точками суммы: элементарный подход». Журнал экономической теории . 25 (2): 314–317. doi :10.1016/0022-0531(81)90010-7. MR  0640201.
  30. Чжоу, Линь (июнь 1993 г.). «Простое доказательство теоремы Шепли-Фолкмана». Экономическая теория . 3 (2): 371–372. doi :10.1007/bf01212924. ISSN  0938-2259.
  31. ^ ab Guesnerie (1989, стр. 138)
  32. ^ Мас-Колелл (1985, стр. 58–61) и Эрроу и Хан (1980, стр. 76–79)
  33. Эрроу и Хан (1980, стр. 79–81)
  34. Старр (1969, стр. 26): «В конце концов, можно быть безразличным, автомобиль это или лодка, но в большинстве случаев невозможно ни управлять, ни управлять комбинацией наполовину лодка, наполовину автомобиль».
  35. ^ Хотеллинг (1935, стр. 74)
  36. Wold (1943b, стр. 231 и 239–240) и Wold & Juréen (1953, стр. 146)
  37. ^ Самуэльсон (1950, стр. 359–360):

    Следует отметить, что любая точка, где кривые безразличия выпуклые, а не вогнутые, не может наблюдаться на конкурентном рынке. Такие точки окутаны вечной тьмой — если только мы не сделаем нашего потребителя монопсонистом и не позволим ему выбирать между товарами, лежащими на очень выпуклой «бюджетной кривой» (вдоль которой он влияет на цену того, что покупает). В этом случае монопсонии мы все еще могли бы вывести наклон кривой безразличия человека из наклона наблюдаемого ограничения в точке равновесия.

  38. ^ Диверт (1982, стр. 552–553)
  39. ^ Фаррелл (1959, 1961a, 1961b)
  40. ^ Батор (1961a, 1961b)
  41. ^ Купманс (1961, стр. 478) и другие — например, Фаррелл (1959, стр. 390–391) и Фаррелл (1961a, стр. 484), Батор (1961a, стр. 482–483), Ротенберг (1960, стр. 438) и Старр (1969, стр. 26) — прокомментировали Купманса (1957, стр. 1–126, особенно 9–16 [1.3 Суммирование множеств возможностей], 23–35 [1.6 Выпуклые множества и ценовые последствия оптимальности] и 35–37 [1.7 Роль предположений о выпуклости в анализе])
  42. ^ Ротенберг (1960, стр. 447, 1961)
  43. ^ Эрроу и Хан (1980, стр. 182)
  44. ^ Шепли и Шубик (1966, стр. 806)
  45. ^ ab Aumann (1966, стр. 1–2) использует результаты Aumann (1964, 1965).
  46. ^ Взятие выпуклой оболочки невыпуклых предпочтений обсуждалось ранее Уолдом (1943b, стр. 243) и Уолдом и Жюрином (1953, стр. 146), согласно Диверту (1982, стр. 552).
  47. ^ аб Старр и Стинчкомб (1999, стр. 217–218)
  48. Эрроу и Хан (1980, стр. 169–182) и Старр (1969, стр. 27–33)
  49. ^ Грин и Хеллер (1981, стр. 44)
  50. ^ Guesnerie (1989, стр. 99)
  51. ^ Мас-Колелл (1987)
  52. ^ Вариан (1992, стр. 393–394)

    Мас-Колелл, Уинстон и Грин (1995, стр. 627–630)

  53. Эрроу и Хан (1980, стр. 169–182)

    Мас-Колелл (1985, стр. 52–55, 145–146, 152–153 и 274–275)

    Хильденбранд (1974, стр. 37, 115–116, 122 и 168)

    Старр (1997, стр. 169)

    Элликсон (1994, стр. xviii, 306–310, 312, 328–329, 347 и 352)

  54. ^ Лаффон, Жан-Жак (1988). «3. Невыпуклости». Основы народной экономики. МТИ Пресс. стр. 63–65. ISBN 0-262-12127-1.
  55. ^ Саланье (2000, стр. 112–113 и 107–115)
  56. ^ Итииси (1983, стр. 24–25)
  57. ^ Касселс (1981, стр. 127 и 33–34)
  58. ^ аб Обин (2007, стр. 458–476)
  59. Картер (2001, стр. 93–94, 143, 318–319, 375–377 и 416)
  60. ^ Трокель (1984, стр. 30)
  61. ^ ab Bertsekas (1999, стр. 496)
  62. ^ Рокафеллар (1997, стр. 23)
  63. ^ Лемарешаль (1973, стр. 38) Эксперименты Лемарешаля обсуждались в более поздних публикациях:

    Аардал (1995, стр. 2–3)

    Хириарт-Уррути и Лемарешаль (1993, стр. 143–145, 151, 153 и 156)

  64. ^ аб Экеланд, Ивар (1974). « Априорная оценка в невыпуклом программировании». Comptes Rendus Hebdomadaires des Séances de l'Académie des Sciences . Серии A и B (на французском языке). 279 : 149–151. ISSN  0151-0509. МР  0395844.
  65. ^ Обин и Экеланд (1976, стр. 226, 233, 235, 238 и 241)
  66. ^ Ди Гульельмо (1977, стр. 287–288)
  67. ^ Шнайдер и Вейль (2008, стр. 45)
  68. ^ Касселс (1975, стр. 433–434)
  69. ^ Молчанов (2005, стр. 195–198, 218, 232, 237–238 и 407).
  70. ^ аб Пури и Ралеску (1985, стр. 154–155)
  71. ^ Вайль (1982, стр. 203 и 205–206)
  72. ^ Серф (1999, стр. 243–244) использует приложения леммы Шепли–Фолкмана из Пури и Ралеску (1985, стр. 154–155).
  73. ^ Ружа (1997, стр. 345)
  74. ^ Тарделла (1990, стр. 478–479)
  75. ^ Vind (1964, стр. 168 и 175) был отмечен лауреатом Нобелевской премии по экономике 1983 года Жераром Дебре . Дебре (1991, стр. 4) писал:

    Концепция выпуклого множества (т. е. множества, содержащего отрезок, соединяющий любые две его точки) неоднократно ставилась в центр экономической теории до 1964 года. Она предстала в новом свете с введением теории интеграции в изучение экономической конкуренции: если связать с каждым агентом экономики произвольное множество в товарном пространстве и если усреднить эти индивидуальные множества по совокупности незначительных агентов, то полученное множество обязательно будет выпуклым . [Дебре добавляет эту сноску: «Об этом прямом следствии теоремы А. А. Ляпунова см. Vind (1964)».] Но объяснения ... функций цен ... могут основываться на выпуклости множеств, полученных с помощью этого процесса усреднения . Выпуклость в товарном пространстве , полученная путем агрегации по совокупности незначительных агентов, является пониманием, которым экономическая теория обязана ... теории интеграции. [ Курсив добавлен ]

  76. ^ Артштейн (1980, стр. 172–183)
  77. ^ Мас-Колелл (1978, стр. 210)

Ссылки

Внешние ссылки