Изучение проблем размещения объектов (FLP) , также известное как анализ местоположения , является разделом исследования операций и вычислительной геометрии, занимающимся оптимальным размещением объектов для минимизации транспортных расходов с учетом таких факторов, как избежание размещения опасных материалов вблизи жилья и объектов конкурентов. Эти методы также применимы к кластерному анализу .
Простая задача размещения объектов — это задача Вебера , в которой необходимо разместить один объект, причем единственным критерием оптимизации является минимизация взвешенной суммы расстояний от заданного набора точек. Более сложные задачи, рассматриваемые в этой дисциплине, включают размещение нескольких объектов, ограничения на местоположение объектов и более сложные критерии оптимизации.
В базовой формулировке задача размещения объектов состоит из набора потенциальных мест расположения объектов L , где объект может быть открыт, и набора точек спроса D , которые должны быть обслужены. Цель состоит в том, чтобы выбрать подмножество F объектов для открытия, чтобы минимизировать сумму расстояний от каждой точки спроса до ближайшего к ней объекта, плюс сумму затрат на открытие объектов.
Задача размещения объектов на общих графах является NP-трудной для оптимального решения, путем сведения к (например) задаче покрытия множеств . Разработан ряд алгоритмов приближения для задачи размещения объектов и многих ее вариантов.
Без предположений о множестве расстояний между клиентами и сайтами (в частности, без предположения, что расстояния удовлетворяют неравенству треугольника ), проблема известна как неметрическое расположение объектов и может быть аппроксимирована с точностью до множителя O(log n ). [1] Этот множитель является узким, посредством сохраняющего аппроксимацию сокращения из задачи покрытия множества.
Если мы предположим, что расстояния между клиентами и сайтами ненаправлены и удовлетворяют неравенству треугольника, мы говорим о метрической задаче размещения объектов (MFL) . MFL по-прежнему является NP-трудной и ее трудно аппроксимировать с коэффициентом лучше 1,463. [2] Лучший из известных в настоящее время алгоритмов аппроксимации достигает коэффициента аппроксимации 1,488. [3]
Задача минимаксного размещения объектов ищет местоположение, которое минимизирует максимальное расстояние до участков, где расстояние от одной точки до участков равно расстоянию от точки до ее ближайшего участка. Формальное определение следующее:
Для заданного множества точек P ⊂ найдите множество точек S ⊂ , | S | = k , так, чтобы max p ∈ P (min q ∈ S (d( p , q )) было минимальным.
В случае евклидовой метрики при k = 1 она известна как задача наименьшей охватывающей сферы или задача с 1 центром . Ее изучение прослеживается по крайней мере до 1860 года.
Было доказано, что точное решение задачи k -центра является NP-трудным. [4] [5] [6] Было обнаружено, что приближение к задаче также является NP-трудным, когда ошибка мала. Уровень ошибки в алгоритме приближения измеряется как фактор приближения, который определяется как отношение между приближением и оптимумом. Доказано, что приближение задачи k -центра является NP-трудным, когда фактор приближения меньше 1,822 (размерность = 2) [7] или 2 (размерность > 2). [6]
Точный решатель
Существуют алгоритмы для получения точных решений этой проблемы. Один точный решатель работает со временем . [8] [9]
1 + ε приближение
Приближение 1 + ε заключается в поиске решения с коэффициентом приближения не более 1 + ε . Это приближение является NP-сложным, поскольку ε произвольно. Предлагается один подход, основанный на концепции coreset , со сложностью выполнения . [10] В качестве альтернативы доступен другой алгоритм, также основанный на coresets. Он выполняется за . [11] Автор утверждает, что время выполнения намного меньше, чем в худшем случае, и, таким образом, можно решить некоторые задачи, когда k мало (скажем, k < 5).
Кластеризация самой дальней точки
Из-за сложности задачи получение точного решения или точного приближения непрактично. Вместо этого для случаев с большим k широко используется приближение с коэффициентом = 2. Это приближение называется алгоритмом кластеризации самой дальней точки (FPC) или обходом самого дальнего первого . [6] Алгоритм довольно прост: выбрать любую точку из множества в качестве одного центра; найти самую дальнюю точку из оставшегося множества в качестве другого центра; повторить процесс, пока не будет найдено k центров.
Легко видеть, что этот алгоритм работает за линейное время. Поскольку доказано, что аппроксимация с коэффициентом меньше 2 является NP-трудной, FPC рассматривался как наилучшее приближение, которое можно было найти.
Что касается производительности выполнения, временная сложность впоследствии улучшается до O( n log k ) с помощью техники блочной декомпозиции. [7]
Задача о максимальном расположении объектов или проблема оскорбительного расположения объектов ищет местоположение, которое максимизирует минимальное расстояние до объектов. В случае евклидовой метрики это известно как задача о наибольшей пустой сфере . Плоский случай ( задача о наибольшем пустом круге ) может быть решен за оптимальное время Θ( n log n). [12] [13]
Задачи размещения объектов часто решаются как целочисленные программы . В этом контексте задачи размещения объектов часто ставятся следующим образом: предположим, что есть объекты и клиенты. Мы хотим выбрать (1) какой из объектов открыть, и (2) какие (открытые) объекты использовать для поставок клиентам, чтобы удовлетворить некоторый фиксированный спрос с минимальными затратами. Мы вводим следующие обозначения: пусть обозначим (фиксированную) стоимость открытия объекта , для . Пусть обозначим стоимость доставки продукта с объекта клиенту для и . Пусть обозначим спрос клиента на . Далее предположим, что каждый объект имеет максимальный выпуск. Пусть обозначим максимальный объем продукта, который может быть произведен объектом , то есть пусть обозначим мощность объекта . Оставшаяся часть этого раздела следует [14]
В нашей первоначальной формулировке введем бинарную переменную для , где если объект открыт, и в противном случае. Далее введем переменную для и , которая представляет собой долю спроса, удовлетворенную объектом . Так называемая задача размещения объекта с емкостью затем задается как
Обратите внимание, что второй набор ограничений гарантирует, что если , то есть предприятие не открыто, то для всех , то есть ни один спрос ни для одного клиента не может быть удовлетворен предприятием .
Обычным случаем проблемы размещения мощностей выше является случай, когда для всех . В этом случае всегда оптимально удовлетворять весь спрос со стороны клиента из ближайшего открытого предприятия. Из-за этого мы можем заменить непрерывные переменные сверху на бинарные переменные , где если клиент снабжается предприятием , и в противном случае. Тогда проблема размещения немощных предприятий задается как
где — константа, выбранная достаточно большой. Выбор может повлиять на результаты вычислений — в данном случае наилучший выбор очевиден: взять . Тогда, если , любой выбор будет удовлетворять второму набору ограничений.
Другая возможность формулировки для проблемы размещения необеспеченных мощностей заключается в разукрупнении ограничений по мощности (больших ограничений). То есть, замене ограничений на ограничения На практике эта новая формулировка работает значительно лучше, в том смысле, что она имеет более жесткую релаксацию линейного программирования, чем первая формулировка. [14] Обратите внимание, что суммирование новых ограничений вместе дает исходные большие ограничения. В случае с обеспеченными мощностями эти формулировки не эквивалентны. Более подробную информацию о проблеме размещения необеспеченных мощностей можно найти в Главе 3 «Теории дискретного размещения». [15]
В здравоохранении неверные решения о местоположении учреждений оказывают серьезное влияние на сообщество, выходящее за рамки простых показателей стоимости и обслуживания; например, труднодоступные медицинские учреждения, скорее всего, будут связаны с повышенной заболеваемостью и смертностью. С этой точки зрения моделирование местоположения учреждений для здравоохранения имеет большее значение, чем аналогичное моделирование для других областей. [16]
Управление твердыми бытовыми отходами по-прежнему остается проблемой для развивающихся стран из-за увеличения производства отходов и высоких затрат, связанных с управлением отходами. Благодаря формулировке и точному решению проблемы размещения объекта можно оптимизировать размещение полигонов для утилизации отходов. [17]
Определенное подмножество задач кластерного анализа можно рассматривать как задачи размещения объектов. В задаче кластеризации на основе центроида цель состоит в том, чтобы разбить точки данных (элементы общего метрического пространства) на классы эквивалентности — часто называемые цветами — так, чтобы точки одного цвета были близки друг к другу (эквивалентно, так, чтобы точки разных цветов были далеки друг от друга). [18]
Чтобы увидеть, как можно рассматривать (читать «преобразовывать» или «редуцировать») задачу кластеризации на основе центроида как (метрическую) задачу размещения объектов, рассмотрим каждую точку данных в первой как точку спроса во второй. Предположим, что данные, которые должны быть кластеризованы, являются элементами метрического пространства (например, пусть будет -мерным евклидовым пространством для некоторого фиксированного ). В задаче размещения объектов, которую мы строим, мы разрешаем размещать объекты в любой точке внутри этого метрического пространства ; это определяет набор разрешенных местоположений объектов . Мы определяем затраты как попарные расстояния между парами местоположение-точка спроса (например, см. метрический k-центр ). В задаче кластеризации на основе центроида данные разбиваются на классы эквивалентности (т. е. цвета), каждый из которых имеет центроид. Давайте посмотрим, как решение нашей построенной задачи размещения объектов также достигает такого разбиения. Допустимое решение — это непустое подмножество местоположений . Эти местоположения в нашей задаче размещения объектов включают набор центроидов в нашей задаче кластеризации на основе центроида. Теперь назначьте каждую точку спроса местоположению , которое минимизирует ее стоимость обслуживания; то есть назначьте точку данных центроиду (разрывайте связи произвольно). Это обеспечивает разбиение при условии, что затраты задачи размещения объектов определены таким образом, что они являются изображениями функции расстояния задачи кластеризации на основе центроида.
Популярный учебник по алгоритмам Algorithm Design [19] дает связанное описание проблемы и алгоритм приближения. Авторы называют метрическую проблему размещения объектов (т. е. проблему кластеризации на основе центроида или проблему метрического центра) проблемой выбора центра , тем самым увеличивая список синонимов.
Кроме того, обратите внимание, что в нашем вышеприведенном определении задачи размещения объектов целевая функция является общей. Конкретные варианты приводят к различным вариантам задачи размещения объектов и, следовательно, к различным вариантам задачи кластеризации на основе центроида. Например, можно выбрать минимизацию суммы расстояний от каждого местоположения до каждой из назначенных ему точек спроса (à la проблема Вебера ), или можно выбрать минимизацию максимального из всех таких расстояний (à la проблема 1-центра ).
{{cite book}}
: CS1 maint: others (link)