stringtranslate.com

Теорема о разделении гиперплоскостей

В геометрии теорема о разделении гиперплоскостей — это теорема о непересекающихся выпуклых множествах в n- мерном евклидовом пространстве . Существует несколько довольно похожих версий. В одной версии теоремы, если оба эти множества замкнуты и хотя бы одно из них компактно , то между ними есть гиперплоскость и даже две параллельные гиперплоскости между ними, разделенные зазором. В другой версии, если оба непересекающихся выпуклых множества открыты, то между ними есть гиперплоскость, но не обязательно какой-либо зазор. Ось, ортогональная разделяющей гиперплоскости, является разделяющей осью , потому что ортогональные проекции выпуклых тел на ось не пересекаются.

Теорема об отделении гиперплоскостей принадлежит Герману Минковскому . Теорема об отделении Хана–Банаха обобщает результат на топологические векторные пространства .

Связанным результатом является теорема о поддерживающей гиперплоскости .

В контексте опорных векторных машин оптимально разделяющая гиперплоскость или гиперплоскость с максимальным запасом — это гиперплоскость , которая разделяет две выпуклые оболочки точек и находится на одинаковом расстоянии от них. [1] [2] [3]

Заявления и доказательства

Теорема о разделении гиперплоскостей [4]  —  Пусть и — два непересекающихся непустых выпуклых подмножества . Тогда существуют ненулевой вектор и действительное число такие, что

для всех в и в ; т.е. гиперплоскость , нормальный вектор, разделяет и .

Если оба множества замкнуты и хотя бы одно из них компактно, то разделение может быть строгим, то есть для некоторого

Во всех случаях предположим, что являются непересекающимися, непустыми и выпуклыми подмножествами . Краткое изложение результатов следующее:

Число измерений должно быть конечным. В бесконечномерных пространствах существуют примеры двух замкнутых, выпуклых, непересекающихся множеств, которые не могут быть разделены замкнутой гиперплоскостью (гиперплоскостью, где непрерывный линейный функционал равен некоторой константе) даже в слабом смысле, где неравенства не являются строгими. [5]

Здесь компактность в гипотезе не может быть ослаблена; см. пример в разделе Контрпримеры и уникальность. Эта версия теоремы о разделении обобщается на бесконечномерную размерность; обобщение более известно как теорема о разделении Хана–Банаха .

Доказательство основано на следующей лемме:

Лемма  —  Пусть и — два непересекающихся замкнутых подмножества , и предположим, что — компактно. Тогда существуют точки и , минимизирующие расстояние над и .

Доказательство леммы

Пусть и — произвольные пары точек, и пусть . Так как компактно, то оно содержится в некотором шаре с центром в ; пусть радиус этого шара равен . Пусть — пересечение с замкнутым шаром радиуса вокруг . Тогда компактно и непусто, так как содержит . Так как функция расстояния непрерывна, существуют точки и , расстояние которых является минимальным по всем парам точек в . Осталось показать, что и на самом деле имеют минимальное расстояние по всем парам точек в . Предположим от противного, что существуют точки и такие, что . Тогда, в частности, , и по неравенству треугольника . Следовательно, содержится в , что противоречит тому факту, что и имели минимальное расстояние по .


Доказательство иллюстрации.
Доказательство теоремы

Сначала докажем второй случай. (См. схему.)

WLOG, компактен. По лемме существуют точки и на минимальном расстоянии друг от друга. Так как и не пересекаются, то имеем . Теперь построим две гиперплоскости, перпендикулярные отрезку прямой , с перекрёстком и перекрёстком . Мы утверждаем, что ни одна из них не входит в пространство между , и, таким образом, перпендикулярные гиперплоскости удовлетворяют требованию теоремы.

Алгебраически гиперплоскости определяются вектором и двумя константами , такими что . Наше утверждение состоит в том, что и .

Предположим, что существует некоторая такая, что , тогда пусть будет основанием перпендикуляра из к отрезку прямой . Так как является выпуклой, находится внутри , и по плоской геометрии ближе к , противоречие. Аналогичное рассуждение применимо к .

Теперь о первом случае.

Подойти к обоим изнутри с помощью и , так чтобы каждый был замкнутым и компактным, а объединения были относительными внутренностями . ( Подробности см. на странице относительной внутренней части .)

Теперь, согласно второму случаю, для каждой пары существует некоторый единичный вектор и действительное число , такие, что .

Поскольку единичная сфера компактна, мы можем взять сходящуюся подпоследовательность, так что . Пусть . Мы утверждаем, что , тем самым разделяя .

Предположим, что нет, тогда существует такое , что , тогда, поскольку , для достаточно большого , имеем , противоречие.


Поскольку разделяющая гиперплоскость не может пересекать внутренности открытых выпуклых множеств, то имеем следствие:

Теорема разделения I  —  Пусть и — два непересекающихся непустых выпуклых множества. Если открыто, то существуют ненулевой вектор и действительное число, такие, что

для всех в и в . Если оба множества открыты, то существуют ненулевой вектор и действительное число такие, что

для всех в и в .

Случай с возможными пересечениями

Если множества имеют возможные пересечения, но их относительные внутренности не пересекаются, то доказательство первого случая по-прежнему применимо без изменений, что дает:

Теорема разделения II  —  Пусть и — два непустых выпуклых подмножества с непересекающимися относительными внутренностями. Тогда существуют ненулевой вектор и действительное число, такие, что

в частности, у нас есть теорема о поддерживающей гиперплоскости .

Теорема об опорной гиперплоскости  —  если — выпуклое множество в и — точка на границе , то существует опорная гиперплоскость , содержащая .

Доказательство

Если аффинная оболочка не является всем , то расширяем аффинную оболочку до опорной гиперплоскости. В противном случае не пересекается с , поэтому применяем приведенную выше теорему.

Обратная теорема

Обратите внимание, что существование гиперплоскости, которая только "разделяет" два выпуклых множества в слабом смысле, поскольку оба неравенства не являются строгими, очевидно, не означает, что два множества не пересекаются. Оба множества могут иметь точки, расположенные на гиперплоскости.

Контрпримеры и уникальность

Теорема неприменима, если одно из тел невыпуклое.

Если один из A или B не является выпуклым, то существует множество возможных контрпримеров. Например, A и B могут быть концентрическими окружностями. Более тонкий контрпример — это тот, в котором A и B оба замкнуты, но ни один из них не компактен. Например, если A — замкнутая полуплоскость, а B ограничен одним плечом гиперболы, то строго разделяющей гиперплоскости не существует:

(Хотя, согласно второй теореме, существует гиперплоскость, разделяющая их внутренности.) Другой тип контрпримера имеет компактный A и открытый B. Например, A может быть замкнутым квадратом, а B может быть открытым квадратом, который касается A.

В первой версии теоремы, очевидно, разделяющая гиперплоскость никогда не является единственной. Во второй версии она может быть единственной, а может и не быть. Технически разделяющая ось никогда не является единственной, поскольку ее можно перенести; во второй версии теоремы разделяющая ось может быть единственной с точностью до переноса.

Угол рога дает хороший контрпример для многих разделений гиперплоскости. Например, в единичный круг не пересекается с открытым интервалом , но единственная линия, разделяющая их, содержит всю . Это показывает, что если замкнуто и относительно открыто , то не обязательно существует разделение, которое является строгим для . Однако, если замкнуто, то такое разделение существует. [6]

Больше вариантов

Лемму Фаркаша и связанные с ней результаты можно понимать как теоремы об отделении гиперплоскостей, когда выпуклые тела определяются конечным числом линейных неравенств.

Можно найти больше результатов. [6]

Использование при обнаружении столкновений

При обнаружении столкновений теорема о разделении гиперплоскостей обычно используется в следующей форме:

Теорема о разделяющей оси  —  Два замкнутых выпуклых объекта не пересекаются, если существует линия («разделяющая ось»), на которую проекции двух объектов не пересекаются.

Независимо от размерности, разделяющая ось всегда является линией. Например, в 3D пространство разделено плоскостями, но разделяющая ось перпендикулярна разделяющей плоскости.

Теорема о разделяющей оси может быть применена для быстрого обнаружения столкновений между полигональными сетками. Нормаль каждой грани или другое направление элемента используется как разделяющая ось. Обратите внимание, что это дает возможные разделяющие оси, а не разделяющие линии/плоскости.

В 3D использование только нормалей граней не позволит разделить некоторые случаи не сталкивающихся ребер. Требуются дополнительные оси, состоящие из перекрестных произведений пар ребер, по одному от каждого объекта. [7]

Для повышения эффективности параллельные оси можно рассчитывать как одну ось.

Смотрите также

Примечания

  1. ^ Хасти, Тревор ; Тибширани, Роберт ; Фридман, Джером (2008). Элементы статистического обучения: добыча данных, вывод и прогнозирование (PDF) (Второе изд.). Нью-Йорк: Springer. С. 129–135.
  2. ^ Witten, Ian H.; Frank, Eibe; Hall, Mark A.; Pal, Christopher J. (2016). Data Mining: Practical Machine Learning Tools and Techniques (Четвертое изд.). Morgan Kaufmann. С. 253–254. ISBN 9780128043578.
  3. ^ Дейзенрот, Марк Питер; Фейсал, А. Альдо; Онг, Ченг Сун (2020). Математика для машинного обучения . Cambridge University Press. стр. 337–338. ISBN 978-1-108-45514-5.
  4. ^ Бойд и Ванденбергхе, 2004, Упражнение 2.22.
  5. ^ Хаим Брезис , Анализ функций: теория и приложения , 1983, примечание 4, стр. 7.
  6. ^ ab Stoer, Josef; Witzgall, Christoph (1970). Выпуклость и оптимизация в конечных измерениях I. Springer Berlin, Heidelberg. (2.12.9). doi :10.1007/978-3-642-46216-0. ISBN 978-3-642-46216-0.
  7. ^ «Расширенная векторная математика».

Ссылки

Внешние ссылки