Геометрия такси или геометрия Манхэттена — это геометрия , в которой игнорируется привычное евклидово расстояние , а расстояние между двумя точками определяется как сумма абсолютных разностей их соответствующих декартовых координат , функция расстояния (или метрика ), называемая расстоянием такси , расстоянием Манхэттена или расстоянием городского квартала . Название относится к острову Манхэттен или, в общем, к любому спланированному городу с прямоугольной сеткой улиц, в котором такси может двигаться только по направлениям сетки. В геометрии такси расстояние между любыми двумя точками равно длине их кратчайшего пути сетки. Это другое определение расстояния также приводит к другому определению длины кривой, для которой отрезок прямой между любыми двумя точками имеет ту же длину, что и путь сетки между этими точками, а не его евклидова длина.
Расстояние такси также иногда называют прямолинейным расстоянием или расстоянием L 1 (см. пространство L p ). [1] Эта геометрия использовалась в регрессионном анализе с 18 века и часто упоминается как ЛАССО . Ее геометрическая интерпретация восходит к неевклидовой геометрии 19 века и принадлежит Герману Минковскому .
В двумерном реальном координатном пространстве расстояние такси между двумя точками и равно . То есть, это сумма абсолютных значений разностей обеих координат.
Расстояние такси, , между двумя точками в n -мерном вещественном координатном пространстве с фиксированной декартовой системой координат , является суммой длин проекций отрезка прямой между точками на оси координат . Более формально, например, в , расстояние такси между и равно
Метрика L 1 использовалась в регрессионном анализе в качестве меры качества соответствия в 1757 году Роджером Джозефом Босковичем . [2] Интерпретация ее как расстояния между точками в геометрическом пространстве относится к концу 19 века и развитию неевклидовых геометрий . В частности, она появилась в 1910 году в работах Фридьеша Рисса и Германа Минковского . Формализация пространств L p , которые включают геометрию такси как частный случай, приписывается Риссу. [3] Разрабатывая геометрию чисел , Герман Минковский установил свое неравенство Минковского , заявив, что эти пространства определяют нормированные векторные пространства . [4]
Название «геометрия такси» было введено Карлом Менгером в брошюре 1952 года « Вам понравится геометрия» , сопровождавшей геометрическую выставку, предназначенную для широкой публики в Музее науки и промышленности в Чикаго. [5]
Рассматриваемое как дополнительная структура, наложенная на евклидово пространство , расстояние такси зависит от ориентации системы координат и изменяется при евклидовом вращении пространства, но не зависит от переноса или отражений, совмещенных с осями . Геометрия такси удовлетворяет всем аксиомам Гильберта (формализация евклидовой геометрии ), за исключением того, что конгруэнтность углов не может быть определена так, чтобы точно соответствовать евклидовой концепции, и при правдоподобных определениях конгруэнтных углов такси аксиома сторона-угол-сторона не выполняется, поскольку в общем случае треугольники с двумя конгруэнтными сторонами такси и конгруэнтным углом между ними не являются конгруэнтными треугольниками .
В любом метрическом пространстве сфера представляет собой набор точек на фиксированном расстоянии, радиусе , от определенной центральной точки. В то время как евклидова сфера круглая и вращательно-симметричная, при расстоянии такси форма сферы представляет собой кросс-политоп , n -мерное обобщение правильного октаэдра , точки которого удовлетворяют уравнению:
где - центр, а r - радиус. Точки на единичной сфере , сфере радиуса 1 с центром в начале координат , удовлетворяют уравнению
В двумерной геометрии такси сфера (называемая окружностью ) представляет собой квадрат, ориентированный по диагонали к осям координат. Изображение справа показывает красным множество всех точек на квадратной сетке с фиксированным расстоянием от синего центра. По мере того, как сетка становится тоньше, красных точек становится больше, и в пределе они стремятся к непрерывному наклонному квадрату. Каждая сторона имеет длину такси 2 r , поэтому окружность равна 8 r . Таким образом, в геометрии такси значение аналога постоянной окружности π , отношения окружности к диаметру , равно 4.
Закрытый шар (или замкнутый диск в двумерном случае) — это заполненная сфера, множество точек на расстоянии, меньшем или равном радиусу от определенного центра. Для клеточных автоматов на квадратной сетке диск такси — это фон-неймановская окрестность радиуса r его центра.
Круг радиуса r для расстояния Чебышева ( метрика L ∞ ) на плоскости также является квадратом со стороной длиной 2 r , параллельной осям координат, поэтому плоское расстояние Чебышева можно рассматривать как эквивалентное путем вращения и масштабирования плоскому расстоянию такси. Однако эта эквивалентность между метриками L 1 и L ∞ не распространяется на более высокие измерения.
Всякий раз, когда каждая пара в наборе этих окружностей имеет непустое пересечение, существует точка пересечения для всего набора; следовательно, манхэттенское расстояние образует инъективное метрическое пространство .
Пусть будет непрерывно дифференцируемой функцией. Пусть будет длиной дуги такси графика на некотором интервале . Возьмем разбиение интервала на равные бесконечно малые подынтервалы, и пусть будет длиной такси поддуги . Тогда [6]
По теореме о среднем значении существует некоторая точка между и такая, что . [7] Тогда предыдущее уравнение можно записать
Тогда задается как сумма каждого разбиения по , поскольку они становятся произвольно малыми .
Чтобы проверить это, возьмем круг такси с радиусом, центрированным в начале координат. Его кривая в первом квадранте задается длиной
Умножение этого значения на для учета оставшихся квадрантов дает , что согласуется с окружностью круга такси. [8] Теперь возьмем евклидову окружность радиуса с центром в начале координат, которая задается как . Длина ее дуги в первом квадранте задается как
Учет оставшихся квадрантов дает снова. Следовательно, окружность круга такси и евклидова окружность в метрике такси равны. [9] Фактически, для любой функции , которая является монотонной и дифференцируемой с непрерывной производной на интервале , длина дуги над равна . [10]
Два треугольника конгруэнтны тогда и только тогда, когда три соответствующие стороны равны по расстоянию и три соответствующих угла равны по мере. Существует несколько теорем, которые гарантируют конгруэнтность треугольников в евклидовой геометрии, а именно: Угол-Угол-Сторона (AAS), Угол-Сторона-Угол (ASA), Сторона-Угол-Сторона (SAS) и Сторона-Сторона-Сторона (SSS). Однако в геометрии такси только SASAS гарантирует конгруэнтность треугольников. [11]
Возьмем, к примеру, два равнобедренных прямоугольных треугольника такси, углы которых составляют 45-90-45. Два катета обоих треугольников имеют длину такси 2, но гипотенузы не равны. Этот контрпример исключает AAS, ASA и SAS. Он также исключает AASS, AAAS и даже ASASA. Наличие трех равных углов и двух сторон не гарантирует равенства треугольников в геометрии такси. Следовательно, единственная теорема о равенстве треугольников в геометрии такси — это SASAS, где все три соответствующие стороны должны быть равны, и по крайней мере два соответствующих угла должны быть равны. [12] Этот результат в основном обусловлен тем фактом, что длина отрезка прямой зависит от его ориентации в геометрии такси.
При решении недоопределенной системы линейных уравнений член регуляризации для вектора параметров выражается через норму (геометрию такси) вектора. [13] Этот подход появляется в структуре восстановления сигнала, называемой сжатым зондированием .
Геометрия такси может использоваться для оценки различий в дискретных распределениях частот. Например, в сплайсинге РНК позиционные распределения гексамеров , которые отображают вероятность появления каждого гексамера в каждом заданном нуклеотиде вблизи сайта сплайсинга, можно сравнить с расстоянием L1. Каждое распределение позиций может быть представлено в виде вектора, где каждая запись представляет вероятность того, что гексамер начнется с определенного нуклеотида. Большое расстояние L1 между двумя векторами указывает на существенное различие в природе распределений, тогда как малое расстояние обозначает распределения схожей формы. Это эквивалентно измерению площади между двумя кривыми распределения, поскольку площадь каждого сегмента является абсолютной разницей между правдоподобиями двух кривых в этой точке. При суммировании для всех сегментов это дает ту же меру, что и расстояние L1. [14]