В статистике и вычислительной геометрии понятие центральной точки является обобщением медианы на данные в многомерном евклидовом пространстве . Для заданного набора точек в d -мерном пространстве центральной точкой набора является точка, такая что любая гиперплоскость, проходящая через эту точку, делит набор точек на два примерно равных подмножества: меньшая часть должна иметь по крайней мере 1/( d + 1) долю точек. Как и медиана, центральная точка не обязательно должна быть одной из точек данных. Каждый непустой набор точек (без дубликатов) имеет по крайней мере одну центральную точку.
Тесно связанными понятиями являются глубина Тьюки точки (минимальное число точек выборки по одну сторону гиперплоскости, проходящей через точку) и медиана Тьюки множества точек (точка, максимизирующая глубину Тьюки). Центральная точка — это точка глубины не менее n / ( d + 1), а медиана Тьюки должна быть центральной точкой, но не каждая центральная точка является медианой Тьюки. Оба термина названы в честь Джона Тьюки .
Для другого обобщения медианы на более высокие измерения см. геометрическую медиану .
Простое доказательство существования центральной точки можно получить с помощью теоремы Хелли . Предположим, что имеется n точек, и рассмотрим семейство замкнутых полупространств , содержащих более dn /( d + 1) точек. Менее n /( d + 1) точек исключены из любого из этих полупространств, поэтому пересечение любого подмножества d + 1 этих полупространств должно быть непустым. Из теоремы Хелли следует, что пересечение всех этих полупространств также должно быть непустым. Любая точка в этом пересечении обязательно является центральной точкой.
Для точек на евклидовой плоскости центральная точка может быть построена за линейное время . [1] В любой размерности d медиана Тьюки (и, следовательно, центральная точка) может быть построена за время O( n d − 1 + n log n ). [2]
Рандомизированный алгоритм , который многократно заменяет наборы точек d + 2 их точкой Радона , может быть использован для вычисления приближения к центральной точке любого набора точек в том смысле, что его глубина Тьюки линейна по размеру выборочного набора, за время, полиномиальное по размеру. [3] [4]