stringtranslate.com

Расстояние Хеллингера

В теории вероятности и статистике расстояние Хеллингера ( тесно связанное с расстоянием Бхаттачарьи, хотя и отличающееся от него ) используется для количественной оценки сходства между двумя распределениями вероятностей . Это разновидность f -дивергенции . Расстояние Хеллингера определяется с помощью интеграла Хеллингера , который был введен Эрнстом Хеллингером в 1909 году . [1] [2]

Иногда его называют расстоянием Джеффриса. [3] [4]

Определение

Теория меры

Чтобы определить расстояние Хеллингера в терминах теории меры , пусть и обозначают две вероятностные меры в пространстве с мерой , абсолютно непрерывные относительно вспомогательной меры . Такая мера всегда существует, например . Квадрат расстояния Хеллингера между и определяется как величина

Здесь и , т.е. и – производные Радона–Никодима от P и Q соответственно по . Это определение не зависит от , т.е. расстояние Хеллингера между P и Q не меняется, если его заменить другой вероятностной мерой, относительно которой и P , и Q абсолютно непрерывны. Для компактности приведенную выше формулу часто записывают как

Теория вероятностей с использованием меры Лебега

Чтобы определить расстояние Хеллингера с точки зрения элементарной теории вероятностей, мы возьмем λ в качестве меры Лебега , так что dP  /  и dQ  /  d λ являются просто функциями плотности вероятности . Если мы обозначим плотности как f и g соответственно, квадрат расстояния Хеллингера можно выразить как стандартный интеграл исчисления.

где вторую форму можно получить, разложив квадрат и воспользовавшись тем фактом, что интеграл от плотности вероятности по его области определения равен 1.

Расстояние Хеллингера H ( PQ ) удовлетворяет свойству (выводимому из неравенства Коши – Шварца )

Дискретные распределения

Для двух дискретных распределений вероятностей и их расстояние Хеллингера определяется как

что напрямую связано с евклидовой нормой разности векторов квадратных корней, т.е.

Также,

Характеристики

Расстояние Хеллингера образует ограниченную метрику в пространстве вероятностных распределений в данном вероятностном пространстве .

Максимальное расстояние 1 достигается, когда P присваивает нулевую вероятность каждому множеству, которому Q присваивает положительную вероятность, и наоборот.

Иногда множитель перед интегралом опускается, и в этом случае расстояние Хеллингера находится в диапазоне от нуля до квадратного корня из двух.

Расстояние Хеллингера связано с коэффициентом Бхаттачарьи , поскольку его можно определить как

Расстояния Хеллингера используются в теории последовательной и асимптотической статистики . [5] [6]

Квадрат расстояния Хеллингера между двумя нормальными распределениями составляет :

Квадрат расстояния Хеллингера между двумя многомерными нормальными распределениями и равен [7]

Квадрат расстояния Хеллингера между двумя экспоненциальными распределениями составляет :

Квадрат расстояния Хеллингера между двумя распределениями Вейбулла и (где – общий параметр формы, а – параметры масштаба соответственно):

Квадрат расстояния Хеллингера между двумя распределениями Пуассона с параметрами скорости и , так что и , равен:

Квадрат расстояния Хеллингера между двумя бета-распределениями составляет :

где бета- функция .

Квадрат расстояния Хеллингера между двумя гамма-распределениями составляет :

где гамма - функция .

Соединение с общим расстоянием изменения

Расстояние Хеллингера и полное вариационное расстояние (или статистическое расстояние) связаны следующим образом: [8]

Константы в этом неравенстве могут меняться в зависимости от того, какую перенормировку вы выберете ( или ).

Эти неравенства непосредственно следуют из неравенств между 1-нормой и 2-нормой .

Смотрите также

Примечания

  1. ^ Никулин, М.С. (2001) [1994], «Расстояние Хеллингера», Математическая энциклопедия , EMS Press
  2. ^ Хеллингер, Эрнст (1909), "Neue Begründung der Theorie Quadatischer Formen von unendlichvielen Veränderlichen", Journal für die reine und angewandte Mathematik (на немецком языке), 1909 (136): 210–271, doi : 10.1515/crll.1909.136.210 , JFM  40.0393.01, S2CID  121150138
  3. ^ "Расстояние Джеффриса - Математическая энциклопедия" . энциклопедияofmath.org . Проверено 24 мая 2022 г.
  4. ^ Джеффрис, Гарольд (24 сентября 1946). «Инвариантная форма априорной вероятности в задачах оценки». Труды Лондонского королевского общества. Серия А. Математические и физические науки . 186 (1007): 453–461. Бибкод : 1946RSPSA.186..453J. дои : 10.1098/rspa.1946.0056 . ISSN  0080-4630. PMID  20998741. S2CID  19490929.
  5. ^ Торгерсон, Эрик (1991). «Сравнение статистических экспериментов». Энциклопедия математики . Том. 36. Издательство Кембриджского университета.
  6. ^ Лизе, Фридрих; Мишке, Клаус-Й. (2008). Статистическая теория принятия решений: оценка, тестирование и отбор . Спрингер. ISBN 978-0-387-73193-3.
  7. ^ Пардо, Л. (2006). Статистический вывод на основе мер расхождения . Нью-Йорк: Чепмен и Холл/CRC. п. 51. ИСБН 1-58488-600-5.
  8. Харша, Прахлад (23 сентября 2011 г.). «Конспекты лекций по сложности коммуникации» (PDF) .

Рекомендации