stringtranslate.com

Логит-нормальное распределение

В теории вероятностей логит -нормальное распределение — это распределение вероятностей случайной величины , логит которой имеет нормальное распределение . Если Y — случайная величина с нормальным распределением, а t — стандартная логистическая функция , то X  =  t ( Y ) имеет логит-нормальное распределение; аналогично, если X распределено логит-нормально, то Y  =  logit ( X )= log ( X /(1- X )) распределено нормально. Оно также известно как логистическое нормальное распределение , [1] которое часто относится к версии полиномиального логита (например, [2] [3] [4] ).

Переменная может быть смоделирована как логит-нормальная, если она представляет собой пропорцию, ограниченную нулем и единицей, и где значения нуля и единицы никогда не встречаются.

Характеристика

Функция плотности вероятности

Функция плотности вероятности (PDF) логарифмически-нормального распределения для 0 < x < 1 имеет вид:

где μ и σсреднее значение и стандартное отклонение логита переменной (по определению логит переменной распределен нормально).

Плотность, полученная путем изменения знака μ, симметрична, поскольку она равна f(1-x;- μ , σ ), смещая моду в другую сторону от 0,5 (середина интервала (0,1)).

График логарифмически нормального распределения плотности вероятности для различных комбинаций μ (граней) и σ (цветов)

Моменты

Моменты логарифмически-нормального распределения не имеют аналитического решения. Моменты можно оценить с помощью численного интегрирования , однако численное интегрирование может быть недопустимым, когда значения таковы, что функция плотности расходится к бесконечности в конечных точках ноль и единица. Альтернативой является использование наблюдения, что логарифмически-нормальное распределение является преобразованием нормальной случайной величины. Это позволяет нам аппроксимировать -й момент с помощью следующей квазиоценки Монте-Карло

где — стандартная логистическая функция, а — обратная кумулятивная функция распределения нормального распределения со средним значением и дисперсией . Когда , это соответствует среднему значению.

Режим или режимы

Когда производная плотности равна 0, то местоположение моды x удовлетворяет следующему уравнению:

Для некоторых значений параметров существует два решения, т.е. распределение является бимодальным .

Многомерное обобщение

Логистическое нормальное распределение является обобщением логит-нормального распределения на D-мерные векторы вероятностей путем логистического преобразования многомерного нормального распределения. [1] [5] [6]

Функция плотности вероятности

Функция плотности вероятности имеет вид:

где обозначает вектор первых (D-1) компонентов и обозначает симплекс D-мерных векторов вероятностей. Это следует из применения аддитивного логистического преобразования для отображения многомерной нормальной случайной величины в симплекс:

Гауссовские функции плотности и соответствующие им логистические нормальные функции плотности после логистического преобразования.

Уникальное обратное отображение задается формулой:

.

Это случай вектора x, компоненты которого в сумме дают единицу. В случае x с сигмоидальными элементами, то есть когда

у нас есть

где логарифм и деление в аргументе берутся поэлементно. Это происходит потому, что матрица Якоби преобразования диагональна с элементами .

Использование в статистическом анализе

Логистическое нормальное распределение является более гибкой альтернативой распределению Дирихле , поскольку оно может улавливать корреляции между компонентами векторов вероятности. Оно также имеет потенциал для упрощения статистического анализа композиционных данных , позволяя отвечать на вопросы о логарифмических отношениях компонентов векторов данных. Часто интересуются отношениями, а не абсолютными значениями компонентов.

Симплекс вероятностей — это ограниченное пространство, что делает стандартные методы, которые обычно применяются к векторам в менее значимыми. Статистик Джон Эйчисон описал проблему ложных отрицательных корреляций при применении таких методов непосредственно к симплициальным векторам. [5] Однако отображение композиционных данных в посредством обратного аддитивного логистического преобразования дает действительные данные в . Стандартные методы могут быть применены к этому представлению данных. Этот подход оправдывает использование логистического нормального распределения, которое, таким образом, можно рассматривать как «гауссово распределение симплекса».

Связь с распределением Дирихле

Логистическая нормальная аппроксимация распределения Дирихле

Распределения Дирихле и логистическое нормальное распределение никогда не бывают в точности равными при любом выборе параметров. Однако Эйтчисон описал метод аппроксимации Дирихле логистическим нормальным распределением, при котором их расхождение Кульбака–Лейблера (KL) минимизируется:

Это минимизируется за счет:

Используя моментные свойства распределения Дирихле, решение можно записать в терминах дигамма- и тригамма -функций:

Это приближение особенно точно для больших . Фактически, можно показать, что для , мы имеем, что .

Смотрите также

Ссылки

  1. ^ ab Aitchison, J.; Shen, SM (1980). "Логистически-нормальные распределения: некоторые свойства и применение". Biometrika . 67 (2): 261. doi :10.2307/2335470. ISSN  0006-3444. JSTOR  2335470.
  2. ^ http://people.csail.mit.edu/tomasz/papers/huang_hln_tech_report_2006.pdf [ пустой URL-адрес PDF ]
  3. ^ Питер Хофф, 2003. Ссылка
  4. ^ «Логнормальная и логистическо-нормальная терминология — ИИ и социальные науки — Брендан О'Коннор». brenocon.com . Получено 18 апреля 2018 г. .
  5. ^ ab J. Atchison. "Статистический анализ композиционных данных". Монографии по статистике и прикладной теории вероятностей, Chapman and Hall, 1986. Книга
  6. ^ Хайнд, Джон (2011). «Логистическое нормальное распределение». В Lovric, Miodrag (ред.). Международная энциклопедия статистических наук . Springer. стр. 754–755. doi :10.1007/978-3-642-04898-2_342. ISBN 978-3-642-04897-5.

Дальнейшее чтение

Внешние ссылки