В теории вероятностей логит -нормальное распределение — это распределение вероятностей случайной величины , логит которой имеет нормальное распределение . Если Y — случайная величина с нормальным распределением, а t — стандартная логистическая функция , то X = t ( Y ) имеет логит-нормальное распределение; аналогично, если X распределено логит-нормально, то Y = logit ( X )= log ( X /(1- X )) распределено нормально. Оно также известно как логистическое нормальное распределение , [1] которое часто относится к версии полиномиального логита (например, [2] [3] [4] ).
Переменная может быть смоделирована как логит-нормальная, если она представляет собой пропорцию, ограниченную нулем и единицей, и где значения нуля и единицы никогда не встречаются.
Характеристика
Функция плотности вероятности
Функция плотности вероятности (PDF) логарифмически-нормального распределения для 0 < x < 1 имеет вид:
Плотность, полученная путем изменения знака μ, симметрична, поскольку она равна f(1-x;- μ , σ ), смещая моду в другую сторону от 0,5 (середина интервала (0,1)).
Моменты
Моменты логарифмически-нормального распределения не имеют аналитического решения. Моменты можно оценить с помощью численного интегрирования , однако численное интегрирование может быть недопустимым, когда значения таковы, что функция плотности расходится к бесконечности в конечных точках ноль и единица. Альтернативой является использование наблюдения, что логарифмически-нормальное распределение является преобразованием нормальной случайной величины. Это позволяет нам аппроксимировать -й момент с помощью следующей квазиоценки Монте-Карло
где — стандартная логистическая функция, а — обратная кумулятивная функция распределения нормального распределения со средним значением и дисперсией . Когда , это соответствует среднему значению.
Режим или режимы
Когда производная плотности равна 0, то местоположение моды x удовлетворяет следующему уравнению:
Для некоторых значений параметров существует два решения, т.е. распределение является бимодальным .
Многомерное обобщение
Логистическое нормальное распределение является обобщением логит-нормального распределения на D-мерные векторы вероятностей путем логистического преобразования многомерного нормального распределения. [1] [5] [6]
где обозначает вектор первых (D-1) компонентов и обозначает симплекс D-мерных векторов вероятностей. Это следует из применения аддитивного логистического преобразования для отображения многомерной нормальной случайной величины в симплекс:
Это случай вектора x, компоненты которого в сумме дают единицу. В случае x с сигмоидальными элементами, то есть когда
у нас есть
где логарифм и деление в аргументе берутся поэлементно. Это происходит потому, что матрица Якоби преобразования диагональна с элементами .
Использование в статистическом анализе
Логистическое нормальное распределение является более гибкой альтернативой распределению Дирихле , поскольку оно может улавливать корреляции между компонентами векторов вероятности. Оно также имеет потенциал для упрощения статистического анализа композиционных данных , позволяя отвечать на вопросы о логарифмических отношениях компонентов векторов данных. Часто интересуются отношениями, а не абсолютными значениями компонентов.
Симплекс вероятностей — это ограниченное пространство, что делает стандартные методы, которые обычно применяются к векторам в менее значимыми. Статистик Джон Эйчисон описал проблему ложных отрицательных корреляций при применении таких методов непосредственно к симплициальным векторам. [5] Однако отображение композиционных данных в посредством обратного аддитивного логистического преобразования дает действительные данные в . Стандартные методы могут быть применены к этому представлению данных. Этот подход оправдывает использование логистического нормального распределения, которое, таким образом, можно рассматривать как «гауссово распределение симплекса».
Связь с распределением Дирихле
Распределения Дирихле и логистическое нормальное распределение никогда не бывают в точности равными при любом выборе параметров. Однако Эйтчисон описал метод аппроксимации Дирихле логистическим нормальным распределением, при котором их расхождение Кульбака–Лейблера (KL) минимизируется:
Это минимизируется за счет:
Используя моментные свойства распределения Дирихле, решение можно записать в терминах дигамма- и тригамма -функций:
Это приближение особенно точно для больших . Фактически, можно показать, что для , мы имеем, что .
^ ab Aitchison, J.; Shen, SM (1980). "Логистически-нормальные распределения: некоторые свойства и применение". Biometrika . 67 (2): 261. doi :10.2307/2335470. ISSN 0006-3444. JSTOR 2335470.
^ http://people.csail.mit.edu/tomasz/papers/huang_hln_tech_report_2006.pdf [ пустой URL-адрес PDF ]
^ Питер Хофф, 2003. Ссылка
^ «Логнормальная и логистическо-нормальная терминология — ИИ и социальные науки — Брендан О'Коннор». brenocon.com . Получено 18 апреля 2018 г. .
^ ab J. Atchison. "Статистический анализ композиционных данных". Монографии по статистике и прикладной теории вероятностей, Chapman and Hall, 1986. Книга
^ Хайнд, Джон (2011). «Логистическое нормальное распределение». В Lovric, Miodrag (ред.). Международная энциклопедия статистических наук . Springer. стр. 754–755. doi :10.1007/978-3-642-04898-2_342. ISBN978-3-642-04897-5.
Дальнейшее чтение
Фредерик, П. и Лад, Ф. (2008) Два момента логнормального распределения. Сообщения по статистике-Моделирование и вычисления . 37: 1263-1269
Мид, Р. (1965). «Обобщенное логит-нормальное распределение». Биометрия . 21 (3): 721–732. doi :10.2307/2528553. JSTOR 2528553. PMID 5858101.