stringtranslate.com

Экспоненциальное семейство

В теории вероятности и статистике экспоненциальное семейство — это параметрический набор вероятностных распределений определенной формы, указанной ниже. Эта специальная форма выбрана для математического удобства, включая возможность пользователю вычислять ожидания и ковариации с использованием дифференцирования на основе некоторых полезных алгебраических свойств, а также для общности, поскольку экспоненциальные семейства в некотором смысле являются очень естественными наборами распределений для рассмотрения. Термин «экспоненциальный класс» иногда используется вместо «экспоненциального семейства» [1] или более старого термина « семейство Купмана-Дармуа» . Этот класс распределений, который иногда называют «экспоненциальным семейством», отличается тем, что все они обладают множеством желательных свойств, и, что наиболее важно, наличием достаточной статистики .

Идея экспоненциальных семейств принадлежит [2] Э. Дж. Питману , [3] Дж. Дармуа , [4] и Б. О. Купману [5] в 1935–1936 годах. Экспоненциальные семейства распределений обеспечивают общую основу для выбора возможной альтернативной параметризации параметрического семейства распределений с точки зрения натуральных параметров и для определения полезной выборочной статистики , называемой естественной достаточной статистикой семейства.

Номенклатурная сложность

Термины «распределение» и «семейство» часто используются широко: в частности, экспоненциальное семейство представляет собой набор распределений, где конкретное распределение варьируется в зависимости от параметра; [a] однако параметрическое семейство распределений часто называют « распределением » (например, «нормальное распределение», что означает «семейство нормальных распределений»), а набор всех экспоненциальных семейств иногда условно называют «экспоненциальное семейство».

Определение

Большинство часто используемых распределений образуют экспоненциальное семейство или подмножество экспоненциального семейства, перечисленное в подразделе ниже. Следующие за ним подразделы представляют собой последовательность все более общих математических определений экспоненциального семейства. Случайный читатель, возможно, пожелает ограничить внимание первым и самым простым определением, которое соответствует однопараметрическому семейству дискретных или непрерывных распределений вероятностей.

Примеры экспоненциальных семейных распределений

Экспоненциальные семейства включают многие из наиболее распространенных распределений. Среди многих других экспоненциальные семейства включают в себя следующие: [6]

Ряд распространенных распределений представляют собой показательные семейства, но только тогда, когда определенные параметры фиксированы и известны. Например:

Обратите внимание, что в каждом случае параметры, которые должны быть зафиксированы, — это те, которые устанавливают предел диапазона значений, которые могут наблюдаться.

Примерами общих распределений, которые не являются экспоненциальными семействами, являются t Стьюдента , большинство смешанных распределений и даже семейство равномерных распределений, когда границы не фиксированы. Дополнительные сведения см. в разделе примеров ниже.

Скалярный параметр

Значение называется параметром семейства.

Однопараметрическое экспоненциальное семейство — это набор вероятностных распределений, функция плотности вероятности которых (или функция массы вероятности в случае дискретного распределения ) может быть выражена в виде

где и – известные функции. Функция должна быть неотрицательной.

Альтернативная, эквивалентная форма, часто используемая:

или эквивалентно

Обратите внимание, что и

Поддержка должна быть независимой от θ

Важно отметить, что поддержка ( все возможные значения, для которых больше ) должна не зависеть от [7]. Это требование можно использовать для исключения параметрического распределения семейства из экспоненциального семейства.

Например: Распределение Парето имеет PDF-файл, который определен для (минимальное значение является параметром масштаба), и поэтому его поддержка имеет нижний предел. Поскольку поддержка зависит от значения параметра, семейство Распределения Парето не образуют экспоненциальное семейство распределений (по крайней мере, когда это неизвестно).

Другой пример: распределения типа Бернуллибиномиальное , отрицательное биномиальное , геометрическое распределение и тому подобное – могут быть включены в экспоненциальный класс только в том случае , если количество испытаний Бернулли рассматривается как фиксированная константа – исключенная из свободных параметров – поскольку разрешенное количество попыток устанавливает пределы количества «успехов» или «неуспехов», которые можно наблюдать в серии испытаний.

Векторные значения x и θ

Часто представляет собой вектор измерений, и в этом случае может быть функцией от пространства возможных значений действительных чисел.

В более общем смысле, каждый из них может иметь векторное значение и иметь действительное значение. Однако см. обсуждение векторных параметров ниже, касающееся семейства кривых экспонент.

Каноническая формулировка

Если тогда, то говорят, что экспоненциальное семейство имеет каноническую форму . Определив преобразованный параметр, всегда можно преобразовать экспоненциальное семейство в каноническую форму. Каноническая форма не уникальна, поскольку ее можно умножить на любую ненулевую константу при условии, что она умножается на обратную величину этой константы, или к ней можно добавить константу c и умножить на нее, чтобы компенсировать ее. В частном случае это семейство называется натуральным показательным семейством .

Даже если это скаляр и имеется только один параметр, функции и могут быть векторами, как описано ниже.

Функция или ее эквивалент определяется автоматически после выбора других функций, поскольку она должна принять форму, которая приводит к нормализации распределения (суммированию или интегрированию до единицы по всей области). Более того, обе эти функции всегда могут быть записаны как функции, даже если это не взаимно-однозначная функция, т. е. два или более различных значений отображают одно и то же значение и, следовательно, не могут быть инвертированы. В таком случае все значения сопоставления с одним и тем же будут иметь одинаковое значение для и

Факторизация задействованных переменных

Что важно отметить и что характеризует все варианты экспоненциального семейства, так это то, что параметр(ы) и переменная(и) наблюдения должны быть факторизованы (могут быть разделены на продукты, каждое из которых включает только один тип переменной), либо напрямую, либо внутри любой части (базы или показателя степени) операции возведения в степень . Как правило, это означает, что все факторы, составляющие функцию плотности или массы, должны иметь одну из следующих форм:

где и – произвольные функции наблюдаемой статистической переменной; и – произвольные функции фиксированных параметров, определяющих форму распределения; и является любым произвольным постоянным выражением (т. е. числом или выражением, которое не изменяется с помощью или ).

Существуют дополнительные ограничения на количество таких факторов. Например, два выражения:

одинаковы, т.е. являются произведением двух «разрешенных» факторов. Однако при переписывании в факторизованную форму

видно, что его невозможно выразить в требуемой форме. (Однако форма такого типа является членом семейства изогнутых экспонент , что позволяет использовать несколько факторизованных членов в показателе степени. [ нужна ссылка ] )

Чтобы понять, почему выражение формы

квалифицируется,

и, следовательно, факторизуется внутри экспоненты. Сходным образом,

и снова факторизуется внутри экспоненты.

Фактор, состоящий из суммы, в которой задействованы оба типа переменных (например, фактор вида ), не может быть факторизован таким образом (за исключением некоторых случаев, когда он встречается непосредственно в показателе степени); именно поэтому, например, распределение Коши и t -распределение Стьюдента не являются экспоненциальными семействами.

Векторный параметр

Определение в терминах одного параметра действительного числа может быть расширено до одного параметра действительного вектора.

Говорят, что семейство распределений принадлежит векторному экспоненциальному семейству, если функцию плотности вероятности (или функцию массы вероятности для дискретных распределений) можно записать как

или в более компактной форме,

Эта форма записывает сумму как скалярное произведение векторных функций и .

Альтернативная, эквивалентная форма, часто встречающаяся:

Как и в скалярном случае, экспоненциальное семейство называется каноническим, если

Семейство векторных экспонент называется искривленным , если размерность

меньше размерности вектора

То есть, если размерность d вектора параметров меньше количества функций s вектора параметров в приведенном выше представлении функции плотности вероятности. Наиболее распространенные распределения в экспоненциальном семействе не являются искривленными, и многие алгоритмы, предназначенные для работы с любым экспоненциальным семейством, неявно или явно предполагают, что распределение не является искривленным.

Как и в случае со скалярным параметром, функция или ее эквивалент автоматически определяется ограничением нормализации после выбора других функций. Даже если оно не является взаимно однозначным, функции и можно определить, потребовав, чтобы распределение было нормализовано для каждого значения натурального параметра . Это дает каноническую форму

или эквивалентно

Вышеупомянутые формы иногда можно увидеть вместо . Это абсолютно эквивалентные формулировки, просто в них используются разные обозначения скалярного произведения .

Векторный параметр, векторная переменная

Форма векторного параметра для одной случайной величины со скалярным знаком может быть тривиально расширена, чтобы охватить совместное распределение по вектору случайных величин. Полученное распределение просто такое же, как и приведенное выше распределение для случайной величины со скалярным знаком, где каждое вхождение скаляра x заменяется вектором

Размеры k случайной величины не обязательно должны совпадать с размерностью d вектора параметров или (в случае изогнутой экспоненциальной функции) с размерностью s натурального параметра и достаточной статистикой T ( x )  .

Распределение в этом случае записывается как

Или более компактно, как

Или альтернативно как

Теоретико-мерная формулировка

Мы используем кумулятивные функции распределения (CDF), чтобы охватить как дискретные, так и непрерывные распределения.

Предположим, H — неубывающая функция действительной переменной. Тогда интегралы Лебега–Стилтьеса по являются интегралами по эталонной мере экспоненциального семейства, порожденного H  .

Любой член этого экспоненциального семейства имеет кумулятивную функцию распределения.

H ( x ) интегратор Лебега–Стилтьеса эталонной меры. Когда эталонная мера конечна, ее можно нормализовать, и H фактически является кумулятивной функцией распределения распределения вероятностей. Если F абсолютно непрерывен с плотностьюотносительно эталонной меры(обычно меры Лебега ), можно написать. В этом случае H также абсолютно непрерывна и ее можно записатьтак, чтобы формулы сводились к формулам из предыдущих абзацев. Если F дискретно, то H ступенчатая функция (со ступеньками на носителе F).

В качестве альтернативы мы можем записать вероятностную меру непосредственно как

для некоторой эталонной меры .

Интерпретация

В приведенных выше определениях функции T ( x ) , η ( θ ) и A ( η ) были произвольными. Однако эти функции имеют важные интерпретации в итоговом распределении вероятностей.

Функция A важна сама по себе, потому что среднее значение , дисперсия и другие моменты достаточной статистики T ( x ) могут быть получены просто путем дифференцирования A ( η ) . Например, поскольку log( x ) является одним из компонентов достаточной статистики гамма-распределения , его можно легко определить для этого распределения с помощью A ( η ) . Технически это верно, потому что

кумулянтная производящая функция достаточной статистики.

Характеристики

Экспоненциальные семейства обладают большим количеством свойств, которые делают их чрезвычайно полезными для статистического анализа. Во многих случаях можно показать, что этими свойствами обладают только экспоненциальные семейства. Примеры:

Учитывая экспоненциальное семейство, определенное , где пространство параметров, такое, что . Затем

Примеры

При рассмотрении примеров в этом разделе очень важно помнить приведенное выше обсуждение того, что означает сказать, что «распределение» является экспоненциальным семейством, и, в частности, иметь в виду, что набор параметров, которые могут изменяться имеет решающее значение для определения того, является ли «распределение» экспоненциальным семейством или нет.

Нормальное , экспоненциальное , логарифмически нормальное , гамма - распределение , хи-квадрат , бета , Дирихле , Бернулли , категориальное распределение , распределение Пуассона , геометрическое , обратное гауссово , ALAAM , распределение фон Мизеса и фон Мизеса-Фишера — все это экспоненциальные семейства.

Некоторые распределения являются экспоненциальными семействами только в том случае, если некоторые из их параметров остаются фиксированными. Семейство распределений Парето с фиксированной минимальной границей x m образует экспоненциальное семейство. Семейства биномиальных и полиномиальных распределений с фиксированным количеством испытаний n , но неизвестными параметрами вероятности являются экспоненциальными семействами. Семейство отрицательных биномиальных распределений с фиксированным количеством отказов (он же параметр времени остановки) r является экспоненциальным семейством. Однако если любой из вышеупомянутых фиксированных параметров может изменяться, полученное семейство не является экспоненциальным семейством.

Как упоминалось выше, как правило, поддержка экспоненциального семейства должна оставаться одинаковой для всех настроек параметров в семействе. Вот почему приведенные выше случаи (например, биномиальный с переменным количеством испытаний, Парето с варьирующейся минимальной границей) не являются экспоненциальными семействами — во всех случаях рассматриваемый параметр влияет на поддержку (в частности, изменение минимального или максимально возможного значения). . По тем же причинам ни дискретное равномерное распределение , ни непрерывное равномерное распределение не являются экспоненциальными семействами, поскольку одна или обе границы изменяются.

Распределение Вейбулла с фиксированным параметром формы k представляет собой экспоненциальное семейство. В отличие от предыдущих примеров, параметр формы не влияет на опору; тот факт, что разрешение изменяться, делает Вейбулла неэкспоненциальным, объясняется, скорее, особой формой функции плотности вероятности Вейбулла ( k появляется в показателе показателя).

В общем, распределения, которые являются результатом конечной или бесконечной смеси других распределений, например, плотностей модели смеси и составных распределений вероятностей , не являются экспоненциальными семействами. Примерами являются типичные модели гауссовой смеси, а также многие распределения с тяжелым хвостом , которые возникают в результате объединения (т.е. бесконечного смешивания) распределения с априорным распределением по одному из его параметров, например, t -распределение Стьюдента (составление нормального распределения по гамма-распределению ). априорная распределенная точность), а также бета-биномиальное и мультиномиальное распределения Дирихле. Другими примерами распределений, не являющихся экспоненциальными семействами, являются F-распределение , распределение Коши , гипергеометрическое распределение и логистическое распределение .

Ниже приведены некоторые подробные примеры представления некоторых полезных распределений в виде экспоненциальных семейств.

Нормальное распределение: неизвестное среднее, известная дисперсия.

В качестве первого примера рассмотрим случайную величину, распределенную нормально с неизвестным средним значением µ и известной дисперсией σ 2 . Тогда функция плотности вероятности равна

Это однопараметрическое экспоненциальное семейство, как можно увидеть, установив

Если σ = 1, это имеет каноническую форму, так как тогда  η ( µ ) =  µ .

Нормальное распределение: неизвестное среднее и неизвестная дисперсия

Далее рассмотрим случай нормального распределения с неизвестным средним значением и неизвестной дисперсией. Тогда функция плотности вероятности равна

Это экспоненциальное семейство, которое можно записать в канонической форме, определив

Биномиальное распределение

В качестве примера дискретного экспоненциального семейства рассмотрим биномиальное распределение с известным количеством испытаний n . Функция массы вероятности для этого распределения равна

Это эквивалентно можно записать как

который показывает, что биномиальное распределение представляет собой экспоненциальное семейство, естественный параметр которого равен

Эта функция p известна как логит .

Таблица распределений

В следующей таблице показано, как переписать ряд распространенных распределений как распределения экспоненциального семейства с натуральными параметрами. Обратитесь к карточкам [12] для ознакомления с основными семействами экспонент.

Для скалярной переменной и скалярного параметра форма имеет следующий вид:

Для скалярной переменной и векторного параметра:

Для векторной переменной и векторного параметра:

Приведенные выше формулы выбирают функциональную форму экспоненциального семейства с функцией логарифмического разбиения . Причина этого в том, что моменты достаточной статистики можно легко вычислить, просто дифференцируя эту функцию. Альтернативные формы включают либо параметризацию этой функции в терминах нормального параметра вместо натурального параметра, и/или использование множителя вне экспоненты. Связь между последним и первым такова:

Чтобы преобразовать представления, включающие два типа параметров, используйте приведенные ниже формулы для записи одного типа параметра через другой.

* Скобка Айверсона является обобщением дискретной дельта-функции: если выражение в квадратных скобках истинно, скобка имеет значение 1; если прилагаемое утверждение неверно, скобка Айверсона равна нулю. Существует много вариантов обозначений, например волнистые скобки: a = b эквивалентно обозначению [ a = b ] , использованному выше.

Три варианта категориального распределения и полиномиального распределения обусловлены тем, что параметры ограничены, так что

Таким образом, существуют только независимые параметры.

Варианты 1 и 2 вообще не являются стандартными экспоненциальными семействами. Скорее, они представляют собой изогнутые экспоненциальные семейства , т.е. существуют независимые параметры, встроенные в -мерное пространство параметров. [13] Многие из стандартных результатов для экспоненциальных семейств не применимы к изогнутым экспоненциальным семействам. Примером может служить функция log-partition , которая в изогнутых случаях имеет значение 0. В стандартных экспоненциальных семействах производные этой функции соответствуют моментам (более технически, кумулянтам ) достаточной статистики, например, среднего значения и дисперсии. Однако значение 0 предполагает, что среднее значение и дисперсия всех достаточных статистических данных равномерно равны 0, тогда как на самом деле среднее значение достаточной статистики должно быть равно 0. (Это действительно проявляется правильно при использовании формы, показанной в варианте 3.)

Моменты и кумулянты достаточной статистики

Нормализация распределения

Начнем с нормализации распределения вероятностей. В общем, любая неотрицательная функция f ( x ), которая служит ядром распределения вероятностей (часть, кодирующая всю зависимость от x ), может быть преобразована в правильное распределение путем нормализации : т.е.

где

Фактор Z иногда называют нормализатором или статистической суммой , по аналогии со статистической физикой .

В случае экспоненциального семейства, где

ядро это

и функция распределения

Поскольку распределение должно быть нормализовано, мы имеем

Другими словами,

или эквивалентно

Это оправдывает вызов функции нормализатора журнала или функции разделения журнала .

Момент-производящая функция достаточной статистики

Теперь производящая момент функция T ( x ) равна

доказывая ранее сделанное утверждение о том, что

является кумулянтной производящей функцией для T .

Важным подклассом семейств экспонент являются естественные семейства экспонент , которые имеют аналогичный вид для производящей момент функции распределения x .

Дифференциальные тождества для кумулянтов

В частности, используя свойства кумулянтной производящей функции,

и

Первые два необработанных момента и все смешанные вторые моменты могут быть восстановлены из этих двух тождеств. Моменты и кумулянты высших порядков получаются посредством высших производных. Этот метод часто бывает полезен, когда T является сложной функцией данных, моменты которой трудно вычислить путем интегрирования.

Другой способ увидеть это, не опирающийся на теорию кумулянтов , состоит в том, чтобы начать с того факта, что распределение экспоненциального семейства необходимо нормализовать и дифференцировать. Мы проиллюстрируем это на простом случае одномерного параметра, но аналогичный вывод справедлив и в более общем плане.

В одномерном случае имеем

Это должно быть нормализовано, поэтому

Возьмем производную обеих частей по η :

Поэтому,

Пример 1

В качестве вводного примера рассмотрим гамма-распределение , распределение которого определяется формулой

Обращаясь к приведенной выше таблице, мы видим, что натуральный параметр определяется выражением

обратные замены

достаточная статистика и функция разделения журнала

Мы можем найти среднее значение достаточной статистики следующим образом. Во-первых, для η 1 :

Где - дигамма-функция (производная логарифмической гаммы), и на последнем шаге мы использовали обратные замены.

Теперь для η 2 :

снова сделав обратную замену на последнем шаге.

Чтобы вычислить дисперсию x , мы просто снова дифференцируем:

Все эти расчеты можно выполнить с помощью интегрирования, используя различные свойства гамма- функции , но это требует значительно больше работы.

Пример 2

В качестве другого примера рассмотрим вещественную случайную величину X с плотностью

индексируется по параметру формы (это называется асимметричным логистическим распределением ). Плотность можно переписать как

Обратите внимание, что это экспоненциальное семейство с натуральным параметром

достаточная статистика

и функция разделения журналов

Итак, используя первое тождество,

и используя второе тождество

Этот пример иллюстрирует случай, когда использование этого метода очень просто, но прямой расчет практически невозможен.

Пример 3

Последний пример – это тот, где интеграция будет чрезвычайно трудной. Это случай распределения Уишарта , которое определено по матрицам. Даже получение производных немного сложнее, поскольку оно требует матричного исчисления , но соответствующие тождества перечислены в этой статье.

Из приведенной выше таблицы мы видим, что натуральный параметр определяется выражением

обратные замены

и достаточная статистика

Функция log-partition записана в таблице в различных формах, чтобы облегчить дифференцирование и обратную замену. Мы используем следующие формы:

Ожидание X (связанное с η 1 )

Для дифференцирования по η 1 нам понадобится следующее тождество матричного исчисления :

Затем:

В последней строке используется тот факт, что V симметричен и, следовательно, при транспонировании остается тем же.

Ожидание журнала | Х | (связанный с η 2 )

Теперь для η 2 нам сначала нужно расширить ту часть логарифмической статистической суммы, которая включает в себя многомерную гамма-функцию :

Нам также понадобится дигамма-функция :

Затем:

Последняя формула указана в статье о распространении Wishart . Оба этих ожидания необходимы при выводе вариационных уравнений обновления Байеса в сети Байеса, включающей распределение Уишарта (которое является сопряженным априорным значением многомерного нормального распределения ).

Вычислить эти формулы с помощью интегрирования было бы гораздо сложнее. Например, первый вариант потребует матричной интеграции.

Энтропия

Относительная энтропия

Относительная энтропия ( дивергенция Кульбака–Лейблера , дивергенция КЛ) двух распределений в экспоненциальном семействе имеет простое выражение как расхождение Брегмана между натуральными параметрами относительно логарифматора. [14] Относительная энтропия определяется в терминах интеграла, в то время как дивергенция Брегмана определяется в терминах производной и внутреннего продукта, и, таким образом, ее легче вычислить, и она имеет выражение в замкнутой форме (при условии, что производная имеет замкнутую форму). формировать выражение). Кроме того, расходимость Брегмана с точки зрения натуральных параметров и логарифмического нормализатора равна расходимости Брегмана двойственных параметров (параметров ожидания) в противоположном порядке для выпуклой сопряженной функции. [15]

Фиксация экспоненциального семейства с лог-нормализатором (с выпуклым сопряжением ), запись распределения в этом семействе, соответствующего фиксированному значению натурального параметра (запись для другого значения и с для соответствующих двойных параметров ожидания/момента), запись KL для КЛ-дивергенция, а для дивергенции Брегмана дивергенции связаны следующим образом:

Дивергенция КЛ традиционно записывается по первому параметру, а дивергенция Брегмана традиционно записывается по второму параметру, и, таким образом, это можно прочитать как «относительная энтропия равна дивергенции Брегмана, определяемой логарифмическим нормализатором». по замененным натуральным параметрам» или, что то же самое, как «равный дивергенции Брегмана, определяемой двойственным логарифмическим нормализатором параметров ожидания».

Вывод максимальной энтропии

Экспоненциальные семейства естественным образом возникают как ответ на следующий вопрос: какое распределение максимальной энтропии согласуется с заданными ограничениями на ожидаемые значения?

Информационная энтропия распределения вероятностей dF ( x ) может быть вычислена только относительно некоторого другого распределения вероятностей (или, в более общем смысле, положительной меры), и обе меры должны быть взаимно абсолютно непрерывны . Соответственно, нам нужно выбрать эталонную меру dH ( x ) с той же поддержкой, что и dF ( x ).

Энтропия dF ( x ) относительно dH ( x ) равна

или

где dF / dH и dH / dFпроизводные Радона–Никодима . Обычное определение энтропии для дискретного распределения, поддерживаемого на множестве I , а именно

предполагает , хотя на это редко указывают, что dH выбрана в качестве счетной меры I .

Рассмотрим теперь набор наблюдаемых величин (случайных величин) T i . Распределение вероятностей dF , энтропия которого по отношению к dH наибольшая, при условии, что ожидаемое значение Ti равно t i , представляет собой экспоненциальное семейство с dH в качестве эталонной меры и ( T 1 , ..., T n ) как достаточная статистика.

Вывод представляет собой простой вариационный расчет с использованием множителей Лагранжа . Нормализация налагается, если T 0 = 1 быть одним из ограничений. Естественными параметрами распределения являются множители Лагранжа, а коэффициентом нормализации является множитель Лагранжа, связанный с T 0 .

Примеры таких выводов см. в разделе Распределение вероятностей максимальной энтропии .

Роль в статистике

Классическая оценка: достаточность

Согласно теореме ПитманаКупманаДармуа , среди семейств вероятностных распределений, область определения которых не меняется в зависимости от оцениваемого параметра, только в экспоненциальных семействах существует достаточная статистика , размерность которой остается ограниченной по мере увеличения размера выборки.

Менее кратко, предположим, что X k (где k = 1, 2, 3, ... n ) являются независимыми , одинаково распределенными случайными величинами. Только если их распределение относится к экспоненциальному семейству распределений, существует достаточная статистика T ( X 1 , ..., X n ), число скалярных компонентов которой не увеличивается с увеличением размера выборки n ; статистика T может быть вектором или одним скалярным числом , но чем бы она ни была, ее размер не будет ни увеличиваться, ни уменьшаться при получении большего количества данных.

В качестве контрпримера, если эти условия смягчены, семейство равномерных распределений ( дискретных или непрерывных , с неизвестной одной или обеими границами) имеет достаточную статистику, а именно максимум выборки, минимум выборки и размер выборки, но не образует экспоненциальную зависимость. семейство, так как домен меняется в зависимости от параметров.

Байесовская оценка: сопряженные распределения

Экспоненциальные семейства также важны в байесовской статистике . В байесовской статистике априорное распределение умножается на функцию правдоподобия , а затем нормализуется для получения апостериорного распределения . В случае вероятности, принадлежащей экспоненциальному семейству, существует сопряженный априор , который часто также принадлежит экспоненциальному семейству. Сопряженный априор π для параметра экспоненциального семейства

дан кем-то

или эквивалентно

где s — размерность, а и — гиперпараметры (параметры, управляющие параметрами). соответствует эффективному количеству наблюдений, которые вносит априорное распределение, и соответствует общей сумме, которую эти псевдонаблюдения вносят в достаточную статистику по всем наблюдениям и псевдонаблюдениям. — константа нормализации , которая автоматически определяется остальными функциями и служит для обеспечения того, чтобы данная функция была функцией плотности вероятности (т. е. была нормализована ). и, что эквивалентно, являются теми же функциями, что и в определении распределения, для которого π является сопряженным априорным.

Сопряженное априорное распределение — это такое, которое в сочетании с правдоподобием и нормализацией дает апостериорное распределение того же типа, что и априорное. Например, если кто-то оценивает вероятность успеха биномиального распределения, то если кто-то решит использовать бета-распределение в качестве априорного, апостериорное распределение будет другим бета-распределением. Это делает вычисление задней части особенно простым. Аналогично, если кто-то оценивает параметр распределения Пуассона, использование априорной гаммы приведет к другой апостериорной гамме. Сопряженные априоры часто очень гибки и могут быть очень удобными. Однако, если убеждение о вероятном значении тета-параметра бинома представлено (скажем) бимодальным (двугорбым) априорным распределением, то это не может быть представлено бета-распределением. Однако его можно представить, используя в качестве априорного значения плотность смеси , в данном случае комбинацию двух бета-распределений; это форма гиперприора .

Произвольная вероятность не будет принадлежать экспоненциальному семейству, и поэтому, как правило, сопряженного априора не существует. Затем апостериорную величину придется рассчитывать численными методами.

Чтобы показать, что приведенное выше априорное распределение является сопряженным априорным, мы можем вывести апостериорное.

Во-первых, предположим, что вероятность одного наблюдения следует экспоненциальному семейству, параметризованному с использованием его натурального параметра:

Затем для data вероятность вычисляется следующим образом:

Тогда для вышеуказанного сопряженного априора:

Затем мы можем вычислить апостериорную величину следующим образом:

Последняя строка представляет собой ядро ​​апостериорного распределения, т.е.

Это показывает, что задняя часть имеет ту же форму, что и предыдущая.

Данные X входят в это уравнение только в выражении

что называется достаточной статистикой данных. То есть значения достаточной статистики достаточно, чтобы полностью определить апостериорное распределение. Сами фактические точки данных не нужны, и все наборы точек данных с одинаковой достаточной статистикой будут иметь одинаковое распределение. Это важно, поскольку размерность достаточной статистики не увеличивается с размером данных — она имеет ровно столько компонентов, сколько компонентов (эквивалентно количеству параметров распределения одной точки данных).

Уравнения обновления следующие:

Это показывает, что уравнения обновления могут быть записаны просто с точки зрения количества точек данных и достаточной статистики данных. Это можно ясно увидеть в различных примерах уравнений обновления, показанных на предыдущей странице сопряжения . Из-за способа вычисления достаточной статистики она обязательно включает суммы компонентов данных (в некоторых случаях замаскированные под произведения или другие формы — произведение можно записать в виде суммы логарифмов ) . Случаи, когда уравнения обновления для конкретных распределений не совсем соответствуют приведенным выше формам, — это случаи, когда сопряженный априор был выражен с использованием другой параметризации, чем та, которая создает сопряженный априор вышеуказанной формы — часто именно потому, что приведенная выше форма определяется по естественному параметру, тогда как сопряженные априорные значения обычно определяются по фактическому параметру

Непредвзятая оценка

Если вероятность представляет собой экспоненциальное семейство, то несмещенная оценка равна . [16]

Проверка гипотез: самые мощные тесты

Однопараметрическое экспоненциальное семейство имеет монотонное неубывающее отношение правдоподобия в достаточной статистике T ( x ), при условии, что η ( θ ) не убывает. Как следствие, существует равномерно наиболее мощный тест для проверки гипотезы H 0 : θθ 0 vs . ЧАС 1 : θ < θ 0 .

Обобщенные линейные модели

Экспоненциальные семейства составляют основу функций распределения, используемых в обобщенных линейных моделях (GLM), классе моделей, который охватывает многие из обычно используемых регрессионных моделей в статистике. Примеры включают логистическую регрессию с использованием биномиального семейства и регрессию Пуассона .

Смотрите также

Сноски

  1. ^ Например, семейство нормальных распределений включает стандартное нормальное распределение N (0, 1) со средним значением 0 и дисперсией 1, а также другие нормальные распределения с другим средним значением и дисперсией.
  2. ^ «Функция распределения» часто используется в статистике как синоним «коэффициента нормализации».
  3. ^ Эти распределения сами по себе часто не являются экспоненциальными семействами. Распространенными примерами неэкспоненциальных семейств, возникающих из экспоненциальных, являются t -распределение Стьюдента , бета-биномиальное распределение и мультиномиальное распределение Дирихле .

Рекомендации

Цитаты

  1. ^ Купперман, М. (1958). «Вероятности гипотез и информационная статистика при выборке из популяций экспоненциального класса». Анналы математической статистики . 9 (2): 571–575. дои : 10.1214/aoms/1177706633 . JSTOR  2237349.
  2. ^ Андерсен, Эрлинг (сентябрь 1970 г.). «Достаточность и экспоненциальные семейства для дискретных выборочных пространств». Журнал Американской статистической ассоциации . Журнал Американской статистической ассоциации. 65 (331): 1248–1255. дои : 10.2307/2284291. JSTOR  2284291. МР  0268992.
  3. ^ Питман, Э .; Уишарт, Дж. (1936). «Достаточная статистика и внутренняя точность». Математические труды Кембриджского философского общества . 32 (4): 567–579. Бибкод : 1936PCPS...32..567P. дои : 10.1017/S0305004100019307. S2CID  120708376.
  4. ^ Дармуа, Г. (1935). «Sur les lois de вероятностная оценка исчерпывающая». ЧР акад. наук. Париж (на французском языке). 200 : 1265–1266.
  5. ^ Купман, Б. (1936). «О распределении, допускающем достаточную статистику». Труды Американского математического общества . Американское математическое общество . 39 (3): 399–409. дои : 10.2307/1989758 . JSTOR  1989758. MR  1501854.
  6. ^ «Общие экспоненциальные семейства». www.randomservices.org . Проверено 30 августа 2022 г.
  7. ^ Абрамович и Ритов (2013). Статистическая теория: краткое введение . Чепмен и Холл. ISBN 978-1439851845.
  8. ^ Блей, Дэвид. «Вариационный вывод» (PDF) . Принстон У.
  9. ^ Казелла, Джордж (2002). Статистические выводы. Роджер Л. Бергер (2-е изд.). Австралия: Thomson Learning. Теорема 6.2.25. ISBN 0-534-24312-6. ОСЛК  46538638.
  10. ^ Браун, Лоуренс Д. (1986). Основы статистических экспоненциальных семейств: с приложениями в статистической теории принятия решений. Хейворд, Калифорния: Институт математической статистики. Теорема 2.12. ISBN 0-940600-10-2. ОСЛК  15986663.
  11. ^ Кинер, Роберт В. (2010). Теоретическая статистика: темы основного курса. Нью-Йорк. с. 47, пример 3.12. ISBN 978-0-387-93839-4. ОСЛК  676700036.{{cite book}}: CS1 maint: location missing publisher (link)
  12. ^ Нильсен, Фрэнк; Гарсия, Винсент (2009). «Статистические экспоненциальные семейства: дайджест с карточками». arXiv : 0911.4863 [cs.LG].
  13. ^ ван Гардерен, Кес Ян (1997). «Кривые экспоненциальные модели в эконометрике». Эконометрическая теория . 13 (6): 771–790. дои : 10.1017/S0266466600006253. S2CID  122742807.
  14. ^ Nielsen & Nock 2010, 4. Расхождения Брегмана и относительная энтропия экспоненциальных семейств.
  15. ^ Барндорф-Нильсен 1978, 9.1 Выпуклая двойственность и экспоненциальные семейства.
  16. ^ Эфрон, Брэдли (декабрь 2011 г.). «Формула Твиди и систематическая ошибка выбора». Журнал Американской статистической ассоциации . 106 (496): 1602–1614. дои : 10.1198/jasa.2011.tm11181. ISSN  0162-1459. ПМК 3325056 . ПМИД  22505788. 

Источники

дальнейшее чтение

Внешние ссылки