Фактор Байеса

Фактор Байеса представляет собой отношение двух конкурирующих статистических моделей , представленных их доказательствами , и используется для количественной оценки поддержки одной модели по сравнению с другой. ^[1] Рассматриваемые модели могут иметь общий набор параметров, таких как нулевая гипотеза и альтернатива, но это не обязательно; например, это может быть также нелинейная модель по сравнению с ее линейной аппроксимацией . Фактор Байеса можно рассматривать как байесовский аналог теста отношения правдоподобия , хотя он использует интегрированное (т. е. предельное) правдоподобие, а не максимизированное правдоподобие. Таким образом, обе величины совпадают только при простых гипотезах (например, двух конкретных значениях параметров). ^[2] Кроме того, в отличие от проверки значимости нулевой гипотезы , факторы Байеса поддерживают оценку доказательств в пользу нулевой гипотезы, а не только позволяют отвергнуть или не отвергнуть нулевую гипотезу. ^[3]

Хотя концептуально просто, вычисление фактора Байеса может быть сложным в зависимости от сложности модели и гипотез. ^[4] Поскольку выражения предельного правдоподобия в замкнутой форме, как правило, недоступны, были предложены численные приближения, основанные на образцах MCMC . ^[5] Для некоторых особых случаев могут быть выведены упрощенные алгебраические выражения; например, отношение плотности Сэвиджа–Дики в случае точной (ограниченной равенством) гипотезы против неограниченной альтернативы. ^[6]^[7] Другое приближение, полученное путем применения приближения Лапласа к интегрированным правдоподобиям, известно как критерий информации Байеса (BIC); ^[8] в больших наборах данных фактор Байеса будет приближаться к BIC по мере того, как влияние априорных данных ослабевает. В небольших наборах данных априорные данные, как правило, имеют значение и не должны быть неправильными, поскольку фактор Байеса будет неопределенным, если любой из двух интегралов в его отношении не является конечным.

Определение

Фактор Байеса представляет собой отношение двух предельных правдоподобий, то есть правдоподобий двух статистических моделей, интегрированных по априорным вероятностям их параметров. ^[9]

Апостериорная вероятность модели M при данных D определяется теоремой Байеса : $\Pr(М|Д)$

\Pr(M|D)={\frac {\Pr(D|M)\Pr(M)}{\Pr(D)}}.

Ключевой зависящий от данных термин представляет собой вероятность того, что некоторые данные получены в предположении модели M ; его правильная оценка является ключом к сравнению байесовских моделей. $\Pr(D|M)$

При наличии проблемы выбора модели , в которой требуется сделать выбор между двумя моделями на основе наблюдаемых данных D , правдоподобность двух различных моделей M ₁ и M ₂ , параметризованных векторами параметров модели и , оценивается с помощью коэффициента Байеса K, определяемого как $\тета _{1}$ $\тета _{2}$

K={\frac {\Pr(D|M_{1})}{\Pr(D|M_{2})}}={\frac {\int \Pr(\theta _{1}|M_{1})\Pr(D|\theta _{1},M_{1})\,d\theta _{1}}{\int \Pr(\theta _{2}|M_{2})\Pr(D|\theta _{2},M_{2})\,d\theta _{2}}}={\frac {\frac {\Pr(M_{1}|D)\Pr(D)}{\Pr(M_{1})}}{\frac {\Pr(M_{2}|D)\Pr(D)}{\Pr(M_{2})}}}={\frac {\Pr(M_{1}|D)}{\Pr(M_{2}|D)}}{\frac {\Pr(M_{2})}{\Pr(M_{1})}}.

Когда две модели имеют одинаковую априорную вероятность, так что , фактор Байеса равен отношению апостериорных вероятностей M ₁ и M ₂ . Если вместо интеграла фактора Байеса используется вероятность, соответствующая оценке максимального правдоподобия параметра для каждой статистической модели, то тест становится классическим тестом отношения правдоподобия . В отличие от теста отношения правдоподобия, это сравнение байесовских моделей не зависит от какого-либо одного набора параметров, поскольку оно интегрируется по всем параметрам в каждой модели (относительно соответствующих априорных значений). Преимущество использования факторов Байеса заключается в том, что оно автоматически и вполне естественно включает штраф за включение слишком большой структуры модели. ^[10] Таким образом, это защищает от переобучения . Для моделей, где явная версия вероятности недоступна или слишком затратна для численной оценки, приближенное байесовское вычисление может использоваться для выбора модели в байесовской структуре, ^[11] с оговоркой, что приближенные байесовские оценки факторов Байеса часто смещены. ^[12] $\Pr(M_{1})=\Pr(M_{2})$

Другие подходы:

рассматривать сравнение моделей как проблему принятия решений , вычисляя ожидаемую ценность или стоимость каждого выбора модели;
использовать минимальную длину сообщения (MML).
использовать минимальную длину описания (MDL).

Интерпретация

Значение K > 1 означает, что M ₁ более сильно поддерживается рассматриваемыми данными, чем M ₂ . Обратите внимание, что классическая проверка гипотез дает одной гипотезе (или модели) предпочтительный статус («нулевая гипотеза») и рассматривает только доказательства против нее. Тот факт, что фактор Байеса может предоставить доказательства за , а не только против нулевой гипотезы, является одним из ключевых преимуществ этого метода анализа. ^[13]

Гарольд Джеффрис дал шкалу для интерпретации K : ^[14]

Во втором столбце указаны соответствующие веса доказательств в децихартли (также известных как децибаны ); биты добавлены в третьем столбце для ясности. Согласно IJ Good, изменение веса доказательств на 1 децибан или 1/3 бита (т. е. изменение отношения шансов с четных до примерно 5:4) примерно так же тонко, как люди могут разумно воспринимать свою степень веры в гипотезу в повседневном использовании. ^[15]

Альтернативная таблица, широко цитируемая, представлена Кассом и Рафтери (1995): ^[10]

Пример

Предположим, у нас есть случайная величина , которая производит либо успех, либо неудачу. Мы хотим сравнить модель M ₁ , где вероятность успеха равна q = 1 ⁄ 2 , и другую модель M _{2 ,} где q неизвестно, и мы берем априорное распределение для q, которое равномерно на [0,1]. Мы берем выборку из 200 и находим 115 успехов и 85 неудач. Вероятность можно рассчитать в соответствии с биномиальным распределением :

{{200 \выберите 115}q^{115}(1-q)^{85}}.

Таким образом, для M ₁ имеем

P(X=115\mid M_{1})={200 \выберите 115}\left({1 \over 2}\right)^{200}\approx 0.006

тогда как для M ₂ мы имеем

P(X=115\mid M_{2})=\int _{0}^{1}{200 \choose 115}q^{115}(1-q)^{85}dq={1 \over 201}\approx 0.005

Тогда соотношение составляет 1,2, что «едва ли заслуживает упоминания», даже если оно очень слабо указывает на M ₁ .

Частотный тест гипотезы M ₁ (здесь рассматриваемый как нулевая гипотеза ) дал бы совсем другой результат. Такой тест говорит, что M 1 _{следует} отвергнуть на уровне значимости 5%, поскольку вероятность получения 115 или более успехов из выборки из 200, если q = 1 ⁄ 2 , составляет 0,02, а как двухсторонний тест получения цифры, такой же экстремальной или более экстремальной, чем 115, составляет 0,04. Обратите внимание, что 115 находится более чем в двух стандартных отклонениях от 100. Таким образом, в то время как частотный тест гипотезы дал бы значимые результаты на уровне значимости 5%, фактор Байеса вряд ли считает это экстремальным результатом. Обратите внимание, однако, что неравномерное априорное распределение (например, такое, которое отражает тот факт, что вы ожидаете, что число успехов и неудач будет одного порядка величины) может привести к фактору Байеса, который больше согласуется с частотным тестом гипотезы.

Классический тест отношения правдоподобия нашел бы оценку максимального правдоподобия для q , а именно , откуда ${\hat {q}}={\frac {115}{200}}=0,575$

\textstyle P(X=115\mid M_{2})={{200 \choose 115}{\hat {q}}^{115}(1-{\hat {q}})^{85}}\approx 0.06

(а не усреднение по всем возможным q ). Это дает отношение правдоподобия 0,1 и указывает на M ₂ .

M ₂ — более сложная модель, чем M ₁ , поскольку она имеет свободный параметр, который позволяет ей моделировать данные более точно. Способность байесовских факторов учитывать это является причиной того, что байесовский вывод был выдвинут в качестве теоретического обоснования и обобщения бритвы Оккама , уменьшая ошибки типа I. [ ^16]

С другой стороны, современный метод относительного правдоподобия учитывает количество свободных параметров в моделях, в отличие от классического отношения правдоподобия. Метод относительного правдоподобия можно применить следующим образом. Модель M ₁ имеет 0 параметров, поэтому ее значение информационного критерия Акаике (AIC) равно . Модель M ₂ имеет 1 параметр, поэтому ее значение AIC равно . Следовательно, M ₁ примерно в раз более вероятно, чем M ₂ , что минимизирует потерю информации. Таким образом, M ₂ немного предпочтительнее, но M ₁ нельзя исключить. $2\cdot 0-2\cdot \ln(0,005956)\приблизительно 10,2467$ $2\cdot 1-2\cdot \ln(0,056991)\приблизительно 7,7297$ $\exp \left({\frac {7.7297-10.2467}{2}}\right)\approx 0.284$

Смотрите также

Статистические коэффициенты

Ссылки

^ Морей, Ричард Д.; Ромейн, Ян-Виллем; Роудер, Джеффри Н. (2016). «Философия факторов Байеса и количественная оценка статистических данных». Журнал математической психологии . 72 : 6–18. doi : 10.1016/j.jmp.2015.11.001 .
^ Лесаффр, Эммануэль; Лоусон, Эндрю Б. (2012). «Проверка байесовской гипотезы». Байесовская биостатистика . Сомерсет: John Wiley & Sons. стр. 72–78. doi :10.1002/9781119942412.ch3. ISBN 978-0-470-01823-1.
^ Ли, Александр и др. (2020). «Байесовская методология сэра Гарольда Джеффриса как практическая альтернатива проверке гипотезы P-значения». Computational Brain & Behavior . 3 (2): 153–161. doi : 10.1007/s42113-019-00070-x . hdl : 2066/226717 .
^ Льоренте, Фернандо и др. (2023). «Вычисление предельного правдоподобия для выбора модели и проверки гипотез: обширный обзор». Обзор SIAM . появится: 3–58. arXiv : 2005.08334 . doi : 10.1137/20M1310849. S2CID 210156537.
^ Конгдон, Питер (2014). «Оценка вероятностей модели или предельных правдоподобий на практике». Прикладное байесовское моделирование (2-е изд.). Wiley. стр. 38–40. ISBN 978-1-119-95151-3.
^ Куп, Гэри (2003). «Сравнение моделей: отношение плотности Сэвиджа–Дики». Байесовская эконометрика . Сомерсет: John Wiley & Sons. стр. 69–71. ISBN 0-470-84567-8.
^ Wagenmakers, Eric-Jan; Lodewyckx, Tom; Kuriyal, Himanshu; Grasman, Raoul (2010). «Проверка байесовских гипотез для психологов: Учебное пособие по методу Сэвиджа–Дики» (PDF) . Cognitive Psychology . 60 (3): 158–189. doi :10.1016/j.cogpsych.2009.12.001. PMID 20064637. S2CID 206867662.
^ Ибрагим, Джозеф Г.; Чен, Мин-Хуэй; Синха, Дебайоти (2001). «Сравнение моделей». Байесовский анализ выживаемости . Springer Series in Statistics. Нью-Йорк: Springer. стр. 246–254. doi :10.1007/978-1-4757-3447-8_6. ISBN 0-387-95277-2.
^ Гилл, Джефф (2002). «Проверка байесовской гипотезы и фактор Байеса». Байесовские методы: подход социальных и поведенческих наук . Chapman & Hall. стр. 199–237. ISBN 1-58488-288-3.
^ ab Роберт Э. Касс и Адриан Э. Рафтери (1995). "Байесовские факторы" (PDF) . Журнал Американской статистической ассоциации . 90 (430): 791. doi :10.2307/2291091. JSTOR 2291091.
^ Тони, Т.; Штумпф, MPH (2009). «Выбор модели на основе моделирования для динамических систем в системной и популяционной биологии». Биоинформатика . 26 (1): 104–10. arXiv : 0911.1705 . doi : 10.1093/bioinformatics/btp619. PMC 2796821. PMID 19880371 .
^ Роберт, CP; J. Cornuet; J. Marin & NS Pillai (2011). «Отсутствие уверенности в выборе приближенной байесовской модели вычислений». Труды Национальной академии наук . 108 (37): 15112–15117. Bibcode : 2011PNAS..10815112R. doi : 10.1073 /pnas.1102900108 . PMC 3174657. PMID 21876135.
^ Уильямс, Мэтт; Боат, Расмус; Филипп, Майкл (2017). «Использование факторов Байеса для проверки гипотез в исследованиях развития». Исследования в области развития человека . 14 : 321–337. doi :10.1080/15427609.2017.1370964.
^ Джеффрис, Гарольд (1998) [1961]. Теория вероятностей (3-е изд.). Оксфорд, Англия. стр. 432. ISBN 9780191589676.{{cite book}}: CS1 maint: location missing publisher (link)
^ Good, IJ (1979). «Исследования по истории вероятности и статистики. XXXVII AM Статистическая работа Тьюринга во Второй мировой войне». Biometrika . 66 (2): 393–396. doi :10.1093/biomet/66.2.393. MR 0548210.
^ Заточка бритвы Оккама на байесовском ремне

Дальнейшее чтение

Бернардо, Дж.; Смит, АФМ (1994). Байесовская теория . Джон Уайли. ISBN 0-471-92416-4.
Денисон, Д. Г. Т.; Холмс, К. К.; Маллик, Б. К.; Смит, А. Ф. М. (2002). Байесовские методы нелинейной классификации и регрессии . John Wiley. ISBN 0-471-49036-9.
Динес, З. (2019). Как узнать, что предсказывает моя теория? Достижения в области методов и практик в психологической науке doi :10.1177/2515245919876960
Дуда, Ричард О.; Харт, Питер Э.; Сторк, Дэвид Г. (2000). "Раздел 9.6.5". Классификация образов (2-е изд.). Wiley. С. 487–489. ISBN 0-471-05669-3.
Гельман, А.; Карлин, Дж.; Стерн, Х.; Рубин, Д. (1995). Байесовский анализ данных . Лондон: Chapman & Hall . ISBN 0-412-03991-5.
Джейнс, ET (1994), Теория вероятностей: логика науки , глава 24.
Кадане, Джозеф Б.; Дики, Джеймс М. (1980). «Байесовская теория принятия решений и упрощение моделей». В Кмента, Ян; Рэмси, Джеймс Б. (ред.). Оценка эконометрических моделей . Нью-Йорк: Academic Press. стр. 245–268. ISBN 0-12-416550-8.
Ли, П. М. (2012). Байесовская статистика: введение . Wiley. ISBN 9781118332573.
Ричард, Марк; Вечер, Ян (2021). «Тестирование эффективности рынков прогнозирования: подход Мартингейла, отношение правдоподобия и анализ байесовского фактора». Риски . 9 (2): 31. doi : 10.3390/risks9020031 . hdl : 10419/258120 .
Винклер, Роберт (2003). Введение в байесовский вывод и принятие решений (2-е изд.). Вероятностный. ISBN 0-9647938-4-9.

Внешние ссылки

BayesFactor — пакет R для вычисления коэффициентов Байеса в общих исследовательских проектах.
Калькулятор коэффициента Байеса — Онлайн-калькулятор для информированного коэффициента Байеса
Калькуляторы коэффициента Байеса. Архивировано 07.05.2015 на Wayback Machine — веб-версия большей части пакета BayesFactor.