Байесовская статистика ( / ˈ b eɪ z i ə n / BAY -zee-ən или / ˈ b eɪ ʒ ən / BAY -zhən ) [1] — теория в области статистики , основанная на байесовской интерпретации вероятности , где вероятность выражает степень веры в событие . Степень веры может быть основана на предшествующих знаниях о событии, таких как результаты предыдущих экспериментов, или на личных убеждениях о событии. Это отличается от ряда других интерпретаций вероятности , таких как частотная интерпретация, которая рассматривает вероятность как предел относительной частоты события после многих испытаний. [2] Более конкретно, анализ в байесовских методах кодифицирует предшествующие знания в форме априорного распределения .
Байесовские статистические методы используют теорему Байеса для вычисления и обновления вероятностей после получения новых данных. Теорема Байеса описывает условную вероятность события на основе данных, а также предшествующей информации или убеждений о событии или условиях, связанных с событием. [3] [4] Например, в байесовском выводе теорему Байеса можно использовать для оценки параметров распределения вероятностей или статистической модели . Поскольку байесовская статистика рассматривает вероятность как степень убеждения, теорема Байеса может напрямую назначить распределение вероятностей, которое количественно определяет убеждение, параметру или набору параметров. [2] [3]
Байесовская статистика названа в честь Томаса Байеса , который сформулировал конкретный случай теоремы Байеса в статье , опубликованной в 1763 году. В нескольких работах, охватывающих период с конца 18-го по начало 19-го века, Пьер-Симон Лаплас разработал байесовскую интерпретацию вероятности. [5] Лаплас использовал методы, которые сейчас считаются байесовскими, для решения ряда статистических задач. Многие байесовские методы были разработаны более поздними авторами, но этот термин не использовался для описания таких методов до 1950-х годов. В течение большей части 20-го века байесовские методы рассматривались многими статистиками неодобрительно из-за философских и практических соображений. Многие байесовские методы требовали больших вычислений для завершения, и большинство методов, которые широко использовались в течение столетия, были основаны на частотной интерпретации. Однако с появлением мощных компьютеров и новых алгоритмов, таких как Монте-Карло с цепями Маркова , байесовские методы стали все чаще использоваться в статистике в 21-м веке. [2] [6]
Теорема Байеса используется в байесовских методах для обновления вероятностей, которые являются степенями доверия, после получения новых данных. При наличии двух событий и условная вероятность того, что дано, что является истинным, выражается следующим образом: [7]
где . Хотя теорема Байеса является фундаментальным результатом теории вероятностей , она имеет специфическую интерпретацию в байесовской статистике. В приведенном выше уравнении обычно представляет собой утверждение (например, утверждение, что монета выпадает орлом в пятидесяти процентах случаев) и представляет собой доказательство или новые данные, которые следует принять во внимание (например, результат серии подбрасываний монеты). — это априорная вероятность того , что выражает чьи-либо убеждения относительно до того, как будут приняты во внимание доказательства. Априорная вероятность может также количественно определять априорные знания или информацию о . — это функция правдоподобия , которую можно интерпретировать как вероятность того, что данное доказательство является истинным. Правдоподобие количественно определяет степень, в которой доказательства подтверждают утверждение . — это апостериорная вероятность , вероятность утверждения после учета доказательств . По сути, теорема Байеса обновляет чьи-либо априорные убеждения после рассмотрения новых доказательств . [2]
Вероятность доказательства может быть рассчитана с использованием закона полной вероятности . Если — это разбиение выборочного пространства , которое является множеством всех результатов эксперимента, то, [2] [7]
Когда существует бесконечное количество результатов, необходимо интегрировать по всем результатам для расчета с использованием закона полной вероятности. Часто бывает трудно подсчитать, так как расчет будет включать суммы или интегралы, оценка которых займет много времени, поэтому часто рассматривается только произведение априорной вероятности и вероятности, поскольку доказательства не меняются в том же анализе. Апостериорная вероятность пропорциональна этому произведению: [2]
Максимум апостериори , который является модой апостериорной вероятности и часто вычисляется в байесовской статистике с использованием методов математической оптимизации , остается тем же самым. Апостериорную вероятность можно аппроксимировать даже без вычисления точного значения с помощью таких методов, как Монте-Карло Маркова или вариационные байесовские методы . [2]
Общий набор статистических методов можно разделить на ряд видов деятельности, многие из которых имеют специальные байесовские версии.
Байесовский вывод относится к статистическому выводу , где неопределенность в выводах количественно определяется с использованием вероятности. [8] В классическом частотном выводе параметры модели и гипотезы считаются фиксированными. Вероятности не назначаются параметрам или гипотезам в частотном выводе. Например, в частотном выводе не имело бы смысла напрямую назначать вероятность событию, которое может произойти только один раз, например, результату следующего подбрасывания честной монеты. Однако имело бы смысл утверждать, что доля орлов приближается к половине по мере увеличения числа подбрасываний монеты. [9]
Статистические модели определяют набор статистических предположений и процессов, которые представляют, как генерируются данные выборки. Статистические модели имеют ряд параметров, которые можно изменять. Например, монету можно представить в виде выборок из распределения Бернулли , которое моделирует два возможных результата. Распределение Бернулли имеет один параметр, равный вероятности одного результата, который в большинстве случаев является вероятностью выпадения орла. Разработка хорошей модели для данных является центральной в байесовском выводе. В большинстве случаев модели только приближают истинный процесс и могут не учитывать определенные факторы, влияющие на данные. [2] В байесовском выводе вероятности могут быть назначены параметрам модели. Параметры могут быть представлены как случайные величины . Байесовский вывод использует теорему Байеса для обновления вероятностей после того, как получены или известны дополнительные доказательства. [2] [10]
Формулировка статистических моделей с использованием байесовской статистики имеет отличительную черту, требующую спецификации априорных распределений для любых неизвестных параметров. Действительно, параметры априорных распределений сами могут иметь априорные распределения, что приводит к байесовскому иерархическому моделированию , [11] [12] [13] также известному как многоуровневое моделирование. Особым случаем являются байесовские сети .
Для проведения байесовского статистического анализа лучшие практики обсуждаются ван де Скут и др. [14]
Для представления результатов байесовского статистического анализа в статье Джона К. Крушке, находящейся в открытом доступе, приведены руководящие принципы отчетности по байесовскому анализу (BARG) . [15]
Байесовский дизайн экспериментов включает концепцию, называемую «влияние предшествующих убеждений». Этот подход использует последовательные методы анализа для включения результатов более ранних экспериментов в дизайн следующего эксперимента. Это достигается путем обновления «убеждений» с помощью априорного и апостериорного распределения . Это позволяет дизайну экспериментов эффективно использовать ресурсы всех типов. Примером этого является задача о многоруком бандите .
Исследовательский анализ байесовских моделей является адаптацией или расширением исследовательского подхода к анализу данных к потребностям и особенностям байесовского моделирования. По словам Перси Диакониса: [16]
Исследовательский анализ данных стремится выявить структуру или простые описания в данных. Мы смотрим на числа или графики и пытаемся найти закономерности. Мы преследуем цели, предложенные фоновой информацией, воображением, воспринятыми закономерностями и опытом с другими анализами данных
Процесс вывода генерирует апостериорное распределение, которое играет центральную роль в байесовской статистике, вместе с другими распределениями, такими как апостериорное предсказательное распределение и априорное предсказательное распределение. Правильная визуализация, анализ и интерпретация этих распределений являются ключом к правильному ответу на вопросы, которые мотивируют процесс вывода. [17]
При работе с байесовскими моделями, помимо собственно вывода, необходимо решить ряд связанных задач:
Все эти задачи являются частью исследовательского анализа байесовских моделей, и их успешное выполнение является центральным для итеративного и интерактивного процесса моделирования. Эти задачи требуют как числовых, так и визуальных обобщений. [18] [19] [20]