Байесовское иерархическое моделирование — это статистическая модель , записанная на нескольких уровнях (иерархическая форма), которая оценивает параметры апостериорного распределения с использованием байесовского метода . [1] Подмодели объединяются для формирования иерархической модели, а теорема Байеса используется для их интеграции с наблюдаемыми данными и учета всей присутствующей неопределенности. Результатом этой интеграции является апостериорное распределение, также известное как обновленная оценка вероятности, поскольку приобретаются дополнительные доказательства априорного распределения .
Частотная статистика может давать выводы, на первый взгляд несовместимые с выводами, предлагаемыми байесовской статистикой, из-за байесовской трактовки параметров как случайных величин и использования субъективной информации при установлении предположений относительно этих параметров. [2] Поскольку подходы отвечают на разные вопросы, формальные результаты технически не противоречат друг другу, но два подхода расходятся во мнениях относительно того, какой ответ имеет отношение к конкретным приложениям. Байесовцы утверждают, что релевантную информацию относительно принятия решений и обновления убеждений нельзя игнорировать и что иерархическое моделирование может перевесить классические методы в приложениях, где респонденты предоставляют множественные данные наблюдений. Более того, модель оказалась надежной , а апостериорное распределение менее чувствительно к более гибким иерархическим априорным данным.
Иерархическое моделирование используется, когда информация доступна на нескольких различных уровнях единиц наблюдения. Например, в эпидемиологическом моделировании для описания траекторий заражения для нескольких стран единицами наблюдения являются страны, и каждая страна имеет свой собственный временной профиль ежедневных случаев заражения. [3] В анализе кривой спада для описания кривой спада добычи нефти или газа для нескольких скважин единицами наблюдения являются нефтяные или газовые скважины в регионе резервуара, и каждая скважина имеет свой собственный временной профиль темпов добычи нефти или газа (обычно, баррелей в месяц). [4] Структура данных для иерархического моделирования сохраняет вложенную структуру данных. Иерархическая форма анализа и организации помогает в понимании многопараметрических проблем, а также играет важную роль в разработке вычислительных стратегий. [5]
Статистические методы и модели обычно включают в себя несколько параметров, которые можно считать связанными или связанными таким образом, что проблема подразумевает зависимость совместной вероятностной модели от этих параметров. [6] Индивидуальные степени убеждения, выраженные в форме вероятностей, сопровождаются неопределенностью. [7] Среди этого есть изменение степеней убеждения с течением времени. Как заявили профессор Хосе М. Бернардо и профессор Адриан Ф. Смит , «Действительность процесса обучения заключается в эволюции индивидуальных и субъективных убеждений о реальности». Эти субъективные вероятности более непосредственно вовлечены в разум, чем физические вероятности. [7] Следовательно, именно с этой потребностью в обновлении убеждений байесовцы сформулировали альтернативную статистическую модель, которая учитывает предшествующее возникновение определенного события. [8]
Предполагаемое возникновение события реального мира обычно изменяет предпочтения между определенными вариантами. Это делается путем изменения степени убежденности, придаваемой индивидуумом событиям, определяющим варианты. [9]
Предположим, что в исследовании эффективности лечения сердечных заболеваний у пациентов в больнице j имеется вероятность выживания , причем вероятность выживания будет обновлена с наступлением y , события, при котором создается спорная сыворотка, которая, как полагают некоторые, увеличивает выживаемость сердечных пациентов.
Для того чтобы сделать обновленные утверждения о вероятности относительно , учитывая возникновение события y , мы должны начать с модели, обеспечивающей совместное распределение вероятностей для и y . Это можно записать как произведение двух распределений, которые часто называют априорным распределением и распределением выборки соответственно:
Используя основное свойство условной вероятности , апостериорное распределение даст:
Это уравнение, показывающее связь между условной вероятностью и отдельными событиями, известно как теорема Байеса. Это простое выражение инкапсулирует техническое ядро байесовского вывода, который направлен на включение обновленного убеждения, , в соответствующие и решаемые способы. [9]
Обычной отправной точкой статистического анализа является предположение, что значения n являются взаимозаменяемыми. Если нет информации – кроме данных y – для различения любого из ' от любого другого, и невозможно упорядочить или сгруппировать параметры, следует предположить симметрию среди параметров в их предыдущем распределении. [10] Эта симметрия вероятностно представлена взаимозаменяемостью. Как правило, полезно и уместно моделировать данные из взаимозаменяемого распределения как независимо и одинаково распределенные , заданные некоторым неизвестным вектором параметров , с распределением .
Для фиксированного числа n набор является заменяемым, если совместная вероятность инвариантна относительно перестановок индексов. То есть, для каждой перестановки или (1, 2, …, n ), [11]
Ниже приведен пример, допускающий обмен, но не независимый и идентичный (iid): Рассмотрим урну с красным и синим шарами внутри, с вероятностью вытягивания любого из них. Шары вытягиваются без возвращения, т. е. после того, как из n шаров вытащен один, для следующего вытягивания останется n − 1 шаров.
Поскольку вероятность выбора красного шара при первом извлечении и синего шара при втором извлечении равна вероятности выбора синего шара при первом извлечении и красного шара при втором извлечении, обе из которых равны 1/2 (т.е. ), то и являются взаимозаменяемыми.
Но вероятность выбора красного шара во втором броске, учитывая, что красный шар уже был выбран в первом броске, равна 0 и не равна вероятности того, что красный шар будет выбран во втором броске, которая равна 1/2 (т.е. ). Таким образом, и не являются независимыми.
Если они независимы и одинаково распределены, то они взаимозаменяемы, но обратное не обязательно верно. [12]
Бесконечная заменимость — это свойство, при котором каждое конечное подмножество бесконечной последовательности является заменимым. То есть, для любого n последовательность является заменимой. [12]
Байесовское иерархическое моделирование использует две важные концепции при выводе апостериорного распределения [1] , а именно:
Предположим, что случайная величина Y следует нормальному распределению с параметром в качестве среднего значения и 1 в качестве дисперсии , то есть . Отношение тильды можно прочитать как «имеет распределение» или «распределено как». Предположим также, что параметр имеет распределение, заданное нормальным распределением со средним значением и дисперсией 1, то есть . Кроме того, следует другому распределению, заданному, например, стандартным нормальным распределением , . Параметр называется гиперпараметром, в то время как его распределение, заданное является примером гипераприорного распределения. Обозначение распределения Y изменяется по мере добавления другого параметра, то есть . Если есть еще один этап, скажем, следует другому нормальному распределению со средним значением и дисперсией , то есть , и также могут называться гиперпараметрами, в то время как их распределения также являются гипераприорными распределениями. [6]
Пусть будет наблюдением и параметром, управляющим процессом генерации данных для . Предположим далее, что параметры генерируются взаимозаменяемо из общей популяции, с распределением, управляемым гиперпараметром . Байесовская иерархическая модель содержит следующие этапы:
Вероятность, как видно на этапе I , равна , с ее априорным распределением. Обратите внимание, что вероятность зависит только от .
Предыдущее распределение на этапе I можно разбить на:
Имея в качестве гиперпараметра с гипераприорным распределением, .
Таким образом, апостериорное распределение пропорционально:
Чтобы проиллюстрировать это, рассмотрим пример: учитель хочет оценить, насколько хорошо ученик сдал SAT . Учитель использует информацию об оценках ученика в старшей школе и текущем среднем балле (GPA), чтобы получить оценку. Текущий средний балл ученика, обозначенный как , имеет вероятность, заданную некоторой функцией вероятности с параметром , то есть . Этот параметр - балл SAT ученика. Балл SAT рассматривается как выборка из общего распределения популяции, индексированного другим параметром , который является баллом ученика в старшей школе (первокурсник, второкурсник, третий или последний). [14] То есть, . Более того, гиперпараметр следует своему собственному распределению, заданному , гиперприором. Чтобы найти балл SAT с учетом информации о среднем балле,
Вся информация в задаче будет использована для решения апостериорного распределения. Вместо решения только с использованием априорного распределения и функции правдоподобия, использование гиперприоров дает больше информации для создания более точных убеждений в поведении параметра. [15]
В общем случае совместное апостериорное распределение интереса в двухэтапных иерархических моделях выглядит следующим образом:
Для трехэтапных иерархических моделей апостериорное распределение определяется по формуле:
Структура байесовского иерархического моделирования часто используется в различных приложениях. В частности, байесовские нелинейные модели смешанных эффектов недавно [ когда? ] получили значительное внимание. [ кем? ] Базовая версия байесовских нелинейных моделей смешанных эффектов представлена в виде следующей трехэтапной:
Этап 1: Модель индивидуального уровня
Этап 2: Модель населения
Этап 3: Предшествующий
Здесь обозначает непрерывную реакцию -го субъекта в момент времени , а - -й ковариат -го субъекта. Параметры, участвующие в модели, записаны греческими буквами. - известная функция, параметризованная -мерным вектором . Обычно - `нелинейная' функция, описывающая временную траекторию индивидуумов. В модели и описывают внутрииндивидуальную и межиндивидуальную изменчивость соответственно. Если этап 3: априорный не рассматривается, то модель сводится к частотной нелинейной модели со смешанными эффектами.
Центральной задачей при применении байесовских нелинейных моделей смешанного эффекта является оценка апостериорной плотности:
Панель справа отображает байесовский исследовательский цикл с использованием байесовской нелинейной модели смешанных эффектов. [16] Исследовательский цикл с использованием байесовской нелинейной модели смешанных эффектов состоит из двух этапов: (a) стандартный исследовательский цикл и (b) байесовский рабочий процесс. Стандартный исследовательский цикл включает обзор литературы, определение проблемы и указание исследовательского вопроса и гипотезы. Байесовский рабочий процесс состоит из трех подэтапов: (b)–(i) формализация априорных распределений на основе фоновых знаний и априорного выявления; (b)–(ii) определение функции правдоподобия на основе нелинейной функции ; и (b)–(iii) выполнение апостериорного вывода. Полученный апостериорный вывод может быть использован для начала нового исследовательского цикла.