Байесовский экспериментальный дизайн обеспечивает общую вероятностно-теоретическую структуру, из которой могут быть выведены другие теории экспериментального дизайна . Он основан на байесовском выводе для интерпретации наблюдений/данных, полученных в ходе эксперимента. Это позволяет учитывать как любые предыдущие знания о параметрах, которые должны быть определены, так и неопределенности в наблюдениях.
Теория байесовского экспериментального дизайна [1] в определенной степени основана на теории принятия оптимальных решений в условиях неопределенности . Целью при планировании эксперимента является максимизация ожидаемой полезности результата эксперимента. Полезность чаще всего определяется в терминах меры точности информации, предоставленной экспериментом (например, информации Шеннона или отрицательной дисперсии ) , но может также включать такие факторы, как финансовые затраты на проведение эксперимента. Каким будет оптимальный дизайн эксперимента, зависит от конкретного выбранного критерия полезности.
Если модель линейна, априорная функция плотности вероятности (PDF) однородна, а ошибки наблюдений распределены нормально , теория упрощается до классической теории оптимального экспериментального планирования .
В многочисленных публикациях по байесовскому экспериментальному плану (часто неявно) предполагается, что все апостериорные вероятности будут приблизительно нормальными. Это позволяет рассчитывать ожидаемую полезность с использованием линейной теории, усредняя по пространству параметров модели. [2] Однако следует проявлять осторожность при применении этого метода, поскольку приблизительную нормальность всех возможных апостериорных вероятностей трудно проверить, даже в случаях нормальных ошибок наблюдений и равномерной априорной вероятности.
Во многих случаях апостериорное распределение недоступно в закрытой форме и должно быть приближено с использованием численных методов. Наиболее распространенным подходом является использование методов Монте-Карло с цепями Маркова для генерации выборок из апостериорного распределения, которые затем могут быть использованы для приближения ожидаемой полезности.
Другой подход заключается в использовании вариационного байесовского приближения апостериора, которое часто можно вычислить в замкнутой форме. Преимущество этого подхода в том, что он вычислительно более эффективен, чем методы Монте-Карло, но недостаток в том, что приближение может быть не очень точным.
Некоторые авторы предложили подходы, которые используют апостериорное предсказательное распределение для оценки влияния новых измерений на неопределенность прогноза, [3] [4], в то время как другие предлагают максимизировать взаимную информацию между параметрами, прогнозами и потенциальными новыми экспериментами. [5]
При наличии вектора параметров для определения, априорной вероятности по этим параметрам и вероятности проведения наблюдения , заданных значений параметров и плана эксперимента , апостериорную вероятность можно рассчитать с помощью теоремы Байеса.
где — предельная плотность вероятности в пространстве наблюдения
Затем можно определить ожидаемую полезность эксперимента с дизайном.
где — некоторый действительный функционал апостериорной вероятности после проведения наблюдения с использованием экспериментального плана .
Полезность может быть определена как априорный и апостериорный прирост информации Шеннона.
Другая возможность — определить полезность как
расхождение Кульбака -Лейблера априорного распределения от апостериорного. Линдли (1956) отметил, что ожидаемая полезность тогда будет независимой от координат и может быть записана в двух формах
из которых последний может быть оценен без необходимости оценки индивидуальной апостериорной вероятности для всех возможных наблюдений . [6] Стоит отметить, что второй член во второй строке уравнения не будет зависеть от дизайна , пока не будет зависеть неопределенность наблюдений. С другой стороны, интеграл в первой форме постоянен для всех , поэтому, если цель состоит в том, чтобы выбрать дизайн с наибольшей полезностью, член вообще не нужно вычислять. Несколько авторов рассматривали численные методы оценки и оптимизации этого критерия. [7] [8] Обратите внимание, что
ожидаемый прирост информации представляет собой в точности взаимную информацию между параметром θ и наблюдением y . Пример байесовского дизайна для линейной динамической дискриминации модели приведен в работе Bania (2019). [9] Поскольку было трудно вычислить, его нижняя граница использовалась в качестве функции полезности. Затем нижняя граница максимизируется при ограничении энергии сигнала. Предложенный байесовский дизайн также сравнивался с классическим средним D-оптимальным дизайном. Было показано, что байесовский дизайн превосходит D-оптимальный дизайн.
Критерий Келли также описывает такую функцию полезности для игрока, стремящегося максимизировать прибыль, которая используется в теории азартных игр и информации ; ситуация Келли идентична предыдущей, только вместо эксперимента используется побочная информация или «частный провод».