В теории принятия решений ожидаемая ценность выборочной информации ( EVSI ) — это ожидаемое увеличение полезности, которое лицо, принимающее решение, может получить от получения доступа к выборке дополнительных наблюдений до принятия решения. Дополнительная информация, полученная из выборки, может позволить им принять более обоснованное и, следовательно, лучшее решение, что приведет к увеличению ожидаемой полезности. EVSI пытается оценить, каким будет это улучшение, прежде чем увидеть фактические выборочные данные; следовательно, EVSI — это форма того, что известно как препостериорный анализ . Использование EVSI в теории принятия решений было популяризировано Робертом Шлайфером и Говардом Райффой в 1960-х годах. [1]
Позволять
Это распространено (но не обязательно) в сценариях EVSI для , и , то есть каждое наблюдение представляет собой беспристрастное показание датчика базового состояния , причем каждое показание датчика является независимым и одинаково распределенным.
Полезность оптимального решения, основанного только на априорной информации, без дополнительных наблюдений, определяется по формуле
Если бы лицо, принимающее решение, могло получить доступ к одному образцу, оптимальная апостериорная полезность была бы
где получается из правила Байеса :
Поскольку они не знают, какой образец был бы получен на самом деле, если бы он был получен, они должны усреднить все возможные образцы, чтобы получить ожидаемую полезность для данного образца:
Ожидаемое значение выборочной информации затем определяется как
Аналитически выполнить интеграцию по пространству возможных наблюдений в E[U|SI] редко возможно, поэтому для вычисления EVSI обычно требуется моделирование Монте-Карло . Метод включает случайное моделирование выборки, , а затем ее использование для вычисления апостериорной и максимизирующей полезности на основе . Затем весь этот процесс повторяется много раз, для получения выборки Монте-Карло оптимальных полезностей. Они усредняются для получения ожидаемой полезности с учетом гипотетической выборки.
Регулирующий орган должен решить, одобрять ли новый метод лечения. Перед принятием окончательного решения об одобрении/отклонении они спрашивают, какова будет ценность проведения дальнейшего исследования на субъектах. На этот вопрос отвечает EVSI.
На диаграмме показана диаграмма влияния для расчета EVSI в этом примере.
Модель классифицирует результат по любому заданному предмету по одной из пяти категорий:
И для каждого из этих результатов назначается полезность, равная оценочной эквивалентной пациенту денежной стоимости результата.
Состояние решения в этом примере — это вектор из пяти чисел от 0 до 1, которые в сумме дают 1, что дает долю будущих пациентов, которые испытают каждый из пяти возможных результатов. Например, состояние обозначает случай, когда 5% пациентов излечиваются, 60% чувствуют себя лучше, 20% считают лечение неэффективным, 10% испытывают легкие побочные эффекты и 5% испытывают опасные побочные эффекты.
Априорное распределение кодируется с использованием распределения Дирихле , требующего пяти чисел (которые в сумме не равны 1), относительные значения которых отражают ожидаемую относительную пропорцию каждого результата, а сумма которых кодирует силу этого априорного убеждения. На диаграмме параметры распределения Дирихле содержатся в переменной dirichlet alpha prior , в то время как само априорное распределение находится в случайной переменной Prior . График плотности вероятности маргиналов показан здесь:
В переменной шанса Trial data данные испытаний моделируются как выборка Монте-Карло из мультиномиального распределения . Например, когда Trial_size=100, каждая выборка Монте-Карло Trial_data содержит вектор, который в сумме равен 100, показывая количество субъектов в моделируемом исследовании, которые испытали каждый из пяти возможных результатов. Следующая таблица результатов отображает первые 8 моделируемых результатов испытаний:
Объединение этих данных испытаний с априорным распределением Дирихле требует только добавления частот исходов к априорным значениям альфа Дирихле, что приводит к апостериорному распределению Дирихле для каждого смоделированного испытания. Для каждого из них решение об одобрении принимается на основе того, является ли средняя полезность положительной, и с использованием полезности, равной нулю, когда лечение не одобрено, получается апостериорная полезность . Повторяя вычисления для диапазона возможных размеров испытаний, получаем EVSI для каждого возможного размера испытания-кандидата, как показано на этом графике:
Ожидаемое значение выборочной информации (EVSI) является ослаблением метрики ожидаемого значения полной информации (EVPI), которая кодирует увеличение полезности, которое было бы получено, если бы кто-то узнал истинное базовое состояние. По сути, EVPI указывает на значение полной информации, в то время как EVSI указывает на значение некоторой ограниченной и неполной информации.
Ожидаемое значение включения неопределенности (EVIU) сравнивает ценность моделирования неопределенной информации с моделированием ситуации без учета неопределенности. Поскольку влияние неопределенности на вычисляемые результаты часто анализируется с использованием методов Монте-Карло , EVIU, по-видимому, очень похоже на ценность проведения анализа с использованием выборки Монте-Карло , что очень похоже по формулировке на понятие, зафиксированное в EVSI. Однако EVSI и EVIU довольно различны — заметное различие между способом, которым EVSI использует байесовское обновление для включения смоделированной выборки.