stringtranslate.com

Гармоническое среднее значение p

Гармоническое среднее p -значение [1] [2] [3] (HMP) — это статистический метод решения проблемы множественных сравнений , который контролирует частоту ошибок по строгому семейству [2] (это утверждение было оспорено [4] ). Он улучшает мощность коррекции Бонферрони , выполняя комбинированные тесты, т. е. проверяя, являются ли группы p -значений статистически значимыми, как метод Фишера . [5] Однако он избегает ограничительного предположения о том, что p - значения независимы , в отличие от метода Фишера. [2] [3] Следовательно, он контролирует частоту ложноположительных результатов , когда тесты являются зависимыми, за счет меньшей мощности (т. е. более высокой частоты ложноотрицательных результатов ), когда тесты являются независимыми. [2] Помимо предоставления альтернативы таким подходам, как коррекция Бонферрони , которая контролирует строгую частоту ошибок по семейству , он также предоставляет альтернативу широко используемой процедуре Бенджамини-Хохберга (BH) для контроля менее строгой частоты ложных открытий . [6] Это связано с тем, что способность HMP обнаруживать значимые группы гипотез больше, чем способность BH обнаруживать значимые отдельные гипотезы. [2]

Существует две версии техники: (i) прямая интерпретация HMP как приблизительного p -значения и (ii) процедура преобразования HMP в асимптотически точное p-значение. Подход обеспечивает многоуровневую процедуру тестирования, в которой можно искать наименьшие группы p -значений, которые являются статистически значимыми.

Прямая интерпретация гармонического среднегоп-ценить

Взвешенное гармоническое среднее p -значений определяется как , где — веса, которые в сумме должны давать единицу, т. е . Могут быть выбраны равные веса, в этом случае .

В целом, интерпретация HMP напрямую как p -значения является антиконсервативной, что означает, что ложноположительный уровень выше ожидаемого. Однако, по мере того, как HMP становится меньше, при определенных предположениях расхождение уменьшается, так что прямая интерпретация значимости достигает ложноположительного уровня, близкого к подразумеваемому для достаточно малых значений (например, ). [2]

HMP никогда не бывает антиконсервативным более чем на фактор для малых или для больших . [3] Однако эти границы представляют собой наихудшие сценарии при произвольной зависимости, которые, вероятно, будут консервативными на практике. Вместо того, чтобы применять эти границы, асимптотически точные p -значения могут быть получены путем преобразования HMP.

Асимптотически точное гармоническое среднееп-стоимостная процедура

Обобщенная центральная предельная теорема показывает, что асимптотически точное p -значение, , может быть вычислено из HMP, , с использованием формулы [2] При условии соблюдения предположений обобщенной центральной предельной теоремы , это преобразованное p -значение становится точным, когда число тестов, , становится большим. Вычисление использует распределение Ландау , функция плотности которого может быть записана Тест реализуется командой пакета R; руководство доступно онлайн. p.hmpharmonicmeanp

Эквивалентно, можно сравнить HMP с таблицей критических значений (таблица 1). Таблица иллюстрирует, что чем меньше частота ложноположительных результатов и чем меньше количество тестов, тем ближе критическое значение к частоте ложноположительных результатов.

Многократное тестирование с помощью многоуровневой процедуры тестирования

Если HMP значим на каком-то уровне для группы p -значений, можно выполнить поиск по всем подмножествам p -значений для наименьшей значимой группы, сохраняя при этом частоту ошибок в сильном смысле семейства. [2] Формально это представляет собой процедуру закрытого тестирования . [7]

Когда мало (например, ), следующий многоуровневый тест, основанный на прямой интерпретации HMP, контролирует частоту ошибок в сильном смысле на уровне примерно

  1. Определим HMP любого подмножества p - значений как
  2. Отвергнуть нулевую гипотезу о том, что ни одно из p -значений в подмножестве не является значимым, если , где . (Напомним, что по определению . )


Асимптотически точная версия вышеприведенного заменяет на шаге 2 на , где дает количество p -значений, а не только тех, которые находятся в подмножестве . [8]

Поскольку прямая интерпретация HMP выполняется быстрее, можно использовать двухпроходную процедуру для определения подмножеств p- значений, которые, вероятно, будут значимыми с использованием прямой интерпретации, при условии подтверждения с помощью асимптотически точной формулы.

Свойства HMP

HMP имеет ряд свойств, которые вытекают из обобщенной центральной предельной теоремы. [2] Это:

Когда HMP незначим, то незначим ни один из подмножеств составляющих тестов. И наоборот, когда многоуровневый тест считает подмножество p -значений значимым, HMP для всех объединенных p -значений, скорее всего, будет значимым; это определенно, когда HMP интерпретируется напрямую. Когда цель состоит в оценке значимости отдельных p -значений, так что объединенные тесты, касающиеся групп p - значений, не представляют интереса, HMP эквивалентен процедуре Бонферрони , но подчиняется более строгому порогу значимости (таблица 1).

HMP предполагает, что отдельные p -значения имеют (не обязательно независимые) стандартные равномерные распределения, когда их нулевые гипотезы верны. Поэтому большое количество недостаточно мощных тестов может нанести вред мощности HMP.

Хотя выбор весов не важен для валидности HMP при нулевой гипотезе, веса влияют на мощность процедуры. Дополнительные методы §5C из [2] и онлайн-руководство рассматривают этот вопрос более подробно.

Байесовские интерпретации HMP

HMP был задуман по аналогии с усреднением байесовской модели и может быть интерпретирован как обратно пропорциональный усредненному по модели фактору Байеса при объединении p -значений из тестов отношения правдоподобия . [1] [2]

Правило среднего гармонического значения

IJ Good сообщил об эмпирической связи между фактором Байеса и p -значением из теста отношения правдоподобия. [1] Для нулевой гипотезы, вложенной в более общую альтернативную гипотезу, он заметил, что часто, где обозначает фактор Байеса в пользу против Экстраполяции , он предложил эмпирическое правило, в котором HMP принимается обратно пропорциональным усредненному по модели фактору Байеса для набора тестов с общей нулевой гипотезой: Для Гуда его эмпирическое правило поддерживало взаимозаменяемость байесовского и классического подходов к проверке гипотез. [9] [10] [11] [12] [13]

Байесовская калибровкап-ценности

Если распределения p -значений при альтернативных гипотезах следуют бета-распределениям с параметрами , форма, рассмотренная Селлке, Байарри и Бергером [14], то обратная пропорциональность между усредненным по модели фактором Байеса и HMP может быть формализована как [2] [15] где

Приближение лучше всего работает для достаточно мощных тестов ( ).

Гармоническое среднееп-значение как ограничение на коэффициент Байеса

Для тестов отношения правдоподобия с ровно двумя степенями свободы теорема Уилкса подразумевает, что , где — максимизированное отношение правдоподобия в пользу альтернативной гипотезы и, следовательно , , где — взвешенное среднее максимизированное отношение правдоподобия, использующее веса Поскольку — верхняя граница фактора Байеса, , то — верхняя граница усредненного по модели фактора Байеса: В то время как эквивалентность сохраняется только для двух степеней свободы, связь между и и, следовательно, ведет себя аналогично для других степеней свободы. [2]

При предположении, что распределения p -значений в альтернативных гипотезах следуют бета-распределениям с параметрами и что веса HMP обеспечивают более точную верхнюю границу усредненного по модели фактора Байеса: результат, который снова воспроизводит обратную пропорциональность эмпирического соотношения Гуда. [16]

Ссылки

  1. ^ abc Good, IJ (1958). «Тесты значимости параллельно и последовательно». Журнал Американской статистической ассоциации . 53 (284): 799–813. doi :10.1080/01621459.1958.10501480. JSTOR  2281953.
  2. ^ abcdefghijklmn Уилсон, DJ (2019). "Гармоническое среднее значение p для объединения зависимых тестов". Труды Национальной академии наук США . 116 (4): 1195–1200. doi : 10.1073/pnas.1814092116 . PMC 6347718. PMID  30610179 . 
  3. ^ abc Вовк, Владимир ; Ван, Руоду (25 апреля 2019 г.). "Объединение p-значений с помощью усреднения" (PDF) . Алгоритмическое обучение в случайном мире .
  4. ^ Goeman, Jelle J.; Rosenblatt, Jonathan D.; Nichols, Thomas E. (2019-11-19). «Гармоническое среднее значение p: сильный контроль против слабого и предположение о независимости». Труды Национальной академии наук . 116 (47): 23382–23383. doi : 10.1073/pnas.1909339116 . ISSN  0027-8424. PMC 6876242. PMID 31662466  . 
  5. ^ Фишер, РА (1934). Статистические методы для научных работников (5-е изд.). Эдинбург, Великобритания: Оливер и Бойд.
  6. ^ Benjamini Y, Hochberg Y (1995). «Контроль частоты ложных открытий: практический и мощный подход к множественному тестированию». Журнал Королевского статистического общества. Серия B (Методологическая) . 57 (1): 289–300. doi :10.1111/j.2517-6161.1995.tb02031.x. JSTOR  2346101.
  7. ^ Маркус Р., Эрик П., Габриэль КР. (1976). «О закрытых процедурах тестирования с особым упором на упорядоченный дисперсионный анализ». Biometrika . 63 (3): 655–660. doi :10.1093/biomet/63.3.655. JSTOR  2335748.
  8. ^ Уилсон, Дэниел Дж. (17 августа 2019 г.). «Обновленная поправка к «Гармоническому среднему значению p для объединения независимых тестов»» (PDF) .
  9. ^ Good, IJ (1984). "C192. Один хвост против двух хвостов и правило гармонического среднего". Журнал статистических вычислений и моделирования . 19 (2): 174–176. doi :10.1080/00949658408810727.
  10. ^ Good, IJ (1984). "C193. Парные и непарные сравнения и правило гармонического среднего". Журнал статистических вычислений и моделирования . 19 (2): 176–177. doi :10.1080/00949658408810728.
  11. ^ Good, IJ (1984). "C213. Уточнение правила гармонического среднего для объединения тестов "параллельно"". Журнал статистических вычислений и моделирования . 20 (2): 173–176. doi :10.1080/00949658408810770.
  12. ^ Good, IJ (1984). "C214. Правило гармонического среднего: некоторые классы приложений". Журнал статистических вычислений и моделирования . 20 (2): 176–179. doi :10.1080/00949658408810771.
  13. ^ Хорошо, Ирвинг Джон. (2009). Хорошее мышление: основы вероятности и ее применения . Dover Publications. ISBN 9780486474380. OCLC  319491702.
  14. ^ Sellke, Thomas; Bayarri, M. J; Berger, James O (2001). «Калибровка значений p для проверки точных нулевых гипотез». The American Statistician . 55 (1): 62–71. doi :10.1198/000313001300339950. ISSN  0003-1305. S2CID  396772.
  15. ^ Уилсон, DJ (2019). «Ответ на Held: Когда гармоническое среднее значение p является фактором Байеса?» (PDF) . Труды Национальной академии наук США . 116 (13): 5857–5858. doi : 10.1073/pnas.1902157116 . PMC 6442550 . PMID  30890643. 
  16. ^ Held, L (2019). «О байесовской интерпретации гармонического среднего p-значения». Труды Национальной академии наук США . 116 (13): 5855–5856. doi : 10.1073/pnas.1900671116 . PMC 6442579. PMID  30890644 .