Ложноположительный процент

В статистике при выполнении множественных сравнений отношение ложных положительных результатов (также известное как отношение выпадений или ложных тревог) представляет собой вероятность ложного отклонения нулевой гипотезы для конкретного теста . Показатель ложных положительных результатов рассчитывается как отношение между числом отрицательных событий, ошибочно классифицированных как положительные ( ложные положительные результаты ), и общим числом фактических отрицательных событий (независимо от классификации).

Коэффициент ложных срабатываний (или «коэффициент ложной тревоги») обычно относится к ожидаемому показателю ложноположительного результата .

Определение

Ложноположительный процент составляет ${\boldsymbol {\mathrm {FPR} }}={\frac {\mathrm {FP} {\mathrm {FP} +\mathrm {TN} }}$

где — количество ложных положительных результатов, — количество истинно отрицательных результатов, — общее количество истинно отрицательных результатов. $\mathrm {FP}$ $\mathrm {TN}$ $N=\mathrm {FP} +\mathrm {TN}$

Уровень значимости, используемый для проверки каждой гипотезы, устанавливается на основе формы вывода ( одновременный вывод или выборочный вывод ) и его подтверждающих критериев (например, FWER или FDR ), которые были заранее определены исследователем.

При выполнении множественных сравнений в статистической структуре, такой как выше, отношение ложных положительных результатов (также известное как отношение ложных тревог , в отличие от отношения ложных положительных результатов / коэффициента ложных тревог ) обычно относится к вероятности ложного отклонения нулевой гипотезы для конкретного теста . Используя предложенную здесь терминологию, это просто . $В/м_{0}$

Поскольку V является случайной величиной и является константой ( ), отношение ложных срабатываний также является случайной величиной, изменяющейся в диапазоне от 0 до 1. Коэффициент ложных срабатываний (или «коэффициент ложной тревоги») обычно относится к ожиданию отношения ложных срабатываний , выраженному как . $m_{0}$ $V\leq m_{0}$
$E(В/м_{0})$

Стоит отметить, что два определения («false positive ratio» / «false positive rate») в некоторой степени взаимозаменяемы. Например, в указанной статье ^[1] выступает в качестве «rate» ложноположительных результатов, а не в качестве «ratio». $В/м_{0}$

Классификация множественных проверок гипотез

Следующая таблица определяет возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть число m нулевых гипотез, обозначенных как: $H 1, H 2, ..., H m .$ Используя статистический тест , мы отвергаем нулевую гипотезу, если тест объявлен значимым. Мы не отвергаем нулевую гипотезу, если тест незначим. Суммирование каждого типа результата по всем H _i дает следующие случайные величины:

$m$ — общее число проверенных гипотез
$m_{0}$ это число истинных нулевых гипотез , неизвестный параметр
$м-м_{0}$ это число истинных альтернативных гипотез
$V$ — количество ложных срабатываний (ошибок типа I) (также называемых «ложными открытиями»)
$S$ — количество истинно положительных результатов (также называемых «истинными открытиями»).
$T$ — количество ложноотрицательных результатов (ошибка II типа)
$U$ — количество истинно отрицательных результатов
$R=V+S$ это количество отклоненных нулевых гипотез (также называемых «открытиями», истинными или ложными)

В $m$ гипотезах, проверка которых является истинной нулевой гипотезой, $R$ является наблюдаемой случайной величиной, а $S$ , $T$ , $U$ и $V$ являются ненаблюдаемыми случайными величинами . $m_{0}$

Сравнение с другими показателями ошибок

Хотя частота ложноположительных результатов математически равна частоте ошибок первого типа , она рассматривается как отдельный термин по следующим причинам: ^{[ необходима ссылка ]}

Частота ошибок типа I часто связана с априорной установкой исследователем уровня значимости : уровень значимости представляет собой приемлемую частоту ошибок , учитывая, что все нулевые гипотезы верны (гипотеза «глобальной нулевой»). Выбор уровня значимости может быть, таким образом, несколько произвольным (т. е. установка 10% (0,1), 5% (0,05), 1% (0,01) и т. д.)

В противоположность этому, частота ложных положительных результатов связана с пост-априорным результатом, который представляет собой ожидаемое число ложных положительных результатов, деленное на общее число гипотез при реальной комбинации истинных и неистинных нулевых гипотез (без учета «глобальной нулевой» гипотезы). Поскольку частота ложных положительных результатов является параметром, который не контролируется исследователем, ее нельзя отождествить с уровнем значимости.

Более того, термин «ложноположительный результат» обычно используется в отношении медицинского теста или диагностического устройства (например, «ложноположительный результат определенного диагностического устройства составляет 1%»), в то время как термин «ошибка I типа» связан со статистическими тестами, где значение слова «положительный» не столь ясно (например, «ошибка I типа теста составляет 1%»).

Ложноположительный уровень также не следует путать с семейным уровнем ошибок , который определяется как . По мере роста числа тестов семейный уровень ошибок обычно стремится к 1, в то время как ложноположительный уровень остается фиксированным. ${\boldsymbol {\mathrm {FWER}}}=\Pr(V\geq 1)\,$

Наконец, важно отметить существенную разницу между показателем ложноположительных результатов и показателем ложных результатов : в то время как первый определяется как , второй определяется как . $E(В/м_{0})$ $E(V/R)$

Смотрите также

Ссылки

^ Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение частоты ложноположительных результатов в программе скрининга инфекций вируса иммунодефицита человека». The New England Journal of Medicine . 319 (15): 961–964. doi :10.1056/NEJM198810133191501. PMID 3419477.