Ложноположительный результат — это ошибка в бинарной классификации , при которой результат теста неверно указывает на наличие состояния (например, заболевания, когда его нет), тогда как ложноотрицательный результат — это противоположная ошибка, при которой результат теста неверно указывает на отсутствие состояния, когда оно на самом деле есть. Это два вида ошибок в бинарном тесте , в отличие от двух видов правильного результата (aистинно положительный иистинно отрицательный ). Они также известны в медицине какложноположительный(илиложноотрицательный)диагноз, а встатистической классификациикакложноположительная(илиложноотрицательная)ошибка.[1]
В статистическом тестировании гипотез аналогичные концепции известны как ошибки типа I и типа II , где положительный результат соответствует отклонению нулевой гипотезы , а отрицательный результат соответствует не отклонению нулевой гипотезы. Термины часто используются взаимозаменяемо, но существуют различия в деталях и интерпретации из-за различий между медицинским тестированием и статистическим тестированием гипотез.
Ложноположительная ошибка , или ложноположительный результат , это результат, который указывает на то, что данное состояние существует, когда на самом деле его нет. Например, тест на беременность, который показывает, что женщина беременна, когда она не беременна, или осуждение невиновного человека.
Ложноположительная ошибка — это ошибка типа I , когда тест проверяет одно условие и ошибочно выдает утвердительное (положительное) решение. Однако важно различать частоту ошибок типа 1 и вероятность того, что положительный результат окажется ложным. Последнее известно как риск ложного положительного результата (см. Неоднозначность в определении частоты ложных положительных результатов ниже). [2]
Ложноотрицательная ошибка , или ложноотрицательный результат , это результат теста, который ошибочно указывает на то, что условие не выполняется. Например, когда тест на беременность показывает, что женщина не беременна, но она беременна, или когда человек, виновный в преступлении, оправдан, это ложноотрицательные результаты. Условие «женщина беременна» или «человек виновен» выполняется, но тест (тест на беременность или судебное разбирательство) не может распознать это условие и ошибочно решает, что человек не беременен или невиновен.
Ложноотрицательная ошибка — это ошибка II типа , возникающая в тесте, где проверяется одно условие, и результат теста оказывается ошибочным, то есть условие отсутствует. [3]
Коэффициент ложноположительных результатов (FPR) — это доля всех отрицательных результатов, которые все же дают положительные результаты теста, т. е. условная вероятность положительного результата теста при наличии события, которого не было.
Ложноположительный процент равен уровню значимости . Специфичность теста равна 1 минус ложноположительный процент.
В статистическом тестировании гипотез эта дробь обозначается греческой буквой α , а 1 − α определяется как специфичность теста. Увеличение специфичности теста снижает вероятность ошибок типа I, но может повысить вероятность ошибок типа II (ложноотрицательных результатов, которые отвергают альтернативную гипотезу, когда она верна). [a]
Дополнительно,Ложноотрицательный показатель (ЛОП) — это доля положительных результатов, дающих отрицательные результаты теста, т. е. условная вероятность отрицательного результата теста при условии, что искомое состояние присутствует.
В статистической проверке гипотез эта дробь обозначается буквой β . « Мощность » (или « чувствительность ») теста равна 1 − β .
Термин «коэффициент ложного обнаружения» (FDR) был использован Колкухоуном (2014) [4] для обозначения вероятности того, что «значимый» результат был ложноположительным. Позже Колкухоун (2017) [2] использовал термин «риск ложного положительного результата» (FPR) для той же величины, чтобы избежать путаницы с термином FDR, который используют люди, работающие над множественными сравнениями . Поправки для множественных сравнений направлены только на исправление коэффициента ошибок типа I, поэтому результатом является (исправленное) p -значение . Таким образом, они подвержены той же неправильной интерпретации, что и любое другое p -значение. Риск ложного положительного результата всегда выше, часто намного выше, чем p -значение. [4] [2]
Смешение этих двух идей, ошибка транспонированного условного , нанесло много вреда. [5] Из-за неоднозначности обозначений в этой области важно смотреть на определение в каждой статье. Опасности опоры на p -значения были подчеркнуты в Колкухоуне (2017) [2] , где было указано, что даже наблюдение p = 0,001 не обязательно является сильным доказательством против нулевой гипотезы. Несмотря на то, что отношение правдоподобия в пользу альтернативной гипотезы по сравнению с нулевой близко к 100, если бы гипотеза была неправдоподобной, с априорной вероятностью реального эффекта 0,1, даже наблюдение p = 0,001 имело бы ложноположительный уровень 8 процентов. Он даже не достиг бы уровня 5 процентов. Как следствие, было рекомендовано [2] [6] , чтобы каждое p -значение сопровождалось априорной вероятностью наличия реального эффекта, которую необходимо было бы предположить, чтобы достичь ложноположительного риска 5%. Например, если мы наблюдаем p = 0,05 в одном эксперименте, то нам нужно быть на 87% уверенными в наличии реального эффекта до проведения эксперимента, чтобы достичь ложноположительного риска в 5%.
В статье « Характеристика работы приемника » рассматриваются параметры статистической обработки сигналов на основе соотношений ошибок различных типов.