stringtranslate.com

Ложноположительные и ложноотрицательные результаты

Ложноположительный результат — это ошибка бинарной классификации , при которой результат теста неправильно указывает на наличие заболевания (например, заболевания, когда заболевания нет), а ложноотрицательный результат противоположная ошибка, когда результат теста неправильно указывает на отсутствие условия, когда оно действительно присутствует. Это два вида ошибок в двоичном тесте , в отличие от двух видов правильных результатов (настоящий позитив иистинно отрицательный ). В медицине они известны также какложноположительные(илиложноотрицательные)диагнозы, а встатистической классификации— какложноположительные(илиложноотрицательные)ошибки.[1]

При проверке статистической гипотезы аналогичные концепции известны как ошибки типа I и типа II , где положительный результат соответствует отклонению нулевой гипотезы , а отрицательный результат соответствует не отклонению нулевой гипотезы. Эти термины часто используются как взаимозаменяемые, но существуют различия в деталях и интерпретации из-за различий между медицинским тестированием и проверкой статистических гипотез.

Ложноположительная ошибка

Ложноположительная ошибка или ложноположительный результат — это результат, указывающий на то, что данное условие существует, хотя его нет. Например, тест на беременность, показывающий, что женщина беременна, хотя на самом деле это не так, или осуждение невиновного человека.

Ложноположительная ошибка — это ошибка типа I , когда тест проверяет одно условие и ошибочно дает утвердительное (положительное) решение. Однако важно различать частоту ошибок первого рода и вероятность ложного положительного результата. Последний известен как риск ложноположительных результатов (см. «Неоднозначность в определении уровня ложноположительных результатов» ниже). [2]

Ложноотрицательная ошибка

Ложноотрицательная ошибка или ложноотрицательный результат — это результат теста, который ошибочно указывает на то, что условие не выполняется. Например, когда тест на беременность показывает, что женщина не беременна, но она беременна, или когда лицо, виновное в совершении преступления, оправдано, это ложноотрицательный результат. Условие «женщина беременна» или «человек виновен» сохраняется, но тест (тест на беременность или судебное разбирательство) не учитывает это условие и ошибочно решает, что человек не беременен или не виновен.

Ложноотрицательная ошибка — это ошибка II рода, возникающая в тесте, в котором проверяется одно условие, а результат теста ошибочен, то есть это условие отсутствует. [3]

Связанные термины

Ложноположительные и ложноотрицательные показатели

Уровень ложноположительных результатов (FPR) — это доля всех отрицательных результатов, которые все же дают положительные результаты теста, т. е. условная вероятность положительного результата теста с учетом события, которого не было.

Уровень ложноположительных результатов равен уровню значимости . Специфичность теста равна 1 минус процент ложноположительных результатов.

При проверке статистических гипотез этой дроби присваивается греческая буква α , а 1 −  α определяется как специфичность теста. Повышение специфичности теста снижает вероятность ошибок типа I, но может повысить вероятность ошибок типа II (ложноотрицательные результаты, которые отвергают альтернативную гипотезу, когда она верна). [а]

Кроме того,Уровень ложноотрицательных результатов (FNR) — это доля положительных результатов, которые приводят к отрицательным результатам теста, т. е. условная вероятность отрицательного результата теста при наличии искомого состояния.

При проверке статистических гипотез этой дроби присваивается буква β . « Мощность » (или « чувствительность ») теста равна 1 −  β .

Неясность в определении уровня ложноположительных результатов

Термин «коэффициент ложного обнаружения» (FDR) использовался Colquhoun (2014) [4] для обозначения вероятности того, что «значимый» результат был ложноположительным. Позже Колкухун (2017) [2] использовал термин «ложноположительный риск» (FPR) для той же величины, чтобы избежать путаницы с термином FDR, используемым людьми, работающими над множественными сравнениями . Коррекции для множественных сравнений направлены только на исправление частоты ошибок типа I, поэтому результатом является (скорректированное) p -значение . Таким образом, они подвержены той же неверной интерпретации, что и любое другое значение p . Риск ложноположительного результата всегда выше, часто намного выше, чем значение p . [4] [2]

Смешение этих двух идей, ошибка транспонированного условного предложения , причинила много вреда. [5] Из-за неоднозначности обозначений в этой области важно смотреть на определение в каждой статье. Опасность зависимости от значений p была подчеркнута в Colquhoun (2017) [2] , указав, что даже наблюдение p = 0,001 не обязательно является убедительным доказательством против нулевой гипотезы. Несмотря на то, что отношение правдоподобия в пользу альтернативной гипотезы по сравнению с нулевой близко к 100, если бы гипотеза была неправдоподобной, а априорная вероятность реального эффекта была бы равна 0,1, даже наблюдение p = 0,001 имело бы ложноположительный результат. ставка 8 процентов. Он не достигнет даже 5-процентного уровня. Как следствие, было рекомендовано [2] [6] чтобы каждое значение p сопровождалось априорной вероятностью существования реального эффекта, который необходимо было бы предположить, чтобы достичь ложноположительного риска в 5%. . Например, если мы наблюдаем p = 0,05 в одном эксперименте, мы должны быть на 87% уверены в том, что существует реальный эффект, прежде чем эксперимент будет проведен, чтобы достичь ложноположительного риска 5%.

Рабочая характеристика приемника

В статье « Рабочая характеристика приемника » рассмотрены параметры статистической обработки сигналов, основанные на соотношениях ошибок различных типов.

Смотрите также

Примечания

  1. ^ При разработке алгоритмов обнаружения или тестов необходимо выбирать баланс между рисками ложноотрицательных и ложноположительных результатов. Обычно существует порог того, насколько близко должно быть достигнуто совпадение с данным образцом, прежде чем алгоритм сообщит о совпадении. Чем выше этот порог, тем больше ложноотрицательных результатов и меньше ложноположительных результатов.

Рекомендации

  1. ^ Ложноположительные и ложноотрицательные результаты
  2. ^ abcde Колкухун, Дэвид (2017). «Воспроизводимость исследований и неправильная интерпретация p-значений». Королевское общество открытой науки . 4 (12): 171085. doi :10.1098/rsos.171085. ПМК  5750014 . ПМИД  29308247.
  3. ^ Банерджи, А; Читнис, УБ; Джадхав, СЛ; Бхавалкар, Дж.С.; Чаудхури, С. (2009). «Проверка гипотез, ошибки I и II рода». Индийская психиатрия Дж . 18 (2): 127–31. дои : 10.4103/0972-6748.62274 . ПМК 2996198 . ПМИД  21180491. 
  4. ^ аб Колкухун, Дэвид (2014). «Исследование частоты ложных открытий и неправильной интерпретации p-значений». Королевское общество открытой науки . 1 (3): 140216. arXiv : 1407.5296 . Бибкод : 2014RSOS....140216C. дои : 10.1098/rsos.140216. ПМЦ 4448847 . ПМИД  26064558. 
  5. ^ Колкухун, Дэвид. «Проблема с p-значениями». Эон . Журнал Эон . Проверено 11 декабря 2016 г.
  6. ^ Колкухун, Дэвид (2018). «Ложноположительный риск: предложение о том, что делать со значениями p». Американский статистик . 73 : 192–201. arXiv : 1802.04888 . дои : 10.1080/00031305.2018.1529622. S2CID  85530643.