Ложные положительные и ложные отрицательные результаты

Ложноположительный результат — это ошибка в бинарной классификации , при которой результат теста неверно указывает на наличие состояния (например, заболевания, когда его нет), тогда как ложноотрицательный результат — это противоположная ошибка, при которой результат теста неверно указывает на отсутствие состояния, когда оно на самом деле есть. Это два вида ошибок в бинарном тесте, в отличие от двух видов правильного результата (aистинно положительный иистинно отрицательный ). Они также известны в медицине какложноположительный(илиложноотрицательный)диагноз, а встатистической классификациикакложноположительная(илиложноотрицательная)ошибка.^[1]

В статистическом тестировании гипотез аналогичные концепции известны как ошибки типа I и типа II , где положительный результат соответствует отклонению нулевой гипотезы , а отрицательный результат соответствует не отклонению нулевой гипотезы. Эти термины часто используются взаимозаменяемо, но существуют различия в деталях и интерпретации из-за различий между медицинским тестированием и статистическим тестированием гипотез.

Ложноположительная ошибка

Ложноположительная ошибка , или ложноположительный результат , это результат, который указывает на то, что данное состояние существует, когда на самом деле его нет. Например, тест на беременность, который показывает, что женщина беременна, когда она не беременна, или осуждение невиновного человека. ^[2]

Ложноположительная ошибка — это ошибка типа I , когда тест проверяет одно условие и ошибочно выдает утвердительное (положительное) решение. Однако важно различать частоту ошибок типа 1 и вероятность того, что положительный результат окажется ложным. Последнее известно как риск ложного положительного результата (см. Неоднозначность в определении частоты ложных положительных результатов ниже). ^[3]

Ложноотрицательная ошибка

Ложноотрицательная ошибка , или ложноотрицательный результат теста, который ошибочно указывает на то, что условие не выполняется. Например, когда тест на беременность показывает, что женщина не беременна, но она беременна, или когда человек, виновный в преступлении, оправдан, это ложноотрицательные результаты. Условие «женщина беременна» или «человек виновен» выполняется, но тест (тест на беременность или судебное разбирательство) не может реализовать это условие и ошибочно решает, что человек не беременен или невиновен. ^[4]

Ложноотрицательная ошибка — это ошибка II типа , возникающая в тесте, где проверяется одно условие, и результат теста оказывается ошибочным, то есть условие отсутствует. ^[5]

Связанные термины

Ложноположительные и ложноотрицательные показатели

Коэффициент ложноположительных результатов (FPR) — это доля всех отрицательных результатов, которые все еще дают положительные результаты теста, т. е. условная вероятность положительного результата теста при условии, что событие не было. ^[6] Коэффициент ложноположительных результатов зависит от уровня значимости . Специфичность теста равна 1 минус коэффициент ложноположительных результатов. ^[7]

В статистическом тестировании гипотез эта дробь обозначается греческой буквой α , а 1 − α определяется как специфичность теста. Увеличение специфичности теста снижает вероятность ошибок типа I, но может повысить вероятность ошибок типа II (ложноотрицательных результатов, которые отвергают альтернативную гипотезу, когда она верна). ^[a]

Дополнительно,Ложноотрицательный показатель (ЛОП) — это доля положительных результатов, которые дают отрицательные результаты теста, т. е. условная вероятность отрицательного результата теста при условии, что искомое условие присутствует.^[8]

В статистическом тестировании гипотез эта дробь обозначается буквой β . « Мощность » (или « чувствительность ») теста равна 1 − β .

Неоднозначность определения ложноположительного показателя

Термин «коэффициент ложного обнаружения» (FDR) был использован Колкухоуном (2014) ^[9] для обозначения вероятности того, что «значимый» результат был ложноположительным. Позже Колкухоун (2017) ^[3] использовал термин «риск ложного положительного результата» (FPR) для той же величины, чтобы избежать путаницы с термином FDR, который используют люди, работающие над множественными сравнениями . Поправки для множественных сравнений направлены только на исправление коэффициента ошибок типа I, поэтому результатом является (исправленное) p -значение . Таким образом, они подвержены той же неправильной интерпретации, что и любое другое p -значение. Риск ложного положительного результата всегда выше, часто намного выше, чем p -значение. ^[9]^[3]

Смешение этих двух идей, ошибка транспонированного условного , нанесло много вреда. ^[10] Из-за неоднозначности обозначений в этой области важно смотреть на определение в каждой статье. Опасности опоры на p -значения были подчеркнуты в Колкухоуне (2017) ^[3] , где было указано, что даже наблюдение p = 0,001 не обязательно является сильным доказательством против нулевой гипотезы. Несмотря на то, что отношение правдоподобия в пользу альтернативной гипотезы по сравнению с нулевой близко к 100, если бы гипотеза была неправдоподобной, с априорной вероятностью реального эффекта 0,1, даже наблюдение p = 0,001 имело бы ложноположительный уровень 8 процентов. Он даже не достиг бы 5-процентного уровня. Вследствие этого было рекомендовано ^[3]^[11] , чтобы каждое значение p сопровождалось априорной вероятностью наличия реального эффекта, которую необходимо предположить для достижения ложноположительного риска в 5%. Например, если мы наблюдаем p = 0,05 в одном эксперименте, мы должны быть на 87% уверены в наличии реального эффекта до проведения эксперимента, чтобы достичь ложноположительного риска в 5%.

Эксплуатационная характеристика приемника

В статье « Характеристика работы приемника » рассматриваются параметры статистической обработки сигналов на основе соотношений ошибок различных типов.

Смотрите также

Примечания

^ При разработке алгоритмов обнаружения или тестов необходимо выбрать баланс между рисками ложных отрицательных и ложных положительных результатов. Обычно существует порог того, насколько близкое совпадение с данным образцом должно быть достигнуто, прежде чем алгоритм сообщит о совпадении. Чем выше этот порог, тем больше ложных отрицательных результатов и меньше ложных положительных результатов.

Ссылки

^ Ложноположительные и ложноотрицательные результаты
^ Робинсон, Александр; Келлер, Л. Робин; дель Кампо, Кристина (октябрь 2022 г.). «Построение представлений об истинно положительных и ложноположительных результатах: правило Байеса». Журнал инновационного образования в области принятия решений . 20 (4): 224–234. doi :10.1111/dsji.12265. ISSN 1540-4595.
^ abcde Колкухун, Дэвид (2017). «Воспроизводимость исследований и неправильная интерпретация p-значений». Royal Society Open Science . 4 (12): 171085. doi : 10.1098 /rsos.171085. PMC 5750014. PMID 29308247.
^ Alnabulsi, Hussein; Islam, Rafiqui; Mamun, Qasi (2018). "Новый алгоритм защиты от атак с внедрением кода". В Abawajy, Jemal H.; Choo, Kim-Kwang Raymond; Islam, Rafiqul (ред.). Международная конференция по приложениям и методам в области кибербезопасности и разведки: приложения и методы в области кибербезопасности и разведки . Чам, Швейцария: Springer International Publishing. стр. 288. ISBN 978-3-31967-071-3.
^ Баннерджи, А.; Читнис, У. Б.; Джадхав, С. Л.; Бхавалкар, Дж. С.; Чаудхури, С. (2009). «Проверка гипотез, ошибки типа I и типа II». Ind Psychiatry J . 18 (2): 127–31. doi : 10.4103/0972-6748.62274 . PMC 2996198 . PMID 21180491.
^ Бозе, Просенджит; Го, Хуа; Кранакис, Эвангелос; Махешвари, Анил; Морин, Пэт; Моррисон, Джейсон; Смид, Михил; Тан, Ихуэй (2008). «О частоте ложноположительных результатов фильтров Блума». Information Processing Letters . 108 (4): 210. doi :10.1016/j.ipl.2008.05.018.
^ Кронин, Пол; Келли, Эйн Мари (2011). «Влияние распространенности населения на количество ложноположительных результатов: упущенная из виду сущность». Academic Radiology . 18 (9): 1088. doi :10.1016/j.acra.2011.04.011.
^ Кронин и Келли, 2011, стр.1087
^ ab Colquhoun, David (2014). «Исследование частоты ложных открытий и неправильной интерпретации p-значений». Royal Society Open Science . 1 (3): 140216. arXiv : 1407.5296 . Bibcode :2014RSOS....140216C. doi :10.1098/rsos.140216. PMC 4448847 . PMID 26064558.
^ Колкухун, Дэвид. «Проблема с p-значениями». Aeon . Журнал Aeon . Получено 11 декабря 2016 г. .
^ Колкухун, Дэвид (2018). «Риск ложного положительного результата: предложение о том, что делать со значениями p». Американский статистик . 73 : 192–201. arXiv : 1802.04888 . doi : 10.1080/00031305.2018.1529622. S2CID 85530643.