Положительные и отрицательные прогностические значения

Положительные и отрицательные прогностические значения ( PPV и NPV соответственно) представляют собой доли положительных и отрицательных результатов в статистике и диагностических тестах , которые являются истинно положительными и истинно отрицательными результатами соответственно. ^[1] PPV и NPV описывают производительность диагностического теста или другой статистической меры. Высокий результат можно интерпретировать как указание на точность такой статистики. PPV и NPV не являются внутренними для теста (в отличие от истинно положительного и истинно отрицательного показателей ); они также зависят от распространенности . ^[2] Как PPV, так и NPV можно вывести с помощью теоремы Байеса .

Хотя иногда это используется как синоним, положительное прогностическое значение обычно относится к тому, что установлено контрольными группами, в то время как вероятность после теста относится к вероятности для отдельного человека. Тем не менее, если вероятность до теста у отдельного человека целевого состояния такая же, как распространенность в контрольной группе, использованной для установления положительного прогностического значения, то эти два показателя численно равны.

В информационном поиске статистику PPV часто называют точностью .

Определение

Положительная прогностическая ценность (ППЦ)

Положительная прогностическая ценность (ППЦ), или точность , определяется как

{\text{PPV}}={\frac {\text{Number of true positives}}{{\text{Number of true positives}}+{\text{Number of false positives}}}}={\frac {\text{Number of true positives}}{\text{Number of positive calls}}}

где « истинно положительный » — это событие, когда тест делает положительный прогноз, и у субъекта положительный результат в соответствии с золотым стандартом , а « ложно положительный » — это событие, когда тест делает положительный прогноз, и у субъекта отрицательный результат в соответствии с золотым стандартом. Идеальное значение PPV при идеальном тесте равно 1 (100%), а наихудшее возможное значение равно нулю.

PPV также можно рассчитать на основе чувствительности , специфичности и распространенности заболевания:

{\text{PPV}}={\frac {{\text{sensitivity}}\times {\text{prevalence}}}{{\text{sensitivity}}\times {\text{prevalence}}+(1-{\text{specificity}})\times (1-{\text{prevalence}})}}

см. теорема Байеса

Дополнением к PPV является показатель ложных срабатываний (FDR):

{\text{FDR}}=1-{\text{PPV}}={\frac {\text{Number of false positives}}{{\text{Number of true positives}}+{\text{Number of false positives}}}}={\frac {\text{Number of false positives}}{\text{Number of positive calls}}}

Отрицательная прогностическая ценность (NPV)

Отрицательная прогностическая ценность определяется как:

{\text{NPV}}={\frac {\text{Number of true negatives}}{{\text{Number of true negatives}}+{\text{Number of false negatives}}}}={\frac {\text{Number of true negatives}}{\text{Number of negative calls}}}

где « истинно отрицательный » — это событие, при котором тест дает отрицательный прогноз, и у субъекта отрицательный результат в соответствии с золотым стандартом, а « ложноотрицательный » — это событие, при котором тест дает отрицательный прогноз, и у субъекта положительный результат в соответствии с золотым стандартом. При идеальном тесте, который не возвращает ложноотрицательных результатов, значение NPV равно 1 (100%), а при тесте, который не возвращает истинно отрицательных результатов, значение NPV равно нулю.

NPV также можно рассчитать на основе чувствительности , специфичности и распространенности :

{\text{NPV}}={\frac {{\text{specificity}}\times (1-{\text{prevalence}})}{{\text{specificity}}\times (1-{\text{prevalence}})+(1-{\text{sensitivity}})\times {\text{prevalence}}}}

{\text{NPV}}={\frac {TN}{TN+FN}}

Дополнением к NPV являетсяКоэффициент ложного пропуска (FOR):

{\text{FOR}}=1-{\text{NPV}}={\frac {\text{Number of false negatives}}{{\text{Number of true negatives}}+{\text{Number of false negatives}}}}={\frac {\text{Number of false negatives}}{\text{Number of negative calls}}}

Хотя иногда это используется как синоним, отрицательное предсказательное значение обычно относится к тому, что установлено контрольными группами, в то время как отрицательная посттестовая вероятность скорее относится к вероятности для отдельного человека. Тем не менее, если предтестовая вероятность отдельного человека целевого состояния такая же, как распространенность в контрольной группе, использованной для установления отрицательного предсказательного значения, то эти два показателя численно равны.

Отношение

Следующая диаграмма иллюстрирует, как связаны между собой положительная прогностическая ценность , отрицательная прогностическая ценность , чувствительность и специфичность .

^ количество реальных положительных случаев в данных
^ Результат теста, который правильно указывает на наличие состояния или характеристики.
^ Ошибка типа II: результат теста, который ошибочно указывает на отсутствие определенного условия или атрибута.
^ количество реальных отрицательных случаев в данных
^ Результат теста, который правильно указывает на отсутствие состояния или характеристики.
^ Ошибка типа I: результат теста, который ошибочно указывает на наличие определенного состояния или атрибута.

Обратите внимание, что положительные и отрицательные прогностические значения могут быть оценены только с использованием данных поперечного исследования или другого популяционного исследования, в котором могут быть получены достоверные оценки распространенности . Напротив, чувствительность и специфичность могут быть оценены с помощью исследований случай-контроль .

Рабочий пример

Предположим, что тест на скрытую кровь в кале (FOB) будет использоваться у 2030 человек для выявления рака кишечника:

Малая положительная прогностическая ценность (PPV = 10%) указывает на то, что многие из положительных результатов этой процедуры тестирования являются ложноположительными. Таким образом, необходимо будет дополнить любой положительный результат более надежным тестом, чтобы получить более точную оценку наличия рака. Тем не менее, такой тест может быть полезен, если он недорогой и удобный. Сила скринингового теста FOB заключается в его отрицательной прогностической ценности — которая, если она отрицательна для человека, дает нам высокую уверенность в том, что его отрицательный результат верен.

Проблемы

Другие индивидуальные факторы

Обратите внимание, что PPV не является неотъемлемой частью теста — он также зависит от распространенности. ^[2] Из-за большого влияния распространенности на прогностические значения был предложен стандартизированный подход, в котором PPV нормализуется до распространенности 50%. ^[11] PPV прямо пропорционален ^{[ сомнительно — обсудите ]} распространенности заболевания или состояния. В приведенном выше примере, если бы группа людей, прошедших тестирование, включала большую долю людей с раком кишечника, то PPV, вероятно, оказался бы выше, а NPV — ниже. Если бы у всех в группе был рак кишечника, PPV был бы 100%, а NPV — 0%. ^{[ требуется цитата ]}

Чтобы преодолеть эту проблему, NPV и PPV следует использовать только в том случае, если соотношение числа пациентов в группе заболевания и числа пациентов в здоровой контрольной группе, использованное для установления NPV и PPV, эквивалентно распространенности заболеваний в исследуемой популяции, или, в случае сравнения двух групп заболеваний, если соотношение числа пациентов в группе заболевания 1 и числа пациентов в группе заболевания 2 эквивалентно соотношению распространенностей двух исследуемых заболеваний. В противном случае положительные и отрицательные отношения правдоподобия более точны, чем NPV и PPV, поскольку отношения правдоподобия не зависят от распространенности. ^{[ необходима цитата ]}

Когда у тестируемого человека предтестовая вероятность наличия заболевания отличается от контрольных групп, используемых для установления PPV и NPV, PPV и NPV обычно отличаются от положительных и отрицательных послетестовых вероятностей , при этом PPV и NPV относятся к тем, которые установлены контрольными группами, а послетестовые вероятности относятся к тем, которые установлены для тестируемого человека (например, по оценкам отношений правдоподобия ). Предпочтительно, чтобы в таких случаях изучалась большая группа эквивалентных людей, чтобы установить отдельные положительные и отрицательные прогностические значения для использования теста у таких людей. ^{[ необходима цитата ]}

Байесовское обновление

Теорема Байеса накладывает неотъемлемые ограничения на точность скрининговых тестов как функцию распространенности заболевания или вероятности до теста. Было показано, что система тестирования может выдерживать значительные падения распространенности, вплоть до определенной четко определенной точки, известной как порог распространенности , ниже которой надежность положительного скринингового теста резко падает. Тем не менее, Балайла и др. ^[12] показали, что последовательное тестирование преодолевает вышеупомянутые байесовские ограничения и, таким образом, повышает надежность скрининговых тестов. Для желаемого положительного прогностического значения , где , которое приближается к некоторой константе , необходимое количество итераций положительного теста равно: $\rho$ $\rho <1$ $k$ $n_{i}$

n_{i}=\lim _{k\to \rho }\left\lceil {\frac {\ln \left[{\frac {k(\phi -1)}{\phi (k-1)}}\right]}{\ln \left[{\frac {a}{1-b}}\right]}}\right\rceil

где

$\rho$ желаемый PPV
$n_{i}$ это количество итераций тестирования, необходимых для достижения $\rho$
$a$ это чувствительность
$b$ это специфика
$\phi$ распространенность заболевания

Следует отметить, что знаменатель приведенного выше уравнения — это натуральный логарифм положительного отношения правдоподобия (LR+). Также следует отметить, что критическим предположением является то, что тесты должны быть независимыми. Как описывают Балайла и др. ^[12] , повторение того же теста может нарушить это предположение о независимости, и на самом деле «более естественным и надежным методом повышения положительной прогностической ценности было бы, если это возможно, использовать другой тест с другими параметрами после получения первоначального положительного результата». ^[12] .

Различные целевые условия

PPV используется для указания вероятности того, что в случае положительного теста у пациента действительно есть указанное заболевание. Однако может быть более одной причины заболевания, и любая одна потенциальная причина не всегда может привести к явному заболеванию, наблюдаемому у пациента. Существует вероятность смешивания связанных целевых состояний PPV и NPV, например, интерпретация PPV или NPV теста как наличия заболевания, когда это значение PPV или NPV на самом деле относится только к предрасположенности к наличию этого заболевания. ^[13]

Примером может служить микробиологический мазок из горла, используемый у пациентов с болью в горле . Обычно публикации, в которых указывается PPV мазка из горла, сообщают о вероятности того, что эта бактерия присутствует в горле, а не о том, что пациент болен из-за обнаруженной бактерии. Если бы присутствие этой бактерии всегда приводило к боли в горле, то PPV был бы очень полезен. Однако бактерии могут колонизировать людей безвредным образом и никогда не приводить к инфекции или заболеванию. Боли в горле, возникающие у этих людей, вызываются другими агентами, такими как вирус. В этой ситуации золотой стандарт, используемый в оценочном исследовании, представляет собой только присутствие бактерий (которые могут быть безвредными), но не причинное бактериальное заболевание болью в горле. Можно доказать, что эта проблема повлияет на положительную прогностическую ценность гораздо больше, чем на отрицательную прогностическую ценность. ^[14] Для оценки диагностических тестов, где золотой стандарт рассматривает только потенциальные причины заболевания, можно использовать расширение прогностической ценности, называемое этиологической прогностической ценностью. ^[13]^[15]

Смотрите также

Ссылки

^ Флетчер, Роберт Х. Флетчер; Сюзанна В. (2005). Клиническая эпидемиология: основы (4-е изд.). Балтимор, Мэриленд: Lippincott Williams & Wilkins. стр. 45. ISBN 0-7817-5215-9.{{cite book}}: CS1 maint: multiple names: authors list (link)
^ ab Altman, DG; Bland, JM (1994). «Диагностические тесты 2: Прогностические значения». BMJ . 309 (6947): 102. doi :10.1136/bmj.309.6947.102. PMC 2540558 . PMID 8038641.
^ Фосетт, Том (2006). «Введение в ROC-анализ» (PDF) . Pattern Recognition Letters . 27 (8): 861–874. doi :10.1016/j.patrec.2005.10.010. S2CID 2027090.
^ Провост, Фостер; Том Фосетт (2013-08-01). «Наука о данных для бизнеса: что вам нужно знать о добыче данных и аналитическом мышлении». O'Reilly Media, Inc.
^ Пауэрс, Дэвид МВ (2011). «Оценка: от точности, полноты и F-меры до ROC, информированности, маркированности и корреляции». Журнал технологий машинного обучения . 2 (1): 37–63.
^ Ting, Kai Ming (2011). Sammut, Claude; Webb, Geoffrey I. (ред.). Энциклопедия машинного обучения . Springer. doi :10.1007/978-0-387-30164-8. ISBN 978-0-387-30164-8.
^ Брукс, Гарольд; Браун, Барб; Эберт, Бет; Ферро, Крис; Джоллифф, Ян; Кох, Тие-Йонг; Рёббер, Пол; Стивенсон, Дэвид (2015-01-26). "WWRP/WGNE Joint Working Group on Forecast Verification Research". Collaboration for Australian Weather and Climate Research . World Meteorological Organization . Получено 17 июля 2019 г.
^ Chicco D, Jurman G (январь 2020 г.). «Преимущества коэффициента корреляции Мэтьюса (MCC) над оценкой F1 и точностью оценки бинарной классификации». BMC Genomics . 21 (1): 6-1–6-13. doi : 10.1186/s12864-019-6413-7 . PMC 6941312 . PMID 31898477.
^ Chicco D, Toetsch N, Jurman G (февраль 2021 г.). «Коэффициент корреляции Мэтьюса (MCC) более надежен, чем сбалансированная точность, информированность букмекера и маркированность при оценке двухклассовой матрицы путаницы». BioData Mining . 14 (13): 13. doi : 10.1186/s13040-021-00244-z . PMC 7863449 . PMID 33541410.
^ Tharwat A. (август 2018 г.). «Методы оценки классификации». Прикладная вычислительная техника и информатика . 17 : 168–192. doi : 10.1016/j.aci.2018.08.003 .
^ Хестон, Томас Ф. (2011). «Стандартизация прогностических значений в диагностических исследованиях с использованием визуализации». Журнал магнитно-резонансной томографии . 33 (2): 505, ответ автора 506–7. doi : 10.1002/jmri.22466 . PMID 21274995.
^ abc Жак Балайла. Байесовское обновление и последовательное тестирование: преодоление выводимых ограничений скрининговых тестов. BMC Med Inform Decis Mak 22, 6 (2022). https://doi.org/10.1186/s12911-021-01738-w
^ ab Gunnarsson, Ronny K.; Lanke, Jan (2002). «Прогностическая ценность микробиологических диагностических тестов при наличии бессимптомных носителей». Статистика в медицине . 21 (12): 1773–85. doi :10.1002/sim.1119. PMID 12111911. S2CID 26163122.
^ Орда, Ульрих; Гуннарссон, Ронни К; Орда, Сабина; Фицджеральд, Марк; Рофе, Джеффри; Дарган, Анна (2016). «Этиологическая прогностическая ценность быстрого иммуноанализа для обнаружения антигена стрептококка группы А в мазках из горла у пациентов с болью в горле» (PDF) . Международный журнал инфекционных заболеваний . 45 (апрель): 32–5. doi : 10.1016/j.ijid.2016.02.002 . PMID 26873279.
^ Гуннарссон, Ронни К. «Калькулятор EPV». Science Network TV .