В медицине и медицинской статистике золотой стандарт , критериальный стандарт [1] или справочный стандарт [2] — это диагностический тест или эталон , который является наилучшим из доступных при разумных условиях. [3] Это тест, с которым сравниваются новые тесты для оценки их достоверности, и он используется для оценки эффективности лечения. [1]
Значение «золотого стандарта» может различаться между практической медициной и статистическим идеалом. При некоторых медицинских состояниях только вскрытие может гарантировать диагностическую достоверность. В этих случаях тест золотого стандарта является лучшим тестом, который сохраняет жизнь пациента, и даже тесты золотого стандарта могут потребовать последующего наблюдения для подтверждения или опровержения диагноза. [4]
Термин «золотой стандарт» в его нынешнем значении в медицинских исследованиях был введен Раддом в 1979 году в отношении монетарного золотого стандарта. [5]
«Золотой стандарт» может относиться к популярным клиническим конечным точкам , по которым оцениваются научные доказательства. Например, в исследованиях по реанимации «золотым стандартом» теста лекарства или процедуры является то, приводит ли оно к увеличению числа неврологически здоровых выживших, которые покидают больницу. [6] Другие типы медицинских исследований могут рассматривать значительное снижение 30-дневной смертности как золотой стандарт. [ необходима цитата ]
В руководстве по стилю AMA предпочтение отдано фразе «критериальный стандарт » вместо «золотого стандарта». Другие журналы также выпустили предписания в своих инструкциях для авторов. Например, Архив биологической медицины и реабилитации определяет это использование. [7] Однако на практике понимание этого термина авторами, а также его соблюдение редакционным составом, заметно слабы, по крайней мере, для журналов AMA. [8]
Когда критерием является целая процедура клинического тестирования, ее обычно называют определением клинического случая . Различные определения случаев могут давать совершенно разные результаты, если их использовать в качестве основы для оценки данного диагностического метода. [9]
Гипотетический идеальный тест «золотого стандарта» имеет чувствительность 100% относительно наличия заболевания (он идентифицирует всех людей с четко определенным процессом заболевания; у него нет ложноотрицательных результатов) и специфичность 100% (он не идентифицирует ложно кого-то с состоянием, у которого нет этого состояния; у него нет ложноположительных результатов). На практике нет настоящих тестов золотого стандарта. [10]
Иногда тест становится популярным и объявляется золотым стандартом без должного рассмотрения альтернатив или несмотря на недостатки. [11]
По мере появления новых диагностических методов тест «золотого стандарта» может со временем меняться. Например, для диагностики расслоения аорты тестом «золотого стандарта» раньше была аортограмма , чувствительность которой составляла всего 83%, а специфичность — всего 87%. С развитием магнитно-резонансной томографии новым тестом «золотого стандарта» для расслоения аорты стала магнитно-резонансная ангиограмма ( МРА), чувствительность которой составляла 95%, а специфичность — 92%. [ необходима цитата ] До широкого принятия любого нового теста прежний тест сохранял свой статус «золотого стандарта».
Поскольку тесты могут быть неверными (давать ложноотрицательный или ложноположительный результат ), результаты следует интерпретировать в контексте истории болезни, физических данных и других результатов тестов человека, проходящего тестирование. Именно в этом контексте определяется чувствительность и специфичность теста «золотого стандарта». [ необходима цитата ]
Когда золотой стандарт не идеален, его чувствительность и специфичность должны быть откалиброваны относительно более точных тестов или относительно определения состояния. [12] Эта калибровка особенно важна, когда идеальный тест доступен только при аутопсии. Тест должен соответствовать некоторому межнаблюдательному соглашению, чтобы избежать некоторой предвзятости, вызванной самим исследованием. [13] Ошибки калибровки могут привести к неправильной диагностике . [14]
Иногда «тест золотого стандарта» относится к наиболее эффективному из имеющихся тестов. В этих случаях нет другого критерия, с которым его можно было бы сравнить, и он эквивалентен определению. При ссылке на это значение тесты золотого стандарта обычно вообще не проводятся. Это связано с тем, что тест золотого стандарта может быть трудно выполнить или невозможно выполнить на живом человеке (т. е. тест проводится как часть аутопсии или может потребоваться слишком много времени, чтобы результаты теста стали доступны для клинической пользы).
В других случаях «золотой стандарт» относится не к наиболее эффективному из доступных тестов, а к наиболее доступному в разумных условиях. Например, в этом смысле МРТ является золотым стандартом для диагностики опухолей мозга, хотя она не так хороша, как биопсия. В этом случае чувствительность и специфичность золотого стандарта не составляют 100%, и его называют «несовершенным золотым стандартом» или «легированным золотым стандартом». [12]
Термин «основная истина» относится к базовому абсолютному состоянию информации; золотой стандарт стремится представить основную истину как можно точнее. В то время как золотой стандарт является наилучшим способом получить истину, основная истина обычно собирается путем прямых наблюдений. В машинном обучении и поиске информации «основная истина» является предпочтительным термином, даже когда классификации могут быть несовершенными; золотой стандарт предполагается как основная истина. [ необходима цитата ]
Некоторые авторы используют термин «золотой стандарт». Классен утверждает, что такое использование неверно, поскольку «золотой стандарт» подразумевает уровень совершенства, недостижимый в медицинской науке. [5]