В медицине и медицинской статистике золотой стандарт , критериальный стандарт [ 1] или эталонный стандарт [2] — это диагностический тест или эталон , который является лучшим из доступных при разумных условиях. [3] Это тест, с которым сравниваются новые тесты, чтобы оценить их достоверность, и он используется для оценки эффективности лечения. [1]
Значения могут различаться между практической медициной и статистическим идеалом, поскольку в медицине при некоторых заболеваниях только вскрытие гарантирует диагностическую достоверность, поэтому тест «золотого стандарта» будет лучшим тестом, позволяющим сохранить жизнь пациенту вместо аутопсии. В этих случаях даже так называемые тесты «золотого стандарта» требуют последующего наблюдения для подтверждения или опровержения диагноза. [4]
Термин «золотой стандарт» в его нынешнем понимании в медицинских исследованиях был введен Раддом в 1979 году в отношении денежного золотого стандарта. [5]
«Золотой стандарт» может относиться к критериям, по которым оцениваются научные данные. Например, в исследованиях в области реанимации «золотым стандартом» лекарства или процедуры является то, приводит ли оно к увеличению числа неврологически неповрежденных выживших, покидающих больницу. [6] Другие виды медицинских исследований могут рассматривать значительное снижение 30-дневной смертности как золотой стандарт. [ нужна цитата ]
Руководство по стилю AMA отдает предпочтение стандарту фразовых критериев вместо «золотого стандарта». Другие журналы также предоставили мандаты в своих инструкциях для авторов. Например, в Архиве биологической медицины и реабилитации указано такое использование. [7] На практике, однако, понимание этого термина авторами, а также его соблюдение редакционным персоналом крайне плохое, по крайней мере, для журналов АМА. [8]
Когда критерием является вся процедура клинического тестирования, его обычно называют определением клинического случая . Различные определения случаев могут привести к совершенно разным результатам, если они используются в качестве основы для оценки конкретного диагностического метода. [9]
Гипотетический идеальный тест «золотого стандарта» имеет чувствительность 100% в отношении наличия заболевания (он выявляет всех лиц с четко выраженным болезненным процессом; он не дает ложноотрицательных результатов) и специфичность 100 % ( он не идентифицирует ложно человека с заболеванием, у которого этого заболевания нет; он не дает ложноположительных результатов). На практике иногда не существует настоящего золотого стандарта. [10]
По мере появления новых методов диагностики «золотой стандарт» теста может со временем измениться. Например, для диагностики расслоения аорты золотым стандартом раньше была аортограмма , чувствительность которой составляла всего 83%, а специфичность - всего 87%. С развитием магнитно-резонансной томографии магнитно -резонансная ангиография (МРА) стала новым золотым стандартом диагностики расслоения аорты с чувствительностью 95% и специфичностью 92%. [ нужна цитата ] До широкого принятия любого нового теста, предыдущий тест сохраняет свой статус «золотого стандарта».
Поскольку тесты могут быть неправильными (давая ложноотрицательный или ложноположительный результат ), результаты следует интерпретировать в контексте анамнеза, физических данных и других результатов тестов испытуемого. Именно в этом контексте определяется чувствительность и специфичность теста «золотого стандарта». [ нужна цитата ]
Если золотой стандарт не является совершенным, его чувствительность и специфичность должны быть откалиброваны по более точным тестам или определению заболевания. [11] Эта калибровка особенно важна, когда идеальный тест доступен только при вскрытии. Важно подчеркнуть, что тест должен соответствовать определенному соглашению между наблюдателями, чтобы избежать некоторой систематической ошибки, вызванной самим исследованием. [12]
Ошибки калибровки могут привести к ошибочному диагнозу . [13] [ сомнительно ]
Иногда «золотой стандартный тест» относится к наиболее эффективному доступному тесту. В этих случаях не существует другого критерия, с которым его можно было бы сравнивать, и он эквивалентен определению. Говоря об этом значении, тесты золотого стандарта обычно не проводятся вообще. Это связано с тем, что тест «золотого стандарта» может быть трудно или невозможно провести на живом человеке (т. е. тест проводится в рамках вскрытия или может потребоваться слишком много времени, чтобы результаты теста стали доступны для клинического применения). полезный).
В других случаях «золотой стандарт» относится не к самому эффективному из доступных тестов, а к лучшему из доступных при разумных условиях. Например, в этом смысле МРТ является золотым стандартом диагностики опухолей головного мозга, хотя она и не так эффективна, как биопсия. В этом случае чувствительность и специфичность золотого стандарта не составляют 100%, и его называют «несовершенным золотым стандартом» или «сплавным золотым стандартом». [11]
Термин «основная истина» относится к лежащему в основе абсолютному состоянию информации; золотой стандарт стремится как можно точнее отразить основную истину. Хотя золотой стандарт – это лучший способ получить истину, основная истина обычно собирается путем прямых наблюдений. В машинном обучении и поиске информации предпочтительным термином является «основная истина», даже если классификации могут быть несовершенными; золотой стандарт считается основной истиной. [ нужна цитата ]
Некоторые авторы используют термин «золотой стандарт». Клаассен утверждает, что такое использование неверно, поскольку «золотой стандарт» подразумевает уровень совершенства, недостижимый в медицинской науке. [5]