В биостатистике смещение спектра относится к явлению, при котором эффективность диагностического теста может различаться в разных клинических условиях, поскольку в каждом случае разный состав пациентов. [1] Поскольку эффективность может зависеть от состава пациентов, эффективность в одной клинике может не быть прогнозируемой по отношению к эффективности в другой клинике. [2] Эти различия интерпретируются как своего рода смещение . Математически смещение спектра является смещением выборки , а не традиционным статистическим смещением ; это привело к тому, что некоторые авторы называют это явление эффектами спектра , [3] в то время как другие утверждают, что это смещение, если истинная эффективность теста отличается от «ожидаемой». [2] Обычно эффективность диагностического теста измеряется с точки зрения его чувствительности и специфичности , и именно изменения в них рассматриваются при упоминании смещения спектра. Однако другие показатели эффективности, такие как отношения правдоподобия, также могут быть затронуты смещением спектра. [2]
Обычно считается, что смещение спектра имеет три причины. [2] Первая причина связана с изменением состава случаев пациентов с целевым расстройством (заболеванием), и это влияет на чувствительность . Вторая причина связана с изменением состава случаев пациентов без целевого расстройства (без заболевания), и это влияет на специфичность . Третья причина связана с изменением распространенности, и это влияет как на чувствительность , так и на специфичность . [4] Эта последняя причина не получила широкого признания, но появляется все больше эмпирических доказательств [4] [5], а также теоретических аргументов [6] , которые предполагают, что она действительно влияет на эффективность теста.
Примеры, когда чувствительность и специфичность меняются между различными подгруппами пациентов, можно найти в тесте на раковый эмбриональный антиген [7] и тест- полосках для анализа мочи [8] .
Результаты диагностических тестов, о которых сообщают некоторые исследования, могут быть искусственно завышены, если это дизайн случай-контроль, где здоровая популяция («наиболее приспособленная из приспособленных») сравнивается с популяцией с запущенным заболеванием («наиболее больная из больных»). То есть сравниваются две крайние популяции, а не типичные здоровая и больная популяции. [9]
При правильном анализе распознавание неоднородности подгрупп может привести к пониманию эффективности теста в различных популяциях. [3]