Клиническое значение

В медицине и психологии клиническое значение — это практическая значимость эффекта лечения — имеет ли он реальное, ощутимое, заметное влияние на повседневную жизнь. ^[1]

Виды значимости

Статистическая значимость

Статистическая значимость используется при проверке гипотез , при которой проверяется нулевая гипотеза (об отсутствии связи между переменными ). ^[2] Выбирается уровень значимости (чаще всего α = 0,05 или 0,01), который обозначает вероятность ошибочного отклонения истинной нулевой гипотезы. ^[2] Если существует значительная разница между двумя группами при α = 0,05, это означает, что существует только 5% вероятность получения наблюдаемых результатов при условии, что разница полностью обусловлена случайностью (т. е. нулевая гипотеза истинный); это не дает никаких указаний на величину или клиническую значимость разницы. ^[3] Когда достигаются статистически значимые результаты, они выступают за отклонение нулевой гипотезы, но не доказывают, что нулевая гипотеза ложна. Аналогично, несущественные результаты не доказывают, что нулевая гипотеза верна; они также не дают никаких доказательств истинности или ложности гипотезы, выдвинутой исследователем. ^[2] Статистическая значимость относится только к совместимости наблюдаемых данных с тем, что можно было бы ожидать, если предположить, что нулевая гипотеза верна.

Практическая значимость

В широком использовании термин «практическая клиническая значимость» отвечает на вопрос, насколько эффективно вмешательство или лечение или насколько сильное изменение вызывает лечение. С точки зрения тестирования клинических методов лечения практическая значимость оптимально дает количественную информацию о важности открытия с использованием таких показателей, как размер эффекта , число, необходимое для лечения (ЧБЛН) и профилактическая доля . ^[4] Практическая значимость может также выражать полуколичественную, сравнительную или технико-экономическую оценку полезности.

Размер эффекта является одним из видов практического значения. ^[4]^[5] Он количественно определяет степень отклонения выборки от ожиданий. ^[6] Размер эффекта может предоставить важную информацию о результатах исследования, и его рекомендуется включать в дополнение к статистической значимости. Величина эффекта имеет свои собственные источники систематической ошибки, может меняться в зависимости от популяционной изменчивости зависимой переменной и имеет тенденцию фокусироваться на групповых эффектах, а не на индивидуальных изменениях. ^[5]^[7]^[8]

Хотя клиническое значение и практическое значение часто используются как синонимы, более строгое использование этого термина означает, что это ошибочно. ^[5] Такое техническое использование в психологии и психотерапии не только является результатом тщательно продуманной точности и особенности языка, но и позволяет сместить взгляд с групповых эффектов на особенности изменений внутри человека. ^{[ нужна цитата ]}

Конкретное использование

Напротив, при использовании в качестве технического термина в психологии и психотерапии клиническая значимость дает информацию о том, было ли лечение достаточно эффективным, чтобы изменить диагностический ярлык пациента. С точки зрения клинических исследований лечения, клиническая значимость отвечает на вопрос: «Достаточно ли эффективно лечение, чтобы привести пациента в норму [в отношении рассматриваемых диагностических критериев]?» ^{[ нужна цитата ]}

Например, лечение может значительно изменить симптомы депрессии (статистическая значимость), изменение может заключаться в значительном уменьшении симптомов депрессии (практическая значимость – величина эффекта), а 40% пациентов больше не соответствуют диагностическим критериям депрессии (клиническая значимость). ). Вполне возможно провести лечение, которое даст значительную разницу и средний или большой эффект, но не приведет пациента от дисфункционального состояния к функциональному. ^{[ нужна цитата ]}

В рамках психологии и психотерапии клиническое значение было впервые предложено Якобсоном, Фоллеттом и Ревенсторфом ^[9] как способ ответить на вопрос: достаточно ли эффективна терапия или лечение, чтобы клиент не соответствовал критериям диагноза? Позже Джейкобсон и Труакс определили клиническую значимость как «степень, в которой терапия выводит человека за пределы дисфункциональной популяции или в пределы функциональной популяции». ^[10] Они предложили два компонента этого индекса изменений: состояние пациента или клиента после завершения терапии и «сколько изменений произошло в ходе терапии». ^[10]

Клиническая значимость также учитывается при интерпретации результатов психологической оценки человека. Часто разница в баллах или подшкалах является статистически значимой и вряд ли возникает чисто случайно. Однако не все эти статистически значимые различия являются клинически значимыми, поскольку они не объясняют существующую информацию о клиенте и не дают полезного направления для вмешательства. Небольшие по величине различия обычно не имеют практической значимости и вряд ли будут клинически значимыми. Различия, распространенные в популяции, также вряд ли будут клинически значимыми, поскольку они могут просто отражать уровень нормальных человеческих вариаций. Кроме того, врачи ищут в данных оценки и истории клиента информацию, подтверждающую значимость статистической разницы, чтобы установить связь между результатами конкретного теста и более общим функционированием человека. ^[11]^[12]

Расчет клинической значимости

Точно так же, как существует множество способов расчета статистической значимости и практической значимости, существует множество способов расчета клинической значимости. Пять распространенных методов — это метод Джейкобсона-Труакса, метод Гулликсена-Лорда-Новика, метод Эдвардса-Наннелли, метод Хагемана-Арринделла и иерархическое линейное моделирование. ^[5]

Джейкобсон-Труакс

Якобсона-Труакса — распространенный метод расчета клинической значимости. Он включает в себя расчет индекса изменения надежности (RCI). ^[10] RCI равен разнице между баллами участника до и после теста, деленной на стандартную ошибку разницы. Пороговые баллы устанавливаются для помещения участников в одну из четырех категорий: выздоровевшие, улучшенные, неизмененные или ухудшенные, в зависимости от направленности RCI и того, был ли достигнут пороговый балл. ^{[ нужна цитата ]}

Гулликсен-Лорд-Новик

Метод Гулликсена-Лорда-Новика ^[13] аналогичен методу Якобсона-Труакса, за исключением того, что он учитывает регрессию к среднему значению . Это делается путем вычитания оценок до и после тестирования из среднего значения генеральной совокупности и деления на стандартное отклонение генеральной совокупности. ^[5]

Эдвардс-Наннелли

Метод Эдвардса-Наннелли ^[14] расчета клинической значимости является более строгой альтернативой методу Джейкобсона-Труакса. ^[5] Оценки надежности используются для приближения оценок предварительного тестирования к среднему значению, а затем для этой скорректированной оценки предварительного тестирования разрабатывается доверительный интервал. Доверительные интервалы используются при расчете изменения от предварительного теста к послетесту, поэтому для демонстрации клинической значимости необходимо большее фактическое изменение оценок по сравнению с методом Джейкобсона-Труакса. ^{[ нужна цитата ]}

Хагеман-Арринделл

Расчет клинической значимости Хагемана-Арринделла ^[15] включает индексы групповых и индивидуальных изменений. Надежность изменений показывает, улучшилось ли состояние пациента, осталось прежним или ухудшилось. Второй индекс, клиническая значимость изменений, указывает на четыре категории, аналогичные тем, которые использовал Джейкобсон-Труакс: ухудшение, достоверное изменение, улучшение, но не восстановление, восстановление. ^{[ нужна цитата ]}

Иерархическое линейное моделирование (HLM)

HLM включает в себя анализ кривой роста вместо сравнения результатов до и после тестирования, поэтому от каждого пациента требуются три точки данных, а не только две точки данных (до и после тестирования). ^[5] Компьютерная программа, такая как «Иерархическое линейное и нелинейное моделирование» ^[16], используется для расчета оценок изменений для каждого участника. HLM также позволяет анализировать модели кривых роста диад и групп. ^{[ нужна цитата ]}