В медицине и психологии клиническая значимость — это практическая значимость лечебного эффекта, то есть имеет ли он действительное, ощутимое, заметное влияние на повседневную жизнь. [1]
Статистическая значимость используется при проверке гипотез , при которой проверяется нулевая гипотеза (что нет никакой связи между переменными ). [2] Выбирается уровень значимости (чаще всего α = 0,05 или 0,01), который означает вероятность ошибочного отклонения истинной нулевой гипотезы. [2] Если между двумя группами наблюдается значительная разница при α = 0,05, это означает, что существует только 5% вероятность получения наблюдаемых результатов при предположении, что разница полностью обусловлена случайностью (т. е. нулевая гипотеза верна); это не дает никаких указаний на величину или клиническую значимость разницы. [3] Когда достигаются статистически значимые результаты, они свидетельствуют в пользу отклонения нулевой гипотезы, но они не доказывают, что нулевая гипотеза ложна. Аналогично, незначимые результаты не доказывают, что нулевая гипотеза верна; они также не дают никаких доказательств истинности или ложности гипотезы, выдвинутой исследователем. [2] Статистическая значимость относится только к совместимости наблюдаемых данных с тем, что можно было бы ожидать при условии, что нулевая гипотеза верна.
В широком смысле «практическая клиническая значимость» отвечает на вопрос, насколько эффективно вмешательство или лечение, или насколько сильное изменение вызывает лечение. С точки зрения тестирования клинических методов лечения практическая значимость оптимально дает количественную информацию о важности вывода, используя такие показатели, как размер эффекта , число, необходимое для лечения (NNT), и профилактическая фракция . [4] Практическая значимость может также передавать полуколичественные, сравнительные или осуществимые оценки полезности.
Размер эффекта — один из типов практической значимости. [4] [5] Он количественно определяет степень отклонения выборки от ожиданий. [6] Размер эффекта может предоставить важную информацию о результатах исследования и рекомендуется для включения в дополнение к статистической значимости. Размеры эффекта имеют свои собственные источники смещения, подвержены изменениям в зависимости от популяционной изменчивости зависимой переменной и, как правило, фокусируются на групповых эффектах, а не на индивидуальных изменениях. [5] [7] [8]
Хотя клиническая значимость и практическая значимость часто используются как синонимы, более техническое ограничительное использование обозначает это как ошибочное. [5] Это техническое использование в психологии и психотерапии не только является результатом тщательно выверенной точности и специфичности языка, но и позволяет сместить перспективу с групповых эффектов на специфику изменений внутри индивидуума. [ необходима ссылка ]
Напротив, при использовании в качестве технического термина в психологии и психотерапии клиническая значимость дает информацию о том, было ли лечение достаточно эффективным, чтобы изменить диагностическую метку пациента. В терминах клинических исследований лечения клиническая значимость отвечает на вопрос «Достаточно ли эффективно лечение, чтобы сделать пациента нормальным [в отношении рассматриваемых диагностических критериев]?» [ необходима цитата ]
Например, лечение может значительно изменить симптомы депрессии (статистическая значимость), изменение может быть значительным уменьшением симптомов депрессии (практическая значимость - размер эффекта), и 40% пациентов больше не соответствуют диагностическим критериям депрессии (клиническая значимость). Вполне возможно иметь лечение, которое дает значительную разницу и средние или большие размеры эффекта, но не переводит пациента из дисфункционального в функционального. [ необходима цитата ]
В психологии и психотерапии клиническая значимость была впервые предложена Якобсоном, Фоллеттом и Ревенсторфом [9] как способ ответить на вопрос, достаточно ли эффективна терапия или лечение, чтобы клиент не соответствовал критериям для диагноза? Позже Якобсон и Труакс определили клиническую значимость как «степень, в которой терапия выводит кого-либо за пределы диапазона дисфункциональной популяции или в диапазон функциональной популяции». [10] Они предложили два компонента этого индекса изменения: статус пациента или клиента после завершения терапии и «насколько сильно изменилось в ходе терапии». [10]
Клиническая значимость также является соображением при интерпретации результатов психологической оценки отдельного человека. Часто будет иметь место статистически значимая разница в баллах или подбаллах , которая вряд ли произошла чисто случайно. Однако не все эти статистически значимые различия являются клинически значимыми, поскольку они не объясняют существующую информацию о клиенте и не дают полезного направления для вмешательства. Различия, которые невелики по величине, как правило, не имеют практической значимости и вряд ли будут клинически значимыми. Различия, которые распространены в популяции, также вряд ли будут клинически значимыми, поскольку они могут просто отражать уровень нормальной человеческой вариации. Кроме того, клиницисты ищут информацию в данных оценки и истории болезни клиента, которая подтверждает значимость статистической разницы, чтобы установить связь между результатами конкретного теста и более общим функционированием человека. [11] [12]
Так же, как существует множество способов расчета статистической значимости и практической значимости, существует множество способов расчета клинической значимости. Пять распространенных методов — это метод Якобсона-Труакса, метод Гулликсена-Лорда-Новика, метод Эдвардса-Наннэлли, метод Хагемана-Арринделла и иерархическое линейное моделирование. [5]
Метод Якобсона-Труакса является распространенным методом расчета клинической значимости. Он включает расчет индекса изменения надежности (RCI). [10] RCI равен разнице между пред- и пост-тестовыми баллами участника, деленной на стандартную ошибку разности. Пороговые баллы устанавливаются для помещения участников в одну из четырех категорий: выздоровевшие, улучшенные, не изменившиеся или ухудшенные, в зависимости от направленности RCI и того, был ли достигнут пороговый балл. [ необходима цитата ]
Метод Гулликсена-Лорда-Новика [13] похож на метод Якобсона-Труакса, за исключением того, что он учитывает регрессию к среднему значению . Это делается путем вычитания предтестовых и посттестовых оценок из среднего значения популяции и деления на стандартное отклонение популяции. [5]
Метод Эдвардса-Нанналли [14] расчета клинической значимости является более строгой альтернативой методу Якобсона-Труакса. [5] Оценки надежности используются для приближения оценок до теста к среднему значению, а затем для этой скорректированной оценки до теста разрабатывается доверительный интервал. Доверительные интервалы используются при расчете изменения от оценки до теста до результата после теста, поэтому для демонстрации клинической значимости необходимо большее фактическое изменение оценок по сравнению с методом Якобсона-Труакса. [ необходима цитата ]
Расчет клинической значимости по Хагеману-Арринделлу [15] включает индексы групповых изменений и индивидуальных изменений. Надежность изменений указывает на то, улучшилось ли состояние пациента, осталось прежним или ухудшилось. Второй индекс, клиническая значимость изменений, указывает на четыре категории, аналогичные тем, которые использует Якобсон-Труакс: ухудшилось, достоверно не изменилось, улучшилось, но не восстановилось, и восстановилось. [ необходима цитата ]
HLM включает анализ кривой роста вместо сравнений до и после теста, поэтому для каждого пациента требуется три точки данных вместо двух точек данных (до и после теста). [5] Компьютерная программа, такая как Hierarchical Linear and Nonlinear Modeling [16], используется для расчета оценок изменений для каждого участника. HLM также позволяет анализировать модели кривых роста диад и групп. [ необходима ссылка ]