В медицине и психологии клиническое значение — это практическая значимость эффекта лечения — имеет ли он реальное, ощутимое, заметное влияние на повседневную жизнь. [1]
Статистическая значимость используется при проверке гипотез , при которой проверяется нулевая гипотеза (об отсутствии связи между переменными ). [2] Выбирается уровень значимости (чаще всего α = 0,05 или 0,01), который обозначает вероятность ошибочного отклонения истинной нулевой гипотезы. [2] Если существует значительная разница между двумя группами при α = 0,05, это означает, что существует только 5% вероятность получения наблюдаемых результатов при условии, что разница полностью обусловлена случайностью (т. е. нулевая гипотеза истинный); это не дает никаких указаний на величину или клиническую значимость разницы. [3] Когда достигаются статистически значимые результаты, они выступают за отклонение нулевой гипотезы, но не доказывают, что нулевая гипотеза ложна. Аналогично, несущественные результаты не доказывают, что нулевая гипотеза верна; они также не дают никаких доказательств истинности или ложности гипотезы, выдвинутой исследователем. [2] Статистическая значимость относится только к совместимости наблюдаемых данных с тем, что можно было бы ожидать, если предположить, что нулевая гипотеза верна.
В широком использовании термин «практическая клиническая значимость» отвечает на вопрос, насколько эффективно вмешательство или лечение или насколько сильное изменение вызывает лечение. С точки зрения тестирования клинических методов лечения практическая значимость оптимально дает количественную информацию о важности открытия с использованием таких показателей, как размер эффекта , число, необходимое для лечения (ЧБЛН) и профилактическая доля . [4] Практическая значимость может также выражать полуколичественную, сравнительную или технико-экономическую оценку полезности.
Размер эффекта является одним из видов практического значения. [4] [5] Он количественно определяет степень отклонения выборки от ожиданий. [6] Размер эффекта может предоставить важную информацию о результатах исследования, и его рекомендуется включать в дополнение к статистической значимости. Величина эффекта имеет свои собственные источники систематической ошибки, может меняться в зависимости от популяционной изменчивости зависимой переменной и имеет тенденцию фокусироваться на групповых эффектах, а не на индивидуальных изменениях. [5] [7] [8]
Хотя клиническое значение и практическое значение часто используются как синонимы, более строгое использование этого термина означает, что это ошибочно. [5] Такое техническое использование в психологии и психотерапии не только является результатом тщательно продуманной точности и особенности языка, но и позволяет сместить взгляд с групповых эффектов на особенности изменений внутри человека. [ нужна цитата ]
Напротив, при использовании в качестве технического термина в психологии и психотерапии клиническая значимость дает информацию о том, было ли лечение достаточно эффективным, чтобы изменить диагностический ярлык пациента. С точки зрения клинических исследований лечения, клиническая значимость отвечает на вопрос: «Достаточно ли эффективно лечение, чтобы привести пациента в норму [в отношении рассматриваемых диагностических критериев]?» [ нужна цитата ]
Например, лечение может значительно изменить симптомы депрессии (статистическая значимость), изменение может заключаться в значительном уменьшении симптомов депрессии (практическая значимость – величина эффекта), а 40% пациентов больше не соответствуют диагностическим критериям депрессии (клиническая значимость). ). Вполне возможно провести лечение, которое даст значительную разницу и средний или большой эффект, но не приведет пациента от дисфункционального состояния к функциональному. [ нужна цитата ]
В рамках психологии и психотерапии клиническое значение было впервые предложено Якобсоном, Фоллеттом и Ревенсторфом [9] как способ ответить на вопрос: достаточно ли эффективна терапия или лечение, чтобы клиент не соответствовал критериям диагноза? Позже Джейкобсон и Труакс определили клиническую значимость как «степень, в которой терапия выводит человека за пределы дисфункциональной популяции или в пределы функциональной популяции». [10] Они предложили два компонента этого индекса изменений: состояние пациента или клиента после завершения терапии и «сколько изменений произошло в ходе терапии». [10]
Клиническая значимость также учитывается при интерпретации результатов психологической оценки человека. Часто разница в баллах или подшкалах является статистически значимой и вряд ли возникает чисто случайно. Однако не все эти статистически значимые различия являются клинически значимыми, поскольку они не объясняют существующую информацию о клиенте и не дают полезного направления для вмешательства. Небольшие по величине различия обычно не имеют практической значимости и вряд ли будут клинически значимыми. Различия, распространенные в популяции, также вряд ли будут клинически значимыми, поскольку они могут просто отражать уровень нормальных человеческих вариаций. Кроме того, врачи ищут в данных оценки и истории клиента информацию, подтверждающую значимость статистической разницы, чтобы установить связь между результатами конкретного теста и более общим функционированием человека. [11] [12]
Точно так же, как существует множество способов расчета статистической значимости и практической значимости, существует множество способов расчета клинической значимости. Пять распространенных методов — это метод Джейкобсона-Труакса, метод Гулликсена-Лорда-Новика, метод Эдвардса-Наннелли, метод Хагемана-Арринделла и иерархическое линейное моделирование. [5]
Якобсона-Труакса — распространенный метод расчета клинической значимости. Он включает в себя расчет индекса изменения надежности (RCI). [10] RCI равен разнице между баллами участника до и после теста, деленной на стандартную ошибку разницы. Пороговые баллы устанавливаются для помещения участников в одну из четырех категорий: выздоровевшие, улучшенные, неизмененные или ухудшенные, в зависимости от направленности RCI и того, был ли достигнут пороговый балл. [ нужна цитата ]
Метод Гулликсена-Лорда-Новика [13] аналогичен методу Якобсона-Труакса, за исключением того, что он учитывает регрессию к среднему значению . Это делается путем вычитания оценок до и после тестирования из среднего значения генеральной совокупности и деления на стандартное отклонение генеральной совокупности. [5]
Метод Эдвардса-Наннелли [14] расчета клинической значимости является более строгой альтернативой методу Джейкобсона-Труакса. [5] Оценки надежности используются для приближения оценок предварительного тестирования к среднему значению, а затем для этой скорректированной оценки предварительного тестирования разрабатывается доверительный интервал. Доверительные интервалы используются при расчете изменения от предварительного теста к послетесту, поэтому для демонстрации клинической значимости необходимо большее фактическое изменение оценок по сравнению с методом Джейкобсона-Труакса. [ нужна цитата ]
Расчет клинической значимости Хагемана-Арринделла [15] включает индексы групповых и индивидуальных изменений. Надежность изменений показывает, улучшилось ли состояние пациента, осталось прежним или ухудшилось. Второй индекс, клиническая значимость изменений, указывает на четыре категории, аналогичные тем, которые использовал Джейкобсон-Труакс: ухудшение, достоверное изменение, улучшение, но не восстановление, восстановление. [ нужна цитата ]
HLM включает в себя анализ кривой роста вместо сравнения результатов до и после тестирования, поэтому от каждого пациента требуются три точки данных, а не только две точки данных (до и после тестирования). [5] Компьютерная программа, такая как «Иерархическое линейное и нелинейное моделирование» [16], используется для расчета оценок изменений для каждого участника. HLM также позволяет анализировать модели кривых роста диад и групп. [ нужна цитата ]