В статистике модель посредничества стремится идентифицировать и объяснить механизм или процесс, который лежит в основе наблюдаемой связи между независимой переменной и зависимой переменной посредством включения третьей гипотетической переменной, известной как переменная-посредник (также опосредующая переменная , промежуточная переменная или промежуточная переменная ). [1] Вместо прямой причинно-следственной связи между независимой переменной и зависимой переменной, которая часто является ложной , модель посредничества предполагает, что независимая переменная влияет на переменную-посредника, которая, в свою очередь, влияет на зависимую переменную. Таким образом, переменная-посредник служит для выяснения характера связи между независимой и зависимой переменными. [2] [3]
Медиационный анализ применяется для понимания известной взаимосвязи путем изучения базового механизма или процесса, посредством которого одна переменная влияет на другую переменную через переменную-посредника. [4] В частности, медиационный анализ может способствовать лучшему пониманию взаимосвязи между независимой переменной и зависимой переменной, когда эти переменные не имеют очевидной прямой связи.
Барон и Кенни (1986) изложили несколько требований, которые необходимо выполнить для формирования настоящих посреднических отношений. [5] Они изложены ниже с использованием примера из реального мира. См. диаграмму выше для визуального представления общих посреднических отношений, которые необходимо объяснить. Исходные шаги следующие.
Продолжительность отношений
Следующий пример, взятый из Howell (2009), [6] объясняет каждый шаг требований Baron и Kenny для дальнейшего понимания того, как характеризуется эффект медиации. Шаг 1 и шаг 2 используют простой регрессионный анализ, тогда как шаг 3 использует множественный регрессионный анализ .
Подобные результаты приводят к выводу, что ваши чувства компетентности и самооценки являются посредниками между тем, как вас воспитывали, и тем, насколько уверенно вы себя чувствуете, воспитывая собственных детей.
Если шаг 1 не дает значимого результата, все равно могут быть основания перейти к шагу 2. Иногда на самом деле существует значимая связь между независимыми и зависимыми переменными, но из-за малых размеров выборки или других внешних факторов может быть недостаточно мощности для прогнозирования эффекта, который фактически существует. [7]
На диаграмме, показанной выше, косвенный эффект является произведением коэффициентов пути «A» и «B». Прямой эффект — это коэффициент «C'». Прямой эффект измеряет степень изменения зависимой переменной, когда независимая переменная увеличивается на одну единицу, а медиаторная переменная остается неизменной. Напротив, косвенный эффект измеряет степень изменения зависимой переменной, когда независимая переменная остается постоянной, а медиаторная переменная изменяется на величину, на которую она бы изменилась, если бы независимая переменная увеличилась на одну единицу. [8] [9]
В линейных системах общий эффект равен сумме прямого и косвенного ( C' + AB в модели выше). В нелинейных моделях общий эффект, как правило, равен не сумме прямого и косвенного эффектов, а модифицированной комбинации этих двух. [9]
Переменная-посредник может объяснять либо все, либо некоторые наблюдаемые взаимосвязи между двумя переменными.
Максимальное доказательство медиации, также называемой полной медиацией, будет получено, если включение переменной медиации снизит связь между независимой переменной и зависимой переменной (см. путь c ′ на диаграмме выше) до нуля.
Частичное посредничество утверждает, что опосредующая переменная объясняет некоторые, но не все, отношения между независимой переменной и зависимой переменной. Частичное посредничество подразумевает, что существует не только значимая связь между посредником и зависимой переменной, но также и некоторая прямая связь между независимой и зависимой переменной.
Для того чтобы установить либо полное, либо частичное посредничество, уменьшение дисперсии, объясняемое независимой переменной, должно быть значительным, что определяется одним из нескольких тестов, например тестом Собеля . [10] Влияние независимой переменной на зависимую переменную может стать незначительным, когда медиатор вводится просто потому, что объясняется незначительная величина дисперсии (т. е. не истинное посредничество). Таким образом, крайне важно показать значительное уменьшение дисперсии, объясняемой независимой переменной, прежде чем утверждать либо полное, либо частичное посредничество. Возможно наличие статистически значимых косвенных эффектов при отсутствии общего эффекта. [11] Это можно объяснить наличием нескольких путей посредничества, которые компенсируют друг друга и становятся заметными, когда контролируется один из компенсирующих медиаторов. Это подразумевает, что термины «частичное» и «полное» посредничество всегда следует интерпретировать относительно набора переменных, которые присутствуют в модели. Во всех случаях операцию «фиксации переменной» следует отличать от операции «контроля переменной», которая неправильно использовалась в литературе. [8] [12] Первая означает физическую фиксацию, а вторая означает обусловливание, корректировку или добавление к регрессионной модели. Эти два понятия совпадают только тогда, когда все ошибочные термины (не показанные на диаграмме) статистически не коррелированы. Когда ошибки коррелированы, необходимо внести корректировки для нейтрализации этих корреляций, прежде чем приступать к анализу посредничества (см. Байесовская сеть ).
Тест Собеля [10] проводится для определения того, значительно ли снизилась связь между независимой и зависимой переменной после включения переменной-медиатора. Другими словами, этот тест оценивает, является ли эффект медиации значимым. Он исследует связь между независимой и зависимой переменной по сравнению с связью между независимой и зависимой переменной, включая фактор медиации.
Тест Собеля точнее, чем шаги Барона и Кенни, описанные выше; однако он имеет низкую статистическую мощность. Таким образом, для достаточной мощности обнаружения значимых эффектов требуются большие размеры выборки. Это связано с тем, что ключевым предположением теста Собеля является предположение о нормальности. Поскольку тест Собеля оценивает заданную выборку по нормальному распределению, небольшие размеры выборки и асимметрия распределения выборки могут быть проблематичными (см. Нормальное распределение для получения более подробной информации). Таким образом, эмпирическое правило, предложенное МакКинноном и др. (2002) [13] , заключается в том, что для обнаружения небольшого эффекта требуется размер выборки 1000, размер выборки 100 достаточен для обнаружения среднего эффекта, а размер выборки 50 требуется для обнаружения большого эффекта.
Уравнение Собеля имеет вид: [14]
Метод бутстрепа обеспечивает некоторые преимущества тесту Собеля, в первую очередь увеличение мощности. Метод бутстрепа Пречера и Хейса является непараметрическим тестом и не навязывает предположение о нормальности. Поэтому, если доступны необработанные данные, рекомендуется метод бутстрепа. [14] Бутстреп включает в себя повторную случайную выборку наблюдений с заменой из набора данных для вычисления желаемой статистики в каждой повторной выборке. Вычисление сотен или тысяч повторных выборок бутстрепа дает приближение распределения выборки интересующей статистики. Метод Пречера–Хейса предоставляет точечные оценки и доверительные интервалы, с помощью которых можно оценить значимость или незначимость эффекта медиации. Точечные оценки показывают среднее значение по числу бутстрепированных образцов, и если ноль не попадает между полученными доверительными интервалами метода бутстрепа, можно с уверенностью заключить, что имеется значительный эффект медиации, о котором следует сообщить.
Как указано выше, существует несколько различных вариантов, из которых можно выбрать оценку модели посредничества.
Бутстрэппинг [15] [16] становится самым популярным методом тестирования медиации, поскольку он не требует выполнения предположения о нормальности и может эффективно использоваться с меньшими размерами выборки ( N < 25). Однако медиация по-прежнему чаще всего определяется с использованием логики Барона и Кенни [17] или теста Собеля . Становится все труднее публиковать тесты медиации, основанные исключительно на методе Барона и Кенни или тестах, которые делают предположения о распределении, таких как тест Собеля. Таким образом, важно учитывать свои варианты при выборе того, какой тест проводить. [11]
Хотя концепция медиации, как она определена в психологии, теоретически привлекательна, методы, используемые для эмпирического изучения медиации, были оспорены статистиками и эпидемиологами [8] [12] [18] и интерпретированы формально. [9]
Хейс (2009) раскритиковал подход Барона и Кенни к посредническим шагам [11] , а в 2019 году Дэвид А. Кенни на своем веб-сайте заявил, что посредничество может существовать при отсутствии «значительного» общего эффекта (иногда называемого «непоследовательным посредничеством»), и поэтому шаг 1 оригинального подхода 1986 года может не понадобиться. Более поздние публикации Хейса подвергли сомнению концепции полного посредничества и частичного посредничества и выступили за отказ от этих терминов и шагов в классической (1986) посредничестве.
Экспериментальные подходы к медиации должны осуществляться с осторожностью. Во-первых, важно иметь сильную теоретическую поддержку для разведывательного исследования потенциальной опосредующей переменной. Критика подхода медиации основывается на способности манипулировать и измерять опосредующую переменную. Таким образом, необходимо иметь возможность манипулировать предлагаемым медиатором приемлемым и этичным образом. Таким образом, необходимо иметь возможность измерять промежуточный процесс, не вмешиваясь в результат. Медиатор также должен иметь возможность устанавливать конструктную валидность манипуляции. Одно из наиболее распространенных критических замечаний подхода измерения медиации заключается в том, что он в конечном итоге является корреляционным дизайном. Следовательно, возможно, что какая-то другая третья переменная, независимая от предлагаемого медиатора, может быть ответственна за предлагаемый эффект. Однако исследователи упорно трудились, чтобы предоставить контрдоказательства этому пренебрежению. В частности, были выдвинуты следующие контраргументы: [4]
Медиация может быть чрезвычайно полезным и мощным статистическим тестом; однако, ее нужно использовать правильно. Важно, чтобы меры, используемые для оценки медиатора и зависимой переменной, были теоретически различны, и чтобы независимая переменная и медиатор не могли взаимодействовать. Если бы было взаимодействие между независимой переменной и медиатором, были бы основания для исследования модерации .
Другая часто проверяемая модель — это модель, в которой конкурирующие переменные в модели являются альтернативными потенциальными медиаторами или неизмеренной причиной зависимой переменной. Дополнительная переменная в причинной модели может скрыть или запутать связь между независимыми и зависимыми переменными. Потенциальные конфаундеры — это переменные, которые могут оказывать причинное влияние как на независимую, так и на зависимую переменную. Они включают общие источники погрешности измерения (как обсуждалось выше), а также другие влияния, общие как для независимых, так и для зависимых переменных.
В экспериментальных исследованиях особое внимание уделяется аспектам экспериментальной манипуляции или настройки, которые могут объяснять эффекты исследования, а не мотивирующий теоретический фактор. Любая из этих проблем может привести к ложным связям между независимыми и зависимыми переменными, которые измеряются. Игнорирование вмешивающейся переменной может привести к смещению эмпирических оценок причинного эффекта независимой переменной.
Подавляющая переменная увеличивает прогностическую валидность другой переменной при включении в уравнение регрессии. Подавление может происходить, когда одна причинная переменная связана с переменной результата через две отдельные переменные-медиаторы, и когда один из этих опосредованных эффектов положительный, а другой — отрицательный. В таком случае каждая переменная-медиатор подавляет или скрывает эффект, который передается через другую переменную-медиатор. Например, более высокие баллы интеллекта (причинная переменная, A ) могут вызвать увеличение обнаружения ошибок (переменная-медиатор, B ), что, в свою очередь, может вызвать уменьшение ошибок, совершаемых при работе на сборочной линии (переменная результата, X ); в то же время интеллект также может вызвать увеличение скуки ( C ), что, в свою очередь, может вызвать увеличение ошибок ( X ). Таким образом, в одном причинном пути интеллект уменьшает ошибки, а в другом — увеличивает их. Когда ни один из медиаторов не включен в анализ, интеллект, по-видимому, не оказывает никакого влияния или оказывает слабое влияние на ошибки. Однако, когда скука контролируется, интеллект, по-видимому, уменьшает количество ошибок, а когда обнаружение ошибок контролируется, интеллект, по-видимому, увеличивает количество ошибок. Если бы интеллект мог быть увеличен, при этом только скука оставалась бы постоянной, количество ошибок уменьшилось бы; если бы интеллект мог быть увеличен, при этом только обнаружение ошибок оставалось бы постоянным, количество ошибок увеличилось бы.
В целом, исключение подавляющих или искажающих факторов приведет либо к недооценке, либо к переоценке влияния A на X , тем самым либо к уменьшению, либо к искусственному увеличению величины связи между двумя переменными.
Другие важные третьи переменные — это модераторы . Модераторы — это переменные, которые могут сделать связь между двумя переменными сильнее или слабее. Такие переменные дополнительно характеризуют взаимодействия в регрессии, влияя на направление и/или силу связи между X и Y. Модерирующее отношение можно рассматривать как взаимодействие . Оно возникает, когда связь между переменными A и B зависит от уровня C. См. модерирование для дальнейшего обсуждения.
Медиация и модерация могут сосуществовать в статистических моделях. Возможно опосредовать модерацию и умерять медиацию.
Умеренное посредничество — это когда эффект лечения A на медиатор и/или частичный эффект B на зависимую переменную зависят в свою очередь от уровней другой переменной (модератора). По сути, при умеренном посредничестве сначала устанавливается посредничество, а затем исследуется, смягчается ли эффект посредничества, описывающий связь между независимой переменной и зависимой переменной, различными уровнями другой переменной (т. е. модератора). Это определение было изложено Мюллером, Джаддом и Изербитом (2005) [20] и Пречером, Ракером и Хейсом (2007). [21]
Существует пять возможных моделей модерируемого посредничества, как показано на диаграммах ниже. [20]
В дополнение к моделям, упомянутым выше, может также существовать новая переменная, которая модерирует связь между независимой переменной и медиатором (путь A), и в то же время новая переменная может модерировать связь между независимой переменной и зависимой переменной (путь C). [1]
Опосредованная модерация является вариантом как модерации, так и медиации. Это когда изначально есть общая модерация и прямое влияние переменной-модератора на результат опосредовано. Главное различие между опосредованной модерацией и умеренной медиацией заключается в том, что для первой есть начальная (общая) модерация и этот эффект опосредован, а для второй нет модерации, но либо влияние лечения на медиатор (путь A ) модерируется, либо влияние медиатора на результат (путь B ) модерируется. [20]
Чтобы установить опосредованную модерацию, нужно сначала установить модерацию , то есть направление и/или сила связи между независимыми и зависимыми переменными (путь C ) различаются в зависимости от уровня третьей переменной (переменной-модератора). Затем исследователи ищут наличие опосредованной модерации, когда у них есть теоретическое основание полагать, что существует четвертая переменная, которая действует как механизм или процесс, вызывающий связь между независимой переменной и модератором (путь A ) или между модератором и зависимой переменной (путь C ).
Ниже приведен опубликованный пример опосредованной модерации в психологических исследованиях. [22] Участникам был представлен начальный стимул (прайм), который заставил их подумать о морали или о силе. Затем они приняли участие в игре «Дилемма заключенного» (PDG), в которой участники притворялись, что они и их партнер по преступлению были арестованы, и они должны были решить, оставаться ли верными своему партнеру или конкурировать с ним и сотрудничать с властями. Исследователи обнаружили, что просоциальные индивиды были затронуты праймами морали и силы, тогда как просебя-индивиды — нет. Таким образом, социальная ценностная ориентация (просебя против просоциального) смягчала связь между праймом (независимая переменная: мораль против силы) и поведением, выбранным в PDG (зависимая переменная: соревновательный против кооперативного).
Затем исследователи искали наличие опосредованного эффекта модерации. Регрессионный анализ показал, что тип прайма (мораль против мощи) опосредовал модерирующее отношение социальной ценностной ориентации участников к поведению PDG. Просоциальные участники, которые испытали моральный прайм, ожидали, что их партнер будет сотрудничать с ними, поэтому они сами решили сотрудничать. Просоциальные участники, которые испытали прайм мощи, ожидали, что их партнер будет конкурировать с ними, что сделало их более склонными к конкуренции со своим партнером и сотрудничеству с властями. Напротив, участники с про-себяной социальной ценностной ориентацией всегда действовали конкурентно.
Мюллер, Джадд и Изербит (2005) [20] описывают три фундаментальные модели, которые лежат в основе как модерируемой медиации, так и опосредованной модерации. Mo представляет собой переменную(ые)-модератор(ы), Me представляет(ые) переменную(ые)-медиатор(ы), а ε i представляет собой ошибку измерения каждого уравнения регрессии.
Модерация связи между независимой переменной (X) и зависимой переменной (Y), также называемая общим эффектом лечения (путь C на диаграмме).
Модерация связи между независимой переменной и медиатором (путь А ).
Модерация как связи между независимыми и зависимыми переменными (путь A ), так и связи между медиатором и зависимой переменной (путь B ).
Медиационный анализ количественно определяет степень, в которой переменная участвует в передаче изменения от причины к ее следствию. Это по своей сути каузальное понятие, поэтому его нельзя определить в статистических терминах. Традиционно, однако, большая часть медиационного анализа проводилась в рамках линейной регрессии, а статистическая терминология маскировала причинный характер вовлеченных отношений. Это приводило к трудностям, предубеждениям и ограничениям, которые были смягчены современными методами каузального анализа, основанными на каузальных диаграммах и контрфактуальной логике.
Источник этих трудностей заключается в определении медиации в терминах изменений, вызванных добавлением третьей переменной в уравнение регрессии. Такие статистические изменения являются эпифеноменами, которые иногда сопровождают медиацию, но, в общем, не в состоянии уловить причинно-следственные связи, которые анализ медиации стремится количественно оценить.
Основная предпосылка причинного подхода заключается в том, что не всегда целесообразно «контролировать» посредника M , когда мы пытаемся оценить прямое влияние X на Y (см. рисунок выше). Классическое обоснование «контроля» для M заключается в том, что если нам удастся предотвратить изменение M , то любые изменения, которые мы измеряем в Y, можно приписать исключительно изменениям в X , и тогда мы имеем полное право провозгласить наблюдаемый эффект «прямым влиянием X на Y ». К сожалению, «контроль для M » физически не предотвращает изменение M ; он просто сужает внимание аналитика до случаев равных значений M. Более того, язык теории вероятностей не обладает обозначениями для выражения идеи «предотвращения изменения M » или «физического поддержания M постоянным». Единственный оператор, который предоставляет вероятность, — это «обусловливание», что мы и делаем, когда «контролируем» M или добавляем M в качестве регрессора в уравнение для Y. Результатом является то, что вместо того, чтобы физически поддерживать M постоянным (скажем, при M = m ) и сравнивать Y для единиц при X = 1' с единицами при X = 0, мы позволяем M изменяться, но игнорируем все единицы, за исключением тех, в которых M достигает значения M = m . Эти две операции принципиально различны и дают разные результаты. результаты, [23] [24] за исключением случая отсутствия пропущенных переменных. Неправильное обусловливание опосредованных эффектов может быть типом плохого контроля .
Для иллюстрации предположим, что погрешности M и Y коррелируют. При таких условиях структурные коэффициенты B и A (между M и Y и между Y и X ) больше не могут быть оценены путем регрессии Y на X и M. Фактически, оба наклона регрессии могут быть ненулевыми, даже если C равен нулю. [25] Это имеет два последствия. Во-первых, необходимо разработать новые стратегии для оценки структурных коэффициентов A, B и C. Во-вторых, основные определения прямых и косвенных эффектов должны выходить за рамки регрессионного анализа и должны вызывать операцию, которая имитирует «фиксацию M », а не «обусловливание на M ».
Такой оператор, обозначенный do( M = m ), был определен в Pearl (1994) [24] и он работает путем удаления уравнения M и замены его константой m . Например, если базовая модель посредничества состоит из уравнений:
то после применения оператора do( M = m ) модель становится:
и после применения оператора do( X = x ) модель становится:
где функции f и g , а также распределения членов ошибки ε 1 и ε 3 остаются неизменными. Если мы далее переименуем переменные M и Y , полученные из do( X = x ), как M ( x ) и Y ( x ) соответственно, мы получим то, что стало известно как «потенциальные результаты» [26] или «структурные контрфактуальные данные». [27] Эти новые переменные предоставляют удобные обозначения для определения прямых и косвенных эффектов. В частности, для перехода от X = 0 к X = 1 были определены четыре типа эффектов :
(а) Общий эффект –
(б) Контролируемый прямой эффект -
(c) Естественное прямое воздействие -
(d) Естественное косвенное воздействие
Где E [ ] обозначает математическое ожидание, взятое с учетом ошибок.
Эти эффекты имеют следующие интерпретации:
Контролируемой версии косвенного эффекта не существует, поскольку нет способа отключить прямой эффект, зафиксировав переменную на константе.
Согласно этим определениям общий эффект можно разложить в виде суммы
где NIE r обозначает обратный переход от X = 1 к X = 0; он становится аддитивным в линейных системах, где обращение переходов влечет за собой изменение знака.
Сила этих определений заключается в их общности: они применимы к моделям с произвольными нелинейными взаимодействиями, произвольными зависимостями между возмущениями, а также как с непрерывными, так и с категориальными переменными.
В линейном анализе все эффекты определяются суммами произведений структурных коэффициентов, что дает
Следовательно, все эффекты можно оценить, когда модель идентифицирована. В нелинейных системах требуются более строгие условия для оценки прямых и косвенных эффектов. [9] [28] [29] Например, если не существует никаких смешивающих факторов (т.е. ε 1 , ε 2 и ε 3 взаимно независимы), можно вывести следующие формулы: [9]
Последние два уравнения называются Формулами Медиации [30] [31] [32] и стали целью оценки во многих исследованиях медиации. [28] [29] [31] [32] Они дают выражения без распределения для прямых и косвенных эффектов и показывают, что, несмотря на произвольную природу распределений ошибок и функций f , g , и h , опосредованные эффекты тем не менее могут быть оценены по данным с использованием регрессии. Анализы модерируемой медиации и опосредующих модераторов являются частными случаями анализа причинной медиации, а формулы медиации определяют, как различные коэффициенты взаимодействия вносят вклад в необходимые и достаточные компоненты медиации. [29] [30]
Предположим, что модель имеет вид
где параметр количественно определяет степень, в которой M изменяет влияние X на Y. Даже когда все параметры оцениваются по данным, все еще не очевидно, какие комбинации параметров измеряют прямое и косвенное влияние X на Y , или, что более практично, как оценить долю общего эффекта , которая объясняется посредничеством, и долю , которая обязана посредничеству. В линейном анализе первая доля фиксируется произведением , вторая — разностью , и эти две величины совпадают. Однако при наличии взаимодействия каждая доля требует отдельного анализа, как предписано Формулой посредничества, которая дает:
Таким образом, доля выходного отклика, для которой посредничество будет достаточным, составляет
в то время как доля, для которой посредничество будет необходимо, составляет
Эти фракции включают неочевидные комбинации параметров модели и могут быть построены механически с помощью формулы медиации. Примечательно, что из-за взаимодействия прямой эффект может поддерживаться даже при исчезновении параметра и, более того, общий эффект может поддерживаться даже при исчезновении как прямого, так и косвенного эффектов. Это иллюстрирует, что оценка параметров в изоляции мало что говорит нам об эффекте медиации и, в более общем смысле, медиация и модерация переплетены и не могут быть оценены по отдельности.
По состоянию на 19 июня 2014 года эта статья полностью или частично основана на Causal Analysis in Theory and Practice . Владелец авторских прав лицензировал контент таким образом, что позволяет повторное использование в соответствии с CC BY-SA 3.0 и GFDL . Все соответствующие условия должны быть соблюдены. [ мертвая ссылка ]