Внешняя валидность

Внешняя валидность — это обоснованность применения выводов научного исследования вне контекста этого исследования. ^[1] Другими словами, это степень, в которой результаты исследования могут быть обобщены или перенесены на другие ситуации, людей, стимулы и времена. ^[2]^[3] Обобщаемость означает применимость заранее определенной выборки к более широкой популяции, тогда как транспортабельность означает применимость одной выборки к другой целевой популяции. ^[2] Напротив, внутренняя валидность — это достоверность выводов, сделанных в контексте конкретного исследования.

Математический анализ внешней валидности касается определения того, возможно ли обобщение на гетерогенные группы населения, а также разработки статистических и вычислительных методов, которые дают достоверные обобщения. ^[4]

При установлении внешней достоверности ученые склонны определять «объем» исследования, который относится к применимости или ограничениям теории или аргументов исследования. ^[2] Это влечет за собой определение выборки исследования и более широкой популяции, которую представляет выборка. ^[2]

Угрозы

«Угроза внешней достоверности — это объяснение того, как вы можете ошибаться, делая обобщения на основе результатов конкретного исследования». ^[5] В большинстве случаев возможность обобщения ограничена, когда эффект одного фактора (т.е. независимой переменной ) зависит от других факторов. Следовательно, все угрозы внешней валидности можно описать как статистические взаимодействия . ^[6] Вот некоторые примеры:

Способность в зависимости от лечения: выборка может иметь определенные особенности, которые взаимодействуют с независимой переменной, ограничивая возможность обобщения. Например, в сравнительных психотерапевтических исследованиях часто используются конкретные выборки (например, добровольцы, находящиеся в сильной депрессии и не имеющие сопутствующих заболеваний). Если психотерапия окажется эффективной для пациентов из этой выборки, будет ли она также эффективна для недобровольцев, пациентов с легкой депрессией или пациентов с сопутствующими другими расстройствами? В противном случае внешняя достоверность исследования будет ограничена.
Взаимодействие ситуации с лечением: все ситуационные особенности (например, условия лечения, время, место, освещение, шум, назначение лечения, исследователь, время, объем и степень измерения и т. д.) исследования потенциально ограничивают возможность обобщения.
Взаимодействие предварительного тестирования и лечения: Если причинно-следственные связи можно обнаружить только при проведении предварительных тестов, то это также ограничивает общность результатов. Иногда это называют «сенсибилизацией», поскольку предварительный тест делает людей более чувствительными к манипуляциям с лечением.

Обратите внимание, что внешняя валидность исследования ограничена его внутренней валидностью. Если причинно-следственный вывод , сделанный в ходе исследования, недействителен, то обобщение этого вывода на другие контексты также будет недействительным.

Кук и Кэмпбелл ^[7] провели решающее различие между обобщением на некоторую популяцию и обобщением на субпопуляции, определяемые разными уровнями некоторого фонового фактора. Линч утверждал, что почти никогда невозможно обобщить значимые популяции, за исключением моментального снимка истории, но можно проверить, в какой степени влияние некоторой причины на некоторую зависимую переменную распространяется на субпопуляции, которые различаются по некоторому фоновому фактору. Это требует проверки того, смягчается ли исследуемый эффект лечения взаимодействием с одним или несколькими фоновыми факторами. ^[6]^[8]

Обезоруживающие угрозы

Хотя перечисление угроз достоверности может помочь исследователям избежать необоснованных обобщений, многие из этих угроз можно обезвредить или нейтрализовать систематическим образом, чтобы обеспечить обоснованное обобщение. В частности, экспериментальные результаты одной популяции могут быть «повторно обработаны» или «перекалиброваны», чтобы обойти популяционные различия и произвести действительные обобщения во второй популяции, где эксперименты не могут быть проведены. Перл и Барейнбойм ^[4] классифицировали проблемы обобщения на две категории: (1) те, которые поддаются валидной перекалибровке, и (2) те, где внешняя валидность теоретически невозможна. Используя исчисление на основе графов, ^[9] они вывели необходимое и достаточное условие для экземпляра задачи, позволяющее сделать допустимое обобщение, и разработали алгоритмы, которые автоматически производят необходимую повторную калибровку, когда бы она ни существовала. ^[10] Это сводит проблему внешней валидности к упражнениям в теории графов и привело некоторых философов к выводу, что проблема теперь решена. ^[11]

Важный вариант проблемы внешней достоверности касается систематической ошибки отбора , также известной как систематическая ошибка выборки , то есть систематическая ошибка, возникающая, когда исследования проводятся на нерепрезентативных выборках целевой совокупности. Например, если клиническое исследование проводится на студентах колледжа, исследователь может захотеть узнать, распространяются ли результаты на всю популяцию, где такие характеристики, как возраст, образование и доход, существенно отличаются от характеристик типичного студента. Основанный на графах метод Барейнбойма и Перла определяет условия, при которых можно обойти систематическую ошибку отбора выборки, и, когда эти условия выполняются, метод строит несмещенную оценку среднего причинного эффекта во всей совокупности. Основное различие между обобщением результатов исследований с неправильной выборкой и обобщением на разрозненные группы населения заключается в том, что различия между популяциями обычно вызваны ранее существовавшими факторами, такими как возраст или этническая принадлежность, тогда как ошибка отбора часто вызвана условиями после лечения, например, пациенты, выбывшие из исследования, или пациенты, отобранные по тяжести травмы. Когда выбор определяется факторами после обработки, требуются нетрадиционные методы повторной калибровки для обеспечения оценки без систематических ошибок, и эти методы легко получить из графика задачи. ^[12]^[13]

Примеры

Если возраст считается основным фактором, вызывающим различия в эффекте лечения от человека к человеку, тогда возрастные различия между включенными в выборку студентами и населением в целом могут привести к смещенной оценке среднего эффекта лечения в этой группе населения. Однако такое смещение можно исправить с помощью простой процедуры повторного взвешивания: мы берем возрастной эффект в студенческой подгруппе и вычисляем его среднее значение, используя возрастное распределение в общей популяции. Это дало бы нам объективную оценку среднего эффекта лечения в популяции. Если, с другой стороны, лечение само по себе влияет на соответствующий фактор, который отличает исследуемую выборку от генеральной совокупности, тогда необходимо использовать другую схему повторного взвешивания. Назвав этот фактор Z , мы снова усредняем z -специфическое влияние X на Y в экспериментальной выборке, но теперь взвешиваем его по «причинному влиянию» X на Z. Другими словами, новый вес представляет собой долю единиц, достигших уровня Z=z , в которых лечение X=x проводилось для всей популяции. Эту вероятность вмешательства, о которой часто пишут ^[14] , иногда можно оценить на основе наблюдательных исследований среди населения в целом. $P(Z=z|do(X=x))$

Типичный пример такого характера возникает, когда Z является посредником между лечением и результатом. Например, лечение может представлять собой препарат, снижающий уровень холестерина, Z может быть уровнем холестерина, а Y — ожидаемой продолжительностью жизни. Здесь на Z влияет как лечение, так и основной фактор, определяющий результат, Y. Предположим, что субъекты, выбранные для экспериментального исследования, имеют тенденцию иметь более высокий уровень холестерина, чем это типично для населения в целом. Чтобы оценить средний эффект препарата на выживаемость во всей популяции, мы сначала вычисляем z -специфический эффект лечения в экспериментальном исследовании, а затем усредняем его, используя в качестве весовой функции. Полученная оценка будет свободна от систематической ошибки, даже если Z и Y смешаны, то есть когда существует неизмеренный общий фактор, влияющий как на Z , так и на Y. ^[15] $P(Z=z|do(X=x))$

Точные условия, обеспечивающие достоверность этой и других схем взвешивания, сформулированы в работах Bareinboim and Pearl, 2016 ^[15] и Bareinboim et al., 2014. ^[13]

Внешняя, внутренняя и экологическая валидность

Во многих исследованиях и проектах исследований может существовать компромисс между внутренней и внешней валидностью: ^[16]^[17]^[18] Попытки повысить внутреннюю валидность могут также ограничить возможность обобщения результатов, и наоборот. Эта ситуация побудила многих исследователей призывать к «экологически обоснованным» экспериментам. Под этим они подразумевают, что экспериментальные процедуры должны напоминать условия «реального мира». Они критикуют отсутствие экологической обоснованности многих лабораторных исследований с упором на искусственно контролируемую и ограниченную среду. Некоторые исследователи считают, что внешняя валидность и экологическая валидность тесно связаны в том смысле, что причинно-следственные выводы, основанные на экологически обоснованных исследовательских проектах, часто допускают более высокую степень обобщения, чем те, которые получены в искусственно созданной лабораторной среде. Однако это снова связано с различием между обобщением на некоторую популяцию (тесно связанным с опасениями по поводу экологической обоснованности) и обобщением на субпопуляции, которые различаются по какому-то фоновому фактору. Некоторые результаты, полученные в экологически обоснованных исследовательских условиях, вряд ли могут быть обобщены, а некоторые результаты, полученные в строго контролируемых условиях, могут претендовать на почти универсальную внешнюю достоверность. Таким образом, внешняя и экологическая валидность независимы — исследование может обладать внешней валидностью, но не экологической валидностью, и наоборот.

Качественное исследование

В рамках качественной исследовательской парадигмы внешняя валидность заменяется концепцией переносимости. Переносимость — это способность результатов исследования переноситься в ситуации со схожими параметрами, популяциями и характеристиками. ^[19]

В экспериментах

Исследователи часто заявляют, что эксперименты по своей природе имеют низкую внешнюю валидность. Некоторые утверждают, что при использовании экспериментального метода может возникнуть множество недостатков. Благодаря получению достаточного контроля над ситуацией, чтобы случайным образом распределять людей по условиям и исключать влияние посторонних переменных, ситуация может стать несколько искусственной и далекой от реальной жизни.

Речь идет о двух видах обобщения:

Степень, в которой мы можем обобщать ситуацию, созданную экспериментатором, на ситуации реальной жизни ( обобщаемость на ситуации ), ^[3] и
Степень, в которой мы можем обобщать людей, принимавших участие в эксперименте, на людей в целом ( обобщаемость на людей ) ^[3]

Однако оба эти соображения относятся к концепции Кука и Кэмпбелла об обобщении на некоторую целевую группу, а не к, возможно, более важной задаче оценки возможности обобщения результатов эксперимента на субпопуляции, которые отличаются от конкретной изучаемой ситуации, и на людей, которые отличаются от респондентов. изучается каким-то осмысленным образом. ^[7]

Критики экспериментов предполагают, что внешняя валидность может быть повышена за счет использования полевых условий (или, как минимум, реалистичных лабораторных условий) и использования истинных вероятностных выборок респондентов. Однако, если цель состоит в том, чтобы понять возможность обобщения среди субпопуляций, которые различаются ситуативными или личными фоновыми факторами, эти средства не обладают той эффективностью в увеличении внешней валидности, которую им обычно приписывают. Если существуют фоновые взаимодействия с лечением фактора X, о которых исследователь не знает (что кажется вероятным), эти исследовательские практики могут маскировать существенный недостаток внешней валидности. Дипбой и Фланаган, пишущие о промышленной и организационной психологии, отмечают, что факты свидетельствуют о том, что результаты, полученные в одной полевой обстановке и в одной лабораторной обстановке, с одинаковой вероятностью не будут обобщены на вторую полевые условия. ^[20] Таким образом, полевые исследования по своей природе не обладают высокой внешней валидностью, а лабораторные исследования по своей природе не обладают низкой внешней валидностью. В обоих случаях зависит, будет ли конкретный изучаемый эффект лечения меняться при изменении фоновых факторов, которые в этом исследовании остаются постоянными. Если исследование «нереалистично» на уровне какого-то фонового фактора, который не взаимодействует с лечением, оно не влияет на внешнюю валидность. Внешняя достоверность оказывается под угрозой только в том случае, если в эксперименте сохраняется постоянный какой-либо фоновый фактор на нереалистичном уровне и если изменение этого фонового фактора выявило бы сильное взаимодействие Лечение x Фоновый фактор. ^[6]

Обобщаемость по ситуациям

Исследования в области психологических экспериментов, проводимые в университетах, часто критикуются за то, что они проводятся в искусственных ситуациях и не могут быть обобщены на реальную жизнь. ^[21]^[22] Чтобы решить эту проблему, социальные психологи пытаются повысить обобщаемость своих результатов, делая свои исследования как можно более реалистичными. Как отмечалось выше, это сделано в надежде на обобщение на какую-то конкретную группу населения. Реализм сам по себе не помогает делать заявления о том, изменились бы результаты, если бы условия были более реалистичными или если бы участники исследования были помещены в другие реалистичные условия. Если тестируется только один параметр, невозможно делать заявления о возможности обобщения для всех параметров. ^[6]^[8]

Однако многие авторы смешивают внешнюю обоснованность и реализм. Существует несколько способов сделать эксперимент реалистичным:

Сходство экспериментальной ситуации с событиями, часто происходящими в повседневной жизни, — ясно, что многие эксперименты решительно нереальны.
Во многих экспериментах людей помещают в ситуации, с которыми они редко сталкиваются в повседневной жизни.

Степень сходства эксперимента с ситуациями реальной жизни называется обыденным реализмом эксперимента. ^[21]

Гораздо важнее обеспечить высокий уровень психологического реализма исследования — насколько схожи психологические процессы, запускаемые в эксперименте, с психологическими процессами, происходящими в повседневной жизни. ^[23]

Психологический реализм усиливается, если люди оказываются вовлеченными в реальное событие. Для этого исследователи иногда рассказывают участникам легенду — ложное описание цели исследования. Однако если бы экспериментаторы рассказали участникам о цели эксперимента, такая процедура была бы низкой по психологическому реализму. В повседневной жизни никто не знает, когда произойдет чрезвычайная ситуация, и у людей нет времени планировать меры реагирования на них. Это означает, что типы запускаемых психологических процессов будут сильно отличаться от тех, что происходят в реальной чрезвычайной ситуации, что снижает психологический реализм исследования. ^[3]

Люди не всегда знают, почему они делают то, что делают, или что они делают, пока это не происходит. Следовательно, описание экспериментальной ситуации участникам и последующая просьба к ним нормально реагировать приведет к реакциям, которые могут не соответствовать поведению людей, которые на самом деле находятся в такой же ситуации. Мы не можем зависеть от предсказаний людей относительно того, что они будут делать в гипотетической ситуации; мы сможем узнать, что на самом деле будут делать люди, только если сконструируем ситуацию, запускающую те же психологические процессы, которые происходят в реальном мире.

Обобщаемость на людей

Социальные психологи изучают, как люди в целом восприимчивы к социальному влиянию. Несколько экспериментов зафиксировали интересный и неожиданный пример социального влияния, когда простое знание о присутствии других снижало вероятность того, что люди помогут.

Единственный способ быть уверенным в том, что результаты эксперимента отражают поведение конкретной популяции, — это гарантировать, что участники выбираются из этой популяции случайным образом. Выборки в экспериментах не могут быть выбраны случайным образом, как в опросах, потому что отбирать случайные выборки для экспериментов по социальной психологии непрактично и дорого. Достаточно сложно убедить случайную выборку людей согласиться ответить на несколько вопросов по телефону в рамках политического опроса, и проведение таких опросов может стоить тысячи долларов. Более того, даже если каким-то образом удалось набрать по-настоящему случайную выборку, в эффектах экспериментального лечения может наблюдаться ненаблюдаемая гетерогенность... Лечение может иметь положительный эффект на одни подгруппы, но отрицательный эффект на другие. Эффекты, показанные в средних значениях лечения, не могут распространяться на какую-либо подгруппу. ^[6]^[24]

Многие исследователи решают эту проблему, изучая основные психологические процессы, которые делают людей восприимчивыми к социальному влиянию, предполагая, что эти процессы настолько фундаментальны, что они универсальны. Некоторые процессы социальной психологии различаются в разных культурах, и в таких случаях необходимо изучать разные выборки людей. ^[25]

Репликации

Окончательной проверкой внешней валидности эксперимента является повторение — проведение исследования заново, как правило, с другими группами испытуемых или в разных условиях. Исследователи часто используют разные методы, чтобы увидеть, получают ли они те же результаты.

Когда проводится множество исследований одной проблемы, результаты могут различаться. Некоторые исследования могут обнаружить влияние количества свидетелей на помогающее поведение, тогда как некоторые этого не делают. Чтобы разобраться в этом, существует статистический метод, называемый метаанализом , который усредняет результаты двух или более исследований, чтобы увидеть, является ли эффект независимой переменной надежным. Метаанализ, по сути, говорит нам о вероятности того, что результаты многих исследований обусловлены случайностью или независимой переменной. Если будет обнаружено, что независимая переменная оказывает влияние только в одном из 20 исследований, метаанализ покажет вам, что это одно исследование было исключением и что в среднем независимая переменная не влияет на зависимую переменную. Если независимая переменная оказывает влияние в большинстве исследований, метаанализ, скорее всего, покажет нам, что в среднем она влияет на зависимую переменную.

Могут быть достоверные явления, которые не ограничиваются лабораторными условиями. Например, было обнаружено, что увеличение числа свидетелей препятствует оказанию помощи многим людям, включая детей, студентов университетов и будущих служителей; ^[25] в Израиле; ^[26] в маленьких и крупных городах США; ^[27] в различных местах, таких как психологические лаборатории, городские улицы и поезда метро; ^[28] и при различных типах чрезвычайных ситуаций, таких как захваты, потенциальные пожары, драки и несчастные случаи, ^[29] , а также при менее серьезных событиях, таких как спущенное колесо. ^[30] Многие из этих повторов были проведены в реальных условиях, когда люди не могли знать, что эксперимент проводится.

Основная дилемма социального психолога

Некоторые полагают, что при проведении экспериментов в психологии всегда существует компромисс между внутренней и внешней достоверностью.

иметь достаточный контроль над ситуацией, чтобы гарантировать, что никакие посторонние переменные не влияют на результаты, и случайным образом распределять людей по условиям, и
обеспечение возможности распространения результатов на повседневную жизнь.

Некоторые исследователи полагают, что хороший способ повысить внешнюю валидность — провести полевые эксперименты . В полевом эксперименте поведение людей изучается вне лаборатории, в естественной обстановке. Полевой эксперимент по своей конструкции идентичен лабораторному эксперименту, за исключением того, что он проводится в реальных условиях. Участники полевого эксперимента не осознают, что события, которые они переживают, на самом деле являются экспериментом. Некоторые утверждают, что внешняя валидность такого эксперимента высока, поскольку он проводится в реальном мире с реальными людьми, которые более разнообразны, чем типичная выборка студентов университета. Однако, поскольку реальные условия существенно различаются, результаты в одной реальной ситуации могут или не могут быть обобщены на другую реальную ситуацию. ^[20]

Ни внутренняя, ни внешняя валидность не фиксируется ни в одном эксперименте. Социальные психологи в первую очередь отдают предпочтение внутренней валидности, проводя лабораторные эксперименты, в которых людей случайным образом распределяют в разные условия и контролируют все внешние переменные. Другие социальные психологи предпочитают внешнюю валидность контролю, проводя большую часть своих исследований в полевых условиях, а многие делают и то, и другое. В совокупности оба типа исследований отвечают требованиям идеального эксперимента. Посредством репликации исследователи могут изучить данный исследовательский вопрос с максимальной внутренней и внешней достоверностью. ^[31]

Смотрите также

Примечания

^ Митчелл, М. и Джолли, Дж. (2001). Объяснение дизайна исследования (4-е изд.) Нью-Йорк: Harcourt.
^ abcd Финдли, Майкл Г.; Кикута, Кёске; Денли, Майкл (2021). "Внешняя валидность". Ежегодный обзор политической науки . 24 (1): 365–393. doi : 10.1146/annurev-polisci-041719-102556 . ISSN 1094-2939.
^ abcd Аронсон, Э., Уилсон, Т.Д., Акерт, Р.М., и Фер, Б. (2007). Социальная психология. (4-е изд.). Торонто, Онтарио: Pearson Education.
^ аб Перл, Иудея; Барейнбойм, Элиас (2014). «Внешняя валидность: от do -исчисления к транспортабельности среди населения». Статистическая наука . 29 (4): 579–595. arXiv : 1503.01603 . дои :10.1214/14-ст486. S2CID 5586184.
^ Трохим, Уильям М. База знаний о методах исследования, 2-е издание.
^ abcde Линч, Джон (1982). «О внешней достоверности экспериментов в области исследований потребителей». Журнал потребительских исследований . 9 (3): 225–239. дои : 10.1086/208919. JSTOR 2488619.
^ аб Кук, Томас Д.; Кэмпбелл, Дональд Т. (1979). Квази-эксперименты: проблемы проектирования и анализа полевых настроек . Чикаго: Издательская компания колледжа Рэнда МакНелли. ISBN 978-0395307908.
^ Аб Линч, Джон (1999). «Теория и внешняя валидность». Журнал Академии маркетинговых наук . 27 (3): 367–76. CiteSeerX 10.1.1.417.8073 . дои : 10.1177/0092070399273007. S2CID 145357923.
^ Перл, Иудея (1995). «Причинно-следственные диаграммы для эмпирических исследований». Биометрика . 82 (4): 669–710. дои : 10.1093/биомет/82.4.669.
^ Барейнбойм, Элиас; Перл, Иудея (2013). «Общий алгоритм определения транспортабельности экспериментальных результатов». Журнал причинно-следственных выводов . 1 (1): 107–134. arXiv : 1312.7485 . doi : 10.1515/jci-2012-0004. S2CID 13325846.
^ Марчеллези, Александр (декабрь 2015 г.). «Внешняя валидность: проблема все еще существует?». Философия науки . 82 (5): 1308–1317. дои : 10.1086/684084. S2CID 125072255.
^ Перл, Иудея (2015). Обобщение результатов эксперимента . Журнал причинно-следственных выводов . Том. 3, нет. 2. С. 259–266.
^ аб Барейнбойм, Элиас; Тиан, Джин; Перл, Иудея (2014). Бродли, Карла Э .; Стоун, Питер (ред.). «Восстановление после систематической ошибки выбора в причинно-следственных и статистических выводах». Материалы двадцать восьмой конференции AAAI по искусственному интеллекту : 2410–2416.
^ Перл, Иудея; Глимур, Мэделин; Джуэлл, Николас П. (2016). Причинно-следственный вывод в статистике: учебник для начинающих . Нью-Йорк: Уайли.
^ аб Барейнбойм, Элиас; Перл, Иудея (2016). «Причинно-следственный вывод и проблема объединения данных». Труды Национальной академии наук . 113 (27): 7345–7352. дои : 10.1073/pnas.1510507113 . ПМЦ 4941504 . ПМИД 27382148.
^ Кэмпбелл, Дональд Т. (1957). «Факторы, имеющие отношение к достоверности экспериментов в социальных сетях». Психологический вестник . 54 (4): 297–312. дои : 10.1037/h0040950. ISSN 1939-1455. ПМИД 13465924.
^ Лин, Хаус; Вернер, Кейтлин М.; Инцлихт, Майкл (16 февраля 2021 г.). «Обещания и опасности экспериментирования: проблема взаимной внутренней достоверности». Перспективы психологической науки . 16 (4): 854–863. дои : 10.1177/1745691620974773. ISSN 1745-6916. PMID 33593177. S2CID 231877717.
^ Шрам, Артур (1 июня 2005 г.). «Искусственность: напряжение между внутренней и внешней обоснованностью экономических экспериментов». Журнал экономической методологии . 12 (2): 225–237. дои : 10.1080/13501780500086081. ISSN 1350-178X. S2CID 145588503.
^ Линкольн, Ю.С.; Губа, Е.Г. (1986). «Но является ли это строгим? Надежность и подлинность в натуралистической оценке». В Уильямсе, Д.Д. (ред.). Натуралистическая оценка . Новые направления оценки программ. Том. 30. Сан-Франциско: Джосси-Басс. стр. 73–84. ISBN 0-87589-728-2.
^ аб Дипбой, Роберт Л.; Фланаган, Майкл Ф. (1979). «Обстановка исследований в области промышленной и организационной психологии: результаты в этой области более обобщаемы, чем лабораторные». Американский психолог . 34 (2): 141–150. дои : 10.1037/0003-066x.34.2.141.
^ Аб Аронсон, Э., и Карлсмит, Дж. М. (1968). Эксперименты в социальной психологии. В Г. Линдзи и Э. Аронсоне (ред.), Справочник по социальной психологии. (Том 2, стр. 1–79.) Ридинг, Массачусетс: Аддисон-Уэсли.
^ Яркони, Таль (21 декабря 2020 г.). «Кризис обобщения». Поведенческие и мозговые науки . 45 : е1. дои : 10.1017/S0140525X20001685. ISSN 0140-525X. ПМЦ 10681374 . ПМИД 33342451.
^ Аронсон, Э., Уилсон, Т.Д., и Брюэр, м. (1998). Экспериментальные методы. В Д. Гилберте, С. Фиске и Г. Линдзи (ред.), Справочник по социальной психологии. (4-е изд., Том 1, стр. 99–142.) Нью-Йорк: Random House.
^ Хатчинсон, Дж. Уэсли; Камакура, Вагнер А.; Линч, Джон Г. (2000). «Ненаблюдаемая гетерогенность как альтернативное объяснение «обратных» эффектов в поведенческих исследованиях». Журнал потребительских исследований . 27 (3): 324–344. дои : 10.1086/317588. JSTOR 10.1086/317588. S2CID 16353123.
^ Аб Дарли, Дж. М.; Бэтсон, компакт-диск (1973). «От Иерусалима до Иерихона: исследование ситуационных и диспозиционных переменных в помогающем поведении». Журнал личности и социальной психологии . 27 : 100–108. дои : 10.1037/h0034449.
^ Шварц, SH; Готлиб, А. (1976). «Реакция свидетеля на насильственную кражу: Преступление в Иерусалиме». Журнал личности и социальной психологии . 34 (6): 1188–1199. дои : 10.1037/0022-3514.34.6.1188. ПМИД 1003323.
^ Латане, Б.; Даббс, Дж. М. (1975). «Секс, размер группы и помощь в трех городах». Социометрия . 38 (2): 108–194. дои : 10.2307/2786599. JSTOR 2786599.
^ Харрисон, Дж.А.; Уэллс, РБ (1991). «Влияние свидетеля на помогающее поведение мужчин: социальное сравнение и распределение ответственности». Репрезентативные исследования в области социальной психологии . 96 : 187–192.
^ Латане, Б.; Дарли, Дж. М. (1968). «Групповое торможение вмешательства посторонних». Журнал личности и социальной психологии . 10 (3): 215–221. дои : 10.1037/h0026570. PMID 5704479. S2CID 28550502.
^ Херли, Д.; Аллен, БП (1974). «Влияние количества людей, находящихся в неаварийной ситуации». Журнал социальной психологии . 92 : 27–29. дои : 10.1080/00224545.1974.9923068.
^ Латане, Б., и Дарли, Дж. М. (1970). Неотзывчивый очевидец: Почему он не помогает? Энглвуд Клиффс, Нью-Джерси: Прентис Холл