Филогенетическая автокорреляция, также известная как проблема Гальтона , в честь сэра Фрэнсиса Гальтона , который ее описал, — это проблема вывода выводов из кросс-культурных данных из-за статистического явления, которое теперь называется автокорреляцией . Теперь эта проблема признана общей и применима ко всем неэкспериментальным исследованиям, а также к некоторым экспериментальным проектам . Ее проще всего описать как проблему внешних зависимостей при создании статистических оценок, когда выбранные элементы не являются статистически независимыми . Например, если спросить двух людей в одном доме, смотрят ли они телевизор, вы не получите статистически независимых ответов. Размер выборки n для независимых наблюдений в этом случае равен одному, а не двум. После внесения надлежащих корректировок, касающихся внешних зависимостей, будут применяться аксиомы теории вероятностей, касающиеся статистической независимости. Эти аксиомы важны для вывода мер дисперсии , например, или тестов статистической значимости .
В 1888 году Гальтон присутствовал, когда сэр Эдвард Тайлор представил доклад в Королевском антропологическом институте . Тайлор собрал информацию об институтах брака и происхождения для 350 культур и исследовал связи между этими институтами и мерами общественной сложности. Тайлор интерпретировал свои результаты как указания на общую эволюционную последовательность, в которой институты меняют фокус с материнской линии на отцовскую по мере того, как общества становятся все более сложными. Гальтон не согласился, указав, что сходство между культурами может быть обусловлено заимствованием, может быть обусловлено общим происхождением или может быть обусловлено эволюционным развитием; он утверждал, что без учета заимствования и общего происхождения нельзя делать обоснованные выводы относительно эволюционного развития. Критика Гальтона стала одноименной проблемой Гальтона , [1] : 175 , названной Раулем Нароллом , [2] [3], который предложил первые статистические решения.
К началу 20 века однолинейный эволюционизм был заброшен, а вместе с ним и вывод прямых выводов из корреляций в эволюционные последовательности. Однако критика Гальтона оказалась столь же справедливой для вывода функциональных отношений из корреляций. Проблема автокорреляции осталась.
Статистик Уильям С. Госсет в 1914 году разработал методы устранения ложной корреляции из-за того, как положение во времени или пространстве влияет на сходства. Сегодняшние предвыборные опросы имеют похожую проблему: чем ближе опрос к выборам, тем меньше людей принимают решения независимо, и тем больше ненадежность результатов опроса, особенно предела погрешности или доверительных интервалов . Эффективное n независимых случаев из их выборки падает по мере приближения выборов. Статистическая значимость падает с уменьшением эффективного размера выборки.
Проблема возникает в выборочных обследованиях , когда социологи хотят сократить время в пути для проведения интервью, и поэтому они делят свою популяцию на локальные кластеры и делают выборку кластеров случайным образом, а затем снова делают выборку внутри кластеров. Если они опрашивают n человек в кластерах размером m, то эффективный размер выборки (efs) будет иметь нижний предел 1 + ( n − 1) / m , если все в каждом кластере были бы идентичны. Когда внутри кластеров есть только частичное сходство, m в этой формуле должно быть соответственно уменьшено. Формула такого рода имеет вид 1 + d ( n − 1) , где d — внутриклассовая корреляция для рассматриваемой статистики. [4] В общем, оценка соответствующих efs зависит от оцененной статистики , например, среднего значения , хи-квадрат , корреляции , коэффициента регрессии и их дисперсий .
Для кросс-культурных исследований Мёрдок и Уайт [5] оценили размер участков сходства в своей выборке из 186 обществ. Четыре переменные, которые они тестировали — язык, экономика, политическая интеграция и происхождение — имели участки сходства, которые варьировались от размера трех до размера десяти. Очень грубым эмпирическим правилом может быть деление квадратного корня размеров участков сходства на n , так что эффективные размеры выборки составляют 58 и 107 для этих участков соответственно. Опять же, статистическая значимость падает с уменьшением эффективного размера выборки.
В современном анализе пространственные задержки моделируются для оценки степени глобализации современных обществ. [6]
Пространственная зависимость или автокорреляция является фундаментальной концепцией в географии. Методы, разработанные географами, которые измеряют и контролируют пространственную автокорреляцию [7] [8], делают гораздо больше, чем просто уменьшают эффективное n для тестов значимости корреляции. Одним из примеров является сложная гипотеза о том, что «наличие азартных игр в обществе прямо пропорционально наличию коммерческих денег и наличию значительных социально-экономических различий и обратно пропорционально тому, является ли общество кочевым скотоводческим обществом». [9] Тесты этой гипотезы на выборке из 60 обществ не смогли отвергнуть нулевую гипотезу. Однако анализ автокорреляции показал значительное влияние социально-экономических различий. [10]
Насколько распространена автокорреляция среди переменных, изучаемых в кросс-культурных исследованиях? Тест, проведенный Антоном Эффом на 1700 переменных в совокупной базе данных для Стандартной кросс-культурной выборки , опубликованный в World Cultures, измерил I Морана для пространственной автокорреляции (расстояние), лингвистической автокорреляции (общее происхождение) и автокорреляции в культурной сложности (основная эволюция). «Результаты показывают, что ... было бы разумно проверить пространственную и филогенетическую автокорреляцию при проведении регрессионного анализа со Стандартной кросс-культурной выборкой». [11] Проиллюстрировано использование тестов автокорреляции в разведочном анализе данных, показывающее, как все переменные в данном исследовании могут быть оценены на предмет независимости случаев с точки зрения расстояния, языка и культурной сложности. Затем объясняются и иллюстрируются методы оценки этих эффектов автокорреляции для обычной регрессии наименьших квадратов с использованием снова меры значимости I Морана для автокорреляции.
При наличии автокорреляции ее часто можно удалить, чтобы получить несмещенные оценки коэффициентов регрессии и их дисперсий, построив переопределенную зависимую переменную, которая «отстает» от весов зависимой переменной в других местах, где веса являются степенью связи. Эта отстающая зависимая переменная является эндогенной, и оценка требует либо двухэтапных методов наименьших квадратов, либо методов максимального правдоподобия . [12]
Публичный сервер, используемый извне по адресу http://SocSciCompute.ss.uci.edu Архивировано 20.02.2016 в Wayback Machine , предлагает этнографические данные, переменные и инструменты для вывода с помощью скриптов R Доу (2007) и Эффа и Доу (2009) в поддерживаемой NSF инфраструктуре Galaxy (http://getgalaxy.org) (https://www.xsede.org) для преподавателей, студентов и исследователей для моделирования кросс-культурных исследований "CoSSci Galaxy" Архивировано 20.02.2016 в Wayback Machine с элементами управления для задачи Гальтона с использованием стандартных кросс-культурных выборочных переменных по адресу https://web.archive.org/web/20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook.txt.
В антропологии, где проблема Тайлора была впервые обнаружена статистиком Гальтоном в 1889 году, до сих пор не широко признано, что существуют стандартные статистические корректировки для проблемы пятен сходства в наблюдаемых случаях и возможностей для новых открытий с использованием методов автокорреляции. Некоторые кросс-культурные исследователи (см., например, Коротаев и де Мунк 2003) [13] начали понимать, что доказательства диффузии, исторического происхождения и других источников сходства среди родственных обществ или индивидов следует переименовать в возможности Гальтона и активы Гальтона, а не в проблему Гальтона. Исследователи теперь регулярно используют продольный, кросс-культурный и региональный анализ вариаций для анализа всех конкурирующих гипотез: функциональных отношений, диффузии , общего исторического происхождения, многолинейной эволюции , совместной адаптации с окружающей средой и сложной динамики социального взаимодействия . [14]
В антропологии проблема филогенетической автокорреляции часто приводится в качестве причины для полного отказа от сравнительных исследований. Поскольку эта проблема является общей, общей для наук и статистических выводов в целом, эта конкретная критика кросс-культурных или сравнительных исследований — а их много — является той, которая, логически рассуждая, сводится к полному отказу от науки и статистики. Любые данные, собранные и проанализированные этнографами, например, в равной степени подвержены автокорреляции, понимаемой в самом общем смысле. Критика антикомпаративной критики не ограничивается статистическим сравнением, поскольку она применима также к анализу текста. То есть анализ и использование текста в аргументации подвергаются критике относительно доказательной базы вывода. Опора исключительно на риторику не является защитой от критики относительно обоснованности аргумента и его доказательной базы.
Однако мало сомнений в том, что сообщество исследователей кросс-культурных различий небрежно отнеслось к игнорированию автокорреляции. Экспертное исследование этого вопроса показывает результаты, которые «убедительно свидетельствуют о том, что обширное сообщение о наивных тестах независимости хи-квадрат с использованием кросс-культурных наборов данных за последние несколько десятилетий привело к неправильному отклонению нулевых гипотез на уровнях, намного превышающих ожидаемый уровень в 5%». [15] : 247 Исследователь приходит к выводу, что «неверные теории, которые были «спасены» наивными тестами хи-квадрат со сравнительными данными, могут быть еще более строго проверены в другой день». [15] : 270 И снова скорректированная дисперсия выборки кластера дается как единица, умноженная на 1 + d ( k + 1), где k — средний размер кластера, а более сложная поправка дается для дисперсии корреляций таблицы сопряженности с r строками и c столбцами. С тех пор как эта критика была опубликована в 1993 году, и другие, подобные ей, больше авторов начали принимать поправки к проблеме Гальтона, но большинство в кросс-культурной области этого не сделали. Следовательно, большая часть опубликованных результатов, которые опираются на наивные тесты значимости и которые принимают стандарт P < 0,05, а не P < 0,005, вероятно, будут ошибочными, поскольку они более подвержены ошибке I типа , которая заключается в отклонении нулевой гипотезы, когда она верна.
Некоторые кросс-культурные исследователи отвергают серьезность проблемы автокорреляции, поскольку, как они утверждают, оценки корреляций и средних значений могут быть несмещенными, даже если присутствует автокорреляция, слабая или сильная. Однако, не исследуя автокорреляцию, они все равно могут неправильно оценить статистику, касающуюся взаимосвязей между переменными. Например, в регрессионном анализе изучение моделей автокоррелированных остатков может дать важные подсказки о третьих факторах, которые могут влиять на взаимосвязи между переменными, но которые не были включены в регрессионную модель. Во-вторых, если в выборке есть кластеры похожих и родственных обществ, меры дисперсии будут недооценены, что приведет к ложным статистическим выводам, например, преувеличению статистической значимости корреляций. В-третьих, недооценка дисперсии затрудняет проверку на повторение результатов из двух разных выборок, поскольку результаты будут чаще отклоняться как схожие.
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )