stringtranslate.com

Филогенетическая автокорреляция

Филогенетическая автокорреляция, также известная как проблема Гальтона , в честь описавшего ее сэра Фрэнсиса Гальтона , представляет собой проблему получения выводов на основе межкультурных данных из-за статистического явления, которое теперь называется автокорреляцией . В настоящее время эта проблема признана общей и применимой ко всем неэкспериментальным исследованиям, а также к некоторым экспериментальным планам . Проще всего ее можно описать как проблему внешних зависимостей при проведении статистических оценок, когда элементы выборки не являются статистически независимыми . Например, если спросить двух членов одной семьи, смотрят ли они телевизор, вы не получите статистически независимых ответов. Размер выборки n для независимых наблюдений в этом случае равен одному, а не двум. Как только будут сделаны надлежащие корректировки, касающиеся внешних зависимостей, тогда будут применяться аксиомы теории вероятностей, касающиеся статистической независимости. Эти аксиомы важны, например, для получения показателей дисперсии или тестов статистической значимости .

Источник

В 1888 году Гальтон присутствовал на презентации доклада сэра Эдварда Тайлора в Королевском антропологическом институте . Тейлор собрал информацию об институтах брака и происхождения для 350 культур и исследовал связи между этими институтами и показателями социальной сложности. Тейлор интерпретировал свои результаты как признаки общей эволюционной последовательности, в которой институты меняют фокус с материнской линии на отцовскую по мере того, как общества становятся все более сложными. Гальтон не согласился, указав, что сходство между культурами может быть связано с заимствованием, общим происхождением или эволюционным развитием; он утверждал, что без учета заимствований и общего происхождения нельзя делать достоверные выводы относительно эволюционного развития. Критика Гальтона стала одноименной проблемой Гальтона , [1] : 175  , названной Раулем Нароллом , [2] [3] , который предложил первые статистические решения.

К началу 20 века от однолинейного эволюционизма отказались, а вместе с ним и от прямых выводов из корреляций к эволюционным последовательностям. Однако критика Гальтона оказалась одинаково обоснованной и в отношении вывода функциональных отношений из корреляций. Проблема автокорреляции осталась.

Решения

Статистик Уильям С. Госсет в 1914 году разработал методы устранения ложной корреляции, связанной с тем, как положение во времени или пространстве влияет на сходство. Сегодняшние предвыборные опросы сталкиваются с аналогичной проблемой: чем ближе опрос к выборам, тем меньше людей принимают самостоятельное решение и тем выше ненадежность результатов опросов, особенно предел погрешности или доверительные пределы . Эффективное n независимых дел из их выборки падает по мере приближения выборов. Статистическая значимость падает с меньшим эффективным размером выборки.

Проблема возникает в выборочных опросах, когда социологи хотят сократить время в пути для проведения интервью и, следовательно, делят население на локальные кластеры и выбирают кластеры случайным образом, а затем снова выбирают внутри кластеров. Если они опрашивают n человек в кластерах размером m, эффективный размер выборки (efs) будет иметь нижний предел 1 + ( n − 1) / m , если бы все в каждом кластере были идентичны. Если внутри кластеров имеется лишь частичное сходство, то m в этой формуле необходимо соответственно уменьшить. Формула такого типа: 1 + d ( n − 1) , где dвнутриклассовая корреляция рассматриваемой статистики. [4] В общем, оценка подходящего EFS зависит от оцениваемой статистики , например, среднего значения , хи-квадрата , корреляции , коэффициента регрессии и их дисперсий .

Для кросс-культурных исследований Мердок и Уайт [5] оценили размер участков сходства в своей выборке из 186 обществ. Четыре переменные, которые они тестировали – язык, экономика, политическая интеграция и происхождение – имели участки сходства, которые варьировались от третьего до десятого размера. Очень грубое практическое правило могло бы заключаться в том, чтобы разделить квадратный корень из размеров участков сходства на n так, чтобы эффективные размеры выборки для этих участков были равны 58 и 107 соответственно. Опять же, статистическая значимость падает с меньшим эффективным размером выборки.

В современном анализе пространственные лаги моделируются для оценки степени глобализации современных обществ. [6]

Пространственная зависимость или автокорреляция — фундаментальная концепция географии. Разработанные географами методы измерения и контроля пространственной автокорреляции [7] [8] делают гораздо больше, чем просто уменьшают эффективное n для проверки значимости корреляции. Одним из примеров является сложная гипотеза о том, что «наличие азартных игр в обществе прямо пропорционально наличию коммерческих денег и наличию значительных социально-экономических различий и обратно пропорционально тому, является ли это общество кочевым или пастушеским обществом». [9] Проверка этой гипотезы на выборке из 60 обществ не смогла отвергнуть нулевую гипотезу. Однако автокорреляционный анализ показал значительный эффект социально-экономических различий. [10]

Насколько распространена автокорреляция между переменными, изучаемыми в межкультурных исследованиях? Тест Антона Эффа на 1700 переменных в совокупной базе данных для стандартной межкультурной выборки , опубликованный в журнале World Cultures, измерял I Морана для пространственной автокорреляции (расстояние), лингвистической автокорреляции (общее происхождение) и автокорреляции в культурной сложности (основная эволюция). ). «Результаты показывают, что... было бы разумно проверить пространственную и филогенетическую автокорреляцию при проведении регрессионного анализа со стандартной межкультурной выборкой». [11] Проиллюстрировано использование автокорреляционных тестов в исследовательском анализе данных, показывающих, как все переменные в данном исследовании могут быть оценены на предмет независимости случаев с точки зрения расстояния, языка и культурной сложности. Затем объясняются и иллюстрируются методы оценки этих эффектов автокорреляции для обычной регрессии наименьших квадратов с использованием снова меры значимости автокорреляции Морана I.

Когда присутствует автокорреляция, ее часто можно удалить, чтобы получить несмещенные оценки коэффициентов регрессии и их дисперсий, создав переопределенную зависимую переменную, которая «отстает» от взвешиваний зависимой переменной в других местах, где веса представляют собой степень связи. Эта лагированная зависимая переменная является эндогенной, и для ее оценки требуются либо двухэтапные методы наименьших квадратов , либо методы максимального правдоподобия . [12]

Ресурсы

Публичный сервер, если он используется внешне по адресу http://SocSciCompute.ss.uci.edu. Архивировано 20 февраля 2016 г. на Wayback Machine , предлагает этнографические данные, переменные и инструменты для вывода с помощью сценариев R Доу (2007) и Eff и Доу (2009) в рамках поддерживаемой NSF платформы Galaxy (http://getgalaxy.org) (https://www.xsede.org) для преподавателей, студентов и исследователей для моделирования межкультурных исследований «CoSSci Galaxy». Архивировано в 2016 г. 02–20 в Wayback Machine с элементами управления проблемой Гальтона с использованием стандартных переменных межкультурной выборки по адресу https://web.archive.org/web/20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook. текст.

Возможности

В антропологии, где проблема Тайлора была впервые признана статистиком Гальтоном в 1889 году, до сих пор широко не признано, что существуют стандартные статистические поправки к проблеме участков сходства в наблюдаемых случаях и возможностей для новых открытий с использованием методов автокорреляции. Некоторые кросс-культурные исследователи (см., например, Коротаев и де Мунк, 2003) [13] начали понимать, что доказательства распространения, исторического происхождения и других источников сходства между родственными обществами или людьми следует переименовывать в «Возможности Гальтона» и «Активы Гальтона», а не в «Возможности Гальтона». чем проблема Гальтона. В настоящее время исследователи регулярно используют лонгитюдный, межкультурный и региональный анализ вариаций для анализа всех конкурирующих гипотез: функциональные отношения, диффузия , общее историческое происхождение, многолинейная эволюция , совместная адаптация с окружающей средой и сложная динамика социального взаимодействия . [14]

Споры

В антропологии проблема филогенетической ауокореляции часто рассматривается как причина полного отказа от сравнительных исследований. Поскольку проблема является общей, общей для науки и статистических выводов в целом, эта конкретная критика кросс-культурных или сравнительных исследований (а их много) является, логически говоря, равнозначной полному отказу от науки и статистики. Любые данные, собранные и проанализированные, например, этнографами, в равной степени подвержены автокорреляции, понимаемой в самом общем смысле. Критика антисравнительной критики не ограничивается статистическим сравнением, поскольку она применима также и к анализу текста. То есть анализ и использование текста в аргументации подвергаются критике с точки зрения доказательной основы вывода. Опора исключительно на риторику не является защитой от критики обоснованности аргументов и их доказательной базы.

Однако нет никаких сомнений в том, что сообщество кросс-культурных исследователей упустило возможность игнорировать автокорреляцию. Экспертное исследование этого вопроса показывает результаты, которые «убедительно свидетельствуют о том, что обширные сообщения о наивных тестах независимости хи-квадрат с использованием межкультурных наборов данных за последние несколько десятилетий привели к неправильному отклонению нулевых гипотез на уровнях, намного превышающих ожидаемые 5%». ставка." [15] : 247  Исследователь заключает, что «неправильные теории, которые были «спасены» с помощью наивных тестов хи-квадрат со сравнительными данными, могут быть еще более тщательно проверены в другой день». [15] : 270  Опять же, скорректированная дисперсия кластерной выборки дается как единица, умноженная на 1 + d ( k + 1), где k — средний размер кластера, а более сложная поправка дается для дисперсии корреляции таблицы непредвиденных обстоятельств с r строками и c столбцами. С тех пор, как эта критика была опубликована в 1993 году, как и другие подобные ей, все больше авторов начали принимать поправки к проблеме Гальтона, но большинство специалистов в межкультурной сфере этого не сделали. Следовательно, большая часть опубликованных результатов, основанных на наивных критериях значимости и использующих стандарт P < 0,05, а не стандарт P < 0,005, скорее всего, будет ошибочным, поскольку они более подвержены ошибкам типа I , которые заключаются в отклонении нулевого значения. гипотезу, когда она верна.

Некоторые кросс-культурные исследователи отвергают серьезность проблемы автокорреляции, поскольку, по их мнению, оценки корреляций и средних могут быть объективными, даже если автокорреляция, слабая или сильная, присутствует. Однако, не исследуя автокорреляцию, они все равно могут неправильно оценить статистику, касающуюся взаимосвязей между переменными. Например, в регрессионном анализе изучение закономерностей автокоррелированных остатков может дать важные подсказки о третьих факторах, которые могут влиять на отношения между переменными, но не были включены в регрессионную модель. Во-вторых, если в выборке присутствуют кластеры схожих и родственных обществ, показатели дисперсии будут недооценены, что приведет к ложным статистическим выводам. например, преувеличение статистической значимости корреляций. В-третьих, недооценка дисперсии затрудняет проверку повторения результатов из двух разных выборок, поскольку результаты чаще отклоняются как схожие.

Смотрите также

Рекомендации

  1. ^ Стокинг, Джордж Младший (1968). «Эдвард Бернетт Тайлор». Международная энциклопедия социальных наук. Дэвид Л. Силлс, редактор, Нью-Йорк, Mcmillan Company: т. 16, стр. 170–177.
  2. ^ Рауль Наролл (1961). «Два решения проблемы Гальтона». Философия науки . 28 : 15–29. дои : 10.1086/287778. S2CID  121671403.
  3. ^ Рауль Наролл (1965). «Проблема Гальтона: логика межкультурных исследований». Социальные исследования . 32 : 428–451.
  4. ^ «Размер выборки и эффект дизайна» (PDF) . Архивировано из оригинала (PDF) 14 апреля 2006 г. Проверено 1 ноября 2006 г.
  5. ^ Джордж П. Мердок и Дуглас Р. Уайт (1969). «Стандартный межкультурный образец». Этнология . 9 : 329–369.
  6. ^ Ян, Детлеф (2006). «Глобализация как проблема Гальтона: недостающее звено в анализе моделей распространения в развитии государства всеобщего благосостояния» (PDF) . Международная организация . 60 (2): 401–431. дои : 10.1017/s0020818306060127. S2CID  154976704.абстрактный
  7. ^ Клифф, А.Д. и Дж.К. Орд. 1973. Пространственная автокорреляция . Лондон: Пион Пресс.
  8. ^ Клифф, А.Д. и Дж.К. Орд. 1981. Пространственные процессы . Лондон: Пион Пресс.
  9. ^ Прайор, Фредерик (1976). «Метод возможности диффузии: более общее и простое решение проблемы Гальтона». Американский этнолог . 3 (4). Американская антропологическая ассоциация: 731–749. doi :10.1525/ae.1976.3.4.02a00100.
  10. ^ Малкольм М. Доу, Майкл Л. Бертон, Дуглас Р. Уайт и Карл П. Рейтц (1984). «Проблема Гальтона как сетевая автокорреляция». Американский этнолог . 11 (4): 754–770. doi :10.1525/ae.1984.11.4.02a00080. S2CID  143111431.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  11. ^ Э. Антон Эфф (2004). «Есть ли у г-на Гальтона еще проблема? Автокорреляция в стандартной межкультурной выборке» (PDF) . Мировые культуры . 15 (2): 153–170.
  12. ^ Анселин, Люк. 1988. Пространственная эконометрика: методы и модели. Дордрехт: Kluwer Academic Publishers.
  13. ^ Андрей Коротаев и Виктор де Мунк (2003). «Актив Гальтона и проблема цветка: культурные сети и культурные единицы в межкультурных исследованиях». Американский антрополог . 105 (2): 353–358. дои : 10.1525/aa.2003.105.2.353.
  14. ^ Мейс, Рут; Пейгель, Марк (1994). «Сравнительный метод в антропологии». Современная антропология . 35 (5): 549–564. дои : 10.1086/204317. S2CID  146297584.
  15. ^ ab Малкольм М. Доу (1993). «Сохранение теории: тесты хи-квадрат с данными межкультурных исследований». Межкультурные исследования . 27 (3–4): 247–276. дои : 10.1177/106939719302700305. S2CID  122509821.

дальнейшее чтение