stringtranslate.com

Критерий отбора

Систематическая ошибка отбора — это систематическая ошибка , возникающая в результате отбора отдельных лиц, групп или данных для анализа таким образом, что не достигается надлежащая рандомизация и, таким образом, не удается гарантировать, что полученная выборка является репрезентативной для популяции, предназначенной для анализа. [1] Иногда его называют эффектом отбора . Фраза «систематическая ошибка отбора» чаще всего относится к искажению статистического анализа , возникающему в результате метода сбора выборок. Если не учитывать предвзятость отбора, то некоторые выводы исследования могут оказаться ложными.

Типы

Смещение выборки

Смещение выборки — это систематическая ошибка, возникающая из-за неслучайной выборки совокупности, [2] из-за которой некоторые члены совокупности с меньшей вероятностью будут включены, чем другие, что приводит к смещенной выборке , определяемой как статистическая выборка совокупности ( или нечеловеческие факторы), в которых все участники не одинаково сбалансированы или объективно представлены. [3] В основном его классифицируют как подтип систематической ошибки отбора, [4] иногда специально называют систематической ошибкой выборочного отбора , [5] [6] [7] , но некоторые классифицируют ее как отдельный тип систематической ошибки. [8]

Отличие систематической ошибки выборки (хотя и не общепринятой) заключается в том, что она подрывает внешнюю валидность теста (способность обобщать его результаты на остальную часть населения), в то время как систематическая ошибка отбора в основном касается внутренней валидности различий или сходства, обнаруженные в рассматриваемом образце. В этом смысле ошибки, возникающие в процессе формирования выборки или когорты, вызывают смещение выборки, тогда как ошибки в любом последующем процессе вызывают смещение отбора.

Примеры систематической ошибки выборки включают самоотбор , предварительный отбор участников исследования, дисконтирование участников исследования/тестов, которые не были завершены до конца, а также миграционную ошибку путем исключения участников, которые недавно переехали в или из области исследования, смещение по времени , где обнаруживается медленно развивающееся заболевание с лучшим прогнозом, и смещение времени выполнения , когда заболевание диагностируется у участников раньше, чем в сравниваемых популяциях, хотя среднее течение заболевания такое же.

Временной интервал

Контакт

Данные

Исследования

Потертость

Систематическая ошибка истощения — это своего рода систематическая ошибка отбора, вызванная истощением (потерей участников), [13] не учитывающим субъекты исследований/тесты, которые не были доведены до конца. Оно тесно связано с предвзятостью выжившего , когда в анализ включаются только те субъекты, которые «пережили» процесс, или с предвзятостью неудачи , когда включаются только те субъекты, которые «провалили» процесс. Сюда входят отсев , отсутствие ответа (более низкий процент ответов ), отказ от участия и отклонения от протокола . Он дает необъективные результаты, если они неравны в отношении воздействия и/или результата. Например, при тестировании программы диеты исследователь может просто отклонить всех, кто выбывает из исследования, но большинство из тех, кто выбывает, — это те, для кого она не работает. Различная потеря субъектов в группе вмешательства и группе сравнения может изменить характеристики этих групп и результаты независимо от изучаемого вмешательства . [13]

Потеря для последующего наблюдения — это еще одна форма систематической ошибки истощения, которая в основном возникает в медицинских исследованиях в течение длительного периода времени. На ошибку отсутствия ответа или удержания может влиять ряд как материальных, так и нематериальных факторов, таких как; богатство, образование, альтруизм, первоначальное понимание учебы и ее требований. [14] Исследователи также могут быть не в состоянии осуществлять последующие контакты из-за недостаточной идентифицирующей информации и контактных данных, собранных на начальном этапе набора персонала и исследования. [15]

Выбор наблюдателя

Философ Ник Бостром утверждал, что данные фильтруются не только по дизайну и измерениям исследования, но и по необходимому предварительному условию: кто-то должен проводить исследование. В ситуациях, когда существование наблюдателя или исследование коррелирует с данными, возникают эффекты выбора наблюдения и требуется антропное рассуждение . [16]

Примером могут служить записи прошлых столкновений с Землей: если крупные удары вызовут массовые вымирания и экологические нарушения, исключающие эволюцию разумных наблюдателей на долгие периоды, никто не будет наблюдать никаких свидетельств крупных столкновений в недавнем прошлом (поскольку они бы помешали разумным наблюдателям). наблюдатели от эволюции). Следовательно, существует потенциальная погрешность в записях о столкновениях с Землей. [17] Астрономические экзистенциальные риски также могут быть недооценены из-за предвзятости отбора, и поэтому необходимо ввести антропную поправку. [18]

Предвзятость волонтеров

Предвзятость самоотбора или предвзятость добровольцев в исследованиях создают дополнительные угрозы достоверности исследования, поскольку эти участники могут иметь существенно отличающиеся характеристики от целевой популяции исследования. [19] Исследования показали, что волонтеры, как правило, происходят из более высокого социального положения, чем из более низкого социально-экономического положения. [20] Кроме того, другое исследование показывает, что женщины с большей вероятностью будут добровольно участвовать в исследованиях, чем мужчины. Предвзятость добровольцев очевидна на протяжении всего жизненного цикла исследования, от набора участников до последующего наблюдения. В более общем плане реакцию волонтеров можно объяснить индивидуальным альтруизмом, желанием одобрения, личным отношением к теме исследования и другими причинами. [20] [14] Как и в большинстве случаев, в случае предвзятости добровольцев смягчением последствий является увеличение размера выборки. [ нужна цитата ]

смягчение последствий

В общем случае ошибки отбора невозможно преодолеть только с помощью статистического анализа существующих данных, хотя в особых случаях можно использовать поправку Хекмана . Оценку степени систематической ошибки отбора можно произвести путем изучения корреляций между экзогенными (фоновыми) переменными и показателем лечения. Однако в регрессионных моделях именно корреляция между ненаблюдаемыми детерминантами результата и ненаблюдаемыми детерминантами отбора в выборку оценивает смещение, и эта корреляция между ненаблюдаемыми факторами не может быть непосредственно оценена наблюдаемыми детерминантами лечения. [21]

Когда данные выбираются для целей подбора или прогнозирования, можно настроить коалиционную игру, чтобы функцию подбора или прогнозирования можно было определить для всех подмножеств переменных данных.

Связанные вопросы

Предвзятость отбора тесно связана с:

Смотрите также

Рекомендации

  1. ^ Словарь терминов, посвященных раку → предвзятость выбора. Проверено 23 сентября 2009 г.
  2. ^ Медицинский словарь - «Смещение выборки», получено 23 сентября 2009 г.
  3. ^ TheFreeDictionary → предвзятая выборка. Проверено 23 сентября 2009 г. Сайт, в свою очередь, цитирует: Медицинский словарь Мосби, 8-е издание.
  4. ^ Словарь терминов, посвященных раку → Предвзятость выбора. Проверено 23 сентября 2009 г.
  5. ^ Ардс, Шейла; Чунг, Чанджин; Майерс, Сэмюэл Л. (1998). «Влияние предвзятости отбора выборки на расовые различия в сообщениях о жестоком обращении с детьми». Жестокое обращение с детьми и пренебрежение ими . 22 (2): 103–115. дои : 10.1016/S0145-2134(97)00131-2 . ПМИД  9504213.
  6. ^ Кортес, Коринна; Мори, Мехриар; Райли, Майкл; Ростамизаде, Афшин (2008). «Теория коррекции систематической ошибки при выборе выборки». Алгоритмическая теория обучения (PDF) . Конспекты лекций по информатике. Том. 5254. стр. 38–53. arXiv : 0805.2775 . CiteSeerX 10.1.1.144.4478 . дои : 10.1007/978-3-540-87987-9_8. ISBN  978-3-540-87986-2. S2CID  842488.
  7. ^ Кортес, Коринна; Мори, Мехриар (2014). «Теория адаптации предметной области и коррекции систематической ошибки выборки и алгоритм регрессии» (PDF) . Теоретическая информатика . 519 : 103–126. CiteSeerX 10.1.1.367.6899 . дои : 10.1016/j.tcs.2013.09.027. 
  8. ^ Фадем, Барбара (2009). Поведенческая наука. Липпинкотт Уильямс и Уилкинс. п. 262. ИСБН 978-0-7817-8257-9.
  9. ^ аб Файнштейн А.Р.; Хорвиц Р.И. (ноябрь 1978 г.). «Критика статистических данных, связывающих эстрогены с раком эндометрия». Рак Рез . 38 (11, часть 2): 4001–5. ПМИД  698947.
  10. ^ Тамим Х; Монфаред А.А.; ЛеЛорье Дж. (март 2007 г.). «Применение времени задержки в определениях воздействия для контроля протопатической предвзятости». Фармакоэпидемиоловый препарат Саф . 16 (3): 250–8. дои : 10.1002/pds.1360. PMID  17245804. S2CID  25648490.
  11. ^ Мэтью Р. Вейр (2005). Гипертония (основные заболевания) (серия «Ключевые заболевания Acp») . Филадельфия, Пенсильвания: Американский колледж врачей. п. 159. ИСБН 978-1-930513-58-7.
  12. ^ Краскал, Уильям Х. (1960). «Некоторые замечания по поводу диких наблюдений». Технометрика . 2 (1): 1–3. дои : 10.1080/00401706.1960.10489875.
  13. ^ аб Джуни, П.; Эггер, Маттиас (2005). «Эмпирические доказательства систематической ошибки отсева в клинических исследованиях». Международный журнал эпидемиологии . 34 (1): 87–88. дои : 10.1093/ije/dyh406 . ПМИД  15649954.
  14. ^ Аб Джордан, Сью; Уоткинс, Алан; Стори, Мел; Аллен, Стивен Дж.; Брукс, Кэролайн Дж.; Гарайова, Ивета; Небеса, Мартин Л.; Джонс, Рут; Пламмер, Сью Ф.; Рассел, Ян Т.; Торнтон, Кэтрин А. (9 июля 2013 г.). «Предвзятость добровольцев при наборе, удержании и сдаче образцов крови в рандомизированном контролируемом исследовании с участием матерей и их детей в возрасте шести месяцев и двух лет: продольный анализ». ПЛОС ОДИН . 8 (7): e67912. Бибкод : 2013PLoSO...867912J. дои : 10.1371/journal.pone.0067912 . ISSN  1932-6203. ПМЦ 3706448 . ПМИД  23874465. 
  15. ^ Смолл, WP (6 мая 1967). «Потерян для продолжения». Ланцет . Первоначально опубликовано как Том 1, выпуск 7497. 289 (7497): 997–999. дои : 10.1016/S0140-6736(67)92377-X. ISSN  0140-6736. PMID  4164620. S2CID  27683727.
  16. ^ Бостром, Ник (2002). Антропическая предвзятость: эффекты отбора наблюдений в науке и философии . Нью-Йорк: Рутледж. ISBN 978-0-415-93858-7.
  17. ^ Чиркович, ММ; Сандберг, А.; Бостром, Н. (2010). «Антропная тень: эффекты отбора наблюдений и риски исчезновения человечества». Анализ риска . 30 (10): 1495–506. дои : 10.1111/j.1539-6924.2010.01460.x. PMID  20626690. S2CID  6485564.
  18. ^ Тегмарк, М.; Бостром, Н. (2005). «Астрофизика: вероятна ли катастрофа Судного дня?». Природа . 438 (7069): 754. Бибкод : 2005Natur.438..754T. дои : 10.1038/438754a . PMID  16341005. S2CID  4390013.
  19. ^ Трипепи, Джованни; Джагер, Китти Дж.; Деккер, Фридо В.; Зоккали, Кармин (2010). «Предвзятость выбора и предвзятость информации в клинических исследованиях». Клиническая практика Нефрона . 115 (2): с94–с99. дои : 10.1159/000312871 . ISSN  1660-2110. ПМИД  20407272.
  20. ^ ab «Волонтерская предвзятость». Каталог смещений . 17.11.2017 . Проверено 29 октября 2020 г.
  21. ^ Хекман, Джей-Джей (1979). «Смещение выборки как ошибка спецификации». Эконометрика . 47 (1): 153–161. дои : 10.2307/1912352. JSTOR  1912352.