stringtranslate.com

Основа выборки

В статистике основа выборки — это исходный материал или устройство, из которого формируется выборка . [1] Это список всех членов совокупности , которые могут быть включены в выборку, и может включать отдельных лиц, домохозяйства или учреждения. [1]

Важность основы выборки подчеркивают Джессен [2] , Салант и Диллман. [3]

Во многих практических ситуациях совокупность является вопросом выбора планировщика обследования, а иногда и решающим. [...] Некоторые очень полезные расследования вообще не проводятся из-за отсутствия видимой основы; другие из-за неисправных кадров закончились катастрофой или облаком сомнений .

—  Рэймонд Джеймс Джессен

Несколько более общая концепция основы выборки включает в себя территориальные основы выборки , элементы которой имеют географическую природу. Основы территориальной выборки могут быть полезны, например, в сельскохозяйственной статистике, когда подходящая и обновленная сельскохозяйственная перепись недоступна. В экологических исследованиях единственным вариантом может быть территориальная выборка.

Получение и организация основы выборки

В самых простых случаях, например, при работе с партией материала из производственного цикла или при использовании переписи населения , можно идентифицировать и измерить каждый отдельный элемент генеральной совокупности и включить любой из них в нашу выборку; это известно как прямая выборка элементов . [1] Однако во многих других случаях это невозможно; либо потому, что это непомерно дорого (охват каждого гражданина страны), либо невозможно (охват всех живых людей).

После создания структуры существует ряд способов ее организации для повышения эффективности и результативности. Именно на этом этапе исследователь должен решить, будет ли выборка фактически представлять собой все население и, следовательно, будет ли это перепись .

Этот список также должен облегчить доступ к выбранным единицам выборки . Кадр также может предоставлять дополнительную «вспомогательную информацию» о своих элементах; когда эта информация связана с переменными или группами интересов, ее можно использовать для улучшения структуры обследования. Хотя это и не обязательно для простой выборки, основа выборки, используемая для более продвинутых методов выборки, таких как стратифицированная выборка , может содержать дополнительную информацию (например, демографическую информацию ). [1] Например, список избирателей может включать имя и пол; эту информацию можно использовать для обеспечения того, чтобы выборка, взятая из этой совокупности, охватывала все представляющие интерес демографические категории. (Иногда вспомогательная информация менее очевидна; например, номер телефона может предоставить некоторую информацию о местоположении.

Качества основы выборки

Идеальная основа выборки должна обладать следующими качествами: [1]

Типы основ выборки

Самый простой тип структуры — это список элементов совокупности (предпочтительно всего населения) с соответствующей контактной информацией. Например, в опросе общественного мнения возможные рамки выборки включают список избирателей или телефонный справочник . Другие основы выборки могут включать записи о занятости, списки школьных классов, карты пациентов в больнице, организации, включенные в тематическую базу данных, и т.д. [1] [5] На более практическом уровне основы выборки имеют форму компьютерных файлов . [1]

Не во всех структурах явно перечислены элементы совокупности; некоторые перечисляют только «кластеры». Например, карту улиц можно использовать в качестве основы для поквартирного обследования; хотя отдельные дома не отображаются, мы можем выбирать улицы на карте, а затем выбирать дома на этих улицах. Это дает некоторые преимущества: такая совокупность будет включать людей, которые недавно переехали и еще не включены в рамки списков, обсуждавшихся выше, и ее может быть проще использовать, поскольку она не требует хранения данных для каждой единицы населения, а только для меньшее количество кластеров.

Проблемы с основами выборки

Основа выборки должна быть репрезентативной для населения, и это вопрос, выходящий за рамки статистической теории, требующий суждения экспертов в конкретном изучаемом предмете. Во всех приведенных выше кадрах не учитываются некоторые люди, которые будут голосовать на следующих выборах, и есть некоторые люди, которые не будут голосовать; некоторые кадры будут содержать несколько записей об одном и том же человеке. Люди, не включенные в выборку, не имеют никаких шансов попасть в выборку.

Поскольку кластерная совокупность содержит меньше информации о совокупности, она может налагать ограничения на структуру выборки, возможно, требуя использования менее эффективных методов выборки и/или затрудняя интерпретацию полученных данных.

Статистическая теория говорит нам о неопределенностях при экстраполяции выборки на основу. Следует ожидать, что основы выборки всегда будут содержать некоторые ошибки. [5] В некоторых случаях это может привести к смещению выборки . [1] Такую предвзятость следует свести к минимуму и выявить, хотя полностью избежать ее в реальном мире практически невозможно. [1] Не следует также считать таковыми источники, претендующие на беспристрастность и репрезентативность. [1]

При определении рамок необходимо решить практические, экономические, этические и технические вопросы. Необходимость получения своевременных результатов может помешать расширению охвата далеко в будущем. Трудности могут быть огромными, когда совокупность и структура не пересекаются . Это особая проблема прогнозирования , когда выводы о будущем делаются на основе исторических данных . Фактически, в 1703 году, когда Якоб Бернулли предложил Готфриду Лейбницу возможность использования исторических данных о смертности для прогнозирования вероятности ранней смерти живого человека, Готфрид Лейбниц осознал проблему, ответив: [6]

Природа установила закономерности, возникающие в результате повторения событий, но только по большей части. Новые болезни наводняют род человеческий, так что сколько бы опытов вы ни ставили на трупах, вы не наложили тем самым предел на характер событий, чтобы в будущем они не могли меняться.

—  Готфрид Лейбниц

Лесли Киш сформулировал четыре основные проблемы основы выборки: [7]

  1. Недостающие элементы: Некоторые представители населения не включены в совокупность.
  2. Иностранные элементы: в структуру включены лица, не являющиеся членами населения.
  3. Повторяющиеся записи: член генеральной совокупности опрашивается более одного раза.
  4. Группы или кластеры: во фрейме перечислены кластеры, а не отдельные лица.

Проблемы, подобные перечисленным, можно выявить с помощью предварительных тестов и пилотных исследований .

Рекомендации

  1. ^ abcdefghij Карл-Эрик Сарндал; Бенгт Свенсон; Ян Ретман (2003). Выборка опроса с помощью модели. Спрингер. стр. 9–12. ISBN 978-0-387-40620-6. Проверено 2 января 2011 г.
  2. ^ Раймонд Джеймс Джессен (1978). Методы статистических обследований . Уайли. ISBN 9780471442608. Проверено 2 января 2011 г.[ нужна страница ]
  3. ^ Салант, Присцилла и Дон А. Диллман. «Как провести собственный опрос: ведущие специалисты предоставят вам проверенные методы получения надежных результатов» (1995 г.)
  4. ^ Тернер, Энтони Г. «Системы выборки и эталонные образцы» (PDF) . Секретариат ООН . Проверено 11 декабря 2012 г.
  5. ^ AB Роджер Сапсфорд; Виктор Юпп (29 марта 2006 г.). Сбор и анализ данных. МУДРЕЦ. стр. 28–. ISBN 978-0-7619-4363-1. Проверено 2 января 2011 г.
  6. ^ Питер Л. Бернштейн (1998). Против богов: замечательная история риска . Джон Уайли и сыновья. стр. 118–. ISBN 978-0-471-29563-1. Проверено 2 января 2011 г.
  7. ^ Лесли Киш (1995). Выборка опроса. Уайли. ISBN 978-0-471-10949-5. Проверено 11 января 2011 г.[ нужна страница ]