В статистике выборка опроса описывает процесс отбора выборки элементов из целевой совокупности для проведения опроса. Термин « опрос » может относиться ко многим различным типам или методам наблюдения. При выборке обследования чаще всего используется анкета, используемая для измерения характеристик и/или отношения людей. Различные способы связи с членами выборки после их отбора являются предметом сбора данных обследования . Целью выборки является снижение стоимости и/или объема работы, необходимой для обследования всей целевой совокупности. Обследование, в ходе которого измеряется вся целевая совокупность, называется переписью . Выборка относится к группе или части населения, от которой необходимо получить информацию.
Выборки опросов можно разделить на два типа: вероятностные выборки и супервыборки. Выборки, основанные на вероятностях, реализуют план выборки с заданными вероятностями (возможно, адаптированными вероятностями, заданными адаптивной процедурой). Выборка на основе вероятности позволяет сделать выводы о целевой совокупности на основе дизайна. Выводы основаны на известном объективном распределении вероятностей , указанном в протоколе исследования. Выводы из вероятностных опросов все еще могут страдать от многих типов предвзятости.
Обследования, не основанные на вероятностной выборке, испытывают большие трудности с измерением предвзятости или ошибки выборки . [1] Опросы, основанные на невероятностных выборках, часто не отражают людей в целевой совокупности. [2]
В академических и государственных исследованиях вероятностная выборка является стандартной процедурой. В Соединенных Штатах «Список стандартов для статистических обследований» Управления управления и бюджета гласит, что обследования, финансируемые из федерального бюджета, должны проводиться:
отбор выборок с использованием общепринятых статистических методов (например, вероятностных методов, которые могут обеспечить оценку ошибки выборки). Любое использование методов невероятностной выборки (например, пороговой выборки или выборки на основе модели) должно быть статистически обосновано и иметь возможность измерить ошибку оценки. [3]
Случайная выборка и выводы на основе дизайна дополняются другими статистическими методами, такими как выборка с использованием моделей и выборка на основе моделей. [4] [5]
Например, во многих опросах наблюдается значительное количество неполученных ответов. Несмотря на то, что единицы изначально выбираются с известными вероятностями, механизмы отсутствия ответа неизвестны. Для обследований со значительным отсутствием ответов статистики предложили статистические модели, с помощью которых анализируются наборы данных.
Вопросы, связанные с выборкой обследования, обсуждаются в нескольких источниках, включая Салант и Диллман (1994). [6]
В вероятностной выборке (также называемой «научной» или «случайной» выборкой) каждый член целевой совокупности имеет известную и ненулевую вероятность включения в выборку. [7] Опрос, основанный на вероятностной выборке, теоретически может дать статистические измерения целевой совокупности, которые:
Выборка обследования на основе вероятности создается путем составления списка целевой совокупности, называемого основой выборки , рандомизированного процесса выбора единиц из основы выборки, называемого процедурой отбора, и метода связи с выбранными единицами, чтобы дать им возможность завершить опрос, называемый методом или режимом сбора данных. [10] Для некоторых целевых групп населения этот процесс может быть простым; например, выборка сотрудников компании с использованием списков заработной платы. Однако в больших, неорганизованных группах населения простое построение подходящей основы выборки часто оказывается сложной и дорогостоящей задачей.
Обычными методами проведения вероятностной выборки населения домохозяйств в Соединенных Штатах являются вероятностная выборка по площади, телефонная выборка со случайным цифровым набором и, в последнее время, выборка на основе адреса. [11]
В рамках вероятностной выборки существуют специализированные методы, такие как стратифицированная выборка и кластерная выборка , которые повышают точность или эффективность процесса выборки без изменения фундаментальных принципов вероятностной выборки.
Стратификация — это процесс разделения членов совокупности на однородные подгруппы перед выборкой на основе вспомогательной информации о каждой единице выборки. Страты должны быть взаимоисключающими: каждый элемент совокупности должен быть отнесен только к одной страте. Страты также должны быть коллективно исчерпывающими: ни один элемент населения не может быть исключен. Затем в каждой страте можно применять такие методы, как простая случайная выборка или систематическая выборка . Стратификация часто повышает репрезентативность выборки за счет уменьшения ошибки выборки.
Предвзятость в опросах нежелательна, но зачастую неизбежна. Основные типы систематических ошибок, которые могут возникнуть в процессе выборки:
Многие опросы основаны не на вероятностных выборках, а скорее на поиске подходящей группы респондентов для завершения опроса. Некоторые распространенные примеры невероятностной выборки: [13]
В невероятностных выборках взаимосвязь между целевой совокупностью и выборкой обследования неизмерима, а потенциальная систематическая ошибка непостижима. Опытные пользователи выборок невероятностных обследований склонны рассматривать опрос как экспериментальное условие, а не как инструмент измерения численности населения, и проверять результаты на наличие внутренне непротиворечивых связей.
В учебнике Гроувса и других представлен обзор методологии опроса, включая недавнюю литературу по разработке опросников (на основе когнитивной психологии ):
Другие книги посвящены статистической теории выборки обследований и требуют некоторых знаний базовой статистики, как описано в следующих учебниках:
В элементарной книге Шеффера и других используются квадратные уравнения из школьной алгебры:
Для Лора, Серндаля и других и Кокрана (классика) требуется дополнительная математическая статистика:
Исторически важные книги Деминга и Киша остаются ценными для социологов (особенно в отношении переписи населения США и Института социальных исследований Мичиганского университета ):