Методология опроса – это «изучение методов опроса ». [1] В качестве области прикладной статистики, концентрирующейся на опросах людей , методология опросов изучает выборку отдельных единиц населения и связанные с этим методы сбора данных опроса , такие как построение анкет и методы улучшения количества и точности ответов на опросы. опросы. Методология опроса нацелена на инструменты или процедуры, которые задают один или несколько вопросов, на которые можно или не можно ответить.
Исследователи проводят статистические обследования с целью сделать статистические выводы об изучаемом населении; такие выводы сильно зависят от используемых вопросов опроса. Опросы общественного мнения , опросы общественного здравоохранения, исследования рынка , правительственные опросы и переписи населения — все это примеры количественных исследований , в которых используется методология опросов для ответа на вопросы о населении. Хотя переписи не включают «выборку», они включают другие аспекты методологии обследования, такие как вопросники, интервьюеры и методы отслеживания отсутствия ответов. Опросы предоставляют важную информацию для всех видов общественной информации и исследовательских областей, таких как маркетинговые исследования, психология , здравоохранение и социология .
Одно обследование состоит как минимум из выборки (или всего населения в случае переписи), метода сбора данных (например, анкеты) и отдельных вопросов или элементов, которые становятся данными, которые можно проанализировать статистически. Одно исследование может быть сосредоточено на различных типах тем, таких как предпочтения (например, кандидата в президенты), мнения (например, должен ли аборт быть законным?), поведение (курение и употребление алкоголя) или фактическая информация (например, доход), в зависимости от его цели. Поскольку опросное исследование почти всегда основано на выборке населения, успех исследования зависит от репрезентативности выборки по отношению к целевой совокупности, представляющей интерес для исследователя. Эта целевая совокупность может варьироваться от общего населения данной страны до конкретных групп людей внутри этой страны, до списка членов профессиональной организации или списка учащихся, обучающихся в школьной системе (см. также выборку (статистику) и выборку для обследования). ). Лица, отвечающие на опрос, называются респондентами , и в зависимости от задаваемых вопросов их ответы могут представлять собой отдельных лиц, их домохозяйства, работодателей или другую организацию, которую они представляют.
Методология опроса как научная область направлена на определение принципов построения выборки, инструментов сбора данных, статистической корректировки данных, обработки данных и окончательного анализа данных, которые могут создавать систематические и случайные ошибки опроса. Ошибки обследования иногда анализируются в связи со стоимостью обследования. Ограничения по затратам иногда формулируются как улучшение качества в рамках ограничений по стоимости или, альтернативно, как снижение затрат при фиксированном уровне качества. Методология опросов — это одновременно научная область и профессия, а это означает, что некоторые специалисты в этой области эмпирически фокусируются на ошибках опроса, а другие разрабатывают опросы для их уменьшения. Задача разработчиков опросов включает в себя принятие большого набора решений по тысячам отдельных характеристик опроса с целью его улучшения. [2]
К наиболее важным методологическим задачам методиста опроса относится принятие решений о том, как: [2]
Выборка выбирается из основы выборки, которая состоит из списка всех членов интересующей совокупности. [3] Целью опроса является описание не выборки, а более широкой совокупности. Эта обобщающая способность зависит от репрезентативности выборки, как указано выше. Каждый член популяции называется элементом. При выборе репрезентативной выборки часто возникают трудности. Одной из распространенных ошибок, которая возникает в результате этого, является предвзятость выбора . Систематическая ошибка отбора возникает, когда процедуры, используемые для отбора выборки, приводят к чрезмерному или недостаточному представительству некоторых важных аспектов генеральной совокупности. Например, если интересующая совокупность состоит из 75% женщин и 25% мужчин, а выборка состоит из 40% женщин и 60% мужчин, женщины будут недостаточно представлены, а мужчины перепредставлены. Чтобы минимизировать ошибки отбора, часто используется стратифицированная случайная выборка . Это когда совокупность делится на подгруппы, называемые стратами, и из каждой страты отбираются случайные выборки или элементы для выборки отбираются на пропорциональной основе.
Существует несколько способов проведения опроса. На выбор режима введения влияют несколько факторов, в том числе
Различные методы создают эффекты режима , которые меняют ответы респондентов, и разные методы имеют разные преимущества. Наиболее распространенные способы введения можно резюмировать следующим образом: [4]
Существует несколько различных схем или общих структур, которые можно использовать в опросных исследованиях. Тремя основными типами являются перекрестные, последовательные независимые выборки и продольные исследования. [3]
В перекрестных исследованиях выборка (или выборки) отбирается из соответствующей популяции и изучается один раз. [3] Поперечное исследование описывает характеристики этой популяции в один момент времени, но не может дать никакого понимания причин характеристик популяции, поскольку это прогнозирующий корреляционный дизайн.
При последовательном планировании независимых выборок из генеральной совокупности извлекается несколько случайных выборок один или несколько раз. [3] Этот дизайн позволяет изучать изменения внутри популяции, но не изменения внутри отдельных людей, поскольку одни и те же люди не опрашиваются более одного раза. Таким образом, такие исследования не могут обязательно выявить причины изменений с течением времени. Чтобы последовательные независимые выборки были эффективными, выборки должны быть взяты из одной и той же генеральной совокупности и должны быть в равной степени ее репрезентативными. Если выборки несопоставимы, изменения между выборками могут быть обусловлены демографическими характеристиками, а не временем. Кроме того, вопросы должны быть заданы одинаково, чтобы можно было напрямую сравнить ответы.
Лонгитюдные исследования измеряют одну и ту же случайную выборку в несколько моментов времени. [3] В отличие от последовательного независимого плана выборки, этот дизайн измеряет различия в ответах отдельных участников с течением времени. Это означает, что исследователь потенциально может оценить причины изменения ответов, оценивая различия в опыте респондентов. Лонгитюдные исследования — самый простой способ оценить влияние естественного события, такого как развод, которое невозможно проверить экспериментально.
Однако лонгитюдные исследования дороги и сложны в проведении. Труднее найти образец, который готов участвовать в исследовании продолжительностью в несколько месяцев или лет, чем в 15-минутном интервью, и участники часто покидают исследование до того, как будет проведена окончательная оценка. Кроме того, такие исследования иногда требуют, чтобы сбор данных был конфиденциальным или анонимным, что создает дополнительные трудности в увязке ответов участников с течением времени. Одним из потенциальных решений является использование самогенерируемого идентификационного кода (SGIC). [5] Эти коды обычно создаются из таких элементов, как «месяц рождения» и «первая буква второго имени матери». Некоторые недавние анонимные подходы SGIC также пытались еще больше свести к минимуму использование персонализированных данных, вместо этого используя такие вопросы, как «имя вашего первого домашнего животного». [6] [7] В зависимости от используемого подхода возможность сопоставления некоторой части выборки может быть потеряна.
Кроме того, общее отсев участников не является случайным, поэтому выборки могут стать менее репрезентативными при последовательных оценках. Чтобы учесть это, исследователь может сравнить респондентов, покинувших опрос, с теми, кто этого не сделал, чтобы увидеть, являются ли они статистически разными группами населения. Респонденты также могут попытаться быть последовательными, несмотря на изменения в ответах на опрос.
Анкеты являются наиболее часто используемым инструментом в опросных исследованиях. Однако результаты конкретного опроса ничего не стоят, если анкета написана неадекватно. [3] Анкеты должны давать действительные и надежные измерения демографических переменных и должны выявлять действительные и надежные индивидуальные различия, которые генерируют шкалы самоотчетов. [3]
Категория переменных, которая часто измеряется в опросных исследованиях, — это демографические переменные, которые используются для отображения характеристик опрошенных людей в выборке. [3] Демографические переменные включают такие показатели, как этническая принадлежность, социально-экономический статус, раса и возраст. [3] Опросы часто оценивают предпочтения и отношения людей, и во многих из них используются шкалы самоотчетов для измерения мнений и суждений людей о различных пунктах, представленных на шкале. [3] Шкалы самооценки также используются для изучения различий между людьми по пунктам шкалы. [3] Эти шкалы самоотчетов, которые обычно представлены в форме анкеты, являются одним из наиболее используемых инструментов в психологии, и поэтому важно, чтобы измерения были тщательно построены, но при этом были надежными и действительными. [3]
Надежные меры самоотчета определяются их последовательностью. [3] Таким образом, надежный метод самоотчета дает стабильные результаты каждый раз, когда он выполняется. [3] Надежность теста можно измерить несколькими способами. [3] Во-первых, можно рассчитать тест-ретестовую надежность. [3] Надежность повторного тестирования предполагает проведение одного и того же опросника для большой выборки в два разных раза. [3] Чтобы опросник считался надежным, люди в выборке не обязательно должны набирать одинаковые баллы по каждому тесту, а скорее их положение в распределении баллов должно быть одинаковым как для теста, так и для повторного теста. [3] Измерения самоотчета, как правило, будут более надежными, если они содержат много пунктов, измеряющих конструкт. [3] Кроме того, измерения будут более надежными, если измеряемый фактор будет иметь большую вариабельность среди тестируемых лиц в выборке. [3] Наконец, надежность будет выше, если инструкции по заполнению анкеты будут четкими и когда в среде тестирования будет мало отвлекающих факторов. [3] Напротив, анкета действительна, если то, что она измеряет, соответствует тому, что изначально планировалось измерить. [3] Конструктивная валидность меры — это степень, в которой она измеряет теоретическую конструкцию, которую она изначально должна была измерять. [3]
Для создания анкеты, которая даст надежные и достоверные результаты, можно использовать шесть шагов. [3] Во-первых, необходимо решить, какую информацию следует собирать. [3] Во-вторых, необходимо решить, как проводить анкетирование. [3] В-третьих, необходимо составить первый вариант анкеты. [3] В-четвертых, анкету следует пересмотреть. [3] Далее следует предварительно протестировать анкету. [3] Наконец, вопросник следует отредактировать и указать процедуры его использования. [3]
То, как сформулирован вопрос, может иметь большое влияние на то, как участник исследования ответит на него. [3] Таким образом, исследователи опросов должны внимательно следить за своими формулировками при написании вопросов для опроса. [3] Исследователям важно помнить, что разные люди, культуры и субкультуры могут интерпретировать определенные слова и фразы по-разному. [3] Существует два типа вопросов, которые исследователи используют при написании анкеты: вопросы со свободным ответом и закрытые вопросы. [3] Вопросы со свободным ответом являются открытыми, тогда как закрытые вопросы обычно имеют множественный выбор. [3] Вопросы со свободным ответом полезны, поскольку они предоставляют респонденту большую гибкость, но их также очень сложно записывать и оценивать, поскольку они требуют тщательного кодирования. [3] Напротив, закрытые вопросы легче оценивать и кодировать, но они снижают экспрессивность и спонтанность отвечающего. [3] Как правило, словарь вопросов должен быть очень простым и прямым, и большинство из них должно содержать менее двадцати слов. [3] Каждый вопрос должен быть отредактирован для «читабельности» и избегать наводящих или нагруженных вопросов. [3] Наконец, если для измерения одной конструкции используется несколько вопросов, формулировки некоторых вопросов должны быть сформулированы в противоположном направлении, чтобы избежать систематической ошибки ответа. [3]
Ответ респондента на открытый вопрос может быть впоследствии закодирован в шкалу ответов [4] или проанализирован с использованием более качественных методов.
Исследователи опроса должны тщательно выстроить порядок вопросов в анкете. [3] В анкетах, которые заполняются самостоятельно, наиболее интересные вопросы должны находиться в начале анкеты, чтобы привлечь внимание респондента, а демографические вопросы должны быть ближе к концу. [3] Напротив, если опрос проводится по телефону или лично, демографические вопросы следует задавать в начале интервью, чтобы повысить уверенность респондента. [3] Еще одна причина, по которой следует помнить о порядке вопросов, может вызвать эффект ответа на опрос , при котором один вопрос может повлиять на то, как люди отвечают на последующие вопросы в результате прайминга .
Перевод имеет решающее значение для сбора сопоставимых данных опросов. Анкеты переводятся с исходного языка на один или несколько целевых языков, например, с английского на испанский и немецкий. В процессе перевода рекомендуется использовать командный подход, включающий в себя переводчиков, профильных экспертов и лиц, помогающих в этом процессе. [8] [9]
Лучшие практики перевода опросов включают параллельный перевод, групповые обсуждения и предварительное тестирование с участием реальных людей. [10] [11] Это не механический процесс размещения слов. Модель TRAPD - перевод, проверка, судебное решение, предварительное тестирование и документация - первоначально разработанная для European Social Surveys , теперь «широко используется в глобальном исследовательском сообществе, хотя и не всегда помечается как таковая или реализуется в полной форме». [12] [13] [8] Например, социолингвистика обеспечивает теоретическую основу для перевода анкет и дополняет TRAPD. Этот подход гласит, что для того, чтобы перевод анкеты достиг коммуникативного эффекта, эквивалентного исходному языку, перевод должен быть лингвистически приемлемым, в то же время включающим социальные практики и культурные нормы целевого языка. [14]
Следующие способы были рекомендованы для сокращения неполучения ответов [15] при телефонных и личных опросах: [16]
Краткость также часто называют фактором, повышающим скорость ответа. Обзор литературы 1996 года обнаружил неоднозначные доказательства в поддержку этого утверждения как в письменных, так и в устных опросах, и пришел к выводу, что другие факторы часто могут быть более важными. [18] Исследование 2010 года, в котором рассматривались 100 000 онлайн-опросов, показало, что процент ответов снизился примерно на 3% на 10 вопросов и примерно на 6% на 20 вопросов, при этом спад замедлился (например, снижение только на 10% на 40 вопросов). [19] Другие исследования показали, что качество ответов ухудшается к концу длительных опросов. [20]
Некоторые исследователи также обсуждали роль или профессию получателя как потенциальный фактор, влияющий на то, как справляться с отсутствием ответа. Например, факсы обычно не используются для распространения опросов, но в недавнем исследовании иногда им отдают предпочтение фармацевты, поскольку они часто получают рецепты по факсу на работе, но не всегда могут иметь доступ к общеадресному почтовому отправлению. [21]
Методисты опроса приложили немало усилий для определения степени, в которой на ответы интервьюируемого влияют физические характеристики интервьюера. Основными характеристиками интервьюера, которые, как было продемонстрировано, влияют на ответы на опрос, являются раса, [22] пол, [23] и относительная масса тела (ИМТ). [24] Эти эффекты интервьюера особенно эффективны, когда вопросы связаны с чертами интервьюера. Таким образом, было показано, что раса интервьюера влияет на ответы на меры, касающиеся расовых отношений, [25] на ответы интервьюера на пол на вопросы, связанные с гендерными вопросами, [26] и ответы интервьюера на ИМТ на вопросы, связанные с питанием и диетой. [27] Хотя эффекты интервьюера исследовались в основном для личных опросов, было также показано, что они существуют и для режимов интервью без визуального контакта, таких как телефонные опросы и веб-опросы с использованием видео. Эффекты интервьюера обычно объясняются предвзятостью социальной желательности : участники опроса могут попытаться спроецировать позитивную самооценку, пытаясь соответствовать нормам, которые они приписывают интервьюеру, задающему вопросы. Эффекты интервьюера являются одним из примеров эффектов ответов на опрос .
С 2018 года методисты опросов начали изучать, как большие данные могут дополнять методологию опросов, позволяя исследователям и практикам улучшить подготовку статистики опросов и ее качество. Большие данные имеют низкую стоимость на единицу данных, применяют методы анализа с помощью машинного обучения и интеллектуального анализа данных и включают в себя разнообразные и новые источники данных, например, регистры, социальные сети, приложения и другие формы цифровых данных. На сегодняшний день было проведено три конференции Big Data Meets Survey Science (BigSurv) в 2018, 2020, 2023 годах, а также конференция, запланированная на 2025 год, [28] специальный выпуск в журнале Social Science Computer Review , [29] специальный выпуск в журнале Social Science Computer Review. Журнал Королевского статистического общества , [30] и специальный выпуск в EP J Data Science , [31] и книга под названием « Большие данные встречаются с социальными науками» [32] под редакцией Крейга А. Хилла и пяти других членов Американского статистического общества. Ассоциация .
[...] методология опроса – это изучение методов опроса. Это изучение источников ошибок в опросах и того, как сделать цифры, полученные в результате опросов, максимально точными.