Определение размера выборки

Определение или оценка размера выборки – это выбор количества наблюдений или повторов для включения в статистическую выборку . Размер выборки — важная особенность любого эмпирического исследования, цель которого — сделать выводы о совокупности на основе выборки. На практике размер выборки, используемый в исследовании, обычно определяется на основе стоимости, времени или удобства сбора данных, а также необходимости обеспечения достаточной статистической мощности . В комплексных исследованиях могут быть выделены выборки разных размеров, например, в стратифицированных исследованиях или экспериментальных планах с несколькими группами лечения. При переписи данные собираются для всего населения, поэтому предполагаемый размер выборки равен численности населения. При планировании эксперимента , когда исследование может быть разделено на различные группы лечения , для каждой группы могут быть разные размеры выборки.

Размер выборки можно выбрать несколькими способами:

использование опыта: небольшие выборки, хотя иногда и неизбежны, могут привести к широким доверительным интервалам и риску ошибок при проверке статистических гипотез .
использование целевой дисперсии для оценки, которая должна быть получена на основе полученной в конечном итоге выборки, т. е. если требуется высокая точность (узкий доверительный интервал), это приводит к низкой целевой дисперсии оценщика.
использование целевого показателя мощности, т.е. мощности статистического теста , который будет применяться после сбора выборки.
использование уровня достоверности, т.е. чем выше требуемый уровень достоверности, тем больше размер выборки (при условии постоянного требования к точности).

Введение

Определение размера выборки является важнейшим аспектом методологии исследования, который играет важную роль в обеспечении надежности и достоверности результатов исследования. Чтобы повлиять на точность оценок, мощность статистических тестов и общую надежность результатов исследования, необходимо тщательно выбирать количество участников или точек данных, которые будут включены в исследование.

Например, если мы проводим опрос для определения среднего уровня удовлетворенности клиентов относительно нового продукта. Чтобы определить подходящий размер выборки, нам необходимо учитывать такие факторы, как желаемый уровень уверенности, погрешность и изменчивость ответов. Мы можем решить, что нам нужен уровень достоверности 95 %, то есть мы на 95 % уверены, что истинный средний уровень удовлетворенности находится в пределах рассчитанного диапазона. Мы также определяем предел погрешности в размере ±3%, который указывает на приемлемый диапазон различий между нашей выборочной оценкой и истинным параметром совокупности. Кроме того, мы можем иметь некоторое представление об ожидаемой изменчивости уровней удовлетворенности на основе предыдущих данных или предположений.

Важность

Большие размеры выборки обычно приводят к повышению точности при оценке неизвестных параметров. Например, чтобы точно определить распространенность возбудителя инфекции у конкретного вида рыб, предпочтительнее исследовать выборку из 200 рыб, а не из 100 рыб. Это явление описывают несколько фундаментальных фактов математической статистики, включая закон больших чисел и центральную предельную теорему .

В некоторых ситуациях повышение точности для выборок большего размера минимально или даже отсутствует. Это может быть результатом наличия систематических ошибок или сильной зависимости в данных, или того, что данные следуют распределению с тяжелым хвостом, или потому, что данные сильно зависимы или предвзяты.

Размер выборки можно оценить по качеству полученных оценок следующим образом. Обычно он определяется на основе стоимости, времени или удобства сбора данных, а также необходимости наличия достаточной статистической мощности. Например, если оценивается доля, может потребоваться, чтобы 95% доверительный интервал был шириной менее 0,06 единиц. Альтернативно, размер выборки может быть оценен на основе силы проверки гипотезы. Например, если мы сравниваем поддержку определенного политического кандидата среди женщин с поддержкой этого кандидата среди мужчин, нам может потребоваться иметь 80% власти, чтобы обнаружить разницу в уровнях поддержки в 0,04 единицы.

Оценка

Оценка доли

Относительно простой ситуацией является оценка доли . Это фундаментальный аспект статистического анализа, особенно при оценке распространенности определенной характеристики среди населения. Например, мы можем захотеть оценить долю жителей в сообществе в возрасте не менее 65 лет.

Оценка пропорции равна , где X — количество «положительных» (например, количество людей из n выбранных людей в возрасте не менее 65 лет). Когда наблюдения независимы , эта оценка имеет (масштабированное) биномиальное распределение (а также является выборочным средним данных из распределения Бернулли ). Максимальная дисперсия этого распределения составляет 0,25, что происходит, когда истинный параметр равен p = 0,5. В практических приложениях, где истинный параметр p неизвестен, максимальная дисперсия часто используется для оценки размера выборки. Если известна разумная оценка p, эту величину можно использовать вместо 0,25. ${\hat {p}}=X/n$ ${\ displaystyle p (1-p)}$

Когда размер выборки n станет достаточно большим, распределение будет близко приближаться к нормальному распределению . ^[1] Использование этого метода и метода Вальда для биномиального распределения дает доверительный интервал, где Z представляет собой стандартный Z-показатель для желаемого уровня достоверности (например, 1,96 для 95% доверительного интервала) в форме: ${\шляпа {p}}$

\left({\widehat {p}}-Z{\sqrt {\frac {0,25}{n}}},\quad {\widehat {p}}+Z{\sqrt {\frac {0,25} {n}}}\вправо)

Чтобы определить подходящий размер выборки n для оценки пропорций, можно решить приведенное ниже уравнение, где W представляет собой желаемую ширину доверительного интервала. Полученная формула размера выборки часто применяется с консервативной оценкой p (например, 0,5):

Z{\sqrt {\frac {0,25}{n}}}=W/2

для n , что дает размер выборки

$n={\frac {Z^{2}}{W^{2}}}$ , в случае использования 0,5 в качестве наиболее консервативной оценки доли. (Примечание: W/2 = погрешность .)

На рисунке ниже можно увидеть, как размеры выборки для биномиальных пропорций изменяются при различных уровнях достоверности и пределах погрешности.

В противном случае формула будет иметь вид , что дает . Например, при оценке доли населения США, поддерживающего кандидата в президенты, с шириной доверительного интервала 95% в 2 процентных пункта (0,02), требуется размер выборки (1,96) ² / (0,02 ² ) = 9604 с запасом погрешность в данном случае составляет 1 процентный пункт. В этом случае разумно использовать оценку p 0,5, поскольку президентские гонки часто близки к 50/50, и также разумно использовать консервативную оценку. Погрешность в этом случае составляет 1 процентный пункт (половина 0,02). $Z{\sqrt {\frac {p(1-p)}{n}}}=W/2$ $n={\frac {4Z^{2}p(1-p)}{W^{2}}}$

На практике формула: обычно используется для формирования 95% доверительного интервала для истинной пропорции. Уравнение можно решить относительно n , обеспечив минимальный размер выборки, необходимый для достижения желаемой погрешности. Вышеизложенное обычно упрощается: «Вывод для регрессии». utdallas.edu . $\left({\widehat {p}}-1,96{\sqrt {\frac {0,25}{n}}},\quad {\widehat {p}}+1,96{\sqrt {\frac {0,25} {n}}}\вправо)$ $4{\sqrt {\frac {0,25}{n}}}=W/2$ </ref> ^[2] n = 4/ W ² = 1/ B ² , где B — граница ошибки оценки, т. е. оценка обычно дается в пределах ± B . Для B = 10% требуется n = 100, для B = 5% необходимо n = 400, для B = 3% требование приближается к n = 1000, а для B = 1% требуется размер выборки n = 10000. . Эти цифры часто приводятся в новостях, опросах общественного мнения и других выборочных опросах . Однако сообщаемые результаты могут не соответствовать точному значению, поскольку числа желательно округлять в большую сторону. Зная, что значение n представляет собой минимальное количество точек выборки, необходимое для получения желаемого результата, количество респондентов должно находиться на уровне минимума или превышать его.

Оценка среднего

Проще говоря, если мы пытаемся оценить среднее время, которое требуется людям, чтобы добраться до работы в городе. Вместо опроса всего населения вы можете взять случайную выборку из 100 человек, записать время их пути на работу, а затем рассчитать среднее (среднее) время в пути для этой выборки. Например, человеку 1 требуется 25 минут, человеку 2 — 30 минут, ..., человеку 100 — 20 минут. Сложите все время в пути и разделите на количество людей в выборке (в данном случае 100). Результатом будет ваша оценка среднего времени в пути для всего населения. Этот метод практичен, когда невозможно измерить всех членов популяции, и он обеспечивает разумную аппроксимацию на основе репрезентативной выборки.

Точно математическим способом при оценке среднего значения совокупности с использованием независимой и одинаково распределенной (iid) выборки размера n , где каждое значение данных имеет дисперсию σ ² , стандартная ошибка выборочного среднего равна:

{\frac {\sigma }{\sqrt {n}}}.

Это выражение количественно описывает, как оценка становится более точной по мере увеличения размера выборки. Использование центральной предельной теоремы для обоснования аппроксимации выборочного среднего с помощью нормального распределения дает доверительный интервал вида

\left({\bar {x}}-{\frac {Z\sigma }{\sqrt {n}}},\quad {\bar {x}}+{\frac {Z\sigma } \sqrt {n}}}\right)

где Z — стандартный Z-показатель для желаемого уровня достоверности (1,96 для 95% доверительного интервала).

Чтобы определить размер выборки n , необходимый для доверительного интервала шириной W, где W/2 является погрешностью на каждой стороне выборочного среднего, уравнение

{\frac {Z\sigma }{\sqrt {n}}}=W/2

можно решить. Это дает формулу размера выборки для n :

$n={\frac {4Z^{2}\sigma ^{2}}{W^{2}}}$ .

Например, если оценить влияние препарата на артериальное давление с 95% доверительным интервалом шириной шесть единиц, а известное стандартное отклонение артериального давления в популяции равно 15, требуемый размер выборки будет равен , который будет округлен. до 97, поскольку размеры выборки должны быть целыми числами и должны соответствовать рассчитанному минимальному значению или превышать его. Понимание этих расчетов важно для исследователей, планирующих исследования для точной оценки средних значений численности населения в пределах желаемого уровня достоверности. ${\frac {4\times 1,96^{2}\times 15^{2}}{6^{2}}}=96,04$

Требуемые размеры выборки для проверки гипотез

Одна из распространенных проблем, с которыми сталкиваются статистики, связана с задачей расчета размера выборки, необходимого для достижения заданной статистической мощности теста, при сохранении заранее определенного коэффициента ошибок типа I α, который означает уровень значимости при проверке гипотез. . Это дает определенную мощность для теста при заданных заранее условиях. Таким образом, это можно оценить с помощью заранее определенных таблиц для определенных значений, с помощью уравнения ресурсов Мида или, в более общем смысле, с помощью кумулятивной функции распределения :

Таблицы

Таблицу, показанную справа, можно использовать в двухвыборочном t-тесте для оценки размеров выборки экспериментальной группы и контрольной группы , которые имеют одинаковый размер, то есть общее количество участников в исследовании вдвое превышает заданного числа, а желаемый уровень значимости составляет 0,05. ^[3] Используемые параметры:

Желаемая статистическая мощность исследования показана в столбце слева.
D Коэна (= величина эффекта), который представляет собой ожидаемую разницу между средними целевыми значениями между экспериментальной группой и контрольной группой , деленную на ожидаемое стандартное отклонение .

Уравнение ресурсов Мида

Уравнение ресурсов Мида часто используется для оценки размеров выборок лабораторных животных , а также во многих других лабораторных экспериментах. Он может быть не таким точным, как использование других методов оценки размера выборки, но дает подсказку о том, какой размер выборки является подходящим, когда такие параметры, как ожидаемые стандартные отклонения или ожидаемые различия в значениях между группами, неизвестны или очень трудно оценить. ^[4]

Все параметры в уравнении по сути являются степенями свободы числа их понятий, и, следовательно, их числа вычитаются на 1 перед подстановкой в уравнение.

Уравнение: ^[4]

E=NBT,

где:

N — общее количество лиц или единиц в исследовании (минус 1)
B — блокирующий компонент , представляющий воздействие окружающей среды, предусмотренное проектом (минус 1).
T — компонент лечения , соответствующий количеству используемых групп лечения (включая контрольную группу ) или количеству задаваемых вопросов (минус 1).
E — это степени свободы компонента ошибки и должно быть где-то между 10 и 20.

Например, если исследование с использованием лабораторных животных планируется с четырьмя экспериментальными группами ( T =3), по восемь животных в каждой группе, всего 32 животных ( N =31), без какой-либо дальнейшей стратификации ( B =0), тогда E будет равно 28, что выше порогового значения в 20, что указывает на то, что размер выборки может быть слишком большим, и шесть животных на группу могут быть более подходящими. ^[5]

Кумулятивная функция распределения

Пусть X _i , i = 1, 2, ..., n будут независимыми наблюдениями, взятыми из нормального распределения с неизвестным средним значением µ и известной дисперсией σ ² . Рассмотрим две гипотезы, нулевую гипотезу :

H_{0}:\mu =0

и альтернативная гипотеза:

H_{a}:\mu =\mu ^{*}

для некоторой «наименьшей значимой разницы» μ ^* > 0. Это наименьшее значение, при котором нам важно наблюдать разницу. Теперь, чтобы (1) отклонить H ₀ с вероятностью не менее 1 − β , когда H _a истинно (т. е. степень 1 − β ), и (2) отклонить H ₀ с вероятностью α, когда H ₀ истинно, необходимо следующее: Если z _α является верхней процентной точкой α стандартного нормального распределения, то

\Pr({\bar {x}}>z_{\alpha }\sigma /{\sqrt {n}}\mid H_{0})=\alpha

и так

'Отклонить H ₀ , если наше выборочное среднее ( ) больше, чем '

{\bar {x}}

z_{\alpha }\sigma /{\sqrt {n}}

является решающим правилом , удовлетворяющим (2). (Это односторонний тест.) В таком сценарии достижение этого с вероятностью не менее 1-β, когда альтернативная гипотеза H _a верна, становится обязательным. Здесь выборочное среднее происходит из нормального распределения со средним значением ц ^* . Таким образом, требование выражается в следующем:

\Pr({\bar {x}}>z_ {\alpha }\sigma /{\sqrt {n}}\mid H_{a})\geq 1-\beta

Путем тщательного манипулирования можно показать (см. Пример статистической мощности ), что это происходит, когда

n\geq \left({\frac {z_{\alpha }+\Phi ^{-1}(1-\beta)}{\mu ^{*}/\sigma }}\right)^{ 2}

где – нормальная кумулятивная функция распределения . $\Фи$

Размер стратифицированной выборки

При использовании более сложных методов выборки, таких как стратифицированная выборка , выборку часто можно разделить на подвыборки. Обычно, если таких подвыборок H (из H разных слоев), то каждая из них будет иметь размер выборки n _h , h = 1, 2, ..., H . Эти n _h должны соответствовать правилу, что n ₁ + n ₂ + ... + n _H = n (т. е. общий размер выборки определяется суммой размеров подвыборки). Оптимальный выбор этих n _h можно выполнить различными способами, используя, например, оптимальное распределение Неймана.

Существует много причин для использования стратифицированной выборки: ^[6] для уменьшения дисперсии оценок выборки, для использования частично неслучайных методов или для изучения страт индивидуально. Полезным, частично неслучайным методом будет выборка отдельных лиц там, где это легко доступно, а там, где это невозможно, выборка кластеров для экономии транспортных расходов. ^[7]

В общем, для страт H взвешенное выборочное среднее равно

{\bar {x}}_{w}=\sum _{h=1}^{H}W_{h}{\bar {x}}_{h},

\operatorname {Var} ({\bar {x}}_{w})=\sum _{h=1}^{H}W_{h}^{2}\operatorname {Var} ({\ бар {x}}_{h}).

^[8]

Веса , часто, но не всегда, представляют доли элементов совокупности в стратах, и . Для фиксированного размера выборки, т.е. $W_{h}$ $W_{h}=N_{h}/N$ $n=\sum n_{h}$

\operatorname {Var} ({\bar {x}}_{w})=\sum _{h=1}^{H}W_{h}^{2}\operatorname {Var} ({\ бар {x}}_{h})\left({\frac {1}{n_{h}}}-{\frac {1}{N_{h}}}\right),

^[9]

которое можно сделать минимальным, если частоту выборки внутри каждой страты сделать пропорциональной стандартному отклонению внутри каждой страты: , где и является константой, такой что . $n_{h}/N_{h}=kS_{h}$ $S_{h}={\sqrt {\operatorname {Var} ({\bar {x}}_{h})}}$ $k$ $\sum {n_{h}}=n$

«Оптимальное распределение» достигается, когда частота выборки внутри страты прямо пропорциональна стандартным отклонениям внутри страты и обратно пропорциональна квадратному корню из стоимости выборки на элемент внутри страты : $C_{h}$

{\frac {n_{h}}{N_{h}}}={\frac {KS_{h}}{\sqrt {C_{h}}}},

^[10]

где константа такая , что или, в более общем смысле, когда $K$ $\sum {n_{h}}=n$

n_{h}={\frac {K'W_{h}S_{h}}{\sqrt {C_{h}}}}.

^[11]

Качественное исследование

Качественные исследования подходят к определению размера выборки с использованием особой методологии, которая отличается от количественных методов. Вместо того, чтобы полагаться на заранее определенные формулы или статистические расчеты, оно предполагает субъективное и повторяющееся суждение на протяжении всего исследовательского процесса. В качественных исследованиях исследователи часто занимают субъективную позицию, делая выводы по мере развития исследования. Определение размера выборки в качественных исследованиях использует другой подход. Обычно это субъективное суждение, принимаемое по ходу исследования. ^[12] Одним из распространенных подходов является постоянное включение дополнительных участников или материалов до тех пор, пока не будет достигнута точка «насыщения». Насыщение происходит, когда новые участники или данные перестают давать свежие идеи, что указывает на то, что исследование адекватно отражает разнообразие точек зрения или опыта в пределах выбранной выборки. Насыщение достигается. ^[13] Количество, необходимое для достижения насыщения, было исследовано эмпирически. ^[14]^[15]^[16]^[17]

В отличие от количественных исследований, качественные исследования сталкиваются с нехваткой надежных указаний относительно оценки размера выборки до начала исследования. Представьте себе, что при проведении глубинных интервью с людьми, пережившими рак, качественные исследователи могут использовать насыщение данных для определения подходящего размера выборки. Если в ходе нескольких интервью не обнаруживается свежих тем или идей, значит, насыщение достигнуто, и дальнейшие интервью могут мало что добавить к нашим знаниям об опыте пережившего насилие. Таким образом, вместо следования заранее заданной статистической формуле концепция достижения насыщения служит динамическим руководством для определения размера выборки в качественных исследованиях. Существует недостаток надежных руководств по оценке размеров выборки перед началом исследования, а также дается ряд предложений. ^[15]^[18]^[19]^[20] В попытке привнести некоторую структуру в процесс определения размера выборки в качественных исследованиях был предложен инструмент, аналогичный количественным расчетам мощности. Этот инструмент, основанный на отрицательном биномиальном распределении , специально предназначен для тематического анализа . ^[21]^[20]

Смотрите также

Планирование экспериментов
Пример поверхности инженерного реагирования в рамках пошаговой регрессии
Коэн ч

Общие ссылки

Бартлетт, JE II; Котрлик, Дж.В.; Хиггинс, К. (2001). «Организационное исследование: определение подходящего размера выборки для опросного исследования» (PDF) . Журнал информационных технологий, обучения и производительности . 19 (1): 43–50.
Киш, Л. (1965). Выборка опроса . Уайли. ISBN 978-0-471-48900-9.
Смит, Скотт (8 апреля 2013 г.). «Определение размера выборки: как убедиться, что вы получили правильный размер выборки». Квалтрикс . Проверено 19 сентября 2018 г.
Израиль, Гленн Д. (1992). «Определение размера выборки». Университет Флориды, PEOD-6 . Проверено 29 июня 2019 г.
Ренс ван де Шут, Милица Миочевич (ред.). 2020. Решения для малых выборок (открытый доступ): Руководство для прикладных исследователей и практиков. Рутледж.

дальнейшее чтение

NIST: Выбор размера выборки
ASTM E122-07: Стандартная практика расчета размера выборки для оценки с заданной точностью среднего значения характеристики партии или процесса.

Внешние ссылки

Сценарий MATLAB, реализующий формулу размера выборки Кокрана.