stringtranslate.com

Определение размера выборки

Определение или оценка размера выборки – это выбор количества наблюдений или повторов для включения в статистическую выборку . Размер выборки — важная особенность любого эмпирического исследования, цель которого — сделать выводы о совокупности на основе выборки. На практике размер выборки, используемый в исследовании, обычно определяется на основе стоимости, времени или удобства сбора данных, а также необходимости обеспечения достаточной статистической мощности . В комплексных исследованиях могут быть выделены выборки разных размеров, например, в стратифицированных исследованиях или экспериментальных планах с несколькими группами лечения. При переписи данные собираются для всего населения, поэтому предполагаемый размер выборки равен численности населения. При планировании эксперимента , когда исследование может быть разделено на различные группы лечения , для каждой группы могут быть разные размеры выборки.

Размер выборки можно выбрать несколькими способами:

Введение

Определение размера выборки является важнейшим аспектом методологии исследования, который играет важную роль в обеспечении надежности и достоверности результатов исследования. Чтобы повлиять на точность оценок, мощность статистических тестов и общую надежность результатов исследования, необходимо тщательно выбирать количество участников или точек данных, которые будут включены в исследование.

Например, если мы проводим опрос для определения среднего уровня удовлетворенности клиентов относительно нового продукта. Чтобы определить подходящий размер выборки, нам необходимо учитывать такие факторы, как желаемый уровень уверенности, погрешность и изменчивость ответов. Мы можем решить, что нам нужен уровень достоверности 95 %, то есть мы на 95 % уверены, что истинный средний уровень удовлетворенности находится в пределах рассчитанного диапазона. Мы также определяем предел погрешности в размере ±3%, который указывает на приемлемый диапазон различий между нашей выборочной оценкой и истинным параметром совокупности. Кроме того, мы можем иметь некоторое представление об ожидаемой изменчивости уровней удовлетворенности на основе предыдущих данных или предположений.

Важность

Большие размеры выборки обычно приводят к повышению точности при оценке неизвестных параметров. Например, чтобы точно определить распространенность возбудителя инфекции у конкретного вида рыб, предпочтительнее исследовать выборку из 200 рыб, а не из 100 рыб. Это явление описывают несколько фундаментальных фактов математической статистики, включая закон больших чисел и центральную предельную теорему .

В некоторых ситуациях повышение точности для выборок большего размера минимально или даже отсутствует. Это может быть результатом наличия систематических ошибок или сильной зависимости в данных, или того, что данные следуют распределению с тяжелым хвостом, или потому, что данные сильно зависимы или предвзяты.

Размер выборки можно оценить по качеству полученных оценок следующим образом. Обычно он определяется на основе стоимости, времени или удобства сбора данных, а также необходимости наличия достаточной статистической мощности. Например, если оценивается доля, может потребоваться, чтобы 95% доверительный интервал был шириной менее 0,06 единиц. Альтернативно, размер выборки может быть оценен на основе силы проверки гипотезы. Например, если мы сравниваем поддержку определенного политического кандидата среди женщин с поддержкой этого кандидата среди мужчин, нам может потребоваться иметь 80% власти, чтобы обнаружить разницу в уровнях поддержки в 0,04 единицы.

Оценка

Оценка доли

Относительно простой ситуацией является оценка доли . Это фундаментальный аспект статистического анализа, особенно при оценке распространенности определенной характеристики среди населения. Например, мы можем захотеть оценить долю жителей в сообществе в возрасте не менее 65 лет.

Оценка пропорции равна , где X — количество «положительных» (например, количество людей из n выбранных людей в возрасте не менее 65 лет). Когда наблюдения независимы , эта оценка имеет (масштабированное) биномиальное распределение (а также является выборочным средним данных из распределения Бернулли ). Максимальная дисперсия этого распределения составляет 0,25, что происходит, когда истинный параметр равен p = 0,5. В практических приложениях, где истинный параметр p неизвестен, максимальная дисперсия часто используется для оценки размера выборки. Если известна разумная оценка p, эту величину можно использовать вместо 0,25.

Когда размер выборки n станет достаточно большим, распределение будет близко приближаться к нормальному распределению . [1] Использование этого метода и метода Вальда для биномиального распределения дает доверительный интервал, где Z представляет собой стандартный Z-показатель для желаемого уровня достоверности (например, 1,96 для 95% доверительного интервала) в форме:

Чтобы определить подходящий размер выборки n для оценки пропорций, можно решить приведенное ниже уравнение, где W представляет собой желаемую ширину доверительного интервала. Полученная формула размера выборки часто применяется с консервативной оценкой p (например, 0,5):

для n , что дает размер выборки

размеры выборки для биномиальных пропорций с учетом разных уровней достоверности и погрешностей

, в случае использования 0,5 в качестве наиболее консервативной оценки доли. (Примечание: W/2 = погрешность .)

На рисунке ниже можно увидеть, как размеры выборки для биномиальных пропорций изменяются при различных уровнях достоверности и пределах погрешности.


В противном случае формула будет иметь вид , что дает . Например, при оценке доли населения США, поддерживающего кандидата в президенты, с шириной доверительного интервала 95% в 2 процентных пункта (0,02), требуется размер выборки (1,96) 2 / (0,02 2 ) = 9604 с запасом погрешность в данном случае составляет 1 процентный пункт. В этом случае разумно использовать оценку p 0,5, поскольку президентские гонки часто близки к 50/50, и также разумно использовать консервативную оценку. Погрешность в этом случае составляет 1 процентный пункт (половина 0,02).

На практике формула: обычно используется для формирования 95% доверительного интервала для истинной пропорции. Уравнение можно решить относительно n , обеспечив минимальный размер выборки, необходимый для достижения желаемой погрешности. Вышеизложенное обычно упрощается: «Вывод для регрессии». utdallas.edu .</ref> [2] n  = 4/ W 2  = 1/ B 2 , где B — граница ошибки оценки, т. е. оценка обычно дается в пределах ± B . Для B = 10% требуется n = 100, для B = 5% необходимо n = 400, для B = 3% требование приближается к n = 1000, а для B = 1% требуется размер выборки n = 10000. . Эти цифры часто приводятся в новостях, опросах общественного мнения и других выборочных опросах . Однако сообщаемые результаты могут не соответствовать точному значению, поскольку числа желательно округлять в большую сторону. Зная, что значение n представляет собой минимальное количество точек выборки, необходимое для получения желаемого результата, количество респондентов должно находиться на уровне минимума или превышать его.

Оценка среднего

Проще говоря, если мы пытаемся оценить среднее время, которое требуется людям, чтобы добраться до работы в городе. Вместо опроса всего населения вы можете взять случайную выборку из 100 человек, записать время их пути на работу, а затем рассчитать среднее (среднее) время в пути для этой выборки. Например, человеку 1 требуется 25 минут, человеку 2 — 30 минут, ..., человеку 100 — 20 минут. Сложите все время в пути и разделите на количество людей в выборке (в данном случае 100). Результатом будет ваша оценка среднего времени в пути для всего населения. Этот метод практичен, когда невозможно измерить всех членов популяции, и он обеспечивает разумную аппроксимацию на основе репрезентативной выборки.

Точно математическим способом при оценке среднего значения совокупности с использованием независимой и одинаково распределенной (iid) выборки размера n , где каждое значение данных имеет дисперсию σ 2 , стандартная ошибка выборочного среднего равна:

Это выражение количественно описывает, как оценка становится более точной по мере увеличения размера выборки. Использование центральной предельной теоремы для обоснования аппроксимации выборочного среднего с помощью нормального распределения дает доверительный интервал вида

,
где Z — стандартный Z-показатель для желаемого уровня достоверности (1,96 для 95% доверительного интервала).

Чтобы определить размер выборки n , необходимый для доверительного интервала шириной W, где W/2 является погрешностью на каждой стороне выборочного среднего, уравнение

можно решить. Это дает формулу размера выборки для n :

.

Например, если оценить влияние препарата на артериальное давление с 95% доверительным интервалом шириной шесть единиц, а известное стандартное отклонение артериального давления в популяции равно 15, требуемый размер выборки будет равен , который будет округлен. до 97, поскольку размеры выборки должны быть целыми числами и должны соответствовать рассчитанному минимальному значению или превышать его. Понимание этих расчетов важно для исследователей, планирующих исследования для точной оценки средних значений численности населения в пределах желаемого уровня достоверности.

Требуемые размеры выборки для проверки гипотез

Одна из распространенных проблем, с которыми сталкиваются статистики, связана с задачей расчета размера выборки, необходимого для достижения заданной статистической мощности теста, при сохранении заранее определенного коэффициента ошибок типа I α, который означает уровень значимости при проверке гипотез. . Это дает определенную мощность для теста при заданных заранее условиях. Таким образом, это можно оценить с помощью заранее определенных таблиц для определенных значений, с помощью уравнения ресурсов Мида или, в более общем смысле, с помощью кумулятивной функции распределения :

Таблицы

Таблицу, показанную справа, можно использовать в двухвыборочном t-тесте для оценки размеров выборки экспериментальной группы и контрольной группы , которые имеют одинаковый размер, то есть общее количество участников в исследовании вдвое превышает заданного числа, а желаемый уровень значимости составляет 0,05. [3] Используемые параметры:

Уравнение ресурсов Мида

Уравнение ресурсов Мида часто используется для оценки размеров выборок лабораторных животных , а также во многих других лабораторных экспериментах. Он может быть не таким точным, как использование других методов оценки размера выборки, но дает подсказку о том, какой размер выборки является подходящим, когда такие параметры, как ожидаемые стандартные отклонения или ожидаемые различия в значениях между группами, неизвестны или очень трудно оценить. [4]

Все параметры в уравнении по сути являются степенями свободы числа их понятий, и, следовательно, их числа вычитаются на 1 перед подстановкой в ​​уравнение.

Уравнение: [4]

где:

Например, если исследование с использованием лабораторных животных планируется с четырьмя экспериментальными группами ( T =3), по восемь животных в каждой группе, всего 32 животных ( N =31), без какой-либо дальнейшей стратификации ( B =0), тогда E будет равно 28, что выше порогового значения в 20, что указывает на то, что размер выборки может быть слишком большим, и шесть животных на группу могут быть более подходящими. [5]

Кумулятивная функция распределения

Пусть X i , i = 1, 2, ..., n будут независимыми наблюдениями, взятыми из нормального распределения с неизвестным средним значением µ и известной дисперсией σ 2 . Рассмотрим две гипотезы, нулевую гипотезу :

и альтернативная гипотеза:

для некоторой «наименьшей значимой разницы» μ *  > 0. Это наименьшее значение, при котором нам важно наблюдать разницу. Теперь, чтобы (1) отклонить H 0 с вероятностью не менее 1 −  β , когда H a истинно (т. е. степень 1 −  β ), и (2) отклонить H 0 с вероятностью α, когда H 0 истинно, необходимо следующее: Если z α является верхней процентной точкой α стандартного нормального распределения, то

и так

'Отклонить H 0 , если наше выборочное среднее ( ) больше, чем '

является решающим правилом , удовлетворяющим (2). (Это односторонний тест.) В таком сценарии достижение этого с вероятностью не менее 1-β, когда альтернативная гипотеза H a верна, становится обязательным. Здесь выборочное среднее происходит из нормального распределения со средним значением ц * . Таким образом, требование выражается в следующем:

Путем тщательного манипулирования можно показать (см. Пример статистической мощности ), что это происходит, когда

где – нормальная кумулятивная функция распределения .

Размер стратифицированной выборки

При использовании более сложных методов выборки, таких как стратифицированная выборка , выборку часто можно разделить на подвыборки. Обычно, если таких подвыборок H (из H разных слоев), то каждая из них будет иметь размер выборки n h , h = 1, 2, ..., H . Эти n h должны соответствовать правилу, что n 1 + n 2 + ... + n H = n (т. е. общий размер выборки определяется суммой размеров подвыборки). Оптимальный выбор этих n h можно выполнить различными способами, используя, например, оптимальное распределение Неймана.

Существует много причин для использования стратифицированной выборки: [6] для уменьшения дисперсии оценок выборки, для использования частично неслучайных методов или для изучения страт индивидуально. Полезным, частично неслучайным методом будет выборка отдельных лиц там, где это легко доступно, а там, где это невозможно, выборка кластеров для экономии транспортных расходов. [7]

В общем, для страт H взвешенное выборочное среднее равно

с

[8]

Веса , часто, но не всегда, представляют доли элементов совокупности в стратах, и . Для фиксированного размера выборки, т.е.

[9]

которое можно сделать минимальным, если частоту выборки внутри каждой страты сделать пропорциональной стандартному отклонению внутри каждой страты: , где и является константой, такой что .

«Оптимальное распределение» достигается, когда частота выборки внутри страты прямо пропорциональна стандартным отклонениям внутри страты и обратно пропорциональна квадратному корню из стоимости выборки на элемент внутри страты :

[10]

где константа такая , что или, в более общем смысле, когда

[11]

Качественное исследование

Качественные исследования подходят к определению размера выборки с использованием особой методологии, которая отличается от количественных методов. Вместо того, чтобы полагаться на заранее определенные формулы или статистические расчеты, оно предполагает субъективное и повторяющееся суждение на протяжении всего исследовательского процесса. В качественных исследованиях исследователи часто занимают субъективную позицию, делая выводы по мере развития исследования. Определение размера выборки в качественных исследованиях использует другой подход. Обычно это субъективное суждение, принимаемое по ходу исследования. [12] Одним из распространенных подходов является постоянное включение дополнительных участников или материалов до тех пор, пока не будет достигнута точка «насыщения». Насыщение происходит, когда новые участники или данные перестают давать свежие идеи, что указывает на то, что исследование адекватно отражает разнообразие точек зрения или опыта в пределах выбранной выборки. Насыщение достигается. [13] Количество, необходимое для достижения насыщения, было исследовано эмпирически. [14] [15] [16] [17]

В отличие от количественных исследований, качественные исследования сталкиваются с нехваткой надежных указаний относительно оценки размера выборки до начала исследования. Представьте себе, что при проведении глубинных интервью с людьми, пережившими рак, качественные исследователи могут использовать насыщение данных для определения подходящего размера выборки. Если в ходе нескольких интервью не обнаруживается свежих тем или идей, значит, насыщение достигнуто, и дальнейшие интервью могут мало что добавить к нашим знаниям об опыте пережившего насилие. Таким образом, вместо следования заранее заданной статистической формуле концепция достижения насыщения служит динамическим руководством для определения размера выборки в качественных исследованиях. Существует недостаток надежных руководств по оценке размеров выборки перед началом исследования, а также дается ряд предложений. [15] [18] [19] [20] В попытке привнести некоторую структуру в процесс определения размера выборки в качественных исследованиях был предложен инструмент, аналогичный количественным расчетам мощности. Этот инструмент, основанный на отрицательном биномиальном распределении , специально предназначен для тематического анализа . [21] [20]

Смотрите также

Рекомендации

  1. ^ NIST / SEMATECH , «7.2.4.2. Требуемые размеры выборки», электронный справочник по статистическим методам.
  2. ^ «Доверительный интервал для пропорции». Архивировано 23 августа 2011 г. в Wayback Machine.
  3. ^ ab Глава 13, страница 215, в: Кенни, Дэвид А. (1987). Статистика для социальных и поведенческих наук . Бостон: Литтл, Браун. ISBN 978-0-316-48915-7.
  4. ^ Аб Кирквуд, Джеймс; Роберт Хубрехт (2010). Справочник UFAW по уходу и содержанию лабораторных и других исследовательских животных . Уайли-Блэквелл. п. 29. ISBN 978-1-4051-7523-4.онлайн Страница 29
  5. ^ Isogenic.info > Уравнение ресурсов Майкла Ф. В. Фестинга. Обновлено в сентябре 2006 г.
  6. ^ Киш (1965, раздел 3.1)
  7. ^ Киш (1965), с. 148.
  8. ^ Киш (1965), с. 78.
  9. ^ Киш (1965), с. 81.
  10. ^ Киш (1965), с. 93.
  11. ^ Киш (1965), с. 94.
  12. ^ Санделовски, М. (1995). Размер выборки в качественных исследованиях. Исследования в области сестринского дела и здравоохранения , 18, 179–183.
  13. ^ Глейзер, Б. (1965). Постоянный сравнительный метод качественного анализа. Социальные проблемы , 12, 436–445.
  14. ^ Фрэнсис, Джилл Дж.; Джонстон, Мари; Робертсон, Клэр; Глайдвелл, Лиз; Энтвистл, Викки; Экклс, Мартин П.; Гримшоу, Джереми М. (2010). «Каков адекватный размер выборки? Оперативное насыщение данных для теоретических интервью-исследований» (PDF) . Психология и здоровье . 25 (10): 1229–1245. дои : 10.1080/08870440903194015. PMID  20204937. S2CID  28152749.
  15. ^ аб Гость, Грег; Банс, Арвен; Джонсон, Лаура (2006). «Сколько интервью достаточно?». Полевые методы . 18 : 59–82. дои : 10.1177/1525822X05279903. S2CID  62237589.
  16. ^ Райт, Адам; Мэлони, Франсин Л.; Фебловиц, Джошуа К. (2011). «Отношение врачей к электронным спискам проблем и их использованию: тематический анализ». BMC Медицинская информатика и принятие решений . 11:36 . дои : 10.1186/1472-6947-11-36 . ПМК 3120635 . ПМИД  21612639. 
  17. ^ Мейсон, Марк (2010). «Размер выборки и насыщенность докторских исследований с использованием качественных интервью». Форум Качественного социального обеспечения . 11 (3): 8.
  18. ^ Эммель, Н. (2013). Выборка и выбор случаев в качественных исследованиях: реалистичный подход. Лондон: Сейдж.
  19. ^ Онвуегбузи, Энтони Дж.; Пиявка, Нэнси Л. (2007). «Призыв к качественному анализу мощности». Качество и количество . 41 : 105–121. дои : 10.1007/s11135-005-1098-1. S2CID  62179911.
  20. ^ аб Фугард AJB; Поттс HWW (10 февраля 2015 г.). «Поддержка размышлений о размерах выборки для тематического анализа: количественный инструмент» (PDF) . Международный журнал методологии социальных исследований . 18 (6): 669–684. дои : 10.1080/13645579.2015.1005453 . S2CID  59047474.
  21. ^ Гэлвин Р. (2015). Сколько интервью достаточно? Дают ли качественные интервью в ходе исследования энергопотребления зданий надежные знания? Журнал строительной техники, 1: 2–12.

Общие ссылки

дальнейшее чтение

Внешние ссылки