stringtranslate.com

Ошибка выборки

В статистике ошибки выборки возникают, когда статистические характеристики совокупности оцениваются на основе подмножества или выборки этой совокупности. Поскольку выборка не включает всех членов совокупности, статистика выборки (часто известная как оценщики ), такая как средние значения и квартили, обычно отличается от статистики всей совокупности (известной как параметры ). Разница между статистикой выборки и параметром совокупности считается ошибкой выборки . [1] Например, если измерить рост тысячи человек из одного миллиона населения, средний рост тысячи обычно не совпадает со средним ростом всего миллиона человек в стране.

Поскольку выборка почти всегда производится для оценки неизвестных параметров совокупности, точное измерение ошибок выборки по определению невозможно; однако их часто можно оценить либо с помощью общих методов, таких как бутстрэппинг , либо с помощью конкретных методов, включающих некоторые предположения (или догадки) относительно истинного распределения населения и его параметров.

Описание

Ошибка выборки

Ошибка выборки — это ошибка , вызванная наблюдением за выборкой, а не за всей совокупностью. [1] Ошибка выборки — это разница между статистикой выборки, используемой для оценки параметра совокупности, и фактическим, но неизвестным значением параметра. [2]

Эффективная выборка

В статистике действительно случайная выборка означает отбор индивидуумов из совокупности с эквивалентной вероятностью ; другими словами, выбор людей из группы без предвзятости. Неспособность сделать это правильно приведет к систематической ошибке выборки , которая может значительно увеличить ошибку выборки . Например, попытка измерить средний рост всего населения Земли, но измерить выборку только из одной страны, может привести к значительному завышению или недооценке. В действительности получение несмещенной выборки может быть затруднено, поскольку многие параметры (в данном примере страна, возраст, пол и т. д.) могут сильно смещать оценщика, и необходимо гарантировать, что ни один из этих факторов не играет роли в процессе отбора. .

Даже в идеальной несмещенной выборке ошибка выборки все равно будет существовать из-за оставшейся статистической составляющей; Учтите, что измерение только двух или трех особей и взятие среднего значения каждый раз будут давать совершенно разные результаты. Вероятный размер ошибки выборки обычно можно уменьшить, взяв выборку большего размера. [3]

Определение размера выборки

В действительности стоимость увеличения размера выборки может оказаться непомерно высокой. Поскольку ошибку выборки часто можно оценить заранее как функцию размера выборки, используются различные методы определения размера выборки , чтобы сопоставить прогнозируемую точность оценщика с прогнозируемой стоимостью взятия большей выборки.

Начальная загрузка и стандартная ошибка

Как уже говорилось, статистика выборки, такая как среднее значение или процент, обычно может варьироваться от выборки к выборке. [1] Сравнивая множество выборок или разделяя большую выборку на более мелкие (возможно, с перекрытием), разброс результирующей статистики выборки можно использовать для оценки стандартной ошибки выборки.

В генетике

Термин «ошибка выборки» также использовался в схожем, но принципиально ином смысле в области генетики ; например, в эффекте узкого места или эффекте основателя , когда стихийные бедствия или миграции резко сокращают размер населения, в результате чего меньшая популяция может точно отражать исходную, а может и нет. Это является источником генетического дрейфа (поскольку определенные аллели становятся более или менее распространенными), и это называется «ошибкой выборки» [4] , хотя в статистическом смысле это не является «ошибкой».

Смотрите также

Рекомендации

  1. ^ abc Сарндал, Свенсон и Ретман (1992), Выборка опросов с помощью модели, Springer-Verlag, ISBN  0-387-40620-4
  2. ^ Бернс, Н.; Гроув, СК (2009). Практика сестринского исследования: оценка, синтез и получение доказательств (6-е изд.). Сент-Луис, Миссури: Сондерс Эльзевир. ISBN 978-1-4557-0736-2.
  3. ^ Шойрен, Фриц (2005). «Что такое погрешность?». Что такое опрос? (PDF) . Вашингтон, округ Колумбия: Американская статистическая ассоциация. Архивировано из оригинала (PDF) 12 марта 2013 г. Проверено 8 января 2008 г.
  4. ^ Кэмпбелл, Нил А.; Рис, Джейн Б. (2002). Биология . Бенджамин Каммингс. стр. 450–451. ISBN 0-536-68045-0.