Распределение выборки

В статистике выборочное распределение или распределение конечной выборки — это распределение вероятностей заданной статистики на основе случайной выборки . Если произвольно большое количество выборок, каждая из которых включает несколько наблюдений (точек данных), были отдельно использованы для вычисления одного значения статистики (например, выборочного среднего или выборочной дисперсии ) для каждой выборки, то выборочное распределение — это распределение вероятностей значений, которые принимает статистика. Во многих контекстах наблюдается только одна выборка, но выборочное распределение можно найти теоретически.

Выборочные распределения важны в статистике, поскольку они обеспечивают значительное упрощение на пути к статистическому выводу . Более конкретно, они позволяют аналитическим соображениям основываться на распределении вероятностей статистики, а не на совместном распределении вероятностей всех отдельных значений выборки.

Введение

Выборочное распределение статистики — это распределение этой статистики, рассматриваемой как случайная величина , полученное из случайной выборки размера . Его можно рассматривать как распределение статистики для всех возможных выборок из той же совокупности заданного размера выборки. Выборочное распределение зависит от базового распределения совокупности, рассматриваемой статистики, используемой процедуры выборки и используемого размера выборки. Часто возникает значительный интерес к тому, можно ли выборочное распределение аппроксимировать асимптотическим распределением , которое соответствует предельному случаю, когда либо число случайных выборок конечного размера, взятых из бесконечной совокупности и используемых для получения распределения, стремится к бесконечности, либо когда из той же совокупности берется всего одна «выборка» столь же бесконечного размера. $n$

Например, рассмотрим нормальную совокупность со средним значением и дисперсией . Предположим, что мы многократно берем выборки заданного размера из этой совокупности и вычисляем среднее арифметическое для каждой выборки — эта статистика называется средним значением выборки . Распределение этих средних значений или средних называется «выборочным распределением среднего значения выборки». Это распределение является нормальным ( n — размер выборки), поскольку базовая совокупность является нормальной, хотя распределения выборки также часто могут быть близки к нормальному, даже если распределение совокупности не является таковым (см. центральную предельную теорему ). Альтернативой среднему значению выборки является медиана выборки . При расчете для той же совокупности она имеет другое распределение выборки, чем распределение среднего значения, и, как правило, не является нормальным (но может быть близко для больших размеров выборки). $\мю$ $\сигма ^{2}$ ${\bar {x}}$ ${\mathcal {N}}(\mu,\sigma ^{2}/n)$

Среднее значение выборки из популяции, имеющей нормальное распределение, является примером простой статистики, взятой из одной из простейших статистических популяций . Для других статистик и других популяций формулы более сложны, и часто они не существуют в замкнутой форме . В таких случаях выборочные распределения могут быть аппроксимированы с помощью моделирования Монте-Карло , ^{[1] методов} бутстрапа или теории асимптотического распределения .

Стандартная ошибка

Стандартное отклонение выборочного распределения статистики называется стандартной ошибкой этой величины. В случае, когда статистика является выборочным средним, а выборки некоррелированы, стандартная ошибка равна: где — стандартное отклонение распределения совокупности этой величины, а — размер выборки (количество элементов в выборке). $\sigma _{\bar {x}}={\frac {\sigma }{\sqrt {n}}}$ $\сигма$ $n$

Важным следствием этой формулы является то, что размер выборки должен быть учетверен (умножен на 4), чтобы достичь половины (1/2) погрешности измерения. При разработке статистических исследований, где стоимость является фактором, это может сыграть роль в понимании компромиссов между затратами и выгодами.

Для случая, когда статистика представляет собой выборочную совокупность, а выборки некоррелированы, стандартная ошибка равна: где, опять же, — стандартное отклонение распределения генеральной совокупности этой величины, а — размер выборки (количество элементов в выборке). $\sigma _{\Sigma x}=\sigma {\sqrt {n}}$ $\сигма$ $n$

Примеры

Ссылки

^ Муни, Кристофер З. (1999). Моделирование Монте-Карло. Thousand Oaks, Калифорния: Sage. стр. 2. ISBN 9780803959439.

Мерберг, А. и С. Дж. Миллер (2008). «Выборочное распределение медианы». Курсовые заметки по математике 162: Математическая статистика , стр. 1–9.

Внешние ссылки

Демонстрация Mathematica, показывающая распределение выборки различных статистик (например, Σx²) для нормальной совокупности