В статистике выборочное распределение или распределение конечной выборки — это распределение вероятностей заданной статистики на основе случайной выборки . Если произвольно большое количество выборок, каждая из которых включает несколько наблюдений (точек данных), были отдельно использованы для вычисления одного значения статистики (например, выборочного среднего или выборочной дисперсии ) для каждой выборки, то выборочное распределение — это распределение вероятностей значений, которые принимает статистика. Во многих контекстах наблюдается только одна выборка, но выборочное распределение можно найти теоретически.
Выборочные распределения важны в статистике, поскольку они обеспечивают значительное упрощение на пути к статистическому выводу . Более конкретно, они позволяют аналитическим соображениям основываться на распределении вероятностей статистики, а не на совместном распределении вероятностей всех отдельных значений выборки.
Выборочное распределение статистики — это распределение этой статистики, рассматриваемой как случайная величина , полученное из случайной выборки размера . Его можно рассматривать как распределение статистики для всех возможных выборок из той же совокупности заданного размера выборки. Выборочное распределение зависит от базового распределения совокупности, рассматриваемой статистики, используемой процедуры выборки и используемого размера выборки. Часто возникает значительный интерес к тому, можно ли выборочное распределение аппроксимировать асимптотическим распределением , которое соответствует предельному случаю, когда либо число случайных выборок конечного размера, взятых из бесконечной совокупности и используемых для получения распределения, стремится к бесконечности, либо когда из той же совокупности берется всего одна «выборка» столь же бесконечного размера.
Например, рассмотрим нормальную совокупность со средним значением и дисперсией . Предположим, что мы многократно берем выборки заданного размера из этой совокупности и вычисляем среднее арифметическое для каждой выборки — эта статистика называется средним значением выборки . Распределение этих средних значений или средних называется «выборочным распределением среднего значения выборки». Это распределение является нормальным ( n — размер выборки), поскольку базовая совокупность является нормальной, хотя распределения выборки также часто могут быть близки к нормальному, даже если распределение совокупности не является таковым (см. центральную предельную теорему ). Альтернативой среднему значению выборки является медиана выборки . При расчете для той же совокупности она имеет другое распределение выборки, чем распределение среднего значения, и, как правило, не является нормальным (но может быть близко для больших размеров выборки).
Среднее значение выборки из популяции, имеющей нормальное распределение, является примером простой статистики, взятой из одной из простейших статистических популяций . Для других статистик и других популяций формулы более сложны, и часто они не существуют в замкнутой форме . В таких случаях выборочные распределения могут быть аппроксимированы с помощью моделирования Монте-Карло , [1] методов бутстрапа или теории асимптотического распределения .
Стандартное отклонение выборочного распределения статистики называется стандартной ошибкой этой величины. В случае, когда статистика является выборочным средним, а выборки некоррелированы, стандартная ошибка равна: где — стандартное отклонение распределения совокупности этой величины, а — размер выборки (количество элементов в выборке).
Важным следствием этой формулы является то, что размер выборки должен быть учетверен (умножен на 4), чтобы достичь половины (1/2) погрешности измерения. При разработке статистических исследований, где стоимость является фактором, это может сыграть роль в понимании компромиссов между затратами и выгодами.
Для случая, когда статистика представляет собой выборочную совокупность, а выборки некоррелированы, стандартная ошибка равна: где, опять же, — стандартное отклонение распределения генеральной совокупности этой величины, а — размер выборки (количество элементов в выборке).