В статистике популяция — это набор схожих элементов или событий, представляющих интерес для некоторого вопроса или эксперимента . [1] Статистическая популяция может быть группой существующих объектов (например, набор всех звезд в галактике Млечный Путь ) или гипотетической и потенциально бесконечной группой объектов, задуманной как обобщение опыта (например, набор всех возможных рук в игре в покер). [2] Общей целью статистического анализа является получение информации о некоторой выбранной популяции. [3]
В статистическом выводе подмножество популяции (статистическая выборка ) выбирается для представления популяции в статистическом анализе. [4] Более того, статистическая выборка должна быть беспристрастной и точно моделировать популяцию (каждая единица популяции имеет равные шансы на выборку). Отношение размера этой статистической выборки к размеру популяции называется выборочной фракцией . Затем можно оценить параметры популяции, используя соответствующую выборочную статистику .
Среднее значение популяции или ожидаемое значение популяции — это мера центральной тенденции распределения вероятностей или случайной величины , характеризуемой этим распределением. [5] В дискретном распределении вероятностей случайной величины среднее значение равно сумме по всем возможным значениям, взвешенным по вероятности этого значения; то есть оно вычисляется путем взятия произведения каждого возможного значения и его вероятности , а затем сложения всех этих произведений вместе, что дает . [6] [7] Аналогичная формула применима к случаю непрерывного распределения вероятностей . Не каждое распределение вероятностей имеет определенное среднее значение (см. распределение Коши в качестве примера). Более того, для некоторых распределений среднее значение может быть бесконечным.
Для конечной популяции среднее значение свойства равно среднему арифметическому данного свойства, при рассмотрении каждого члена популяции. Например, средний рост популяции равен сумме высот каждого индивидуума, деленной на общее количество индивидуумов. Выборочное среднее значение может отличаться от среднего значения популяции, особенно для небольших выборок. Закон больших чисел гласит, что чем больше размер выборки, тем больше вероятность того, что выборочное среднее значение будет близко к среднему значению популяции. [8]