Среднее значение — это числовая величина, представляющая центр набора чисел и промежуточная по отношению к крайним значениям набора чисел. [1] В математике , особенно в статистике , существует несколько видов средств . Каждое среднее значение служит для обобщения определенной группы данных , часто для лучшего понимания общего значения ( величины и знака ) данного набора данных .
Для набора данных среднее арифметическое , также известное как «среднее арифметическое», является мерой центральной тенденции конечного набора чисел: в частности, суммы значений, разделенной на количество значений. Среднее арифметическое набора чисел x 1 , x 2 , ..., x n обычно обозначается с помощью верхней черты , . [примечание 1] Если набор данных был основан на серии наблюдений, полученных путем выборки из статистической совокупности , среднее арифметическое является выборочным средним ( ), чтобы отличить его от среднего или ожидаемого значения основного распределения, совокупности среднее значение (обозначается или [примечание 2] ). [2]
Помимо вероятности и статистики, в геометрии и математическом анализе часто используется широкий спектр других понятий среднего значения ; примеры приведены ниже.
Среднее арифметическое (или просто среднее или выборочное среднее ) списка чисел представляет собой сумму всех чисел, разделенную на количество чисел. Аналогично, среднее значение выборки , обычно обозначаемое , представляет собой сумму выборочных значений, деленную на количество элементов в выборке.
Например, среднее арифметическое пяти значений: 4, 36, 45, 50, 75 равно:
Среднее геометрическое — это среднее значение, которое полезно для наборов положительных чисел, которые интерпретируются в соответствии с их произведением (как в случае с темпами роста), а не их суммой (как в случае со средним арифметическим):
Например, среднее геометрическое пяти значений: 4, 36, 45, 50, 75 равно:
Среднее гармоническое — это среднее значение, которое полезно для наборов чисел, определенных относительно некоторой единицы , как в случае скорости (т. е. расстояния в единицу времени):
Например, среднее гармоническое пяти значений: 4, 36, 45, 50, 75 равно
Если у нас есть пять насосов, которые могут опорожнить резервуар определенного размера соответственно за 4, 36, 45, 50 и 75 минут, то среднее гармоническое говорит нам, что эти пять разных насосов, работающих вместе, будут перекачивать с той же скоростью, что и как пять насосов, каждый из которых может опорожнить резервуар за считанные минуты.
AM, GM и HM удовлетворяют этим неравенствам:
Равенство имеет место, если все элементы данной выборки равны.
В описательной статистике среднее значение можно спутать с медианой , модой или средним диапазоном , поскольку любое из них может быть ошибочно названо «средним» (более формально, мерой центральной тенденции ). Среднее значение набора наблюдений представляет собой среднее арифметическое значений; однако для асимметричных распределений среднее значение не обязательно совпадает со средним значением (медианой) или наиболее вероятным значением (режимом). Например, средний доход обычно искажается вверх из-за небольшого числа людей с очень высокими доходами, так что у большинства доход ниже среднего. Напротив, медианный доход — это уровень, на котором половина населения находится ниже, а половина — выше. Режим дохода является наиболее вероятным доходом и благоприятствует большему числу людей с более низкими доходами. Хотя медиана и мода часто являются более интуитивными мерами для таких асимметричных данных, многие асимметричные распределения на самом деле лучше всего описываются их средним значением, включая экспоненциальное распределение и распределение Пуассона .
Среднее значение распределения вероятностей — это долгосрочное среднее арифметическое значение случайной величины, имеющей это распределение. Если случайная величина обозначена , то среднее значение также известно как ожидаемое значение ( обозначается ). Для дискретного распределения вероятностей среднее значение определяется как , где сумма берется по всем возможным значениям случайной величины и представляет собой функцию массы вероятности . Для непрерывного распределения среднее значение равно , где – функция плотности вероятности . [5] Во всех случаях, включая те, в которых распределение не является ни дискретным, ни непрерывным, среднее значение представляет собой интеграл Лебега случайной величины относительно ее вероятностной меры . Среднее значение не обязательно должно существовать или быть конечным; для некоторых вероятностных распределений среднее значение бесконечно ( +∞ или −∞ ), а для других среднее значение не определено .
Обобщенное среднее , также известное как среднее степенное или среднее Гёльдера, представляет собой абстракцию квадратичных , арифметических, геометрических и гармонических средних. Он определяется для набора из n положительных чисел x i формулой
[3]
Путем выбора различных значений параметра m получаются следующие типы средних:
Это можно обобщить дальше как обобщенное f -среднее
и снова подходящий выбор обратимого f даст
Средневзвешенное арифметическое (или средневзвешенное) используется, если нужно объединить средние значения из выборок разного размера одной и той же совокупности:
Где и — среднее значение и размер выборки соответственно. В других приложениях они представляют собой меру надежности влияния соответствующих значений на среднее значение.
Иногда набор чисел может содержать выбросы (т. е. значения данных, которые намного ниже или намного выше, чем другие). Часто выбросы представляют собой ошибочные данные, вызванные артефактами . В этом случае можно использовать усеченное среднее . Он включает в себя отбрасывание заданных частей данных на верхнем или нижнем конце, обычно равное количество на каждом конце, а затем взятие среднего арифметического оставшихся данных. Количество удаленных значений указывается в процентах от общего количества значений.
Интерквартильное среднее является конкретным примером усеченного среднего. Это просто среднее арифметическое после удаления самой низкой и самой высокой четверти значений.
если предположить, что значения упорядочены, то это просто конкретный пример средневзвешенного значения для определенного набора весов.
В некоторых случаях математики могут вычислить среднее значение бесконечного (или даже неисчислимого ) набора значений. Это может произойти при вычислении среднего значения функции . Интуитивно среднее значение функции можно представить как вычисление площади под участком кривой и затем деление на длину этого участка. Это можно сделать грубо, посчитав квадраты на миллиметровой бумаге или, точнее, проинтегрировав . Формула интегрирования записывается как:
При этом необходимо позаботиться о том, чтобы интеграл сходился. Но среднее значение может быть конечным, даже если сама функция в некоторых точках стремится к бесконечности.
Углы , время суток и другие циклические величины требуют модульной арифметики для сложения и иного объединения чисел. Во всех этих ситуациях не будет единственного средства. Например, время за час до и после полуночи равноудалено как от полуночи, так и от полудня. Также возможно, что никакого среднего не существует. Рассмотрим цветовой круг : набор всех цветов не имеет значения. В таких ситуациях вы должны решить, какое среднее значение является наиболее полезным. Вы можете сделать это, корректируя значения перед усреднением или используя специальный подход для среднего значения круговых величин .
Среднее значение Фреше дает способ определить «центр» распределения массы на поверхности или, в более общем смысле, на римановом многообразии . В отличие от многих других средств, среднее значение Фреше определяется в пространстве, элементы которого не обязательно складываются или умножаются на скаляры. Иногда его также называют средним значением Керхера (названным в честь Германа Керхера).
В геометрии существуют тысячи различных определений центра треугольника , которые все можно интерпретировать как среднее значение треугольного набора точек на плоскости. [ нужна цитата ]
Это приближение к среднему значению для умеренно асимметричного распределения. [6] Он используется при разведке углеводородов и определяется как:
где и – 10-й, 50-й и 90-й процентили распределения соответственно.