Среднее значение — это числовое количество, представляющее «центр» набора чисел и являющееся промежуточным по отношению к крайним значениям набора чисел. [1] В математике , особенно в статистике , существует несколько видов средних значений (или «мер центральной тенденции ») . Каждый из них пытается обобщить или типизировать заданную группу данных , иллюстрируя величину и знак набора данных . Какая из этих мер является наиболее показательной, зависит от того, что измеряется, а также от контекста и цели. [2]
Среднее арифметическое , также известное как «среднее арифметическое», представляет собой сумму значений, деленную на количество значений. Среднее арифметическое набора чисел x 1 , x 2 , ..., x n обычно обозначается с помощью верхней черты , . [примечание 1] Если числа получены из наблюдения выборки большей группы , среднее арифметическое называется средним выборки ( ), чтобы отличить его от среднего значения группы (или ожидаемого значения ) базового распределения, обозначаемого или . [примечание 2] [3]
Помимо теории вероятностей и статистики, в геометрии и математическом анализе часто используется широкий спектр других понятий среднего значения ; примеры приведены ниже.
В математике три классических пифагорейских средних значения — это среднее арифметическое (AM), среднее геометрическое (GM) и среднее гармоническое (HM). Эти средние значения изучались с помощью пропорций пифагорейцами и последующими поколениями греческих математиков [4] из-за их важности в геометрии и музыке.
Среднее арифметическое (или просто среднее или среднее ) списка чисел — это сумма всех чисел, деленная на их количество. Аналогично, среднее значение выборки , обычно обозначаемое как , — это сумма выборочных значений, деленная на количество элементов в выборке.
Например, среднее арифметическое пяти значений: 4, 36, 45, 50, 75 равно:
Среднее геометрическое — это среднее значение, которое полезно для наборов положительных чисел, которые интерпретируются в соответствии с их произведением (как в случае с темпами роста), а не их суммой (как в случае со средним арифметическим):
Например, среднее геометрическое пяти значений: 4, 36, 45, 50, 75 равно:
Гармоническое среднее — это среднее значение, которое полезно для наборов чисел, которые определены по отношению к некоторой единице , как в случае скорости (т. е. расстояния за единицу времени):
Например, среднее гармоническое пяти значений: 4, 36, 45, 50, 75 равно
Если у нас есть пять насосов, которые могут опорожнить резервуар определенного размера за 4, 36, 45, 50 и 75 минут соответственно, то среднее гармоническое значение говорит нам, что эти пять различных насосов, работающих вместе, будут качать с той же скоростью столько же, сколько пять насосов, каждый из которых может опорожнить резервуар за считанные минуты.
AM, GM и HM удовлетворяют следующим неравенствам: [ необходима ссылка ]
Равенство имеет место, если все элементы данной выборки равны.
В описательной статистике среднее значение можно спутать с медианой , модой или средним диапазоном , поскольку любое из них может быть неправильно названо «средним» (более формально, мерой центральной тенденции ). Среднее значение набора наблюдений — это среднее арифметическое значений; однако для асимметричных распределений среднее значение не обязательно совпадает со средним значением (медианой) или наиболее вероятным значением (мода). Например, средний доход обычно смещен вверх небольшим числом людей с очень большими доходами, так что большинство имеет доход ниже среднего. Напротив, медианный доход — это уровень, на котором половина населения находится ниже, а половина — выше. Модальный доход — это наиболее вероятный доход, который благоприятствует большему числу людей с более низкими доходами. Хотя медиана и мода часто являются более интуитивными мерами для таких асимметричных данных, многие асимметричные распределения на самом деле лучше всего описываются их средним значением, включая экспоненциальное и пуассоновское распределения.
Среднее значение распределения вероятностей — это долгосрочное арифметическое среднее значение случайной величины , имеющей это распределение. Если случайная величина обозначается как , то среднее значение также известно как ожидаемое значение ( обозначается ). Для дискретного распределения вероятностей среднее значение задается как , где сумма берется по всем возможным значениям случайной величины и является функцией массы вероятности . Для непрерывного распределения среднее значение равно , где — функция плотности вероятности . [6] Во всех случаях, включая те, в которых распределение не является ни дискретным, ни непрерывным, среднее значение является интегралом Лебега случайной величины относительно ее меры вероятности . Среднее значение не обязательно должно существовать или быть конечным; для некоторых распределений вероятностей среднее значение бесконечно ( +∞ или −∞ ), в то время как для других среднее значение не определено .
Обобщенное среднее , также известное как среднее степенное или среднее Гёльдера, является абстракцией квадратичного , арифметического, геометрического и гармонического среднего. Оно определяется для набора из n положительных чисел x i как
[1]
Выбирая различные значения параметра m , получают следующие типы средних:
Это можно обобщить далее как обобщенное f -среднее
и снова подходящий выбор обратимого f даст
Средневзвешенное арифметическое значение (или средневзвешенное значение) используется, если требуется объединить средние значения из выборок разного размера одной и той же совокупности:
Где и — среднее значение и размер выборки соответственно. В других приложениях они представляют собой меру надежности влияния соответствующих значений на среднее значение.
Иногда набор чисел может содержать выбросы (т. е. значения данных, которые намного ниже или намного выше других). Часто выбросы представляют собой ошибочные данные, вызванные артефактами . В этом случае можно использовать усеченное среднее . Оно включает в себя отбрасывание заданных частей данных в верхней или нижней части, как правило, равное количество в каждой части, а затем взятие арифметического среднего оставшихся данных. Количество удаленных значений указывается как процент от общего количества значений.
Межквартильное среднее — это частный пример усеченного среднего. Это просто арифметическое среднее после удаления самой низкой и самой высокой четверти значений.
если предположить, что значения были упорядочены, то это просто конкретный пример взвешенного среднего для определенного набора весов.
В некоторых обстоятельствах математики могут вычислять среднее значение бесконечного (или даже несчетного ) набора значений. Это может произойти при вычислении среднего значения функции . Интуитивно среднее значение функции можно представить как вычисление площади под участком кривой, а затем деление на длину этого участка. Это можно сделать грубо, подсчитав квадраты на миллиметровой бумаге, или, точнее, путем интегрирования . Формула интегрирования записывается как:
В этом случае необходимо следить за тем, чтобы интеграл сходился. Но среднее значение может быть конечным, даже если сама функция стремится к бесконечности в некоторых точках.
Углы , время суток и другие циклические величины требуют модульной арифметики для сложения и иного объединения чисел. Во всех этих ситуациях не будет уникального среднего значения. Например, время за час до и после полуночи равноудалено как от полуночи, так и от полудня. Также возможно, что среднего значения не существует. Рассмотрим цветовой круг — для набора всех цветов нет среднего значения. В этих ситуациях вы должны решить, какое среднее значение наиболее полезно. Вы можете сделать это, скорректировав значения перед усреднением или используя специализированный подход для среднего значения круговых величин .
Среднее Фреше дает способ определения «центра» распределения масс на поверхности или, в более общем смысле, римановом многообразии . В отличие от многих других средних, среднее Фреше определяется на пространстве, элементы которого не обязательно могут быть сложены или умножены на скаляры. Иногда его также называют средним Кархера (названным в честь Германа Кархера).
В геометрии существуют тысячи различных определений центра треугольника , которые все можно интерпретировать как среднее значение треугольного набора точек на плоскости. [7]
Это приближение к среднему значению для умеренно асимметричного распределения. [8] Оно используется при разведке углеводородов и определяется как:
где , и — 10-й, 50-й и 90-й процентили распределения соответственно.
под руководством Кларка Кимберлинга была разработана электронная энциклопедия центров треугольников (ETC), она содержит более 7000 центров и множество свойств этих точек