В математике и статистике среднее арифметическое ( / ˌ æ r ɪ θ ˈ m ɛ t ɪ k / arr-ith- MET -ik ), арифметическое среднее или просто среднее или среднее (когда контекст ясен) — это сумма набора чисел, деленная на количество чисел в наборе. [1] Набор часто представляет собой набор результатов эксперимента , наблюдательного исследования или опроса . Термин «среднее арифметическое» предпочтительнее в некоторых контекстах математики и статистики, поскольку он помогает отличить его от других типов средних, таких как геометрическое и гармоническое .
Помимо математики и статистики, среднее арифметическое часто используется в экономике , антропологии , истории и почти в каждой академической области в той или иной степени. Например, доход на душу населения — это среднее арифметическое дохода населения страны.
Хотя среднее арифметическое часто используется для сообщения о центральных тенденциях , оно не является надежной статистикой : на него сильно влияют выбросы (значения, намного большие или меньшие, чем большинство других). Для асимметричных распределений , таких как распределение доходов , при котором доходы нескольких людей существенно выше, чем у большинства людей, среднее арифметическое может не совпадать с представлением человека о «середине». В этом случае надежная статистика, такая как медиана , может обеспечить лучшее описание центральной тенденции.
Среднее арифметическое набора наблюдаемых данных равно сумме числовых значений каждого наблюдения, деленной на общее число наблюдений. Символически, для набора данных, состоящего из значений , среднее арифметическое определяется по формуле:
(Для объяснения оператора суммирования см. суммирование .)
Например, если ежемесячная заработная плата сотрудников составляет , то среднее арифметическое равно:
Если набор данных представляет собой статистическую совокупность (т. е. состоит из всех возможных наблюдений, а не только из их подмножества), то среднее значение этой совокупности называется средним значением совокупности и обозначается греческой буквой . Если набор данных представляет собой статистическую выборку (подмножество совокупности), то оно называется средним значением выборки (что для набора данных обозначается как ).
Среднее арифметическое может быть аналогично определено для векторов в нескольких измерениях, а не только для скалярных значений; это часто называют центроидом . В более общем смысле, поскольку среднее арифметическое является выпуклой комбинацией (то есть ее коэффициенты в сумме дают ), его можно определить в выпуклом пространстве , а не только в векторном пространстве.
Среднее арифметическое имеет несколько свойств, которые делают его интересным, особенно как меру центральной тенденции. К ним относятся:
Среднее арифметическое можно противопоставить медиане . Медиана определяется таким образом, что не более половины значений больше нее и не более половины меньше ее. Если элементы в данных увеличиваются арифметически при размещении в некотором порядке, то медиана и среднее арифметическое равны. Например, рассмотрим выборку данных . Среднее равно , как и медиана. Однако, когда мы рассматриваем выборку, которая не может быть организована для увеличения арифметически, например , медиана и среднее арифметическое могут значительно отличаться. В этом случае среднее арифметическое равно , в то время как медиана равна . Среднее значение может значительно отличаться от большинства значений в выборке и может быть больше или меньше большинства.
Существуют приложения этого явления во многих областях. Например, с 1980-х годов медианный доход в Соединенных Штатах рос медленнее, чем среднее арифметическое дохода. [4]
Средневзвешенное значение, или средневзвешенное значение, — это среднее значение, в котором некоторые точки данных имеют больший вес, чем другие, поскольку им придается больший вес при расчете. [5] Например, среднее арифметическое и равно , или эквивалентно . Напротив, средневзвешенное значение, в котором первое число получает, например, в два раза больший вес, чем второе (возможно, потому что предполагается, что оно появляется в два раза чаще в общей популяции, из которой были отобраны эти числа), будет рассчитано как . Здесь веса, которые обязательно в сумме равны единице, равны и , причем первое в два раза больше второго. Среднее арифметическое (иногда называемое «невзвешенным средним» или «равновзвешенным средним») можно интерпретировать как особый случай средневзвешенного, в котором все веса равны одному и тому же числу ( в приведенном выше примере и в ситуации с усредняемыми числами).
Если числовое свойство и любая выборка данных из него могут принимать любое значение из непрерывного диапазона вместо, например, только целых чисел, то вероятность попадания числа в некоторый диапазон возможных значений можно описать путем интегрирования непрерывного распределения вероятностей по этому диапазону, даже когда наивная вероятность для выборочного числа, принимающего одно определенное значение из бесконечного множества, равна нулю. В этом контексте аналог взвешенного среднего, в котором существует бесконечно много возможностей для точного значения переменной в каждом диапазоне, называется средним значением распределения вероятностей . Наиболее широко встречающееся распределение вероятностей называется нормальным распределением ; оно обладает тем свойством, что все меры его центральной тенденции, включая не только среднее значение, но и медиану, упомянутую выше, и моду (три M [6] ), равны. Это равенство не выполняется для других распределений вероятностей, как показано здесь для логнормального распределения.
Особая осторожность необходима при использовании циклических данных, таких как фазы или углы . Взятие среднего арифметического 1° и 359° дает результат 180 ° . Это неверно по двум причинам:
В общем случае такое упущение приведет к тому, что среднее значение будет искусственно смещено к середине числового диапазона. Решение этой проблемы заключается в использовании формулировки оптимизации (то есть, определить среднее значение как центральную точку: точку, относительно которой имеется наименьшая дисперсия) и переопределить разницу как модульное расстояние (то есть, расстояние на окружности: так, модульное расстояние между 1° и 359° равно 2°, а не 358°).
Среднее арифметическое часто обозначается чертой ( винкулумом или макроном ), как в [3] .
Некоторое программное обеспечение ( текстовые процессоры , веб-браузеры ) может не отображать символ «x̄» правильно. Например, HTML- символ «x̄» объединяет два кода — базовую букву «x» плюс код для строки выше (̄ или ¯). [7]
В некоторых форматах документов (например, PDF ) символ может быть заменен символом «¢» ( цент ) при копировании в текстовый редактор, например Microsoft Word .