В математике и статистике среднее арифметическое ( / ˌ æ r ɪ θ ˈ m ɛ t ɪ k ˈ m iː n / arr -ith- MET -ik ), среднее арифметическое или просто среднее или среднее (когда контекст понятен). ) — это сумма набора чисел, деленная на количество чисел в коллекции. [1] Коллекция часто представляет собой набор результатов эксперимента , наблюдательного исследования или опроса . Термин «среднее арифметическое» предпочтительнее в некоторых контекстах математики и статистики, поскольку он помогает отличить его от других типов средних, таких как геометрические и гармонические .
Помимо математики и статистики, среднее арифметическое часто используется в экономике , антропологии , истории и почти во всех научных областях в той или иной степени. Например, доход на душу населения — это средний арифметический доход населения страны.
Хотя среднее арифметическое часто используется для определения центральных тенденций , оно не является надежным статистическим показателем : на него сильно влияют выбросы (значения, намного большие или меньшие, чем у большинства других). Для асимметричного распределения , такого как распределение дохода , при котором доходы некоторых людей существенно выше, чем у большинства людей, среднее арифметическое может не совпадать с понятием «среднего». В этом случае надежная статистика, такая как медиана , может обеспечить лучшее описание центральной тенденции.
Среднее арифметическое набора наблюдаемых данных равно сумме числовых значений каждого наблюдения, деленной на общее количество наблюдений. Символически для набора данных, состоящего из значений , среднее арифметическое определяется по формуле:
(Пояснения к оператору суммирования см. в разделе суммирование .)
Например, если месячная заработная плата сотрудников равна , то среднее арифметическое равно:
Если набор данных представляет собой статистическую совокупность (т. е. состоит из всех возможных наблюдений, а не только их подмножества), то среднее значение этой совокупности называется средним значением совокупности и обозначается греческой буквой . Если набор данных представляет собой статистическую выборку (подмножество генеральной совокупности), он называется средним значением выборки (которое для набора данных обозначается как ).
Среднее арифметическое можно аналогичным образом определить для векторов в нескольких измерениях, а не только для скалярных значений; это часто называют центроидом . В более общем смысле, поскольку среднее арифметическое представляет собой выпуклую комбинацию (то есть сумма ее коэффициентов равна ), его можно определить в выпуклом пространстве , а не только в векторном пространстве.
Среднее арифметическое имеет несколько свойств, которые делают его интересным, особенно как меру центральной тенденции. К ним относятся:
Среднее арифметическое можно противопоставить медиане . Медиана определяется так, чтобы не более половины значений были больше и не более половины меньше ее. Если элементы данных увеличиваются арифметически при размещении в некотором порядке, то медиана и среднее арифметическое равны. Например, рассмотрим образец данных . Среднее значение равно , как и медиана. Однако, когда мы рассматриваем выборку, которую нельзя организовать для арифметического увеличения, например , медиана и среднее арифметическое могут значительно отличаться. В этом случае среднее арифметическое равно , а медиана равна . Среднее значение может значительно отличаться от большинства значений в выборке и может быть больше или меньше большинства значений.
Это явление находит применение во многих областях. Например, с 1980-х годов средний доход в США рос медленнее, чем среднее арифметическое дохода. [4]
Средневзвешенное значение или средневзвешенное значение — это среднее значение, в котором некоторые точки данных имеют большее значение, чем другие, поскольку им придается больший вес при расчете. [5] Например, среднее арифметическое и равно , или, что то же самое , . Напротив, средневзвешенное значение, при котором первое число получает, например, в два раза больший вес, чем второе (возможно, потому, что предполагается, что оно встречается в два раза чаще в общей совокупности, из которой были выбраны эти числа), будет рассчитываться как . Здесь веса, сумма которых обязательно равна единице, равны и , причем первый в два раза больше второго. Среднее арифметическое (иногда называемое «невзвешенным средним» или «равновзвешенным средним») можно интерпретировать как частный случай взвешенного среднего, в котором все веса равны одному и тому же числу ( в приведенном выше примере и в ситуации с числами усредняется).
Если числовое свойство и любая выборка данных из него могут принимать любое значение из непрерывного диапазона, а не, например, только целые числа, то вероятность попадания числа в некоторый диапазон возможных значений можно описать путем интегрирования непрерывное распределение вероятностей в этом диапазоне, даже если наивная вероятность того, что число выборок выберет одно определенное значение из бесконечного множества, равна нулю. В этом контексте аналог средневзвешенного значения, в котором существует бесконечно много возможностей для точного значения переменной в каждом диапазоне, называется средним значением распределения вероятностей . Наиболее широко встречающееся распределение вероятностей называется нормальным распределением ; он обладает тем свойством, что все меры его центральной тенденции, включая не только среднее значение, но и упомянутую выше медиану и моду (три Ms [6] ), равны. Это равенство не выполняется для других распределений вероятностей, как показано здесь для логарифмически нормального распределения.
Особая осторожность необходима при использовании циклических данных, таких как фазы или углы . Взяв среднее арифметическое 1° и 359°, получим результат 180 ° . Это неверно по двум причинам:
В общем случае такая оплошность приведет к искусственному смещению среднего значения в сторону середины числового диапазона. Решение этой проблемы состоит в том, чтобы использовать формулировку оптимизации (то есть определить среднее значение как центральную точку: точку, относительно которой имеется наименьшая дисперсия) и переопределить разницу как модульное расстояние (т. е. расстояние по окружности: поэтому модульное расстояние между 1° и 359° составляет 2°, а не 358°).
Среднее арифметическое часто обозначается чертой ( винкулум или макрон ), как в . [3]
Некоторые программы ( текстовые процессоры , веб-браузеры ) могут неправильно отображать символ «x». Например, HTML -символ «x̄» объединяет два кода — базовую букву «x» плюс код строки выше (̄ или ¯). [7]
В некоторых форматах документов (например, PDF ) символ может быть заменен символом «¢» ( цент ) при копировании в текстовый процессор, например Microsoft Word .