stringtranslate.com

Среднее арифметическое

В математике и статистике среднее арифметическое ( / ˌ æ r ɪ θ ˈ m ɛ t ɪ k / arr-ith- MET -ik ), арифметическое среднее или просто среднее или среднее (когда контекст ясен) — это сумма набора чисел, деленная на количество чисел в наборе. [1] Набор часто представляет собой набор результатов эксперимента , наблюдательного исследования или опроса . Термин «среднее арифметическое» предпочтительнее в некоторых контекстах математики и статистики, поскольку он помогает отличить его от других типов средних, таких как геометрическое и гармоническое .

Помимо математики и статистики, среднее арифметическое часто используется в экономике , антропологии , истории и почти в каждой академической области в той или иной степени. Например, доход на душу населения — это среднее арифметическое дохода населения страны.

Хотя среднее арифметическое часто используется для сообщения о центральных тенденциях , оно не является надежной статистикой : на него сильно влияют выбросы (значения, намного большие или меньшие, чем большинство других). Для асимметричных распределений , таких как распределение доходов , при котором доходы нескольких людей существенно выше, чем у большинства людей, среднее арифметическое может не совпадать с представлением человека о «середине». В этом случае надежная статистика, такая как медиана , может обеспечить лучшее описание центральной тенденции.

Определение

Среднее арифметическое набора наблюдаемых данных равно сумме числовых значений каждого наблюдения, деленной на общее число наблюдений. Символически, для набора данных, состоящего из значений , среднее арифметическое определяется по формуле:

[2]

(Для объяснения оператора суммирования см. суммирование .)

Например, если ежемесячная заработная плата сотрудников составляет , то среднее арифметическое равно:

Если набор данных представляет собой статистическую совокупность (т. е. состоит из всех возможных наблюдений, а не только из их подмножества), то среднее значение этой совокупности называется средним значением совокупности и обозначается греческой буквой . Если набор данных представляет собой статистическую выборку (подмножество совокупности), то оно называется средним значением выборки (что для набора данных обозначается как ).

Среднее арифметическое может быть аналогично определено для векторов в нескольких измерениях, а не только для скалярных значений; это часто называют центроидом . В более общем смысле, поскольку среднее арифметическое является выпуклой комбинацией (то есть ее коэффициенты в сумме дают ), его можно определить в выпуклом пространстве , а не только в векторном пространстве.

Мотивирующие свойства

Среднее арифметическое имеет несколько свойств, которые делают его интересным, особенно как меру центральной тенденции. К ним относятся:

Дополнительные свойства

Контраст с медианой

Среднее арифметическое можно противопоставить медиане . Медиана определяется таким образом, что не более половины значений больше нее и не более половины меньше ее. Если элементы в данных увеличиваются арифметически при размещении в некотором порядке, то медиана и среднее арифметическое равны. Например, рассмотрим выборку данных . Среднее равно , как и медиана. Однако, когда мы рассматриваем выборку, которая не может быть организована для увеличения арифметически, например , медиана и среднее арифметическое могут значительно отличаться. В этом случае среднее арифметическое равно , в то время как медиана равна . Среднее значение может значительно отличаться от большинства значений в выборке и может быть больше или меньше большинства.

Существуют приложения этого явления во многих областях. Например, с 1980-х годов медианный доход в Соединенных Штатах рос медленнее, чем среднее арифметическое дохода. [4]

Обобщения

Средневзвешенное значение

Средневзвешенное значение, или средневзвешенное значение, — это среднее значение, в котором некоторые точки данных имеют больший вес, чем другие, поскольку им придается больший вес при расчете. [5] Например, среднее арифметическое и равно , или эквивалентно . Напротив, средневзвешенное значение, в котором первое число получает, например, в два раза больший вес, чем второе (возможно, потому что предполагается, что оно появляется в два раза чаще в общей популяции, из которой были отобраны эти числа), будет рассчитано как . Здесь веса, которые обязательно в сумме равны единице, равны и , причем первое в два раза больше второго. Среднее арифметическое (иногда называемое «невзвешенным средним» или «равновзвешенным средним») можно интерпретировать как особый случай средневзвешенного, в котором все веса равны одному и тому же числу ( в приведенном выше примере и в ситуации с усредняемыми числами).

Непрерывные распределения вероятностей

Сравнение двух логнормальных распределений с одинаковой медианой, но разной асимметрией , приводящее к различным средним значениям и модам

Если числовое свойство и любая выборка данных из него могут принимать любое значение из непрерывного диапазона вместо, например, только целых чисел, то вероятность попадания числа в некоторый диапазон возможных значений можно описать путем интегрирования непрерывного распределения вероятностей по этому диапазону, даже когда наивная вероятность для выборочного числа, принимающего одно определенное значение из бесконечного множества, равна нулю. В этом контексте аналог взвешенного среднего, в котором существует бесконечно много возможностей для точного значения переменной в каждом диапазоне, называется средним значением распределения вероятностей . Наиболее широко встречающееся распределение вероятностей называется нормальным распределением ; оно обладает тем свойством, что все меры его центральной тенденции, включая не только среднее значение, но и медиану, упомянутую выше, и моду (три M [6] ), равны. Это равенство не выполняется для других распределений вероятностей, как показано здесь для логнормального распределения.

Углы

Особая осторожность необходима при использовании циклических данных, таких как фазы или углы . Взятие среднего арифметического 1° и 359° дает результат 180 ° . Это неверно по двум причинам:

В общем случае такое упущение приведет к тому, что среднее значение будет искусственно смещено к середине числового диапазона. Решение этой проблемы заключается в использовании формулировки оптимизации (то есть, определить среднее значение как центральную точку: точку, относительно которой имеется наименьшая дисперсия) и переопределить разницу как модульное расстояние (то есть, расстояние на окружности: так, модульное расстояние между 1° и 359° равно 2°, а не 358°).

Доказательство неравенства AM–GM без слов : PR —
диаметр окружности с центром в точке O; ее радиус AO — среднее арифметическое a и b . Используя теорему о среднем геометрическом , высота GQ треугольника PGR — среднее геометрическое . Для любого отношения a : b , AO ≥ GQ.

Символы и кодировка

Среднее арифметическое часто обозначается чертой ( винкулумом или макроном ), как в [3] .

Некоторое программное обеспечение ( текстовые процессоры , веб-браузеры ) может не отображать символ «x̄» правильно. Например, HTML- символ «x̄» объединяет два кода — базовую букву «x» плюс код для строки выше (̄ или ¯). [7]

В некоторых форматах документов (например, PDF ) символ может быть заменен символом «¢» ( цент ) при копировании в текстовый редактор, например Microsoft Word .

Смотрите также

Геометрическое доказательство без слов того, что max  ( a , b ) > среднеквадратичное ( RMS ) или среднее квадратичное ( QM ) > среднее арифметическое ( AM ) > среднее геометрическое ( GM ) > среднее гармоническое ( HM ) > min  ( a , b ) двух различных положительных чисел a и b [примечание 1]

Примечания

  1. ^ Если AC = a и BC = b . OC = AM точек a и b , и радиус r = QO = OG.
    Используя теорему Пифагора , QC² = QO² + OC² ∴ QC = √ QO² + OC² = QM .
    Используя теорему Пифагора, OC² = OG² + GC² ∴ GC = √ OC² − OG² = GM .
    Используя подобные треугольники , ХК/ГК = ГК/ОК ∴ ХК = GC²/ОК = ГМ .

Ссылки

  1. ^ Якобс, Гарольд Р. (1994). Математика: Человеческое начинание (третье изд.). WH Freeman . стр. 547. ISBN 0-7167-2426-X.
  2. ^ Weisstein, Eric W. "Среднее арифметическое". mathworld.wolfram.com . Получено 21 августа 2020 г. .
  3. ^ ab Medhi, Jyotiprasad (1992). Статистические методы: вводный текст. New Age International. стр. 53–58. ISBN 9788122404197.
  4. ^ Кругман, Пол (4 июня 2014 г.) [осень 1992 г.]. «Богатые, правые и факты: деконструкция дебатов о распределении доходов». The American Prospect .
  5. ^ "Mean | математика". Encyclopedia Britannica . Получено 21 августа 2020 г.
  6. ^ Thinkmap Visual Thesaurus (30 июня 2010 г.). «Три M статистики: мода, медиана, среднее значение 30 июня 2010 г.». www.visualthesaurus.com . Получено 3 декабря 2018 г.
  7. ^ "Notes on Unicode for Stat Symbols". www.personal.psu.edu . Архивировано из оригинала 31 марта 2022 г. Получено 14 октября 2018 г.

Дальнейшее чтение

Внешние ссылки