Квадратные отклонения от среднего значения

Квадратные отклонения от среднего значения ( SDM ) являются результатом квадратичных отклонений . В теории вероятностей и статистике дисперсия определяется либо ожидаемым значением SDM (при рассмотрении теоретического распределения ), либо его средним значением (для фактических экспериментальных данных). Вычисления для дисперсионного анализа включают разделение суммы SDM.

Фон

Понимание связанных с этим вычислений значительно улучшается при изучении статистической ценности

\operatorname {E} (X^{2})

, где – оператор ожидаемого значения.

\operatorname {E}

Для случайной величины со средним значением и дисперсией $X$ $\mu$ $\sigma ^{2}$

\sigma ^{2}=\operatorname {E} (X^{2})-\mu ^{2}.

^[1]

Поэтому,

\operatorname {E} (X^{2})=\sigma ^{2}+\mu ^{2}.

Из вышеизложенного можно сделать следующие выводы:

\operatorname {E} \left(\sum \left(X^{2}\right)\right)=n\sigma ^{2}+n\mu ^{2},

\operatorname {E} \left(\left(\sum X\right)^{2}\right)=n\sigma ^{2}+n^{2}\mu ^{2}.

Выборочная дисперсия

Сумма квадратов отклонений, необходимая для расчета выборочной дисперсии (перед принятием решения о делении на n или n - 1), проще всего вычисляется как

S=\sum x^{2}-{\frac {\left(\sum x\right)^{2}}{n}}

Из двух полученных ожиданий выше ожидаемое значение этой суммы равно

\operatorname {E} (S)=n\sigma ^{2}+n\mu ^{2} - {\frac {n\sigma ^{2}+n^{2}\mu ^{2 }}{n}}

что подразумевает

\operatorname {E} (S)=(n-1)\sigma ^{2}.

Это эффективно доказывает использование делителя n - 1 при вычислении несмещенной выборочной оценки σ ² .

Разделение — дисперсионный анализ

В ситуации, когда данные доступны для k различных групп лечения, имеющих размер n _i , где i варьируется от 1 до k , предполагается, что ожидаемое среднее значение каждой группы равно

\operatorname {E} (\mu _{i})=\mu +T_{i}

и дисперсия каждой группы лечения не отличается от популяционной дисперсии . $\sigma ^{2}$

Согласно нулевой гипотезе, согласно которой лечение не оказывает никакого эффекта, каждое из них будет равно нулю. $T_{i}$

Теперь можно вычислить три суммы квадратов:

Индивидуальный

I=\sum x^{2}

\operatorname {E} (I)=n\sigma ^{2}+n\mu ^{2}

Лечение

{\ displaystyle T = \ sum _ {i = 1} ^ {k} \ left (\ left (\ sum x \ right) ^ {2} / n_ {i} \ right)}

\operatorname {E} (T)=k\sigma ^{2}+\sum _{i=1}^{k}n_{i}(\mu +T_{i})^{2}

\operatorname {E} (T)=k\sigma ^{2}+n\mu ^{2}+2\mu \sum _{i=1}^{k}(n_{i}T_{ i})+\sum _{i=1}^{k}n_{i}(T_{i})^{2}

При нулевой гипотезе, согласно которой методы лечения не вызывают различий и все значения равны нулю, ожидание упрощается до $T_{i}$

\operatorname {E} (T)=k\sigma ^{2}+n\mu ^{2}.

Комбинация

C=\left(\sum x\right)^{2}/n

\operatorname {E} (C)=\sigma ^{2}+n\mu ^{2}

Суммы квадратов отклонений

При нулевой гипотезе разность любой пары I , T и C не содержит никакой зависимости только от . $\mu$ $\sigma ^{2}$

\operatorname {E} (IC)=(n-1)\sigma ^{2}

полные квадратичные отклонения, или общая сумма квадратов

\operatorname {E} (TC)=(k-1)\sigma ^{2}

лечение квадратичных отклонений, иначе говоря, объясненной суммы квадратов

\operatorname {E} (IT)=(nk)\sigma ^{2}

остаточные квадратичные отклонения, или остаточная сумма квадратов

Константы ( n - 1 ), ( k - 1 ) и ( n - k ) обычно называются числом степеней свободы .

Пример

В очень простом примере 5 наблюдений возникают в результате двух обработок. Первая обработка дает три значения: 1, 2 и 3, а вторая обработка дает два значения: 4 и 6.

I={\frac {1^{2}}{1}}+{\frac {2^{2}}{1}}+{\frac {3^{2}}{1}}+ {\frac {4^{2}}{1}}+{\frac {6^{2}}{1}}=66

T={\frac {(1+2+3)^{2}}{3}}+{\frac {(4+6)^{2}}{2}}=12+50=62

C={\frac {(1+2+3+4+6)^{2}}{5}}=256/5=51,2

предоставление

Суммарные квадраты отклонений = 66 − 51,2 = 14,8 с 4 степенями свободы.

Квадратные отклонения лечения = 62 − 51,2 = 10,8 с 1 степенью свободы.

Остаточные квадратичные отклонения = 66 − 62 = 4 с 3 степенями свободы.

Двусторонний дисперсионный анализ

В статистике двусторонний дисперсионный анализ (ANOVA) является расширением однофакторного дисперсионного анализа , который исследует влияние двух разных категориальных независимых переменных на одну непрерывную зависимую переменную . Двусторонний дисперсионный анализ направлен не только на оценку основного эффекта каждой независимой переменной, но также на то, существует ли какое-либо взаимодействие между ними.