Условная дисперсия

В теории вероятностей и статистике условная дисперсия — это дисперсия случайной величины с учетом значений одной или нескольких других переменных. В частности, в эконометрике условная дисперсия также известна как скедастическая функция или скедастическая функция . ^[1] Условные дисперсии являются важной частью моделей авторегрессионной условной гетероскедастичности (ARCH).

Определение

Условная дисперсия случайной величины Y с учетом другой случайной величины X равна

\operatorname {Var} (Y\mid X) = \operatorname {E} {\Big (}{\big (}Y-\operatorname {E} (Y\mid X){\big)}^{ 2}\;{\Big |}\;X{\Big )}.

Условная дисперсия говорит нам, сколько дисперсии останется, если мы будем использовать ее для «предсказания» Y . Здесь, как обычно, обозначается условное ожидание Y при условии X , которое, как мы напомним, само по себе является случайной величиной (функцией X , определенной с точностью до единицы). В результате он сам по себе является случайной величиной (и является функцией X ). $\operatorname {E} (Y\mid X)$ $\operatorname {E} (Y\mid X)$ $\operatorname {Var} (Y\mid X)$

Объяснение, отношение к методу наименьших квадратов

Напомним, что дисперсия — это ожидаемое квадратическое отклонение между случайной величиной (скажем, Y ) и ее ожидаемым значением. Ожидаемое значение можно рассматривать как разумное предсказание результатов случайного эксперимента (в частности, ожидаемое значение — это лучший постоянный прогноз, когда прогнозы оцениваются по ожидаемому квадрату ошибки прогнозирования). Таким образом, одна из интерпретаций дисперсии заключается в том, что она дает наименьшую возможную ожидаемую квадратичную ошибку прогноза. Если у нас есть знания о другой случайной величине ( X ), которую мы можем использовать для прогнозирования Y , мы потенциально можем использовать эти знания для уменьшения ожидаемой квадратичной ошибки. Оказывается, лучшим предсказанием Y при условии X является условное ожидание. В частности, для любого измеримого $f:\mathbb {R} \to \mathbb {R}$

{\begin{aligned}\operatorname {E} [(Yf(X))^{2}]&=\operatorname {E} [(Y-\operatorname {E} (Y|X)\,\ ,+\,\,\operatorname {E} (Y|X)-f(X))^{2}]\\&=\operatorname {E} [\operatorname {E} \{(Y-\operatorname { E} (Y|X)\,\,+\,\,\operatorname {E} (Y|X)-f(X))^{2}|X\}]\\&=\operatorname {E} [\operatorname {Var} (Y|X)]+\operatorname {E} [(\operatorname {E} (Y|X)-f(X))^{2}]\,.\end{aligned}}

При выборе второй неотрицательный член становится нулевым, что подтверждает утверждение. Здесь второе равенство использовало закон полного ожидания . Мы также видим, что ожидаемая условная дисперсия Y при условии X проявляется как неустранимая ошибка прогнозирования Y при условии только знания X . $f(X)=\operatorname {E} (Y|X)$

Особые случаи, варианты

Обусловливание дискретными случайными величинами

Когда X принимает счетное множество значений с положительной вероятностью, т. е. является дискретной случайной величиной , мы можем ввести условную дисперсию Y , учитывая, что X = x для любого x из S следующим образом: $S=\{x_{1},x_{2},\dots \}$ $\operatorname {Var} (Y|X=x)$

\operatorname {Var} (Y|X=x)=\operatorname {E} ((Y-\operatorname {E} (Y\mid X=x))^{2}\mid X=x)= \operatorname {E} (Y^{2}|X=x)-\operatorname {E} (Y|X=x)^{2},

где напомним, что это условное ожидание Z при условии, что X=x , что четко определено для . Альтернативное обозначение для $\operatorname {E} (Z\mid X=x)$ $x\in S$ $\operatorname {Var} (Y|X=x)$ $\operatorname {Var} _{Y\mid X}(Y|x).$

Обратите внимание, что здесь определяется константа для возможных значений x и, в частности, не является случайной величиной. $\operatorname {Var} (Y|X=x)$ $\operatorname {Var} (Y|X=x)$

Связь этого определения с такова: Пусть S будет таким же, как указано выше, и определим функцию как . Тогда почти наверняка . $\operatorname {Var} (Y|X)$ $v:S\to \mathbb {R}$ $v(x)=\operatorname {Var} (Y|X=x)$ $v(X)=\operatorname {Var} (Y|X)$

Определение с использованием условных распределений

«Условное ожидание Y при условии X=x » также может быть определено в более общем смысле, используя условное распределение Y при условии X (это существует в данном случае, поскольку и здесь X , и Y имеют действительные значения).

В частности, полагая (регулярное) условное распределение Y при заданном X , т. е. (намерение состоит в том, что почти наверняка над носителем X ), мы можем определить $P_{Y|X}$ $P_{Y|X}$ $P_{Y|X}:{\mathcal {B}}\times \mathbb {R} \to [0,1]$ $P_{Y|X}(U,x)=P(Y\in U|X=x)$

$\operatorname {Var} (Y|X=x)=\int \left(y-\int y'P_{Y|X}(dy'|x)\right)^{2}P_{Y| X}(dy|x).$

Это, конечно, может быть адаптировано к случаям, когда Y само по себе дискретно (замена интегралов суммами), а также когда существует условная плотность Y при условии X = x относительно некоторого основного распределения.

Компоненты дисперсии

Закон полной дисперсии гласит:

$\operatorname {Var} (Y) = \operatorname {E} (\operatorname {Var} (Y\mid X))+\operatorname {Var} (\operatorname {E} (Y\mid X)).$

Другими словами : дисперсия Y — это сумма ожидаемой условной дисперсии Y с учетом X и дисперсии условного ожидания Y с учетом X. Первый член отражает вариацию, оставшуюся после «использования X для прогнозирования Y », а второй термин отражает вариацию , обусловленную средним значением предсказания Y из-за случайности X.

Смотрите также

дальнейшее чтение

Казелла, Джордж; Бергер, Роджер Л. (2002). Статистический вывод (второе изд.). Уодсворт. стр. 151–52. ISBN 0-534-24312-6.