Дисперсия случайной величины при заданном значении других переменных
В теории вероятностей и статистике условная дисперсия — это дисперсия случайной величины с учетом значений одной или нескольких других переменных. В частности, в эконометрике условная дисперсия также известна как скедастическая функция или скедастическая функция . [1] Условные дисперсии являются важной частью моделей авторегрессионной условной гетероскедастичности (ARCH).
Определение
Условная дисперсия случайной величины Y с учетом другой случайной величины X равна
![{\displaystyle \operatorname {Var} (Y\mid X) = \operatorname {E} {\Big (}{\big (}Y-\operatorname {E} (Y\mid X){\big)}^{ 2}\;{\Big |}\;X{\Big )}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Условная дисперсия говорит нам, сколько дисперсии останется, если мы будем использовать ее для «предсказания» Y . Здесь, как обычно, обозначается условное ожидание Y при условии X , которое, как мы напомним, само по себе является случайной величиной (функцией X , определенной с точностью до единицы). В результате он сам по себе является случайной величиной (и является функцией X ).![{\displaystyle \operatorname {E} (Y\mid X)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {E} (Y\mid X)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {Var} (Y\mid X)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Объяснение, отношение к методу наименьших квадратов
Напомним, что дисперсия — это ожидаемое квадратическое отклонение между случайной величиной (скажем, Y ) и ее ожидаемым значением. Ожидаемое значение можно рассматривать как разумное предсказание результатов случайного эксперимента (в частности, ожидаемое значение — это лучший постоянный прогноз, когда прогнозы оцениваются по ожидаемому квадрату ошибки прогнозирования). Таким образом, одна из интерпретаций дисперсии заключается в том, что она дает наименьшую возможную ожидаемую квадратичную ошибку прогноза. Если у нас есть знания о другой случайной величине ( X ), которую мы можем использовать для прогнозирования Y , мы потенциально можем использовать эти знания для уменьшения ожидаемой квадратичной ошибки. Оказывается, лучшим предсказанием Y при условии X является условное ожидание. В частности, для любого измеримого![{\displaystyle f:\mathbb {R} \to \mathbb {R}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle {\begin{aligned}\operatorname {E} [(Yf(X))^{2}]&=\operatorname {E} [(Y-\operatorname {E} (Y|X)\,\ ,+\,\,\operatorname {E} (Y|X)-f(X))^{2}]\\&=\operatorname {E} [\operatorname {E} \{(Y-\operatorname { E} (Y|X)\,\,+\,\,\operatorname {E} (Y|X)-f(X))^{2}|X\}]\\&=\operatorname {E} [\operatorname {Var} (Y|X)]+\operatorname {E} [(\operatorname {E} (Y|X)-f(X))^{2}]\,.\end{aligned}} }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
При выборе второй неотрицательный член становится нулевым, что подтверждает утверждение. Здесь второе равенство использовало закон полного ожидания . Мы также видим, что ожидаемая условная дисперсия Y при условии X проявляется как неустранимая ошибка прогнозирования Y при условии только знания X .![{\displaystyle f(X)=\operatorname {E} (Y|X)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Особые случаи, варианты
Обусловливание дискретными случайными величинами
Когда X принимает счетное множество значений с положительной вероятностью, т. е. является дискретной случайной величиной , мы можем ввести условную дисперсию Y , учитывая, что X = x для любого x из S следующим образом:![{\displaystyle S=\{x_{1},x_{2},\dots \}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {Var} (Y|X=x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {Var} (Y|X=x)=\operatorname {E} ((Y-\operatorname {E} (Y\mid X=x))^{2}\mid X=x)= \operatorname {E} (Y^{2}|X=x)-\operatorname {E} (Y|X=x)^{2},}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
где напомним, что это условное ожидание Z при условии, что X=x , что четко определено для . Альтернативное обозначение для![{\displaystyle \operatorname {E} (Z\mid X=x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle x\in S}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {Var} (Y|X=x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {Var} _{Y\mid X}(Y|x).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Обратите внимание, что здесь определяется константа для возможных значений x и, в частности, не является случайной величиной.![{\displaystyle \operatorname {Var} (Y|X=x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {Var} (Y|X=x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Связь этого определения с такова: Пусть S будет таким же, как указано выше, и определим функцию как . Тогда почти наверняка .![{\displaystyle \operatorname {Var} (Y|X)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle v:S\to \mathbb {R}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle v(x)=\operatorname {Var} (Y|X=x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Определение с использованием условных распределений
«Условное ожидание Y при условии X=x » также может быть определено в более общем смысле, используя условное распределение Y при условии X (это существует в данном случае, поскольку и здесь X , и Y имеют действительные значения).
В частности, полагая (регулярное) условное распределение Y при заданном X , т. е. (намерение состоит в том, что почти наверняка над носителем X ), мы можем определить
![{\displaystyle P_{Y|X}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle P_{Y|X}:{\mathcal {B}}\times \mathbb {R} \to [0,1]}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle P_{Y|X}(U,x)=P(Y\in U|X=x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {Var} (Y|X=x)=\int \left(y-\int y'P_{Y|X}(dy'|x)\right)^{2}P_{Y| X}(dy|x).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Это, конечно, может быть адаптировано к случаям, когда Y само по себе дискретно (замена интегралов суммами), а также когда существует условная плотность Y при условии X = x относительно некоторого основного распределения.
Компоненты дисперсии
Закон полной дисперсии гласит:
![{\displaystyle \operatorname {Var} (Y) = \operatorname {E} (\operatorname {Var} (Y\mid X))+\operatorname {Var} (\operatorname {E} (Y\mid X)). }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Другими словами : дисперсия Y — это сумма ожидаемой условной дисперсии Y с учетом X и дисперсии условного ожидания Y с учетом X. Первый член отражает вариацию, оставшуюся после «использования X для прогнозирования Y », а второй термин отражает вариацию , обусловленную средним значением предсказания Y из-за случайности X.
Смотрите также
Рекомендации
- ^ Спанос, Арис (1999). «Кондиционирование и регрессия». Теория вероятностей и статистический вывод. Нью-Йорк: Издательство Кембриджского университета. стр. 339–356 [с. 342]. ISBN 0-521-42408-9.
дальнейшее чтение
- Казелла, Джордж; Бергер, Роджер Л. (2002). Статистический вывод (второе изд.). Уодсворт. стр. 151–52. ISBN 0-534-24312-6.