Ожидаемое значение случайной величины при условии, что известны определенные условия
В теории вероятностей условное ожидание , условное ожидаемое значение или условное среднее случайной величины — это ее ожидаемое значение, оцененное относительно условного распределения вероятностей . Если случайная величина может принимать только конечное число значений, «условия» заключаются в том, что переменная может принимать только подмножество этих значений. Более формально, в случае, когда случайная величина определена в дискретном вероятностном пространстве , «условия» являются разбиением этого вероятностного пространства.
В зависимости от контекста, условное ожидание может быть как случайной величиной, так и функцией. Случайная величина обозначается аналогично условной вероятности . Форма функции обозначается либо , либо вводится отдельный символ функции, такой как со значением .
Примеры
Пример 1: Бросание игральных костей
Рассмотрим бросок честной кости и пусть A = 1, если число четное (т. е. 2, 4 или 6), и A = 0 в противном случае. Кроме того, пусть B = 1, если число простое (т. е. 2, 3 или 5), и B = 0 в противном случае.
Безусловное ожидание A равно , но ожидание A, обусловленное B = 1 (т. е. обусловленное выпадением кубика 2, 3 или 5), равно , а ожидание A, обусловленное B = 0 (т. е. обусловленное выпадением кубика 1, 4 или 6), равно . Аналогично, ожидание B, обусловленное A = 1, равно , а ожидание B, обусловленное A = 0, равно .
Пример 2: Данные об осадках
Предположим, у нас есть данные о ежедневных осадках (мм осадков в день), собранные метеостанцией за каждый день десятилетнего (3652-дневного) периода с 1 января 1990 года по 31 декабря 1999 года. Безусловное ожидание осадков для неопределенного дня — это среднее значение количества осадков за эти 3652 дня. Условное ожидание осадков для иного неопределенного дня, который, как известно, находится (при условии, что находится) в месяце марте, — это среднее значение суточного количества осадков за все 310 дней десятилетнего периода, которые приходятся на март. А условное ожидание осадков, обусловленное днями, датированными 2 марта, — это среднее значение количества осадков, выпавших за десять дней с этой конкретной датой.
Заметим, что, как и выше, выражение не определено, если .
Обусловливание дискретной случайной величины такое же, как и обусловливание соответствующего события:
где A — множество .
Непрерывные случайные величины
Пусть и — непрерывные случайные величины с совместной плотностью
и условной плотностью для данного события.
Условное ожидание для данного события равно
Если знаменатель равен нулю, выражение не определено.
Обусловливание непрерывной случайной величины — это не то же самое, что обусловливание события , как это было в дискретном случае. Для обсуждения см. Обусловливание события с нулевой вероятностью . Несоблюдение этого различия может привести к противоречивым выводам, как показано парадоксом Бореля-Колмогорова .
Л2случайные величины
Все случайные величины в этом разделе предполагаются , то есть квадратично интегрируемыми . В своей полной общности условное ожидание разрабатывается без этого предположения, см. ниже в разделе Условное ожидание относительно под-σ-алгебры. Однако теория считается более интуитивной [5] и допускает важные обобщения. В контексте случайных величин условное ожидание также называется регрессией .
Условное ожидание X определяется аналогично, за исключением того , что вместо одного числа результатом будет функция . Пусть будет случайным вектором . Условное ожидание — это измеримая функция, такая что
.
Обратите внимание, что в отличие от , условное ожидание , как правило, не является уникальным: может быть несколько минимизаторов среднеквадратической ошибки.
Уникальность
Пример 1 : Рассмотрим случай, когда Y — постоянная случайная величина, которая всегда равна 1. Тогда среднеквадратическая ошибка минимизируется любой функцией вида
Пример 2 : Рассмотрим случай, когда Y — двумерный случайный вектор . Тогда ясно, что
но в терминах функций это может быть выражено как или или бесконечно многими другими способами. В контексте линейной регрессии это отсутствие уникальности называется мультиколлинеарностью .
Условное ожидание уникально вплоть до набора меры ноль в . Используемая мера — это проталкиваемая мера, индуцированная Y .
В первом примере мера прямого продвижения представляет собой распределение Дирака с шагом 1. Во втором примере она сосредоточена на «диагонали» , так что любое множество, не пересекающее ее, имеет меру 0.
Существование
Существование минимизатора для нетривиально. Можно показать, что
является замкнутым подпространством гильбертова пространства . [6]
По теореме о проекции Гильберта , необходимым и достаточным условием для того, чтобы быть минимизатором, является то, что для всех в M мы имеем
.
На словах это уравнение говорит, что остаток ортогонален пространству M всех функций Y. Это условие ортогональности, примененное к индикаторным функциям , используется ниже для расширения условного ожидания на случай, когда X и Y не обязательно находятся в .
Связь с регрессией
Условное ожидание часто аппроксимируется в прикладной математике и статистике из-за трудностей его аналитического расчета, а также для интерполяции. [7]
Подпространство Гильберта
Определенный выше, заменяется его подмножествами, ограничивая функциональную форму g , вместо того, чтобы допускать любую измеримую функцию. Примерами этого являются регрессия дерева решений , когда g должна быть простой функцией , линейная регрессия , когда g должна быть аффинной и т. д.
Эти обобщения условного ожидания достигаются ценой того, что многие его свойства больше не выполняются. Например, пусть M
будет пространством всех линейных функций Y и пусть обозначает это обобщенное условное ожидание/ проекцию. Если не содержит константных функций , свойство башни
не будет выполняться.
Важный частный случай — когда X и Y распределены совместно нормально. В этом случае можно показать, что условное ожидание эквивалентно линейной регрессии:
является случайной величиной в этом вероятностном пространстве с конечным математическим ожиданием.
является под -σ- алгеброй .
Так как является подалгеброй , то функция обычно не является измеримой, поэтому существование интегралов вида , где и является ограничением на , не может быть установлено в общем случае. Однако локальные средние могут быть восстановлены в с помощью условного ожидания.
Условное ожидание X при заданном значении , обозначаемое как , представляет собой любую измеримую функцию , которая удовлетворяет:
для каждого . [8]
Как отмечено в обсуждении, это условие эквивалентно утверждению, что остаток ортогонален индикаторным функциям :
Существование
Существование можно установить, заметив, что для — конечная мера на , которая абсолютно непрерывна относительно . Если — естественная инъекция из в , то — ограничение на и — ограничение на . Кроме того, — абсолютно непрерывна относительно , поскольку условие
σ-алгебра контролирует «зернистость» кондиционирования. Условное ожидание по более тонкой (большей) σ-алгебре сохраняет информацию о вероятностях большего класса событий. Условное ожидание по более грубой (меньшей) σ-алгебре усредняет по большему количеству событий.
Условная вероятность
Для борелевского подмножества B в можно рассмотреть совокупность случайных величин
.
Можно показать, что они образуют марковское ядро , то есть, для почти всех , является вероятностной мерой. [9]
Пусть . Тогда не зависит от , поэтому получаем, что
Таким образом, определение условного ожидания удовлетворяется постоянной случайной величиной , как и требовалось.
Если не зависит от , то . Обратите внимание, что это не обязательно так, если не зависит только от и от .
Если независимы, независимы, независимы от и независимы от , то .
Стабильность:
Если -измеримо , то .
Доказательство
Для каждого имеем , или эквивалентно
Поскольку это верно для каждого , а оба и являются -измеримыми (первое свойство выполняется по определению; последнее свойство здесь является ключевым), отсюда можно показать
И это касается почти всего.
В частности, для под-σ-алгебр мы имеем . (Обратите внимание, что это отличается от свойства башни ниже.)
Если Z — случайная величина, то . В простейшей форме это звучит так : .
Выделим известные факторы:
Если -измеримо , то .
Доказательство
Все случайные величины здесь предполагаются без потери общности неотрицательными. Общий случай можно рассматривать с помощью .
Исправьте и пусть . Тогда для любого
И так почти везде.
Любая простая функция является конечной линейной комбинацией индикаторных функций. В силу линейности указанное выше свойство справедливо для простых функций: если является простой функцией, то .
Теперь пусть будет -измеримой. Тогда существует последовательность простых функций, сходящаяся монотонно (здесь имеется в виду ) и поточечно к . Следовательно, для последовательность монотонно и поточечно сходится к .
Кроме того, поскольку , последовательность сходится монотонно и поточечно к
Объединяя частный случай, доказанный для простых функций, определение условного ожидания и применяя теорему о монотонной сходимости:
Условная дисперсия : Используя условное математическое ожидание, мы можем определить, по аналогии с определением дисперсии как среднего квадратичного отклонения от среднего, условную дисперсию
Сходимость по мартингалу : Для случайной величины , имеющей конечное математическое ожидание, имеем , если либо является возрастающим рядом под-σ-алгебр и , либо является убывающим рядом под-σ-алгебр и .
Условное ожидание как -проекция: Если находятся в гильбертовом пространстве квадратично интегрируемых действительных случайных величин (действительных случайных величин с конечным вторым моментом), то
для -измеримых имеем , т.е. условное математическое ожидание есть в смысле скалярного произведения L 2 ( P ) ортогональная проекция из на линейное подпространство -измеримых функций. (Это позволяет определить и доказать существование условного математического ожидания на основе проекционной теоремы Гильберта .)
^ Колмогоров, Андрей (1933). Grundbegriffe der Wahrscheinlichkeitsrechnung (на немецком языке). Берлин: Юлиус Шпрингер. п. 46.
Перевод: Колмогоров, Андрей (1956). Основы теории вероятностей (2-е изд.). Нью-Йорк: Челси. С. 53. ISBN 0-8284-0023-7. Архивировано из оригинала 2018-09-14 . Получено 2009-03-14 .
^ Окстоби, Дж. К. (1953). «Обзор: теория меры, П. Р. Халмос» (PDF) . Bull. Amer. Math. Soc . 59 (1): 89–91. doi : 10.1090/s0002-9904-1953-09662-8 .
^ Броквелл, Питер Дж. (1991). Временные ряды: теория и методы (2-е изд.). Нью-Йорк: Springer-Verlag. ISBN978-1-4419-0320-4.
^ Хасти, Тревор. Элементы статистического обучения: добыча данных, вывод и прогнозирование (PDF) (Второе, исправленное 7-е печатное изд.). Нью-Йорк. ISBN978-0-387-84858-7.
^ Биллингсли, Патрик (1995). "Раздел 34. Условное ожидание". Вероятность и мера (3-е изд.). John Wiley & Sons. стр. 445. ISBN0-471-00710-2.
^ Кленке, Ахим. Теория вероятностей: всеобъемлющий курс (Второе изд.). Лондон. ISBN978-1-4471-5361-0.
^ Da Prato, Giuseppe; Zabczyk, Jerzy (2014). Стохастические уравнения в бесконечных измерениях . Cambridge University Press. стр. 26. doi :10.1017/CBO9781107295513.(Определение в сепарабельных банаховых пространствах)
^ Хитонен, Туомас; ван Нервен, Ян; Вераар, Марк; Вайс, Лутц (2016). Анализ в банаховых пространствах, Том I: Мартингалы и теория Литтлвуда-Пэли . Спрингер Чам. дои : 10.1007/978-3-319-48520-1.(Определение в общих банаховых пространствах)