stringtranslate.com

Случайная переменная

Случайная величина (также называемая случайной величиной , алеаторной переменной или стохастической переменной ) — это математическая формализация величины или объекта, которая зависит от случайных событий. [1] Термин «случайная величина» может вводить в заблуждение, поскольку его математическое определение на самом деле не является ни случайным, ни переменной, [2] скорее это функция возможных результатов (например, возможные верхние стороны подброшенной монеты, такие как орёл и хвосты ) в выборочном пространстве (например, наборе ) в измеримое пространство (например, в котором 1 соответствует и −1 соответствует соответственно), часто к действительным числам.

Этот график показывает, как случайная величина является функцией от всех возможных результатов до реальных значений. Он также показывает, как случайная величина используется для определения функций вероятностной массы.

Неофициально случайность обычно представляет собой некий фундаментальный элемент случайности, например, при броске игральной кости ; это также может отражать неопределенность, например, ошибку измерения . [1] Однако интерпретация вероятности сложна с философской точки зрения и даже в конкретных случаях не всегда однозначна. Чисто математический анализ случайных величин не зависит от подобных трудностей интерпретации и может основываться на строгой аксиоматической установке.

На формальном математическом языке теории меры случайная величина определяется как измеримая функция из пространства вероятностной меры (называемого выборочным пространством ) в измеримое пространство . Это позволяет рассмотреть меру прямого действия , которая называется распределением случайной величины; Таким образом, распределение является вероятностной мерой на множестве всех возможных значений случайной величины. Две случайные величины могут иметь одинаковое распределение, но существенно различаться; например, они могут быть независимыми .

Обычно рассматривают частные случаи дискретных случайных величин и абсолютно непрерывных случайных величин , соответствующие тому, оценивается ли случайная величина в счетном подмножестве или в интервале действительных чисел . Есть и другие важные возможности, особенно в теории случайных процессов , где естественно рассматривать случайные последовательности или случайные функции . Иногда считается, что случайная величина автоматически оценивается в действительных числах, а более общие случайные величины вместо этого называются случайными элементами .

По словам Джорджа Макки , Пафнутий Чебышев был первым человеком, который «систематически мыслил в терминах случайных величин». [3]

Определение

Случайная величина — это измеримая функция из выборочного пространства как набора возможных результатов в измеримое пространство . Техническое аксиоматическое определение требует, чтобы выборочное пространство было выборочным пространством тройки вероятностей (см. определение теории меры). Случайную величину часто обозначают заглавными латинскими буквами , например . [4]

Вероятность, принимающая значение в измеримом множестве, записывается как

.

Стандартный корпус

Во многих случаях имеет действительное значение , т.е. В некоторых контекстах термин случайный элемент (см. расширения) используется для обозначения случайной величины не этой формы.

Когда образ (или диапазон) конечно или бесконечно счетен , случайная величина называется дискретной случайной величиной [5] : 399  , а ее распределение представляет собой дискретное распределение вероятностей , т. е. может быть описано функцией вероятностной массы , которая присваивает вероятность каждому значению на изображении . Если изображение несчетно бесконечно (обычно интервал ) , то оно называется непрерывной случайной величиной . [6] [7] В особом случае, когда оно абсолютно непрерывно , его распределение может быть описано функцией плотности вероятности , которая присваивает вероятности интервалам; в частности, каждая отдельная точка обязательно должна иметь нулевую вероятность абсолютно непрерывной случайной величины. Не все непрерывные случайные величины абсолютно непрерывны. [8]

Любую случайную величину можно описать ее кумулятивной функцией распределения , которая описывает вероятность того, что случайная величина будет меньше или равна определенному значению.

Расширения

Термин «случайная величина» в статистике традиционно ограничивается случаем с действительным значением ( ). В этом случае структура действительных чисел позволяет определить такие величины, как ожидаемое значение и дисперсия случайной величины, ее кумулятивную функцию распределения и моменты ее распределения.

Однако приведенное выше определение справедливо для любого измеримого пространства значений. Таким образом, можно рассматривать случайные элементы других наборов , такие как случайные логические значения , категориальные значения , комплексные числа , векторы , матрицы , последовательности , деревья , множества , формы , многообразия и функции . Затем можно конкретно обратиться к случайной величине типа или к случайной величине со значением .

Эта более общая концепция случайного элемента особенно полезна в таких дисциплинах, как теория графов , машинное обучение , обработка естественного языка и других областях дискретной математики и информатики , где часто интересуются моделированием случайных изменений нечисловых данных. структуры . Тем не менее в некоторых случаях удобно представить каждый элемент с помощью одного или нескольких действительных чисел. В этом случае случайный элемент может опционально быть представлен как вектор действительных случайных величин (все они определены в одном и том же базовом вероятностном пространстве , что позволяет различным случайным переменным ковариироваться ). Например:

Функции распределения

Если дана случайная величина , определенная в вероятностном пространстве , мы можем задать вопросы типа «Насколько вероятно, что значение равно 2?». Это то же самое, что и вероятность события , которую часто записывают как или сокращенно.

Запись всех этих вероятностей выходных значений случайной величины дает распределение вероятностей . Распределение вероятностей «забывает» о конкретном вероятностном пространстве, используемом для определения, и записывает только вероятности различных выходных значений . Такое распределение вероятностей, если оно имеет действительное значение, всегда можно отразить с помощью его кумулятивной функции распределения.

а иногда также с использованием функции плотности вероятности , . В терминах теории меры мы используем случайную величину , чтобы «передвинуть» меру на меру на . Эта мера называется «распределением (вероятностей) » или «законом ». [9] Плотность , производная Радона–Никодима по некоторой эталонной мере на (часто этой эталонной мерой является мера Лебега в случае непрерывных случайных величин или считающая мера в случае дискретных случайных величин). Базовое вероятностное пространство — это техническое устройство, используемое для обеспечения существования случайных величин, иногда для их построения, а также для определения таких понятий, как корреляция, зависимость или независимость , основанных на совместном распределении двух или более случайных величин в одном и том же вероятностном пространстве. На практике часто вообще избавляются от пространства и просто помещают в него меру , которая присваивает меру 1 всей действительной линии, т. е. мы работаем с распределениями вероятностей, а не со случайными величинами. См. статью о квантильных функциях для более полного изучения.

Примеры

Дискретная случайная величина

Рассмотрим эксперимент, в котором наугад выбирают человека. Примером случайной величины может быть рост человека. Математически случайная величина интерпретируется как функция, которая сопоставляет человека с его ростом. Со случайной величиной связано распределение вероятностей, которое позволяет вычислить вероятность того, что рост находится в любом подмножестве возможных значений, например, вероятность того, что рост находится в диапазоне от 180 до 190 см, или вероятность того, что рост либо меньше более 150 или более 200 см.

Другой случайной величиной может быть количество детей у человека; это дискретная случайная величина с неотрицательными целочисленными значениями. Он позволяет вычислять вероятности для отдельных целочисленных значений (функцию массы вероятности (PMF)) или для наборов значений, включая бесконечные наборы. Например, интересующим событием может быть «четное количество детей». Как для конечных, так и для бесконечных наборов событий их вероятности можно найти путем сложения PMF элементов; то есть вероятность четного числа детей равна бесконечной сумме .

В таких примерах пространство выборки часто подавляется, поскольку его математически трудно описать, а возможные значения случайных величин затем рассматриваются как пространство выборки. Но когда две случайные величины измеряются в одном и том же выборочном пространстве результатов, например, рост и количество детей рассчитываются для одних и тех же случайных людей, их взаимосвязь легче проследить, если признать, что и рост, и количество детей зависят от от одного и того же случайного человека, например, чтобы можно было задать вопросы о том, коррелируют ли такие случайные величины или нет.

Если – счетные множества действительных чисел, и , то – дискретная функция распределения. Здесь для , для . Взяв, например, перечисление всех рациональных чисел как , можно получить дискретную функцию, которая не обязательно является ступенчатой ​​функцией (кусочно-постоянной).

Подбрасывание монеты

Возможные результаты одного подбрасывания монеты можно описать с помощью выборочного пространства . Мы можем ввести случайную величину с действительным значением , которая моделирует выплату в 1 доллар за успешную ставку на орла следующим образом:

Если монета честная , Y имеет функцию массы вероятности, определяемую следующим образом:

Бросок кубиков

Если выборочное пространство представляет собой набор возможных чисел, выброшенных на двух кубиках, а интересующая случайная величина представляет собой сумму S чисел на двух кубиках, то S представляет собой дискретную случайную величину, распределение которой описывается построенной функцией массы вероятности как высота столбцов изображений здесь.

Случайную величину также можно использовать для описания процесса броска игральной кости и возможных результатов. Наиболее очевидным представлением для случая двух игральных костей является выборка пар чисел n 1 и n 2 из {1, 2, 3, 4, 5, 6} (представляющих числа на двух игральных костях) в качестве выборки. космос. Общее число выпавших чисел (сумма чисел в каждой паре) тогда является случайной величиной X , заданной функцией, которая отображает пару в сумму:

честныеf X

Непрерывная случайная величина

Формально непрерывная случайная величина — это случайная величина, кумулятивная функция распределения которой непрерывна всюду. [10] Не существует « пробелов », которые соответствовали бы числам, вероятность появления которых ограничена . Вместо этого непрерывные случайные величины почти никогда не принимают точное заданное значение c (формально ), но существует положительная вероятность того, что его значение будет лежать в определенных интервалах , которые могут быть сколь угодно малыми . Непрерывные случайные величины обычно допускают функции плотности вероятности (PDF), которые характеризуют их CDF и вероятностные меры ; такие распределения называются также абсолютно непрерывными ; но некоторые непрерывные распределения являются сингулярными или представляют собой смесь абсолютно непрерывной и сингулярной частей.

Примером непрерывной случайной величины может служить вращатель, который может выбирать горизонтальное направление. Тогда значения, принимаемые случайной величиной, являются направлениями. Мы могли бы представить эти направления как север, запад, восток, юг, юго-восток и т. д. Однако обычно удобнее сопоставить пространство выборки со случайной величиной, которая принимает значения, которые являются действительными числами. Это можно сделать, например, путем сопоставления направления с азимутом в градусах по часовой стрелке от севера. Затем случайная величина принимает значения, которые являются действительными числами из интервала [0, 360), причем все части диапазона являются «одинакововероятными». В данном случае X = угол поворота. Любое действительное число имеет нулевую вероятность быть выбранным, но положительная вероятность может быть присвоена любому диапазону значений. Например, вероятность выбора числа из [0, 180] равна 12 . Вместо того, чтобы говорить о функции вероятности, мы говорим, что плотность вероятности X равна 1/360. Вероятность подмножества [0, 360) можно вычислить, умножив меру набора на 1/360. В общем, вероятность набора для данной непрерывной случайной величины можно вычислить путем интегрирования плотности по данному набору.

Более формально, для любого интервала случайная величина называется « непрерывной равномерной случайной величиной» (CURV), если вероятность того, что она принимает значение в подинтервале, зависит только от длины подинтервала. Это означает , что вероятность попадания в любой подинтервал пропорциональна длине подинтервала, то есть, если acdb , имеем

где последнее равенство следует из аксиомы унитарности вероятности. Функция плотности вероятности CURV определяется индикаторной функцией интервала поддержки , нормированной на длину интервала:

единичном интервалераспределения вероятностейфункции квантилясгенерированного числасвойства кумулятивных функций распределения

Смешанный тип

Смешанная случайная величина — это случайная величина, кумулятивная функция распределения которой не является ни дискретной , ни всюду непрерывной . [10] Его можно реализовать как смесь дискретной случайной величины и непрерывной случайной величины; в этом случае CDF будет средневзвешенным CDF составляющих переменных. [10]

Пример случайной величины смешанного типа может быть основан на эксперименте, в котором монета подбрасывается, а спиннер вращается, только если результатом подбрасывания монеты является орел. Если результат — решка, X = −1; в противном случае X = значение счетчика, как в предыдущем примере. Существует вероятность 12 , что эта случайная величина будет иметь значение −1. Другие диапазоны значений будут иметь вдвое меньшую вероятность, чем в последнем примере.

В общем случае каждое распределение вероятностей на действительной линии представляет собой смесь дискретной части, сингулярной части и абсолютно непрерывной части; см. теорему Лебега о разложении § Уточнение . Дискретная часть сосредоточена на счетном множестве, но это множество может быть плотным (как и множество всех рациональных чисел).

Теоретико-мерное определение

Наиболее формальное, аксиоматическое определение случайной величины основано на теории меры . Непрерывные случайные величины определяются в терминах наборов чисел, а также функций, которые отображают такие наборы в вероятности. Из-за различных трудностей (например, парадокса Банаха-Тарского ), которые возникают, если такие множества недостаточно ограничены, необходимо ввести так называемую сигма-алгебру , чтобы ограничить возможные множества, над которыми могут быть определены вероятности. Обычно используется такая сигма-алгебра, борелевская σ-алгебра , которая позволяет определять вероятности над любыми множествами, которые могут быть получены либо непосредственно из непрерывных интервалов чисел, либо с помощью конечного или счетного числа объединений и/ или пересечения таких интервалов. [11]

Теоретико-мерное определение состоит в следующем.

Пусть – вероятностное пространство и измеримое пространство . Тогда -значная случайная величина является измеримой функцией , а это означает, что для каждого подмножества ее прообраз -измерим ; , где . [12] Это определение позволяет нам измерить любое подмножество в целевом пространстве, глядя на его прообраз, который по предположению измерим.

Говоря более интуитивным языком, член — это возможный результат, член — это измеримое подмножество возможных результатов, функция дает вероятность каждого такого измеримого подмножества, представляет собой набор значений, которые может принимать случайная величина (например, набор действительных чисел), а член представляет собой «хорошее» (измеримое) подмножество (тех, для которых можно определить вероятность). Тогда случайная переменная является функцией любого результата от величины, так что результаты, ведущие к любому полезному подмножеству величин для случайной величины, имеют четко определенную вероятность.

Когда - топологическое пространство , то наиболее распространенным выбором в качестве σ-алгебры является борелевская σ-алгебра , которая представляет собой σ-алгебру, порожденную совокупностью всех открытых множеств в . В таком случае случайная величина со значением называется случайной величиной со значением . Более того, когда пространство представляет собой действительную линию , то такая вещественная случайная величина называется просто случайной величиной .

Действительные случайные величины

В этом случае пространство наблюдения представляет собой набор действительных чисел. Напомним, – это вероятностное пространство. Для реального пространства наблюдения функция является действительной случайной величиной, если

Это определение является частным случаем предыдущего, поскольку множество порождает борелевскую σ-алгебру на множестве действительных чисел, и достаточно проверить измеримость на любом порождающем множестве. Здесь мы можем доказать измеримость на этом порождающем наборе, используя тот факт, что .

Моменты

Распределение вероятностей случайной величины часто характеризуется небольшим числом параметров, которые также имеют практическую интерпретацию. Например, зачастую достаточно знать, каково его «среднее значение». Это отражается в математической концепции ожидаемого значения случайной величины, обозначаемой и также называемой первым моментом . В общем, не равен . Как только «среднее значение» станет известно, можно будет задаться вопросом, насколько далеки от этого среднего значения обычно значения - вопрос, на который отвечает дисперсия и стандартное отклонение случайной величины. можно рассматривать интуитивно как среднее значение, полученное из бесконечной совокупности, члены которой имеют определенные оценки .

Математически это известно как (обобщенная) проблема моментов : для данного класса случайных величин найти набор функций, значения которых полностью характеризуют распределение случайной величины .

Моменты можно определять только для вещественных функций случайных величин (или комплексных и т. д.). Если случайная величина сама по себе вещественная, то можно взять моменты самой переменной, которые эквивалентны моментам тождественной функции случайной величины. Однако даже для недействительных случайных величин можно взять моменты вещественных функций этих переменных. Например, для категориальной случайной величины X , которая может принимать номинальные значения «красный», «синий» или «зеленый», можно построить вещественную функцию ; здесь используется скобка Айверсона , и он имеет значение 1, если имеет значение «зеленый», и 0 в противном случае. Затем можно определить математическое ожидание и другие моменты этой функции.

Функции случайных величин

Новую случайную величину Y можно определить, применив действительную измеримую по Борелю функцию к результатам действительной случайной величины . То есть, . Тогда кумулятивная функция распределения равна

Если функция обратима (т. е. существует там, где есть обратная функция ) и либо возрастает, либо убывает , то предыдущее соотношение можно расширить, чтобы получить

При тех же гипотезах обратимости , предполагая также дифференцируемость , связь между функциями плотности вероятности можно найти, дифференцируя обе части приведенного выше выражения по , чтобы получить [10]

Если не существует обратимости, но каждая из них допускает не более счетного числа корней (т. е. конечное или счетное число таких, что ), то предыдущее соотношение между функциями плотности вероятности можно обобщить с помощью

где , согласно теореме об обратной функции . Формулы для плотностей не требуют возрастания.

В теоретико-мерном аксиоматическом подходе к вероятности, если случайная величина на и измеримая по Борелю функция , то также является случайной величиной на , поскольку композиция измеримых функций также измерима . (Однако это не обязательно так, если измеримо по Лебегу . [ нужна ссылка ] ) Та же процедура, которая позволила перейти от вероятностного пространства к, может быть использована для получения распределения .

Пример 1

Пусть – непрерывная случайная величина с действительным знаком и пусть .

Если , то , так

Если , то

так

Пример 2

Предположим , это случайная величина с кумулятивным распределением

где – фиксированный параметр. Рассмотрим случайную величину . Тогда

Последнее выражение можно вычислить с точки зрения кумулятивного распределения так

которая представляет собой кумулятивную функцию распределения (CDF) экспоненциального распределения .

Пример 3

Предположим — случайная величина со стандартным нормальным распределением , плотность которой равна

Рассмотрим случайную величину. Мы можем найти плотность, используя приведенную выше формулу замены переменных:

В этом случае изменение не является монотонным , поскольку каждому значению соответствует два значения (положительное и отрицательное). Однако из-за симметрии обе половины преобразуются одинаково, т.е.

Обратное преобразование

и его производная

Затем,

Это распределение хи-квадрат с одной степенью свободы .

Пример 4

Предположим – случайная величина с нормальным распределением , плотность которой равна

Рассмотрим случайную величину. Мы можем найти плотность, используя приведенную выше формулу замены переменных:

В этом случае изменение не является монотонным , поскольку каждому значению соответствует два значения (положительное и отрицательное). Однако, в отличие от предыдущего примера, в этом случае симметрии нет, и нам нужно вычислить два разных члена:

Обратное преобразование

и его производная

Затем,

Это нецентральное распределение хи-квадрат с одной степенью свободы .

Некоторые свойства

Эквивалентность случайных величин

Существует несколько разных смыслов, в которых случайные величины можно считать эквивалентными. Две случайные величины могут быть равны, почти наверняка равны или равны по распределению.

Ниже приводится точное определение этих понятий эквивалентности в порядке возрастания силы.

Равенство в распределении

Если выборочное пространство является подмножеством реальной линии, случайные величины X и Y равны по распределению (обозначаются ), если они имеют одинаковые функции распределения:

Чтобы быть равными по распределению, случайные величины не обязательно должны определяться в одном и том же вероятностном пространстве. Две случайные величины, имеющие равные производящие моменты, имеют одинаковое распределение. Это обеспечивает, например, полезный метод проверки равенства определенных функций независимых одинаково распределенных (IID) случайных величин . Однако производящая функция момента существует только для распределений, которые имеют определенное преобразование Лапласа .

Почти наверняка равенство

Две случайные величины X и Y почти наверняка равны ( обозначаются ) тогда и только тогда, когда вероятность того, что они различны, равна нулю :

Для всех практических целей теории вероятностей это понятие эквивалентности так же сильно, как и фактическое равенство. Это связано со следующим расстоянием:

где «ess sup» представляет собой существенную верхнюю границу в смысле теории меры .

Равенство

Наконец, две случайные величины X и Y равны , если они равны как функции в своем измеримом пространстве:

Это понятие, как правило, наименее полезно в теории вероятностей, поскольку на практике и в теории лежащее в основе измерения пространство эксперимента редко явно охарактеризовано или даже охарактеризовано.

Конвергенция

Важной темой математической статистики является получение результатов сходимости для определенных последовательностей случайных величин; например, закон больших чисел и центральная предельная теорема .

Существуют различные способы, в которых последовательность случайных величин может сходиться к случайной величине . Это объясняется в статье о сходимости случайных величин .

Смотрите также

Рекомендации

Встроенные цитаты

  1. ^ аб Блицштейн, Джо; Хван, Джессика (2014). Введение в вероятность . ЦРК Пресс. ISBN 9781466575592.
  2. ^ Дейзенрот, Марк Питер (2020). Математика для машинного обучения. А. Альдо Фейсал, Ченг Сун Онг. Кембридж, Соединенное Королевство: Издательство Кембриджского университета. ISBN 978-1-108-47004-9. ОСЛК  1104219401.
  3. ^ Джордж Макки (июль 1980 г.). «Гармонический анализ как использование симметрии - исторический обзор». Бюллетень Американского математического общества . Новая серия. 3 (1).
  4. ^ «Случайные переменные». www.mathsisfun.com . Проверено 21 августа 2020 г.
  5. ^ Йейтс, Дэниел С.; Мур, Дэвид С; Старнс, Дарен С. (2003). Практика статистики (2-е изд.). Нью-Йорк: Фриман . ISBN 978-0-7167-4773-4. Архивировано из оригинала 9 февраля 2005 г.
  6. ^ «Случайные переменные». www.stat.yale.edu . Проверено 21 августа 2020 г.
  7. ^ Деккинг, Фредерик Мишель; Краайкамп, Корнелис; Лопухаа, Хендрик Пауль; Местер, Людольф Эрвин (2005). «Современное введение в вероятность и статистику». Спрингеровские тексты в статистике . дои : 10.1007/1-84628-168-7. ISBN 978-1-85233-896-1. ISSN  1431-875X.
  8. ^ Л. Кастаньеда; В. Аруначалам и С. Дхармараджа (2012). Введение в теорию вероятности и случайные процессы с приложениями. Уайли. п. 67. ИСБН 9781118344941.
  9. ^ Биллингсли, Патрик (1995). Вероятность и мера (3-е изд.). Уайли. п. 187. ИСБН 9781466575592.
  10. ^ abcd Берцекас, Дмитрий П. (2002). Введение в вероятность . Цициклис, Джон Н., Τσιτσικλής, Γιάννης Ν. Бельмонт, Массачусетс: Athena Scientific. ISBN 188652940X. OCLC  51441829.
  11. ^ Штайгервальд, Дуглас Г. «Экономика 245A – Введение в теорию меры» (PDF) . Калифорнийский университет, Санта-Барбара . Проверено 26 апреля 2013 г.
  12. ^ Фристедт и Грей (1996, стр. 11)

Литература

Внешние ссылки