Студенты, изучающие статистику и теорию вероятностей, иногда вырабатывают неправильные представления о нормальном распределении, идеи, которые могут показаться правдоподобными, но математически неверны. Например, иногда ошибочно полагают, что две линейно некоррелированные , нормально распределенные случайные величины должны быть статистически независимы . Однако это неверно, как можно продемонстрировать с помощью контрпримера. Аналогично, иногда ошибочно полагают, что линейная комбинация нормально распределенных случайных величин сама будет распределена нормально, но, опять же, контрпримеры доказывают, что это неверно. [1] [2]
Сказать, что пара случайных величин имеет двумерное нормальное распределение , означает, что каждая линейная комбинация и для постоянных (т.е. не случайных) коэффициентов и (не равных нулю) имеет одномерное нормальное распределение. В этом случае, если и некоррелированы, то они независимы. [ 3] Однако возможно, что две случайные величины и распределены совместно так, что каждая из них по отдельности имеет маргинально нормальное распределение, и они некоррелированы, но не являются независимыми; примеры приведены ниже.
Примеры
Симметричный пример
Предположим, что имеет нормальное распределение с ожидаемым значением 0 и дисперсией 1. Пусть имеет распределение Радемахера , так что или , каждое с вероятностью 1/2, и предположим, что не зависит от . Пусть . Тогда и некоррелированы, что можно проверить, вычислив их ковариацию . Более того, оба имеют одинаковое нормальное распределение. И все же, и не являются независимыми. [4] [1] [5]
Чтобы увидеть, что и не являются независимыми, наблюдайте то или это .
Наконец, распределение простой линейной комбинации концентрирует положительную вероятность в точке 0: . Следовательно, случайная величина не распределена нормально, и, следовательно , и не распределены совместно нормально (по определению выше). [4]
Асимметричный пример
Предположим, что имеет нормальное распределение с ожидаемым значением 0 и дисперсией 1. Пусть
где - положительное число, которое будет указано ниже. Если очень мало, то корреляция близка, если очень велико, то близка к 1. Поскольку корреляция является непрерывной функцией , теорема о промежуточном значении подразумевает, что существует некоторое конкретное значение , которое делает корреляцию 0. Это значение приблизительно равно 1,54. [2] [примечание 1] В этом случае и некоррелированы, но они явно не являются независимыми, поскольку полностью определяет .
Чтобы убедиться, что распределение нормальное (и что его распределение совпадает с распределением ), можно вычислить его кумулятивную функцию распределения : [6]
где предпоследнее равенство следует из симметрии распределения и симметрии условия, что .
В этом примере разность далека от нормального распределения, поскольку имеет существенную вероятность (около 0,88) того, что она равна 0. Напротив, нормальное распределение, будучи непрерывным распределением, не имеет дискретной части — то есть оно не концентрирует больше нулевой вероятности в любой отдельной точке. Следовательно, и не распределены совместно нормально, хотя они по отдельности распределены нормально. [2]
Примеры с поддержкой почти в любой точке плоскости
Предположим, что координаты случайной точки на плоскости выбраны в соответствии с функцией плотности вероятности. Тогда случайные величины и некоррелированы, и каждая из них распределена нормально (со средним значением 0 и дисперсией 1), но они не являются независимыми. [7] : 93
Хорошо известно, что отношение двух независимых стандартных нормальных случайных величин отклоняется и имеет распределение Коши . [8] [9] [7] : 122 Можно с тем же успехом начать со случайной величины Коши и вывести условное распределение для удовлетворения требования, что при и независимой и стандартной нормальной. Из этого следует, что
в где — случайная величина Радемахера, а — случайная величина хи-квадрат с двумя степенями свободы.
Рассмотрим два набора , . Обратите внимание, что не индексируется по – то есть одна и та же случайная величина Коши используется в определении как и . Такое совместное использование приводит к зависимостям между индексами: ни , ни не является независимым от . Тем не менее, все из и некоррелированы, поскольку все двумерные распределения имеют зеркальную симметрию по осям. [ необходима цитата ]
На рисунке показаны диаграммы рассеяния выборок, взятых из указанного выше распределения. Это дает два примера двумерных распределений, которые не коррелируют и имеют нормальные маргинальные распределения, но не являются независимыми. Левая панель показывает совместное распределение и ; распределение имеет поддержку везде, кроме начала координат. Правая панель показывает совместное распределение и ; распределение имеет поддержку везде, кроме осей, и имеет разрыв в начале координат: плотность расходится при приближении к началу координат по любому прямому пути, кроме осей.