stringtranslate.com

Заблуждения о нормальном распределении

Студенты, изучающие статистику и теорию вероятностей, иногда вырабатывают неправильные представления о нормальном распределении, идеи, которые могут показаться правдоподобными, но математически неверны. Например, иногда ошибочно полагают, что две линейно некоррелированные , нормально распределенные случайные величины должны быть статистически независимы . Однако это неверно, как можно продемонстрировать с помощью контрпримера. Аналогично, иногда ошибочно полагают, что линейная комбинация нормально распределенных случайных величин сама будет распределена нормально, но, опять же, контрпримеры доказывают, что это неверно. [1] [2]

Сказать, что пара случайных величин имеет двумерное нормальное распределение , означает, что каждая линейная комбинация и для постоянных (т.е. не случайных) коэффициентов и (не равных нулю) имеет одномерное нормальное распределение. В этом случае, если и некоррелированы, то они независимы. [ 3] Однако возможно, что две случайные величины и распределены совместно так, что каждая из них по отдельности имеет маргинально нормальное распределение, и они некоррелированы, но не являются независимыми; примеры приведены ниже.

Примеры

Симметричный пример

Две нормально распределенные, некоррелированные, но зависимые переменные.
Совместный диапазон и . Более темный цвет указывает на более высокое значение функции плотности.

Предположим, что имеет нормальное распределение с ожидаемым значением 0 и дисперсией 1. Пусть имеет распределение Радемахера , так что или , каждое с вероятностью 1/2, и предположим, что не зависит от . Пусть . Тогда и некоррелированы, что можно проверить, вычислив их ковариацию . Более того, оба имеют одинаковое нормальное распределение. И все же, и не являются независимыми. [4] [1] [5]

Чтобы увидеть, что и не являются независимыми, наблюдайте то или это .

Наконец, распределение простой линейной комбинации концентрирует положительную вероятность в точке 0: . Следовательно, случайная величина не распределена нормально, и, следовательно , и не распределены совместно нормально (по определению выше). [4]

Асимметричный пример

Совместная плотность и . Более темный цвет указывает на более высокое значение плотности.

Предположим, что имеет нормальное распределение с ожидаемым значением 0 и дисперсией 1. Пусть где - положительное число, которое будет указано ниже. Если очень мало, то корреляция близка, если очень велико, то близка к 1. Поскольку корреляция является непрерывной функцией , теорема о промежуточном значении подразумевает, что существует некоторое конкретное значение , которое делает корреляцию 0. Это значение приблизительно равно 1,54. [2] [примечание 1] В этом случае и некоррелированы, но они явно не являются независимыми, поскольку полностью определяет .

Чтобы убедиться, что распределение нормальное (и что его распределение совпадает с распределением ), можно вычислить его кумулятивную функцию распределения : [6]

где предпоследнее равенство следует из симметрии распределения и симметрии условия, что .

В этом примере разность далека от нормального распределения, поскольку имеет существенную вероятность (около 0,88) того, что она равна 0. Напротив, нормальное распределение, будучи непрерывным распределением, не имеет дискретной части — то есть оно не концентрирует больше нулевой вероятности в любой отдельной точке. Следовательно, и не распределены совместно нормально, хотя они по отдельности распределены нормально. [2]

Примеры с поддержкой почти в любой точке плоскости

Предположим, что координаты случайной точки на плоскости выбраны в соответствии с функцией плотности вероятности. Тогда случайные величины и некоррелированы, и каждая из них распределена нормально (со средним значением 0 и дисперсией 1), но они не являются независимыми. [7] : 93 

Хорошо известно, что отношение двух независимых стандартных нормальных случайных величин отклоняется и имеет распределение Коши . [8] [9] [7] : 122  Можно с тем же успехом начать со случайной величины Коши и вывести условное распределение для удовлетворения требования, что при и независимой и стандартной нормальной. Из этого следует, что в где — случайная величина Радемахера, а — случайная величина хи-квадрат с двумя степенями свободы.

Рассмотрим два набора , . Обратите внимание, что не индексируется по – то есть одна и та же случайная величина Коши используется в определении как и . Такое совместное использование приводит к зависимостям между индексами: ни , ни не является независимым от . Тем не менее, все из и некоррелированы, поскольку все двумерные распределения имеют зеркальную симметрию по осям. [ необходима цитата ]

Ненормальные совместные распределения с нормальными предельными значениями.

На рисунке показаны диаграммы рассеяния выборок, взятых из указанного выше распределения. Это дает два примера двумерных распределений, которые не коррелируют и имеют нормальные маргинальные распределения, но не являются независимыми. Левая панель показывает совместное распределение и ; распределение имеет поддержку везде, кроме начала координат. Правая панель показывает совместное распределение и ; распределение имеет поддержку везде, кроме осей, и имеет разрыв в начале координат: плотность расходится при приближении к началу координат по любому прямому пути, кроме осей.

Смотрите также

Ссылки

  1. ^ ab Rosenthal, Jeffrey S. (2005). «Рассуждения о некоррелированных нормальных случайных величинах».
  2. ^ abc Мельник, Эдвард Л.; Тененбейн, Аарон (ноябрь 1982 г.). «Неверные спецификации нормального распределения». The American Statistician . 36 (4): 372–373. doi :10.1080/00031305.1982.10483052.
  3. ^ Хогг, Роберт ; Танис, Эллиот (2001). «Глава 5.4. Двумерное нормальное распределение». Вероятность и статистический вывод (6-е изд.). Prentice Hall. стр. 258–259. ISBN 0130272949.
  4. ^ ab Ash, Robert B. "Lecture 21. The Multivariate Normal Distribution" (PDF) . Lectures on Statistics . Архивировано из оригинала (PDF) 2007-07-14.
  5. ^ Романо, Джозеф П.; Сигел, Эндрю Ф. (1986). Контрпримеры в теории вероятностей и статистике . Wadsworth & Brooks/Cole. стр. 65–66. ISBN 0-534-05568-0.
  6. ^ Wise, Gary L.; Hall, Eric B. (1993). Контрпримеры в вероятностном и реальном анализе . Oxford University Press. С. 140–141. ISBN 0-19-507068-2.
  7. ^ ab Стоянов, Джордан М. (2013). Контрпримеры в теории вероятности (3-е изд.). Довер. ISBN 978-0-486-49998-7.
  8. ^ Патель, Джагдиш К.; Рид, Кэмпбелл Б. (1996). Справочник по нормальному распределению (2-е изд.). Тейлор и Фрэнсис. стр. 113. ISBN 978-0-824-79342-5.
  9. ^ Кришнамурти, К. (2006). Справочник по статистическим распределениям с приложениями . CRC Press. стр. 278. ISBN 978-1-420-01137-1.
Примечания
  1. ^ Точнее 1,53817..., квадратный корень из медианы распределения хи-квадрат с 3 степенями свободы.