stringtranslate.com

Непрерывное равномерное распределение

В теории вероятностей и статистике непрерывные равномерные распределения или прямоугольные распределения представляют собой семейство симметричных распределений вероятностей . Такое распределение описывает эксперимент, в котором есть произвольный результат, который лежит между определенными границами. [1] Границы определяются параметрами, которые являются минимальными и максимальными значениями. Интервал может быть либо замкнутым (т. е . ), либо открытым (т. е. ). [2] Поэтому распределение часто сокращается как , где означает равномерное распределение. [1] Разница между границами определяет длину интервала; все интервалы одинаковой длины на носителе распределения равновероятны. Это максимальное энтропийное распределение вероятностей для случайной величины без каких-либо ограничений, кроме того, что она содержится в носителе распределения. [3]

Определения

Функция плотности вероятности

Функция плотности вероятности непрерывного равномерного распределения равна

Значения на двух границах и обычно не важны, поскольку они не изменяют значение ни на каком интервале , ни на каком-либо более высоком моменте. Иногда они выбираются равными нулю, а иногда выбираются равными Последнее уместно в контексте оценки методом максимального правдоподобия . В контексте анализа Фурье можно взять значение или равным , поскольку тогда обратное преобразование многих интегральных преобразований этой равномерной функции даст обратно саму функцию, а не функцию, которая равна « почти всюду », т. е. за исключением множества точек с нулевой мерой . Кроме того, это согласуется с функцией знака , которая не имеет такой неоднозначности.

Любая функция плотности вероятности интегрируется до так что функция плотности вероятности непрерывного равномерного распределения графически изображается в виде прямоугольника, где — длина основания, а — высота. По мере увеличения длины основания высота (плотность при любом конкретном значении в пределах границ распределения) уменьшается. [4]

В терминах среднего значения и дисперсии функция плотности вероятности непрерывного равномерного распределения имеет вид

Кумулятивная функция распределения

Кумулятивная функция распределения непрерывного равномерного распределения имеет вид:

Его обратная функция:

В терминах среднего значения и дисперсии кумулятивная функция распределения непрерывного равномерного распределения имеет вид:

его обратная величина:

Пример 1.Использование функции непрерывного равномерного распределения

Для случайной величины найдите

В графическом представлении функции непрерывного равномерного распределения область под кривой в указанных границах, отображающая вероятность, представляет собой прямоугольник. Для конкретного примера выше основание будет ⁠, а высота будет [5]

Пример 2.Использование непрерывной равномерной функции распределения (условной)

Для случайной величины найдите

Приведенный выше пример является случаем условной вероятности для непрерывного равномерного распределения: при условии, что ⁠ ⁠ истинно, какова вероятность того, что ⁠ ⁠ Условная вероятность изменит выборочное пространство, поэтому необходимо вычислить новую длину интервала ⁠ ⁠ , где и [5] Графическое представление по-прежнему будет соответствовать примеру 1, где площадь под кривой в указанных границах отображает вероятность; основание прямоугольника будет ⁠, а высота будет [5]

Генерация функций

Функция, генерирующая момент

Функция , генерирующая моменты непрерывного равномерного распределения, имеет вид: [6]

из которых мы можем вычислить сырые моменты

Для случайной величины, следующей непрерывному равномерному распределению, ожидаемое значение равно , а дисперсия равна

Для частного случая функция плотности вероятности непрерывного равномерного распределения имеет вид:

функция, производящая момент, сводится к простому виду:

Функция, генерирующая кумулянт

Для ⁠ ⁠кумулянт непрерывного равномерного распределения на интервале ⁠ ⁠ равен , где - -е число Бернулли . [7]

Стандартное равномерное распределение

Непрерывное равномерное распределение с параметрами и т.е. называется стандартным равномерным распределением .

Одним интересным свойством стандартного равномерного распределения является то, что если имеет стандартное равномерное распределение, то также имеет Это свойство может быть использовано для генерации противоположных переменных , среди прочего. Другими словами, это свойство известно как метод инверсии , где непрерывное стандартное равномерное распределение может быть использовано для генерации случайных чисел для любого другого непрерывного распределения. [4] Если является равномерным случайным числом со стандартным равномерным распределением, т.е. с то генерирует случайное число из любого непрерывного распределения с указанной кумулятивной функцией распределения [4]

Связь с другими функциями

При условии соблюдения тех же соглашений в точках перехода функция плотности вероятности непрерывного равномерного распределения может быть также выражена через ступенчатую функцию Хевисайда следующим образом:

или в терминах функции прямоугольника как:

В точке перехода функции знака нет неоднозначности . Используя соглашение о полумаксимуме в точках перехода, непрерывное равномерное распределение может быть выражено в терминах функции знака как:

Характеристики

Моменты

Среднее значение (первый необработанный момент ) непрерывного равномерного распределения равно:

Вторым важным моментом этого распределения является:

В общем случае -й сырой момент этого распределения равен:

Дисперсия (второй центральный момент ) этого распределения равна:

Статистика заказов

Пусть будет независимой идентифицированной выборкой из и пусть будет статистикой -го порядка из этой выборки.

имеет бета-распределение с параметрами и

Ожидаемое значение:

Этот факт полезен при построении графиков Q–Q .

Дисперсия составляет:

Однородность

Вероятность того, что непрерывно равномерно распределенная случайная величина попадет в любой интервал фиксированной длины, не зависит от местоположения самого интервала (но зависит от размера интервала ), пока интервал содержится в носителе распределения.

Действительно, если и если — подынтервал с фиксированным , то:

который не зависит от Этот факт мотивирует название дистрибутива.

Равномерное распределение на более общих множествах

Равномерное распределение можно обобщить на множества более общие, чем интервалы.

Формально, пусть будет борелевским множеством положительной конечной меры Лебега , т.е. равномерное распределение на можно задать, определив функцию плотности вероятности как равную нулю снаружи и постоянно равную на

Интересным частным случаем является случай, когда множество S является симплексом . Можно получить равномерное распределение на стандартном n -вершинном симплексе следующим образом. [8] : Теорема 4.1  возьмем n независимых случайных величин с одинаковым показательным распределением ; обозначим их через X 1 ,...,X n ; и пусть Y i  := X i / (сумма i X i ). Тогда вектор Y 1 ,...,Y n равномерно распределен на симплексе.

Связанные дистрибутивы

Статистический вывод

Оценка параметров

Оценка максимального

Несмещенная оценка с минимальной дисперсией

При условии равномерного распределения с неизвестными минимально -дисперсионная несмещенная оценка (UMVUE) для максимума имеет вид:

где — максимум выборки , а — размер выборки , выборка без замены (хотя это различие почти наверняка не имеет значения для непрерывного распределения). Это следует из тех же причин, что и оценка для дискретного распределения , и может рассматриваться как очень простой случай оценки максимального интервала . Эта проблема широко известна как проблема немецкого танка из-за применения максимальной оценки к оценкам производства немецких танков во время Второй мировой войны .

Метод оценки момента

Метод оценки моментов :

где — выборочное среднее.

Оценка максимального правдоподобия

Оценка максимального правдоподобия :

где — максимум выборки , также обозначаемый как максимальная порядковая статистика выборки.

Оценка минимума

При условии равномерного распределения с неизвестным a оценка максимального правдоподобия для a имеет вид:

,

минимум выборки . [ 9]

Оценка средней точки

Средняя точка распределения — это и среднее, и медиана равномерного распределения. Хотя и среднее выборки, и медиана выборки являются несмещенными оценками средней точки, ни одна из них не так эффективна , как средняя выборки , т. е. среднее арифметическое максимума выборки и минимума выборки, которая является оценкой UMVU средней точки (а также оценкой максимального правдоподобия ).

Доверительный интервал

Для максимального

Пусть будет выборкой из , где максимальное значение в популяции. Тогда имеет плотность Лебега-Бореля [10]

где - индикаторная функция

Приведенный ранее доверительный интервал математически неверен, поскольку

не может быть решена без знания . Однако можно решить

для любого неизвестного, но действительного

затем выбирается наименьшее возможное, удовлетворяющее условию выше. Обратите внимание, что длина интервала зависит от случайной величины

Возникновение и применение

Вероятности для функции равномерного распределения легко вычислить из-за простоты формы функции. [2] Таким образом, существуют различные приложения, для которых это распределение может быть использовано, как показано ниже: ситуации проверки гипотез, случаи случайной выборки, финансы и т. д. Кроме того, как правило, эксперименты физического происхождения следуют равномерному распределению (например, испускание радиоактивных частиц ). [1] Однако важно отметить, что в любом приложении существует неизменное предположение о том, что вероятность попадания в интервал фиксированной длины постоянна. [2]

Экономический пример равномерного распределения

В области экономики спрос и пополнение обычно не следуют ожидаемому нормальному распределению. В результате для лучшего прогнозирования вероятностей и тенденций используются другие модели распределения, такие как процесс Бернулли . [11] Но согласно Ванке (2008), в конкретном случае исследования времени выполнения заказа для управления запасами в начале жизненного цикла , когда анализируется совершенно новый продукт, равномерное распределение оказывается более полезным. [11] В этой ситуации другое распределение может оказаться нежизнеспособным, поскольку отсутствуют существующие данные о новом продукте или история спроса недоступна, поэтому нет действительно подходящего или известного распределения. [11] Равномерное распределение было бы идеальным в этой ситуации, поскольку случайная величина времени выполнения заказа (связанная со спросом) неизвестна для нового продукта, но результаты, вероятно, будут находиться в диапазоне между правдоподобным диапазоном двух значений. [11] Таким образом, время выполнения заказа будет представлять собой случайную величину. Из модели равномерного распределения можно было рассчитать другие факторы, связанные со временем выполнения заказа, такие как уровень обслуживания цикла и дефицит за цикл. Также было отмечено, что равномерное распределение также использовалось из-за простоты расчетов. [11]

Выборка из произвольного распределения

Равномерное распределение полезно для выборки из произвольных распределений. Общим методом является метод выборки обратного преобразования, который использует кумулятивную функцию распределения (CDF) целевой случайной величины. Этот метод очень полезен в теоретической работе. Поскольку моделирование с использованием этого метода требует инвертирования CDF целевой переменной, были разработаны альтернативные методы для случаев, когда CDF неизвестна в замкнутой форме. Одним из таких методов является выборка с отклонением .

Нормальное распределение является важным примером, где метод обратного преобразования неэффективен. Однако существует точный метод, преобразование Бокса–Мюллера , который использует обратное преобразование для преобразования двух независимых равномерных случайных величин в две независимые нормально распределенные случайные величины.

Ошибка квантования

При аналого-цифровом преобразовании возникает ошибка квантования. Эта ошибка возникает либо из-за округления, либо из-за усечения. Когда исходный сигнал намного больше одного младшего бита (LSB) , ошибка квантования не имеет значительной корреляции с сигналом и имеет приблизительно равномерное распределение. Следовательно, среднеквадратичная ошибка следует из дисперсии этого распределения.

Генерация случайных величин

Существует множество приложений, в которых полезно проводить эксперименты по моделированию. Многие языки программирования поставляются с реализациями для генерации псевдослучайных чисел , которые эффективно распределены в соответствии со стандартным равномерным распределением.

С другой стороны, равномерно распределенные числа часто используются в качестве основы для генерации неравномерных случайных величин .

Если — значение, выбранное из стандартного равномерного распределения, то значение следует равномерному распределению, параметризованному с помощью и , как описано выше.

История

Хотя исторические истоки концепции равномерного распределения неясны, предполагается, что термин «равномерный» возник из концепции равновероятности в играх в кости (обратите внимание, что игры в кости имели бы дискретное , а не непрерывное равномерное пространство выборки). Равновероятность упоминалась в Liber de Ludo Aleae Джероламо Кардано , руководстве, написанном в XVI веке и подробно описывающем расширенное исчисление вероятностей применительно к костям. [12]

Смотрите также

Ссылки

  1. ^ abc Деккинг, Мишель (2005). Современное введение в вероятность и статистику: понимание почему и как . Лондон, Великобритания: Springer. С. 60–61. ISBN 978-1-85233-896-1.
  2. ^ abc Уолпол, Рональд; и др. (2012). Вероятность и статистика для инженеров и ученых . Бостон, США: Prentice Hall. стр. 171–172. ISBN 978-0-321-62911-1.
  3. ^ Park, Sung Y.; Bera, Anil K. (2009). «Модель авторегрессии с максимальной энтропией и условной гетероскедастичностью». Журнал эконометрики . 150 (2): 219–230. CiteSeerX 10.1.1.511.9750 . doi :10.1016/j.jeconom.2008.12.014. 
  4. ^ abc "Равномерное распределение (непрерывное)". MathWorks . 2019 . Получено 22 ноября 2019 .
  5. ^ abc Illowsky, Barbara; et al. (2013). Вводная статистика. Университет Райса, Хьюстон, Техас, США: OpenStax College. стр. 296–304. ISBN 978-1-938168-20-8.
  6. ^ Казелла и Бергер 2001, стр. 626
  7. Вичура, Майкл Дж. (11 января 2001 г.). «Кумулянты» (PDF) . Раздаточные материалы по Стат 304 . Чикагский университет.
  8. ^ Генерация неравномерных случайных величин. doi :10.1007/978-1-4613-8643-8.
  9. ^ . Поскольку у нас есть фактор максимизируется по максимально возможному a , который ограничен в . Следовательно, это максимум .

  10. ^ Нечвал К.Н., Нечвал Н.А., Васерманис Е.К., Макеев В.Ю. (2002) Построение доверительных интервалов наименьшей длины. Транспорт и связь 3 (1) 95-103
  11. ^ abcde Ванке, Питер (2008). «Равномерное распределение как первый практический подход к управлению запасами новой продукции». Международный журнал экономики производства . 114 (2): 811–819. doi :10.1016/j.ijpe.2008.04.004 – через Research Gate.
  12. ^ Беллхаус, Дэвид (май 2005 г.). «Расшифровка Liber de Ludo Кардано». История математики . 32 : 180–202. дои : 10.1016/j.hm.2004.04.001 .

Дальнейшее чтение

Внешние ссылки