stringtranslate.com

Статистическая случайность

Числовая последовательность считается статистически случайной, если она не содержит распознаваемых закономерностей или закономерностей; такие последовательности, как результаты идеального броска игральной кости или цифры числа π, демонстрируют статистическую случайность. [1]

Статистическая случайность не обязательно подразумевает «истинную» случайность , т. е. объективную непредсказуемость . Псевдослучайность достаточна для многих применений, таких как статистика, отсюда и название статистическая случайность.

Глобальная случайность и локальная случайность отличаются. Большинство философских концепций случайности являются глобальными, поскольку они основаны на идее, что «в долгосрочной перспективе» последовательность выглядит действительно случайной, даже если определенные подпоследовательности не будут выглядеть случайными. Например, в «истинно» случайной последовательности чисел достаточной длины, вероятно, будут длинные последовательности, состоящие только из повторяющихся чисел, хотя в целом последовательность может быть случайной. Локальная случайность относится к идее, что могут быть минимальные длины последовательностей, в которых случайные распределения аппроксимируются. Длинные отрезки тех же чисел, даже те, которые генерируются «истинно» случайными процессами, уменьшат «локальную случайность» выборки (она может быть локально случайной только для последовательностей из 10 000 чисел; например, взятие последовательностей из менее 1000 может вообще не казаться случайной).

Последовательность, демонстрирующая закономерность, тем самым не доказывается, что она статистически неслучайна. Согласно принципам теории Рамсея , достаточно большие объекты обязательно должны содержать заданную подструктуру (« полный беспорядок невозможен »).

Законодательство об азартных играх устанавливает определенные стандарты статистической случайности для игровых автоматов .

Тесты

Первые тесты для случайных чисел были опубликованы MG Kendall и Bernard Babington Smith в Journal of the Royal Statistical Society в 1938 году. [2] Они были построены на статистических инструментах, таких как критерий хи-квадрат Пирсона , которые были разработаны для различения того, соответствуют ли экспериментальные явления их теоретическим вероятностям. Пирсон разработал свой тест изначально, показав, что ряд экспериментов с игральными костями, проведенных WFR Weldon, не демонстрировали «случайного» поведения.

Первоначальные четыре теста Кендалла и Смита были тестами гипотез , в которых в качестве нулевой гипотезы рассматривалась идея о том, что каждое число в данной случайной последовательности имеет равные шансы на появление и что различные другие закономерности в данных также должны быть распределены равновероятно.

Если данная последовательность могла пройти все эти тесты в пределах заданной степени значимости (обычно 5%), то она считалась, по их словам, «локально случайной». Кендалл и Смит различали «локальную случайность» от «истинной случайности» тем, что многие последовательности, сгенерированные действительно случайными методами, могли не демонстрировать «локальную случайность» в заданной степени — очень большие последовательности могли содержать много строк из одной цифры. Это могло быть «случайным» в масштабе всей последовательности, но в меньшем блоке это не было бы «случайным» (оно не прошло бы их тесты) и было бы бесполезным для ряда статистических приложений.

По мере того, как наборы случайных чисел становились все более распространенными, использовались все более сложные тесты. Некоторые современные тесты отображают случайные цифры в виде точек на трехмерной плоскости, которые затем можно вращать для поиска скрытых закономерностей. В 1995 году статистик Джордж Марсалья создал набор тестов, известных как тесты diehard , которые он распространяет на CD-ROM с 5 миллиардами псевдослучайных чисел. В 2015 году Юнге Ван распространил программный пакет Java [3] для тестирования случайности на основе статистических расстояний.

Генераторы псевдослучайных чисел требуют тестов в качестве эксклюзивных проверок их «случайности», поскольку они определенно не производятся «истинно случайными» процессами, а скорее детерминированными алгоритмами. За всю историю генерации случайных чисел многие источники чисел, которые, как считалось, казались «случайными» при тестировании, позже оказывались совершенно неслучайными при прохождении определенных типов тестов. Понятие квазислучайных чисел было разработано для обхода некоторых из этих проблем, хотя генераторы псевдослучайных чисел по-прежнему широко используются во многих приложениях (даже в тех, которые известны как крайне «неслучайные»), поскольку они «достаточно хороши» для большинства приложений.

Другие тесты:

Смотрите также

Ссылки

  1. ^ Число Пи кажется хорошим генератором случайных чисел, но не всегда лучшим, Чад Бутин, Университет Пердью
  2. ^ Кендалл, MG ; Смит, B. Бабингтон (1938). «Случайность и случайные числа выборки». Журнал Королевского статистического общества . 101 (1): 147–166. doi :10.2307/2980655. JSTOR  2980655.
  3. ^ Юнге Ван. Статистические методы тестирования для псевдослучайной генерации. http://webpages.uncc.edu/yonwang/liltest/
  4. ^ Юнге Ван: О разработке LIL-тестов для (псевдо)случайных генераторов и некоторых экспериментальных результатах. PDF
  5. ^ Ван, Йонге; Никол, Тони (2015). «Статистические свойства псевдослучайных последовательностей и эксперименты с PHP и Debian OpenSSL». Компьютеры и безопасность . 53 : 44–64. doi :10.1016/j.cose.2015.05.005.
  6. ^ Кнут, Дональд (1998). Искусство программирования. Том 2: Получисленные алгоритмы . Эддисон Уэсли. С. 93–118. ISBN 978-0-201-89684-8.

Внешние ссылки