В теории вероятности и статистики процесс Бернулли (названный в честь Якоба Бернулли ) представляет собой конечную или бесконечную последовательность двоичных случайных величин , поэтому это дискретный во времени стохастический процесс , который принимает только два значения, канонически 0 и 1. Компонентные переменные Бернулли X i одинаково распределены и независимы . Прозаически процесс Бернулли представляет собой повторяющееся подбрасывание монеты , возможно, с нечестной монетой (но с последовательной нечестностью). Каждая переменная X i в последовательности связана с испытанием или экспериментом Бернулли . Все они имеют одно и то же распределение Бернулли . Многое из того, что можно сказать о процессе Бернулли, также можно обобщить на более чем два результата (например, процесс для шестигранной игральной кости); это обобщение известно как схема Бернулли .
Задачу определения процесса, учитывая лишь ограниченную выборку испытаний Бернулли, можно назвать задачей проверки честности монеты .
Процесс Бернулли — это конечная или бесконечная последовательность независимых случайных величин X 1 , X 2 , X 3 , ..., такая, что
Другими словами, процесс Бернулли представляет собой последовательность независимых одинаково распределенных испытаний Бернулли .
Независимость испытаний подразумевает, что процесс не имеет памяти . Учитывая, что вероятность p известна, прошлые результаты не дают никакой информации о будущих результатах. (Однако, если p неизвестно, прошлое информирует о будущем косвенно, через выводы о p .)
Если процесс бесконечен, то с любой точки будущие испытания образуют процесс Бернулли, идентичный всему процессу, свойство нового старта.
Два возможных значения каждого X i часто называются «успехом» и «неудачей». Таким образом, когда результат выражается числом 0 или 1, его можно назвать числом успехов в i -м «испытании».
Две другие распространенные интерпретации значений — это истина или ложь и да или нет. При любой интерпретации двух значений отдельные переменные X i можно назвать испытаниями Бернулли с параметром p.
Во многих приложениях время проходит между испытаниями, поскольку индекс i увеличивается. По сути, испытания X 1 , X 2 , ... X i , ... происходят в "моменты времени" 1, 2, ..., i , .... Однако этот ход времени и связанные с ним понятия "прошлого" и "будущего" не являются необходимыми. В общем случае любые X i и X j в процессе являются просто двумя из набора случайных величин, индексированных {1, 2, ..., n }, конечные случаи, или {1, 2, 3, ...}, бесконечные случаи.
Один эксперимент только с двумя возможными результатами, часто называемыми «успех» и «неудача», обычно кодируемыми как 1 и 0, можно смоделировать как распределение Бернулли . [1] Несколько случайных величин и распределений вероятностей помимо распределения Бернулли могут быть получены из процесса Бернулли:
Отрицательные биномиальные переменные можно интерпретировать как случайное время ожидания .
Процесс Бернулли можно формализовать на языке вероятностных пространств как случайную последовательность независимых реализаций случайной величины, которая может принимать значения орла или решки. Пространство состояний для отдельного значения обозначается как
Рассмотрим счетно бесконечное прямое произведение копий . Обычно рассматривают либо односторонний набор , либо двусторонний набор . На этом пространстве существует естественная топология , называемая топологией произведения . Множества в этой топологии представляют собой конечные последовательности подбрасываний монеты, то есть строки конечной длины из H и T ( H обозначает орел, а T обозначает решку), при этом остальная часть (бесконечно длинная) последовательности рассматривается как «безразлично». Эти множества конечных последовательностей называются цилиндрическими множествами в топологии произведения. Множество всех таких строк образует сигма-алгебру , в частности, алгебру Бореля . Затем эта алгебра обычно записывается как , где элементы представляют собой последовательности конечной длины подбрасываний монеты (цилиндрические множества).
Если шансы выпадения орла или решки задаются вероятностями , то можно определить естественную меру на пространстве произведений, заданную (или для двустороннего процесса). Другими словами, если дискретная случайная величина X имеет распределение Бернулли с параметром p , где 0 ≤ p ≤ 1, а ее функция массы вероятности задается как
Обозначим это распределение через Ber( p ). [1]
При наличии набора цилиндров, то есть определенной последовательности результатов подбрасывания монеты в определенное время , вероятность наблюдения этой конкретной последовательности определяется выражением
где k — это количество раз, когда H появляется в последовательности, а n − k — это количество раз, когда T появляется в последовательности. Существует несколько различных видов обозначений для вышеизложенного; наиболее распространенным является запись
где каждый из них является двоичной случайной величиной с обозначением в скобках Айверсона , что означает либо если, либо если . Эта вероятность обычно называется мерой Бернулли . [2]
Обратите внимание, что вероятность любой конкретной, бесконечно длинной последовательности подбрасываний монеты равна нулю; это происходит потому , что для любого . Вероятность, равная 1, подразумевает, что любая заданная бесконечная последовательность имеет меру ноль . Тем не менее, можно все равно сказать, что некоторые классы бесконечных последовательностей подбрасываний монеты гораздо более вероятны, чем другие, это задается свойством асимптотического равнораспределения .
Чтобы завершить формальное определение, процесс Бернулли задается вероятностной тройкой , как определено выше.
Предположим, что канонический процесс с представлен и представлен . Закон больших чисел гласит, что среднее значение последовательности, т. е. , почти наверняка приблизится к ожидаемому значению , то есть события, которые не удовлетворяют этому пределу, имеют нулевую вероятность. Ожидаемое значение подбрасывания орла , предположительно представленное 1, определяется как . Фактически, можно
для любой заданной случайной величины из бесконечной последовательности испытаний Бернулли, составляющих процесс Бернулли.
Часто бывает интересно узнать, как часто можно наблюдать H в последовательности из n подбрасываний монеты. Это можно сделать простым подсчетом: если задано n последовательных подбрасываний монеты, то есть, если задано множество всех возможных строк длины n , число N ( k , n ) таких строк, которые содержат k вхождений H, определяется биномиальным коэффициентом
Если вероятность выпадения орла равна p , то общая вероятность увидеть строку длины n с k орлами равна
где . Определенная таким образом мера вероятности известна как биномиальное распределение .
Как мы видим из приведенной выше формулы, если n=1, биномиальное распределение превратится в распределение Бернулли . Таким образом, мы можем знать, что распределение Бернулли является в точности частным случаем биномиального распределения, когда n равно 1.
Особый интерес представляет вопрос о значении для достаточно длинной последовательности подбрасываний монеты, то есть для предела . В этом случае можно воспользоваться приближением Стирлинга к факториалу и записать
Подставляя это в выражение для P ( k , n ), получаем нормальное распределение ; это содержание центральной предельной теоремы , и это простейший ее пример.
Сочетание закона больших чисел вместе с центральной предельной теоремой приводит к интересному и, возможно, удивительному результату: свойству асимптотического равнораспределения . Говоря неформально, можно заметить, что, да, за много подбрасываний монеты, мы будем наблюдать H ровно p долю времени, и что это точно соответствует пику гауссианы. Свойство асимптотического равнораспределения по сути утверждает, что этот пик бесконечно острый, с бесконечным спадом с обеих сторон. То есть, учитывая набор всех возможных бесконечно длинных строк H и T , встречающихся в процессе Бернулли, этот набор разбивается на две части: те строки, которые встречаются с вероятностью 1, и те, которые встречаются с вероятностью 0. Это разбиение известно как закон Колмогорова 0-1 .
Размер этого множества также интересен и может быть определен явно: его логарифм в точности равен энтропии процесса Бернулли. Еще раз рассмотрим множество всех строк длины n . Размер этого множества равен . Из них только определенное подмножество вероятно; размер этого множества равен . Используя приближение Стирлинга, подставляя его в выражение для P ( k , n ), решая для местоположения и ширины пика и, наконец, взяв, находим, что
Это значение — энтропия Бернулли процесса Бернулли. Здесь H обозначает энтропию; не путать с тем же символом H, обозначающим головы .
Джон фон Нейман поставил вопрос о процессе Бернулли относительно возможности того, что данный процесс изоморфен другому , в смысле изоморфизма динамических систем . Вопрос долгое время не поддавался анализу, но был окончательно и полностью решен теоремой Орнштейна об изоморфизме . Этот прорыв привел к пониманию того, что процесс Бернулли уникален и универсален ; в определенном смысле это единственный наиболее случайный процесс из возможных; нет ничего «более» случайного, чем процесс Бернулли (хотя следует быть осторожным с этим неформальным утверждением; безусловно, системы, которые являются перемешивающими , в определенном смысле «сильнее», чем процесс Бернулли, который является просто эргодическим, но не перемешивающим. Однако такие процессы не состоят из независимых случайных величин: действительно, многие чисто детерминированные, неслучайные системы могут быть перемешивающими).
Процесс Бернулли также можно понимать как динамическую систему , как пример эргодической системы и, в частности, динамической системы, сохраняющей меру , одним из нескольких различных способов. Один способ — как сдвиговое пространство , а другой — как одометр . Они рассматриваются ниже.
Один из способов создания динамической системы из процесса Бернулли — это сдвиговое пространство . Существует естественная симметрия переноса на пространстве произведений, заданная оператором сдвига
Мера Бернулли, определенная выше, является трансляционно-инвариантной; то есть, для любого набора цилиндров имеем
и, таким образом , мера Бернулли является мерой Хаара ; это инвариантная мера на пространстве произведений.
Вместо вероятностной меры рассмотрим некоторую произвольную функцию .
определяется как снова некоторая функция Таким образом, отображение индуцирует другое отображение на пространстве всех функций То есть, учитывая некоторое , можно определить
Отображение является линейным оператором , как (очевидно) и для функций и констант . Этот линейный оператор называется оператором переноса или оператором Рюэля–Фробениуса–Перрона . Этот оператор имеет спектр , то есть набор собственных функций и соответствующих собственных значений. Наибольшее собственное значение — это собственное значение Фробениуса–Перрона , и в этом случае оно равно 1. Соответствующий собственный вектор — это инвариантная мера: в этом случае это мера Бернулли. То есть,
Если ограничиться действием на многочлены, то собственными функциями будут (как ни странно) многочлены Бернулли ! [3] [4] Это совпадение названий, по-видимому, не было известно Бернулли.
Вышесказанное можно сделать более точным. Дана бесконечная строка двоичных цифр, напишите
Результатом является действительное число в единичном интервале Сдвиг индуцирует гомоморфизм , также называемый , на единичном интервале. Поскольку можно видеть, что Это отображение называется диадическим преобразованием ; для двойной бесконечной последовательности битов индуцированный гомоморфизм является отображением Бейкера .
Рассмотрим теперь пространство функций в . При условии, что кто-то может найти, что
Ограничивая действие оператора функциями, являющимися полиномами, можно обнаружить, что он имеет дискретный спектр , заданный выражением
где — полиномы Бернулли . Действительно, полиномы Бернулли подчиняются тождеству
Обратите внимание, что сумма
дает функцию Кантора , как это обычно определяется. Это одна из причин, почему набор иногда называют набором Кантора .
Другой способ создания динамической системы — определить одометр . Неформально это именно то, на что это похоже: просто «добавьте единицу» к первой позиции и позвольте одометру «перевернуться», используя биты переноса по мере того, как одометр переворачивается. Это не более чем сложение по основанию два на множестве бесконечных строк. Поскольку сложение образует группу (математику) , а процессу Бернулли уже была задана топология выше, это дает простой пример топологической группы .
В этом случае преобразование задается выражением
Он оставляет меру Бернулли инвариантной только для особого случая («честной монеты»); в противном случае — нет. Таким образом, является динамической системой, сохраняющей меру , в противном случае это просто консервативная система .
Термин последовательность Бернулли часто неформально используется для обозначения реализации процесса Бернулли. Однако этот термин имеет совершенно иное формальное определение, как указано ниже.
Предположим, что процесс Бернулли формально определен как одна случайная величина (см. предыдущий раздел). Для каждой бесконечной последовательности x подбрасываний монеты существует последовательность целых чисел
называется последовательностью Бернулли [ требуется проверка ] связанной с процессом Бернулли. Например, если x представляет собой последовательность подбрасываний монеты, то соответствующая последовательность Бернулли — это список натуральных чисел или моментов времени, для которых результатом подбрасывания монеты является орел .
Определенная таким образом последовательность Бернулли также является случайным подмножеством множества индексов, натуральных чисел .
Почти все последовательности Бернулли являются эргодическими последовательностями . [ требуется проверка ]
Из любого процесса Бернулли можно вывести процесс Бернулли с p = 1/2 с помощью экстрактора фон Неймана , самого раннего экстрактора случайности , который фактически извлекает равномерную случайность.
Представьте наблюдаемый процесс в виде последовательности нулей и единиц, или битов, и сгруппируйте этот входной поток в неперекрывающиеся пары последовательных битов, например (11)(00)(10)... Затем для каждой пары,
В этой таблице приведены результаты расчетов.
Например, входной поток из восьми бит 10011011 будет сгруппирован в пары как (10)(01)(10)(11) . Затем, согласно таблице выше, эти пары преобразуются в вывод процедуры: (1)(0)(1)() (= 101 ).
В выходном потоке 0 и 1 равновероятны, как 10 и 01 равновероятны в оригинале, оба имеют вероятность p (1− p ) = (1− p ) p . Это извлечение равномерной случайности не требует, чтобы входные испытания были независимыми, а только некоррелированными . В более общем смысле, это работает для любой заменяемой последовательности битов: все последовательности, которые являются конечными перестановками, равновероятны.
Экстрактор фон Неймана использует два входных бита для получения либо нуля, либо одного выходного бита, поэтому выход короче входного по меньшей мере в 2 раза. В среднем вычисление отбрасывает пропорцию p 2 + (1 − p ) 2 входных пар (00 и 11), которая близка к единице, когда p близка к нулю или единице, и минимизируется до 1/4, когда p = 1/2 для исходного процесса (в этом случае выходной поток в среднем составляет 1/4 длины входного потока).
Псевдокод основной операции фон Неймана (классический) :
если (Бит1 ≠ Бит2) { выход (Бит1)}
Это снижение эффективности или потеря случайности, присутствующей во входном потоке, может быть смягчена путем итерации алгоритма по входным данным. Таким образом, выход может быть сделан "произвольно близким к границе энтропии". [5]
Итерированная версия алгоритма фон Неймана, также известная как усовершенствованная многоуровневая стратегия (AMLS), [6] была представлена Ювалем Пересом в 1992 году. [5] Она работает рекурсивно, перерабатывая «тратящуюся впустую случайность» из двух источников: последовательности отбрасывания-неотбрасывания и значений отброшенных пар (0 для 00 и 1 для 11). Она основана на том факте, что, учитывая уже сгенерированную последовательность, оба этих источника по-прежнему являются взаимозаменяемыми последовательностями битов и, таким образом, пригодны для другого раунда извлечения. Хотя такая генерация дополнительных последовательностей может быть итерирована бесконечно для извлечения всей доступной энтропии, требуется бесконечное количество вычислительных ресурсов, поэтому количество итераций обычно фиксируется на низком значении — это значение либо фиксируется заранее, либо рассчитывается во время выполнения.
Более конкретно, на входной последовательности алгоритм потребляет входные биты парами, генерируя выходные данные вместе с двумя новыми последовательностями, () дает бумажную нотацию AMLS:
(Если длина входных данных нечетная, последний бит полностью отбрасывается.) Затем алгоритм применяется рекурсивно к каждой из двух новых последовательностей, пока входные данные не станут пустыми.
Пример: Входной поток из статьи AMLS, 11001011101110, использующий 1 для H и 0 для T, обрабатывается следующим образом:
Начиная с шага 1, входные данные представляют собой конкатенацию последовательности 2 и последовательности 1 из предыдущего шага (порядок произвольный, но должен быть фиксированным). Окончательный вывод — ()()(1)()(1)()(1)(1)()()(0)(0)()(0)(1)(1)()(1) (= 1111000111 ), так что из 14 бит ввода было сгенерировано 10 бит вывода, в отличие от 3 бит только через алгоритм фон Неймана. Постоянный вывод ровно 2 бита за раунд на пару бит (по сравнению с переменной none на 1 бит в классическом VN) также позволяет реализовать реализации с постоянным временем, которые устойчивы к атакам по времени .
Псевдокод основной операции фон Неймана–Переса (итеративный):
если (Бит1 ≠ Бит2) { вывод(1, Последовательность1) выход (Бит1)} еще { выход(0, Последовательность1) выход (Бит1, Последовательность2)}
Еще одно изменение было представлено в 2016 году, основанное на наблюдении, что канал Sequence2 не обеспечивает большой пропускной способности, и аппаратная реализация с конечным числом уровней может выиграть от его более раннего отказа в обмен на обработку большего количества уровней Sequence1. [7]