Интуитивно, алгоритмически случайная последовательность (или случайная последовательность ) — это последовательность двоичных цифр, которая кажется случайной любому алгоритму, работающему на (префиксно-свободной или нет) универсальной машине Тьюринга . Понятие может быть применено аналогично к последовательностям на любом конечном алфавите (например, десятичные цифры). Случайные последовательности являются ключевыми объектами изучения в алгоритмической теории информации .
В теории вероятностей с мерой , введенной Андреем Колмогоровым в 1933 году, не существует такого понятия , как случайная последовательность. Например, рассмотрим подбрасывание честной монеты бесконечное количество раз. Любая конкретная последовательность, будь то или , имеет одинаковую вероятность ровно нуля. Невозможно утверждать, что одна последовательность «более случайна», чем другая, используя язык теории вероятностей с мерой. Однако интуитивно очевидно, что выглядит более случайным, чем . Алгоритмическая теория случайности формализует эту интуицию.
Поскольку иногда рассматриваются различные типы алгоритмов, начиная от алгоритмов с определенными ограничениями на время выполнения и заканчивая алгоритмами, которые могут задавать вопросы машине оракула , существуют различные понятия случайности. Наиболее распространенное из них известно как случайность Мартина-Лёфа ( K-случайность или 1-случайность ), но существуют также более сильные и более слабые формы случайности. Когда термин «алгоритмически случайный» используется для обозначения конкретной одиночной (конечной или бесконечной) последовательности без уточнения, его обычно понимают как «несжимаемый» или, в случае, если последовательность бесконечна и имеет префикс алгоритмически случайный (т. е. K-несжимаемый), «случайный Мартина-Лёфа–Хайтина».
С момента своего создания случайность Мартина-Лёфа, как было показано, допускает множество эквивалентных характеристик — в терминах сжатия , тестов на случайность и азартных игр — которые внешне мало похожи на исходное определение, но каждая из которых удовлетворяет нашему интуитивному представлению о свойствах, которыми должны обладать случайные последовательности: случайные последовательности должны быть несжимаемыми, они должны проходить статистические тесты на случайность, и на них должно быть трудно делать деньги, делая ставки . Существование этих множественных определений случайности Мартина-Лёфа и устойчивость этих определений при различных моделях вычислений свидетельствуют о том, что случайность Мартина-Лёфа является фундаментальным свойством математики, а не случайностью конкретной модели Мартина-Лёфа.
Важно устранить неоднозначность между алгоритмической случайностью и стохастической случайностью. В отличие от алгоритмической случайности, которая определяется для вычислимых (и, следовательно, детерминированных) процессов, стохастическая случайность обычно считается свойством последовательности, которая, как априори известно, генерируется (или является результатом) независимым одинаково распределенным равновероятным стохастическим процессом.
Поскольку бесконечные последовательности двоичных цифр можно отождествить с действительными числами в единичном интервале, случайные двоичные последовательности часто называют (алгоритмически) случайными действительными числами . Кроме того, бесконечные двоичные последовательности соответствуют характеристическим функциям множеств натуральных чисел; поэтому эти последовательности можно рассматривать как множества натуральных чисел.
Класс всех случайных (двоичных) последовательностей Мартина-Лёфа обозначается RAND или MLR.
Ричард фон Мизес формализовал понятие теста на случайность , чтобы определить случайную последовательность как ту, которая прошла все тесты на случайность. Он определил «коллектив» ( kollektiv ) как бесконечную двоичную строку, определенную таким образом, что
Чтобы выбрать подпоследовательность, сначала выберите бинарную функцию , такую, что при любой двоичной строке она выводит либо 0, либо 1. Если она выводит 1, то мы добавляем к подпоследовательности, иначе мы продолжаем. В этом определении некоторые допустимые правила могут воздерживаться вечно на некоторых последовательностях и, таким образом, не выбирать бесконечную подпоследовательность. Мы рассматриваем только те, которые выбирают бесконечную подпоследовательность.
Другими словами, каждая бесконечная двоичная строка — это игра с подбрасыванием монеты, а допустимое правило — это способ для игрока решить, когда делать ставки. Коллектив — это игра с подбрасыванием монеты, где нет способа, чтобы один игрок выиграл больше, чем другой в долгосрочной перспективе. То есть, не существует игровой системы, которая бы работала для игры.
Определение обобщает двоичный алфавит на счетный алфавит:
Обычно допустимые правила определяются как правила, вычислимые машиной Тьюринга, и мы требуем . При этом у нас есть случайные последовательности Мизеса–Вальда–Черча . Это не ограничение, так как, имея последовательность с , мы можем построить случайные последовательности с любым другим вычислимым . [1] Здесь «Черч» относится к Алонзо Черчу , чья статья 1940 года предложила использовать правила, вычислимые по Тьюрингу. [2]
Теорема. ( Абрахам Вальд , 1936, 1937) [3] Если существует только счетное число допустимых правил, то почти любая последовательность является коллективом.
Набросок доказательства: используйте теоретико-мерную вероятность.
Зафиксируйте одно допустимое правило. Выберите случайную последовательность из пространства Бернулли. С вероятностью 1 (используйте мартингалы) подпоследовательность, выбранная допустимым правилом, все еще имеет . Теперь добавьте все счетное число правил. С вероятностью 1 каждая подпоследовательность, выбранная каждым правилом, все еще имеет .
Контрпример. (Жан Виль, 1939) [4] Если существует только счетное число допустимых правил, то существует коллектив с для всех .
Доказательство: См. [5]
Интуитивно, долгосрочное среднее случайной последовательности должно колебаться по обе стороны от , подобно тому, как случайное блуждание должно пересекать начало координат бесконечно много раз. Контрпример предполагает, что определение фон Мизеса недостаточно сильное.
Контрпример Вилле предполагает, что смысл случайности Мизеса–Вальда–Черча не достаточно хорош, потому что некоторые случайные последовательности не удовлетворяют некоторым законам случайности. Например, контрпример Вилле не удовлетворяет одному из законов итерированного логарифма : Наивно, можно исправить это, потребовав, чтобы последовательность удовлетворяла всем возможным законам случайности, где «закон случайности» — это свойство, которому удовлетворяют все последовательности с вероятностью 1. Однако для каждой бесконечной последовательности у нас есть закон случайности, который , что приводит к выводу, что случайных последовательностей не существует.
( Per Martin-Löf , 1966) [6] определил «случайность Мартина-Лёфа», допуская только законы случайности, которые являются вычислимыми по Тьюрингу. Другими словами, последовательность является случайной, если она проходит все вычислимые по Тьюрингу тесты случайности.
Тезис о том, что определение случайности Мартина-Лёфа «правильно» отражает интуитивное понятие случайности, был назван тезисом Мартина-Лёфа–Хайтина ; он несколько похож на тезис Чёрча–Тьюринга . [7]
Тезис Мартина-Лёфа–Хайтина. Математическое понятие «случайности Мартина-Лёфа» отражает интуитивное представление о том, что бесконечная последовательность «случайна». Тезис Чёрча–Тьюринга. Математическое понятие «вычислимого машинами Тьюринга» отражает интуитивное представление о том, что функция «вычислима».
Подобно тому, как вычислимость Тьюринга имеет много эквивалентных определений, случайность Мартина-Лёфа также имеет много эквивалентных определений. См. следующий раздел.
Первоначальное определение случайной последовательности Мартином-Лёфом было дано в терминах конструктивных нулевых покрытий; он определил последовательность как случайную, если она не содержится ни в одном таком покрытии. Грегори Хайтин , Леонид Левин и Клаус-Петер Шнорр доказали характеристику в терминах алгоритмической сложности : последовательность случайна, если существует равномерная граница сжимаемости ее начальных сегментов. Шнорр дал третье эквивалентное определение в терминах мартингалов . Книга Ли и Витани «Введение в сложность Колмогорова и ее приложения» является стандартным введением в эти идеи.
Характеристика сложности Колмогорова передает интуитивное представление о том, что случайная последовательность несжимаема: никакой префикс не может быть создан программой, которая намного короче префикса.
Характеристика нулевого покрытия передает интуитивное представление о том, что случайное действительное число не должно иметь никаких свойств, которые являются «необычными». Каждое множество меры 0 можно рассматривать как необычное свойство. Последовательность не может лежать ни в одном множестве меры 0, потому что каждое одноточечное множество имеет меру 0. Идея Мартина-Лёфа состояла в том, чтобы ограничить определение множествами меры 0, которые эффективно описываемы; определение эффективного нулевого покрытия определяет счетный набор эффективно описываемых множеств меры 0 и определяет последовательность как случайную, если она не лежит ни в одном из этих конкретных множеств меры 0. Поскольку объединение счетного набора множеств меры 0 имеет меру 0, это определение немедленно приводит к теореме о том, что существует множество меры 1 случайных последовательностей. Обратите внимание, что если мы отождествляем пространство Кантора двоичных последовательностей с интервалом [0,1] действительных чисел, мера на пространстве Кантора согласуется с мерой Лебега .
Эффективный набор мер 0 можно интерпретировать как машину Тьюринга, которая способна сказать, учитывая бесконечную двоичную строку, выглядит ли строка случайной на уровнях статистической значимости. Набор является пересечением сжимающихся наборов , и поскольку каждый набор задается перечислимой последовательностью префиксов, учитывая любую бесконечную двоичную строку, если он находится в , то машина Тьюринга может решить за конечное время, что строка действительно попадает в . Следовательно, она может «отвергнуть гипотезу о том, что строка случайна на уровне значимости ». Если машина Тьюринга может отвергнуть гипотезу на всех уровнях значимости, то строка не является случайной. Случайная строка — это та, которая для каждого вычислимого по Тьюрингу теста случайности умудряется оставаться навсегда неотвергнутой на некотором уровне значимости. [8]
Характеристика мартингала передает интуитивное представление о том, что ни одна эффективная процедура не должна быть способна делать деньги, делая ставки против случайной последовательности. Мартингал d — это стратегия ставок. d считывает конечную строку w и делает ставку на следующий бит. Он ставит некоторую часть своих денег на то, что следующий бит будет 0, а затем оставшуюся часть своих денег на то, что следующий бит будет 1. d удваивает деньги, которые он поставил на бит, который фактически появился, и проигрывает остальное. d ( w ) — это сумма денег, которая у него есть после просмотра строки w . Поскольку ставка, сделанная после просмотра строки w, может быть рассчитана из значений d ( w ), d ( w 0) и d ( w 1), расчет суммы денег, которая у него есть, эквивалентен расчету ставки. Характеристика мартингала гласит, что ни одна стратегия ставок, реализуемая любым компьютером (даже в слабом смысле конструктивных стратегий, которые не обязательно вычислимы ), не может делать деньги, делая ставки на случайную последовательность.
Существует универсальный конструктивный мартингал d . Этот мартингал универсален в том смысле, что если задан любой конструктивный мартингал d , то если d успешен на последовательности, то d также успешен на этой последовательности. Таким образом, d успешен на каждой последовательности в RAND c (но, поскольку d конструктивен, он не успешен ни на одной последовательности в RAND). (Schnorr 1971)
Существует конструктивное нулевое покрытие RAND c . Это означает, что все эффективные тесты на случайность (то есть конструктивные нулевые покрытия) в некотором смысле включены в этот универсальный тест на случайность, поскольку любая последовательность, прошедшая этот единственный тест на случайность, пройдет все тесты на случайность. (Мартин-Лёф 1966) Интуитивно этот универсальный тест на случайность гласит: «Если последовательность имеет все более длинные префиксы, которые могут быть все более хорошо сжаты на этой универсальной машине Тьюринга», то она не случайна». — см. следующий раздел.
Эскиз конструкции: Перечислим эффективные нулевые покрытия как . Перечисление также эффективно (перечислено модифицированной универсальной машиной Тьюринга). Теперь у нас есть универсальное эффективное нулевое покрытие путем диагонализации: .
Если последовательность не проходит тест на алгоритмическую случайность, то она алгоритмически сжимаема. И наоборот, если она алгоритмически сжимаема, то она не проходит тест на алгоритмическую случайность.
Набросок конструкции: Предположим, что последовательность не проходит тест на случайность, тогда ее можно сжать, лексикографически перечислив все последовательности, которые не проходят тест, затем закодировать местоположение последовательности в списке всех таких последовательностей. Это называется «перечислительным кодированием источника». [9]
Наоборот, если последовательность сжимаема, то по принципу ящика только исчезающе малая часть последовательностей такова, поэтому мы можем определить новый тест на случайность как «имеет сжатие этой универсальной машиной Тьюринга». Кстати, это и есть универсальный тест на случайность.
Например, рассмотрим двоичную последовательность, выбранную из распределения Бернулли IID. После взятия большого количества выборок у нас должно быть около единиц. Мы можем закодировать эту последовательность как "Сгенерировать все двоичные последовательности длиной , и единиц. Из них -я последовательность в лексикографическом порядке.".
По приближению Стирлинга , где — двоичная энтропийная функция . Таким образом, число бит в этом описании равно: Первый член предназначен для префиксного кодирования чисел и . Второй член предназначен для префиксного кодирования числа . (Используйте омега-кодирование Элиаса .) Третий член предназначен для префиксного кодирования остальной части описания. Когда велико, это описание содержит только биты, и поэтому оно сжимаемо со степенью сжатия . В частности, степень сжатия равна единице (несжимаемо) только когда . (Пример 14.2.8 [10] )
Рассмотрим казино, предлагающее честные шансы за столом рулетки. Стол рулетки генерирует последовательность случайных чисел. Если эта последовательность алгоритмически случайна, то не существует более низкой полувычислимой стратегии выигрыша, что, в свою очередь, подразумевает, что не существует вычислимой стратегии выигрыша. То есть для любого алгоритма азартных игр долгосрочный логарифмический выигрыш равен нулю (ни положительный, ни отрицательный). И наоборот, если эта последовательность алгоритмически не случайна, то существует более низкая полувычислимая стратегия выигрыша.
Поскольку каждое из эквивалентных определений случайной последовательности Мартина-Лёфа основано на том, что вычислимо некоторой машиной Тьюринга, естественно, можно спросить, что вычислимо машиной оракула Тьюринга . Для фиксированного оракула A последовательность B , которая не только случайна, но и фактически удовлетворяет эквивалентным определениям вычислимости относительно A (например, ни один мартингал, конструктивный относительно оракула A, не достигает успеха на B ), называется случайной относительно A. Две последовательности, будучи сами по себе случайными, могут содержать очень похожую информацию, и поэтому ни одна из них не будет случайной относительно другой. Всякий раз, когда происходит редукция Тьюринга от одной последовательности к другой, вторая последовательность не может быть случайной относительно первой, так же как вычислимые последовательности сами по себе неслучайны; в частности, это означает, что Ω Хайтина не является случайной относительно проблемы остановки .
Важным результатом, касающимся относительной случайности, является теорема ван Ламбалгена , которая гласит, что если C — это последовательность, составленная из A и B путем чередования первого бита A , первого бита B , второго бита A , второго бита B и т. д., то C алгоритмически случайна тогда и только тогда, когда A алгоритмически случайна, а B алгоритмически случайна относительно A. Тесно связанным следствием является то, что если A и B сами по себе случайны, то A случайна относительно B тогда и только тогда, когда B случайна относительно A.
Относительная случайность дает нам первое понятие, которое сильнее случайности Мартина-Лёфа, которая является случайностью относительно некоторого фиксированного оракула A. Для любого оракула это по крайней мере так же сильно, а для большинства оракулов это строго сильнее, поскольку будут случайные последовательности Мартина-Лёфа, которые не являются случайными относительно оракула A. Часто рассматриваемыми важными оракулами являются проблема остановки, и оракул n- го перехода, , поскольку эти оракулы способны отвечать на конкретные вопросы, которые возникают естественным образом. Последовательность, которая случайна относительно оракула, называется n -случайной; последовательность является 1-случайной, следовательно, тогда и только тогда, когда она случайна по Мартину-Лёфу. Последовательность, которая является n -случайной для каждого n , называется арифметически случайной. n -случайные последовательности иногда возникают при рассмотрении более сложных свойств. Например, существует только счетное число множеств , поэтому можно подумать, что они должны быть неслучайными. Однако вероятность остановки Ω является 1-случайной; только после достижения 2-случайности становится невозможным, чтобы случайный набор был .
Кроме того, существует несколько понятий случайности, которые слабее случайности Мартина-Лёфа. Некоторые из них — слабая 1-случайность, случайность Шнорра, вычислимая случайность, частичная вычислимая случайность. Юнге Ван показал [11] , что случайность Шнорра отличается от вычислимой случайности. Кроме того, известно, что случайность Колмогорова-Лавленда не сильнее случайности Мартина-Лёфа, но неизвестно, слабее ли она на самом деле.
На противоположном конце спектра случайности находится понятие K-тривиального множества . Эти множества являются антислучайными в том смысле, что весь начальный сегмент логарифмически сжимаем (т.е. для каждого начального сегмента w), но они невычислимы.