stringtranslate.com

Последовательность с низким расхождением

В математике последовательность с низким расхождением — это последовательность , обладающая тем свойством, что для всех значений ее подпоследовательность имеет низкое расхождение .

Грубо говоря, расхождение последовательности мало, если доля точек в последовательности, попадающих в произвольное множество B , близка к пропорциональной мере B , как это было бы в среднем (но не для конкретных выборок) в случае равномерно распределенной последовательности . Конкретные определения расхождения различаются относительно выбора B ( гиперсферы , гиперкубы и т. д.) и того , как вычисляется расхождение для каждого B (обычно нормируется) и объединяется (обычно путем взятия наихудшего значения).

Последовательности с низким расхождением также называются квазислучайными последовательностями из-за их общего использования в качестве замены равномерно распределенных случайных чисел . Модификатор «квази» используется для более четкого обозначения того, что значения последовательности с низким расхождением не являются ни случайными, ни псевдослучайными , но такие последовательности разделяют некоторые свойства случайных величин, и в определенных приложениях, таких как метод квази-Монте-Карло, их более низкое расхождение является важным преимуществом.

Приложения

Ошибка в оценке эксцесса как функция количества точек данных. «Аддитивный квазислучайный» дает максимальную ошибку, когда c  = ( 5  − 1)/2. «Случайный» дает среднюю ошибку по шести запускам случайных чисел, где среднее берется для уменьшения величины диких колебаний

Квазислучайные числа имеют преимущество перед чисто случайными числами в том, что они быстро и равномерно охватывают интересующую область.

Два полезных применения — нахождение характеристической функции функции плотности вероятности и нахождение производной функции детерминированной функции с небольшим количеством шума. Квазислучайные числа позволяют вычислять моменты более высокого порядка с высокой точностью очень быстро.

Приложения, не включающие сортировку, могут быть использованы для поиска среднего значения , стандартного отклонения , асимметрии и эксцесса статистического распределения, а также для поиска интегральных и глобальных максимумов и минимумов сложных детерминированных функций. Квазислучайные числа также могут использоваться для предоставления начальных точек для детерминированных алгоритмов, которые работают только локально, таких как итерация Ньютона-Рафсона .

Квазислучайные числа также можно комбинировать с алгоритмами поиска. С помощью алгоритма поиска квазислучайные числа можно использовать для нахождения моды , медианы , доверительных интервалов и кумулятивного распределения статистического распределения, а также всех локальных минимумов и всех решений детерминированных функций.

Последовательности с низким расхождением в численном интегрировании

Различные методы численного интегрирования можно сформулировать как приближение интеграла функции в некотором интервале, например, [0,1], как среднего значения функции, вычисленной на некотором наборе в этом интервале:

Если точки выбраны как , это правило прямоугольника . Если точки выбраны так, чтобы быть распределенными случайным (или псевдослучайным образом ), это метод Монте-Карло . Если точки выбраны как элементы последовательности с низким расхождением, это метод квази-Монте-Карло . Замечательный результат, неравенство Коксмы–Главки (изложенное ниже), показывает, что погрешность такого метода может быть ограничена произведением двух членов, один из которых зависит только от , а другой — расхождением множества .

Удобно построить набор таким образом, что если набор с элементами построен, предыдущие элементы не нужно пересчитывать. Правило прямоугольника использует набор точек, которые имеют низкое расхождение, но в общем случае элементы должны быть пересчитаны, если увеличивается. Элементы не нужно пересчитывать в случайном методе Монте-Карло, если увеличивается, но наборы точек не имеют минимального расхождения. Используя последовательности с низким расхождением, мы стремимся к низкому расхождению и отсутствию необходимости в пересчетах, но на самом деле последовательности с низким расхождением могут быть только постепенно хорошими по расхождению, если мы не допускаем пересчета.

Определение несоответствия

Расхождение множества определяется с использованием обозначения Нидеррайтера как

где — -мерная мера Лебега , — число точек , попадающих в , а — множество -мерных интервалов или ящиков вида

где .

Звездное расхождение определяется аналогично, за исключением того, что супремум берется по набору прямоугольных ящиков вида

где находится в полуоткрытом интервале [0, 1).

Эти два понятия связаны между собой

Примечание : При этих определениях расхождение представляет собой наихудшее или максимальное отклонение плотности точек однородного набора. Однако, также имеют смысл и другие меры ошибок, что приводит к другим определениям и мерам вариации. Например, -расхождение или модифицированное центрированное -расхождение также интенсивно используются для сравнения качества однородных наборов точек. Оба они гораздо проще для вычисления для больших и .

Неравенство Коксмы–Главки.

Пусть будет -мерным единичным кубом, . Пусть имеет ограниченную вариацию по в смысле Харди и Краузе. Тогда для любого в ,

Неравенство Коксмы – Главки является точным в следующем смысле: для любой точки , заданной в , и любого существует функция с ограниченной вариацией и такая, что

Поэтому качество правила численного интегрирования зависит только от невязки .

Формула Главки–Зарембы

Пусть . Ибо мы пишем

и обозначим через точку, полученную из x заменой координат, не входящих в u, на . Тогда

где - функция невязки.

TheЛ 2вариант неравенства Коксмы – Главки

Применяя неравенство Коши–Шварца для интегралов и сумм к тождеству Главаки–Зарембы, получаем версию неравенства Коксмы–Главки:

где

и

Discrepancy имеет большое практическое значение, поскольку для заданного набора точек возможны быстрые явные вычисления. Таким образом, легко создавать оптимизаторы набора точек, используя Discrepancy в качестве критерия.

Неравенство Эрдеша–Турана–Коксмы

Вычислительно сложно найти точное значение расхождения больших множеств точек. Неравенство ЭрдёшаТуранаКоксмы дает верхнюю границу.

Пусть — точки в и — произвольное положительное целое число. Тогда

где

Основные предположения

Гипотеза 1. Существует константа, зависящая только от размерности , такая, что

для любого конечного множества точек .

Гипотеза 2. Существует константа, зависящая только от : , такая, что:

для бесконечного числа для любой бесконечной последовательности .

Эти гипотезы эквивалентны. Они были доказаны для WM Schmidt . В более высоких размерностях соответствующая проблема все еще открыта. Наиболее известные нижние границы принадлежат Майклу Лейси и его коллегам.

Нижние границы

Пусть . Тогда

для любого конечного множества точек .

Пусть . В. М. Шмидт доказал, что для любого конечного множества точек ,

где

Для произвольных измерений К. Ф. Рот доказал, что

для любого конечного множества точек . Йозеф Бек [1] ​​установил двойное логарифмическое улучшение этого результата в трех измерениях. Это было улучшено Д. Билыком и М. Т. Лейси до степени одного логарифма. Самая известная граница для s  > 2 принадлежит Д. Билыку, М. Т. Лейси и А. Вагаршакяну. [2] Для существует так, что

для любого конечного множества точек .

Построение последовательностей с низким расхождением

Поскольку любое распределение случайных чисел можно отобразить на равномерное распределение, а квазислучайные числа отображаются таким же образом, в данной статье рассматривается только генерация квазислучайных чисел на многомерном равномерном распределении.

Известны конструкции последовательностей, такие что

где — некоторая константа, зависящая от последовательности. После гипотезы 2 считается, что эти последовательности имеют наилучший возможный порядок сходимости. Примерами ниже являются последовательность Ван дер Корпута , последовательности Холтона и последовательности Соболя . Одним из общих ограничений является то, что методы построения обычно могут гарантировать только порядок сходимости. На практике низкое расхождение может быть достигнуто только в том случае, если достаточно велико, и для больших заданных s этот минимум может быть очень большим. Это означает, что выполнение анализа Монте-Карло с, например, переменными и точками из генератора последовательностей с низким расхождением может дать лишь очень незначительное улучшение точности [ требуется ссылка ] .

Случайные числа

Последовательности квазислучайных чисел могут быть сгенерированы из случайных чисел путем наложения отрицательной корреляции на эти случайные числа. Один из способов сделать это — начать с набора случайных чисел на и построить квазислучайные числа , которые являются однородными на с помощью:

для четных и для нечетных.

Второй способ сделать то же самое с начальными случайными числами — построить случайное блуждание со смещением 0,5, как в:

То есть берем предыдущее квазислучайное число, прибавляем 0,5 и случайное число и берем результат по модулю  1.

Для более чем одного измерения можно использовать латинские квадраты соответствующей размерности для обеспечения смещений, чтобы гарантировать равномерное покрытие всей области.

Покрытие единичного квадрата. Слева для аддитивных квазислучайных чисел с c  = 0,5545497..., 0,308517... Справа для случайных чисел. Сверху вниз. 10, 100, 1000, 10000 точек.

Аддитивная повторяемость

Для любого иррационального числа последовательность

имеет расхождение, стремящееся к . Обратите внимание, что последовательность может быть определена рекурсивно с помощью

Хорошее значение дает меньшее расхождение, чем последовательность независимых равномерных случайных чисел.

Расхождение может быть ограничено показателем аппроксимации . Если показатель аппроксимации равен , то для любого выполняется следующая граница: [3]

По теореме Туэ–Зигеля–Рота показатель аппроксимации любого иррационального алгебраического числа равен 2, что дает оценку выше.

Рекуррентное соотношение, приведенное выше, похоже на рекуррентное соотношение, используемое линейным конгруэнтным генератором , генератором псевдослучайных чисел низкого качества: [4]

Для аддитивной рекуррентности с низким расхождением, приведенной выше, a и m выбраны равными 1. Однако следует отметить, что это не приведет к генерации независимых случайных чисел, поэтому не должно использоваться для целей, требующих независимости.

Значение с наименьшим расхождением является дробной частью золотого сечения : [5]

Другое почти столь же хорошее значение — дробная часть серебряного коэффициента , которая представляет собой дробную часть квадратного корня из 2:

В более чем одном измерении для каждого измерения требуются отдельные квазислучайные числа. Удобный набор значений, которые используются, — это квадратные корни простых чисел от двух и выше, все взятые по модулю 1:

Однако было показано, что набор значений, основанный на обобщенном золотом сечении, обеспечивает более равномерное распределение точек. [6]

Список генераторов псевдослучайных чисел содержит методы генерации независимых псевдослучайных чисел. Примечание : в немногих измерениях рекурсивная рекуррентность приводит к однородным наборам хорошего качества, но для больших (например , ) другие генераторы наборов точек могут предложить гораздо меньшие расхождения.

последовательность ван дер Корпута

Позволять

быть -арным представлением положительного целого числа , т.е. . Установите

Тогда существует константа, зависящая только от , такая, что удовлетворяет условию

где находится звездное расхождение .

последовательность Холтона

Первые 256 точек последовательности Холтона (2,3)

Последовательность Холтона является естественным обобщением последовательности Ван дер Корпута на более высокие размерности. Пусть s — произвольная размерность, а b 1 , ..., b s — произвольные взаимно простые целые числа, большие 1. Определим

Тогда существует константа C, зависящая только от b 1 , ..., b s , такая, что последовательность { x ( n )} n ≥1 является s -мерной последовательностью с

набор Хаммерсли

Набор 2D Hammersley размера 256

Пусть будут взаимно простыми положительными целыми числами, большими 1. Для заданных и -мерное множество Хаммерсли размера определяется как [7]

для . Тогда

где — константа, зависящая только от .

Примечание : Формулы показывают, что множество Хаммерсли на самом деле является последовательностью Холтона, но мы получаем еще одно измерение бесплатно, добавляя линейную развертку. Это возможно только в том случае, если известно заранее. Линейное множество также является множеством с минимально возможным одномерным расхождением в целом. К сожалению, для более высоких измерений такие «наборы записей о расхождении» неизвестны. Для большинство генераторов множеств точек с низким расхождением обеспечивают по крайней мере близкие к оптимальным расхождения.

последовательность Соболя

Вариант последовательности Соболя Антонова–Салеева генерирует числа от нуля до единицы непосредственно в виде двоичных дробей длины из набора специальных двоичных дробей, называемых числами направления. Биты кода Грея , , используются для выбора чисел направления. Чтобы получить значение последовательности Соболя , возьмите исключающее или двоичного значения кода Грея с соответствующим числом направления. Количество требуемых измерений влияет на выбор .

Дисковая выборка Пуассона

Дисковая выборка Пуассона популярна в видеоиграх для быстрого размещения объектов таким образом, чтобы они выглядели случайными, но при этом гарантировали, что каждые две точки будут разделены по крайней мере указанным минимальным расстоянием. [8] Это не гарантирует низкого расхождения (как, например, у Соболя), но по крайней мере значительно меньшего расхождения, чем при чистой случайной выборке. Цель этих шаблонов выборки основана на частотном анализе, а не на расхождении, типе так называемых шаблонов «синего шума».

Графические примеры

Точки, изображенные ниже, являются первыми 100, 1000 и 10000 элементами последовательности типа Соболя. Для сравнения также показаны 10000 элементов последовательности псевдослучайных точек. Последовательность с низким расхождением была сгенерирована алгоритмом TOMS 659. [9] Реализация алгоритма на языке Fortran доступна в Netlib .


Смотрите также

Примечания

  1. ^ Бек, Йожеф (1989). «Двумерная теорема Ван Аарденна-Эренфеста о неоднородностях распределения». Математическая композиция . 72 (3): 269–339. MR  1032337. S2CID  125940424. Збл  0691.10041.
  2. ^ Билык, Дмитрий; Лейси, Майкл Т.; Вагаршакян, Армен (2008). «О неравенстве малого шара во всех измерениях». Журнал функционального анализа . 254 (9): 2470–2502. arXiv : 0705.4619 . doi : 10.1016/j.jfa.2007.09.010 . S2CID  14234006.
  3. ^ Kuipers & Niederreiter 2005, с. 123
  4. ^ Кнут, Дональд Э. «Глава 3 – Случайные числа». Искусство программирования . Том 2.
  5. ^ Скарупке, Мальте (16 июня 2018 г.). «Хеширование Фибоначчи: Оптимизация, о которой забыл мир». Одно из свойств золотого сечения заключается в том, что с его помощью можно примерно поровну разделить любой диапазон... если вы заранее не знаете, сколько шагов собираетесь сделать
  6. ^ Робертс, Мартин (2018). «Необоснованная эффективность квазислучайных последовательностей».
  7. ^ Хаммерсли, Дж. М.; Хэндскомб, Д. К. (1964). Методы Монте-Карло . doi : 10.1007/978-94-009-5819-7. ISBN 978-94-009-5821-0.
  8. ^ Герман Туллекен. Туллекен, Герман (март 2008 г.). «Выборка диска Пуассона». Дев.Маг . № 21. С. 21–25.
  9. ^ Bratley, Paul; Fox, Bennett L. (1988). «Алгоритм 659». ACM Transactions on Mathematical Software . 14 : 88–100. doi : 10.1145/42288.214372 . S2CID  17325779.

Ссылки

Внешние ссылки