В теории вероятностей задача Бюффона об игле — это вопрос, впервые поставленный в XVIII веке Жоржем-Луи Леклерком, графом де Бюффоном : [1]
Игла Бюффона была самой ранней решенной задачей в геометрической вероятности ; [2] ее можно решить с помощью интегральной геометрии . Решение для искомой вероятности p в случае, когда длина иглы l не больше ширины t полосок, имеет вид
Это можно использовать для разработки метода Монте-Карло для аппроксимации числа π , хотя это не было изначальной мотивацией вопроса де Бюффона. [3] Кажущееся необычным появление π в этом выражении происходит из-за того, что базовая функция распределения вероятностей для ориентации иглы является вращательно-симметричной.
Задача, выраженная более математически, выглядит так: если иголка длиной l упала на плоскость, размеченную параллельными линиями на расстоянии t единиц друг от друга, какова вероятность того, что при приземлении игла ляжет на прямую?
Пусть x — расстояние от центра иглы до ближайшей параллельной прямой, а θ — острый угол между иглой и одной из параллельных прямых.
Равномерная функция плотности вероятности (PDF) x между 0 и т/2 это
Здесь x = 0 представляет собой иглу, центр которой находится прямо на линии, а x = т/2 представляет собой иглу, которая идеально центрирована между двумя линиями. Равномерная PDF предполагает, что игла с равной вероятностью попадет в любое место в этом диапазоне, но не может выйти за его пределы.
Равномерная функция плотности вероятности θ между 0 и π/2 это
Здесь θ = 0 представляет собой иглу, параллельную отмеченным линиям, а θ = π/2 радианы представляют собой иглу, перпендикулярную отмеченным линиям. Любой угол в этом диапазоне считается равновероятным результатом.
Две случайные величины , x и θ , независимы, [4] поэтому совместная функция плотности вероятности представляет собой произведение
Игла пересекает линию, если
Теперь есть два случая.
Интегрирование функции плотности совместной вероятности дает вероятность того, что игла пересечет линию:
Предположим, что l > t . В этом случае, интегрируя совместную функцию плотности вероятности, получаем:
где m ( θ ) — минимум между л/2 sin θ и т/2 .
Таким образом, выполняя приведенное выше интегрирование, мы видим, что при l > t вероятность того, что игла пересечет хотя бы одну линию, равна
или
Во втором выражении первый член представляет вероятность того, что угол иглы будет таким, что она всегда пересечет хотя бы одну линию. Правый член представляет вероятность того, что игла упадет под углом, где ее положение имеет значение, и пересечет линию.
В качестве альтернативы обратите внимание, что всякий раз, когда θ имеет такое значение, что l sin θ ≤ t , то есть в диапазоне 0 ≤ θ ≤ arcsin т/л , вероятность пересечения такая же, как и в случае короткой иглы. Однако если l sin θ > t , то есть arcsin т/л < θ ≤ π/2 вероятность постоянна и равна 1.
Следующее решение для случая «короткой иглы», хотя и эквивалентно приведенному выше, имеет более наглядный вид и позволяет избежать повторных интегралов.
Мы можем вычислить вероятность P как произведение двух вероятностей: P = P 1 · P 2 , где P 1 — вероятность того, что центр иглы окажется достаточно близко к линии, чтобы игла могла ее пересечь, а P 2 — вероятность того, что игла действительно пересечет линию, при условии, что центр находится в пределах досягаемости.
Глядя на иллюстрацию в предыдущем разделе, становится ясно, что игла может пересечь линию, если ее центр находится в пределах л/2 единиц с каждой стороны полосы. Добавление л/2 + л/2 с обеих сторон и разделив на всю ширину t , получим P 1 = л/т .
Теперь предположим, что центр находится в пределах досягаемости края полосы, и вычислим P 2. Для упрощения расчета можно предположить, что .
Пусть x и θ будут такими, как на иллюстрации в этом разделе. Если поместить центр иглы в x , игла пересечет вертикальную ось, если она попадет в диапазон 2 θ радиан из π радиан возможных ориентаций. Это представляет собой серую область слева от x на рисунке. Для фиксированного x мы можем выразить θ как функцию x : θ ( x ) = arccos( x ) . Теперь мы можем позволить x изменяться от 0 до 1 и проинтегрировать:
Перемножив оба результата, получаем P = P 1 · P 2 = л/т · 2/π = 2 л/тπ как указано выше.
Существует еще более элегантный и простой метод расчета "короткого игольного чехла". Конец иглы, наиболее удаленный от любой из двух линий, ограничивающих ее область, должен находиться на горизонтальном (перпендикулярном ограничивающим линиям) расстоянии l cos θ (где θ - угол между иглой и горизонталью) от этой линии, чтобы игла могла ее пересечь. Самое большое расстояние, на которое этот конец иглы может отойти от этой линии по горизонтали в своей области, равно t . Вероятность того, что наиболее удаленный конец иглы находится не далее, чем на расстоянии l cos θ от линии (и, таким образом, что игла пересечет линию) из общего расстояния t, на которое она может переместиться в своей области для 0 ≤ θ ≤ π/2 дается
Проблема короткой иглы может быть решена и без интегрирования, способом, который объясняет формулу для p из геометрического факта, что окружность диаметром t всегда (т.е. с вероятностью 1) пересекает расстояние t полос ровно в двух точках. Это решение было дано Жозефом -Эмилем Барбье в 1860 году [5] и также называется « лапшой Бюффона ».
В первом, более простом случае выше, полученную формулу для вероятности P можно переписать так:
Таким образом, если мы проведем эксперимент по оценке P , мы также получим оценку для π .
Предположим, мы бросаем n иголок и обнаруживаем, что h из этих иголок являются пересекающимися линиями, поэтому P аппроксимируется дробью час/н . Это приводит к формуле:
В 1901 году итальянский математик Марио Лаццарини провел эксперимент Буффона с иглой. Подбросив иглу 3408 раз, он получил известное приближение 355/113 для π , с точностью до шести знаков после запятой. [6] «Эксперимент» Лаццарини является примером предвзятости подтверждения , поскольку он был поставлен для воспроизведения уже хорошо известного приближения 355/113 (на самом деле, не существует лучшего рационального приближения с менее чем пятью цифрами в числителе и знаменателе, см. также Milü ), что дает более точное «предсказание» числа π, чем можно было бы ожидать от числа испытаний, как следует: [7]
Лаццарини выбрал иглы длиной 5/6 ширины полосок дерева. В этом случае вероятность того, что иголки пересекут линии, составляет 5/3π . Таким образом, если бы кто-то бросил n иголок и получил x пересечений, то можно было бы оценить π как
Итак, если Лаццарини стремился к результату 355/113 , ему нужны были n и x такие, что
или эквивалентно,
Для этого следует выбрать n как кратное 213, потому что тогда 113 н/213 — целое число; затем бросают n иголок и надеются получить ровно x = 113 н/213 успехов. Если кто-то уронил 213 иголок и получил 113 успехов, то он может с триумфом сообщить об оценке π с точностью до шести знаков после запятой. Если нет, можно просто провести еще 213 испытаний и надеяться на общее количество успехов 226; если нет, просто повторить по мере необходимости. Лаццарини провел 3408 = 213 × 16 испытаний, что делает вероятным, что это стратегия, которую он использовал для получения своей «оценки».
Вышеприведенное описание стратегии можно даже считать милосердным по отношению к Лаццарини. Статистический анализ промежуточных результатов, которые он сообщил для меньшего количества бросков, приводит к очень низкой вероятности достижения такого близкого соответствия ожидаемому значению на протяжении всего эксперимента. Это делает весьма возможным, что сам «эксперимент» никогда не был физически выполнен, а основывался на числах, придуманных воображением, чтобы соответствовать статистическим ожиданиям, но слишком хорошо, как оказалось. [7]
Однако голландский научный журналист Ханс ван Маанен утверждает, что статью Лаццарини никогда не следовало воспринимать слишком серьезно, поскольку читателям журнала (ориентированного на школьных учителей) было бы совершенно очевидно, что аппарат, который, по словам Лаццарини, построил, не может работать так, как описано. [8]
Теперь рассмотрим случай, когда плоскость содержит два набора параллельных линий, ортогональных друг другу, создавая стандартную перпендикулярную сетку. Наша цель — найти вероятность того, что игла пересечет хотя бы одну линию на сетке. Пусть a и b — стороны прямоугольника, содержащего середину иглы, длина которой равна l . Поскольку это случай короткой иглы, l < a , l < b . Пусть ( x , y ) обозначают координаты середины иглы, а φ — угол, образованный иглой и осью x . Подобно примерам, описанным выше, мы считаем x , y , φ независимыми равномерными случайными величинами в диапазонах 0 ≤ x ≤ a , 0 ≤ y ≤ b , − π/2 ≤ φ ≤ π/2 .
Чтобы решить такую задачу, мы сначала вычисляем вероятность того, что игла не пересекает ни одной линии, а затем берем ее дополнение. Мы вычисляем эту первую вероятность, определяя объем области, где игла не пересекает ни одной линии, а затем делим его на объем всех возможностей, V . Мы можем легко увидеть, что V = πab .
Пусть теперь V * — объем возможностей, при которых игла не пересекает ни одну линию. Разработано Ю. В. Успенским , [9]
где F ( φ ) — область, где игла не пересекает никакую линию под углом φ . Чтобы определить F ( φ ) , давайте сначала рассмотрим случай горизонтальных рёбер ограничивающего прямоугольника. Общая длина стороны равна a , а середина не должна находиться внутри л/2 cos φ любой из конечных точек ребра. Таким образом, общая допустимая длина без пересечения равна a − 2( л/2 cos φ ) или просто a − l cos φ . Эквивалентно, для вертикальных ребер с длиной b , мы имеем b ± l sin φ . ± учитывает случаи, когда φ положительно или отрицательно. Взяв положительный случай и затем добавив знаки абсолютного значения в окончательном ответе для общности, мы получаем
Теперь мы можем вычислить следующий интеграл:
Таким образом, вероятность того, что игла не пересечет никакую линию, равна
И наконец, если мы хотим вычислить вероятность P того, что игла пересечет хотя бы одну линию, нам нужно вычесть указанный выше результат из 1, чтобы вычислить его дополнение, что дает
Как упоминалось выше, эксперимент Бюффона с иглой можно использовать для оценки π . Этот факт справедлив и для расширения Лапласа, поскольку π также появляется в этом ответе. Затем естественным образом возникает следующий вопрос, который обсуждается Э. Ф. Шустером в 1974 году. [10] Является ли эксперимент Бюффона или Лапласа лучшим оценщиком значения π ? Поскольку в расширении Лапласа есть два набора параллельных линий, мы сравниваем N капель, когда есть сетка (Лаплас), и 2 N капель в исходном эксперименте Бюффона.
Пусть A — событие, при котором игла пересекает горизонтальную линию (параллельную оси x ).
и пусть B будет событием, при котором игла пересекает вертикальную линию (параллельную оси Y )
Для простоты алгебраической формулировки предположим, что a = b = t = 2 l , так что исходный результат в задаче Бюффона равен P ( A ) = P ( B ) = 1/π . Далее, пусть N = 100 капель.
Теперь давайте рассмотрим P ( AB ) для результата Лапласа, то есть вероятность того, что игла пересечет как горизонтальную, так и вертикальную линию. Мы знаем, что
Из приведенного выше раздела следует, что P ( A ′ B ′) или вероятность того, что игла не пересечет ни одной линии, равна
Мы можем найти P ( A ′ B ) и P ( AB ′), используя следующий метод:
Решая уравнения относительно P ( A ′ B ) и P ( AB ′ ) и подставляя это в исходное определение для P ( AB ) несколькими строками выше, получаем
Хотя это и не является необходимым для решения проблемы, теперь можно увидеть, что P ( A ′ B ) = P ( AB ′) = 3/4π . С приведенными выше значениями мы теперь можем определить, какой из этих оценщиков является лучшим оценщиком для π . Для варианта Лапласа пусть p̂ будет оценщиком вероятности того, что существует пересечение линий, такое что
Нас интересует дисперсия такой оценки, чтобы понять ее полезность или эффективность. Чтобы вычислить дисперсию p̂ , мы сначала вычисляем Var( x n + y n ) , где
Решая каждую часть по отдельности,
Из предыдущего раздела мы знаем, что
уступающий
Таким образом,
Возвращаясь к исходной задаче этого раздела, дисперсия оценки p̂ равна
Теперь давайте вычислим количество капель, M , необходимое для достижения той же дисперсии, что и 100 капель на перпендикулярных линиях. Если M < 200 , то мы можем сделать вывод, что установка только с параллельными линиями более эффективна, чем случай с перпендикулярными линиями. И наоборот, если M равно или больше 200, то эксперимент Бюффона также или менее эффективен, соответственно. Пусть q̂ будет оценкой для исходного эксперимента Бюффона. Тогда,
и
Решая для M ,
Таким образом, для получения той же уверенности, что и 100 капель в случае Лапласа, требуется 222 капли с параллельными линиями. Это на самом деле неудивительно, поскольку Cov( x n , y n ) < 0 . Поскольку x n и y n являются отрицательно коррелированными случайными величинами, они снижают общую дисперсию в оценке, которая является средним значением этих двух величин. Этот метод снижения дисперсии известен как метод антитетических переменных .