Доска Гальтона , также известная как ящик Гальтона или квинконс или бобовая машина (или неправильно доска Дальтона ), — это устройство, изобретенное Фрэнсисом Гальтоном [1] для демонстрации центральной предельной теоремы , в частности того, что при достаточном размере выборки биномиальное распределение приближается к нормальному распределению . Среди его приложений оно дало понимание регрессии к среднему значению или «возврата к посредственности».
Доска Гальтона состоит из вертикальной доски с чередующимися рядами штифтов. Бусины падают сверху и, когда устройство выровнено, отскакивают либо влево, либо вправо, ударяясь о штифты. В конце концов они собираются в контейнеры внизу, где высота столбцов бусин, накопленных в контейнерах, приближается к колоколообразной кривой . Наложение треугольника Паскаля на штифты показывает количество различных путей, по которым можно добраться до каждого контейнера. [2]
Крупномасштабные рабочие модели этого устройства, созданные Чарльзом и Рэй Имз, можно увидеть в постоянной экспозиции Mathematica: A World of Numbers... and Beyond в Бостонском музее науки , Нью-Йоркском зале науки или Музее Генри Форда . [3] Машина из музея Форда была представлена в павильоне IBM во время Всемирной выставки в Нью-Йорке 1964-65 годов , а затем появилась в Тихоокеанском научном центре в Сиэтле. [4] [5] Другая крупномасштабная версия представлена в вестибюле Index Fund Advisors в Ирвайне, Калифорния . [6]
Доски могут быть построены для других распределений путем изменения формы штифтов или смещения их в одном направлении, и даже возможны бимодальные доски. [7] Доска для логнормального распределения (обычного во многих естественных процессах , особенно биологических), которая использует равнобедренные треугольники различной ширины для «умножения» расстояния, пройденного бусинкой, вместо шагов фиксированного размера, которые «суммировались бы», была построена Якобусом Каптейном во время изучения и популяризации статистики логнормального распределения, чтобы помочь визуализировать его и продемонстрировать его правдоподобность. [8] По состоянию на 1963 год она хранилась в Университете Гронингена . [9] Существует также улучшенная логнормальная машина, которая использует перекошенные треугольники, правые стороны которых длиннее, и, таким образом, избегает смещения медианы бусин влево. [10]
Если бусина отскакивает вправо k раз по пути вниз (и влево на оставшихся колышках), она попадает в k -ю ячейку, считая слева. Обозначая количество рядов колышков в доске Гальтона через n , количество путей к k -й ячейке внизу задается биномиальным коэффициентом . Обратите внимание, что самая левая ячейка - это 0 -ячейка, следующая за ней - 1 -ячейка и т. д., а самая дальняя справа - n -ячейка, что делает общее количество ячеек равным n+1 (в каждой строке не обязательно должно быть больше колышков, чем число, идентифицирующее саму строку, например, в первой строке - 1 колышек, во второй - 2 колышка, пока не появится n -ячейка, в которой n колышков, что соответствует n+1 ячейкам). Если вероятность попадания мяча прямо на колышек равна p (что равно 0,5 на несмещенной машине уровня), вероятность того, что мяч попадет в k -ю ячейку, равна . Это функция массы вероятности биномиального распределения . Количество строк соответствует размеру биномиального распределения по количеству попыток, в то время как вероятность p каждой кегли равна p биномиального распределения .
Согласно центральной предельной теореме (точнее, теореме Муавра–Лапласа ), биномиальное распределение приближается к нормальному распределению при условии, что число рядов и число шаров оба большие. Изменение рядов приведет к разным стандартным отклонениям или ширине колоколообразной кривой или нормального распределения в ячейках.
Другая интерпретация, более точная с физической точки зрения, дается энтропией : поскольку энергия, переносимая каждой падающей бусиной, конечна, так что даже на любом кончике их столкновения хаотичны, поскольку производная не определена (нет способа заранее выяснить, какая сторона упадет), среднее значение и дисперсия каждой фасоли ограничены конечными значениями (они никогда не выйдут за пределы коробки), и возникает гауссова форма, поскольку это максимальное распределение вероятности энтропии для непрерывного процесса с определенным средним значением и дисперсией. Рост нормального распределения можно интерпретировать так, что вся возможная информация, переносимая каждой фасолью, связанная с тем, по какому пути она прошла, уже полностью потеряна из-за их столкновений на спуске.
Фрэнсис Гальтон написал в 1889 году свою книгу «Естественное наследование» :
Порядок в кажущемся хаосе: я едва ли знаю что-либо, способное так поразить воображение, как замечательная форма космического порядка, выраженная Законом Частоты Ошибок. Этот закон был бы олицетворен греками и обожествлен, если бы они знали о нем. Он царит с безмятежностью и полным самоуничижением среди самого дикого беспорядка. Чем больше толпа и чем больше кажущаяся анархия, тем совершеннее ее власть. Это высший закон Неразумности. Всякий раз, когда большой образец хаотических элементов берется в руки и выстраивается в порядке их величины, неожиданная и самая прекрасная форма регулярности оказывается скрытой все это время. [1] : 66
Было разработано несколько игр, в которых используется идея изменения траектории движения мячей или других предметов с помощью кеглей: