stringtranslate.com

Теорема о бесконечной обезьяне

Шимпанзе, вероятно, не писал «Гамлета» .

Теорема о бесконечной обезьяне гласит, что обезьяна, нажимающая клавиши на клавиатуре пишущей машинки в случайном порядке в течение бесконечного количества времени, почти наверняка напечатает любой заданный текст, включая все произведения Уильяма Шекспира . Фактически, обезьяна почти наверняка напечатает каждый возможный конечный текст бесконечное количество раз. Теорему можно обобщить, заявив, что любая последовательность событий, которая имеет ненулевую вероятность произойти , почти наверняка произойдет бесконечное количество раз, учитывая бесконечное количество времени или вселенную бесконечного размера .

В этом контексте «почти наверняка» — это математический термин, означающий, что событие происходит с вероятностью 1, а «обезьяна» — это не настоящая обезьяна, а метафора абстрактного устройства , которое производит бесконечную случайную последовательность букв и символов. Варианты теоремы включают несколько и даже бесконечное количество машинисток, а целевой текст варьируется от целой библиотеки до одного предложения.

Один из самых ранних примеров использования «метафоры обезьяны» принадлежит французскому математику Эмилю Борелю в 1913 году [1] , но первый пример, возможно, был еще раньше. Хорхе Луис Борхес проследил историю этой идеи от «О зарождении и уничтожении» Аристотеля и « De Natura Deorum » Цицерона ( О природе богов), через Блеза Паскаля и Джонатана Свифта , вплоть до современных заявлений с их культовыми обезьянами и пишущими машинками. [2] В начале 20-го века Борель и Артур Эддингтон использовали теорему для иллюстрации временных масштабов, подразумеваемых в основах статистической механики .

Решение

Прямое доказательство

Существует простое доказательство этой теоремы. В качестве введения напомним, что если два события статистически независимы , то вероятность того, что оба события произойдут, равна произведению вероятностей того, что каждое из них произойдет независимо. Например, если вероятность дождя в Москве в определенный день в будущем составляет 0,4, а вероятность землетрясения в Сан -Франциско в любой определенный день составляет 0,00003, то вероятность того, что оба события произойдут в один и тот же день, составляет 0,4 × 0,00003 = 0,000012 , предполагая , что они действительно независимы.

Рассмотрим вероятность набора слова banana на пишущей машинке с 50 клавишами. Предположим, что клавиши нажимаются случайным образом и независимо, то есть каждая клавиша имеет равные шансы быть нажатой независимо от того, какие клавиши были нажаты ранее. Вероятность того, что первая напечатанная буква будет 'b', составляет 1/50, а вероятность того, что вторая напечатанная буква будет 'a', также составляет 1/50 и т. д. Таким образом, вероятность того, что первые шесть букв составят слово banana, составляет:

(1/50) × (1/50) × (1/50) × (1/50) × (1/50) × (1/50) = (1/50) 6 = 1/15 625 000 000.

Результат — менее одного из 15 миллиардов, но не ноль.

Из вышесказанного следует, что вероятность не напечатать слово banana в заданном блоке из 6 букв равна 1 − (1/50) 6. Поскольку каждый блок печатается независимо, вероятность X n не напечатать слово banana в любом из первых n блоков из 6 букв равна:

По мере роста n X n становится меньше. Для n = 1 миллион X n примерно равно 0,9999, но для n = 10 миллиардов X n примерно равно 0,53, а для n = 100 миллиардов — примерно 0,0017. По мере того как n стремится к бесконечности, вероятность X n стремится к нулю; то есть, сделав n достаточно большим, X n можно сделать сколь угодно малым, [3] а вероятность ввода слова banana приближается к 100%. [a] Таким образом, вероятность появления слова banana в какой-то точке бесконечной последовательности нажатий клавиш равна единице.

Тот же аргумент применим, если мы заменим одну обезьяну, печатающую n последовательных блоков текста, на n обезьян, каждая из которых печатает один блок (одновременно и независимо). В этом случае X n = (1 − (1/50) 6 ) n — это вероятность того, что ни одна из первых n обезьян не напечатает слово «банан» правильно с первой попытки. Следовательно, по крайней мере одна из бесконечного множества обезьян ( с вероятностью, равной единице ) напечатает текст так же быстро, как это сделал бы совершенно точный человек-машинист, копирующий его с оригинала.

Бесконечные строки

Это можно выразить более общо и компактно в терминах строк , которые представляют собой последовательности символов, выбранных из некоторого конечного алфавита :

Оба легко следуют из второй леммы Бореля–Кантелли . Для второй теоремы пусть E k будет событием , что k -я строка начинается с данного текста. Поскольку это имеет некоторую фиксированную ненулевую вероятность p возникновения, E k независимы, и приведенная ниже сумма расходится,

вероятность того, что возникнет бесконечно много E k , равна 1. Первая теорема доказывается аналогично: можно разделить случайную строку на неперекрывающиеся блоки, соответствующие размеру желаемого текста, и сделать E k событием, при котором k -й блок равен желаемой строке. [b]

Вероятности

Однако для физически значимых количеств обезьян, печатающих в течение физически значимых промежутков времени, результаты обратные. Если бы было столько же обезьян, сколько атомов в наблюдаемой вселенной, печатающих чрезвычайно быстро в течение триллионов раз больше времени существования вселенной, вероятность того, что обезьяны воспроизведут хотя бы одну страницу Шекспира, непостижимо мала.

Игнорируя пунктуацию, пробелы и заглавные буквы, обезьяна, печатающая буквы равномерно и случайным образом, имеет шанс один из 26 правильно напечатать первую букву Гамлета . У нее есть шанс один из 676 (26 × 26) напечатать первые две буквы. Поскольку вероятность уменьшается экспоненциально , при 20 буквах у нее уже есть только шанс один из 26 20 = 19 928 148 895 209 409 152 340 197 376 [c] (почти 2 × 10 28 ). В случае всего текста Гамлета вероятности настолько исчезающе малы, что их невозможно себе представить. Текст Гамлета содержит приблизительно 130 000 букв. [d] Таким образом, вероятность правильного набора текста с первой попытки составляет один к 3,4 × 10 183 946. Среднее количество букв, которое нужно набрать, чтобы текст появился, также составляет 3,4 × 10 183 946 , [e] или, включая знаки препинания, 4,4 × 10 360 783 . [f]

Даже если бы каждый протон в наблюдаемой Вселенной (которая оценивается примерно в 10 80 ) был обезьяной с пишущей машинкой, печатающей от Большого взрыва до конца Вселенной (когда протоны, возможно, уже не будут существовать ), им все равно потребовалось бы гораздо больше времени — более чем на триста шестьдесят тысяч порядков больше — чтобы иметь хотя бы 1 из 10 500 шансов на успех. Другими словами, для одного из триллионного шанса на успех должно было бы быть 10 360 641 наблюдаемых вселенных, состоящих из протонных обезьян. [g] Как написали Киттель и Кремер в своем учебнике по термодинамике , области, статистические основы которой мотивировали первые известные описания печатающих обезьян, [5] «Вероятность Гамлета , следовательно, равна нулю в любом операциональном смысле события ...», и утверждение, что обезьяны должны в конечном итоге добиться успеха, «дает вводящий в заблуждение вывод об очень, очень больших числах».

На самом деле, вероятность успеха того, что такая вселенная, состоящая из обезьян, сможет напечатать какой-либо конкретный документ длиной всего в 79 символов, составляет менее одного на триллион. [h]

Почти наверняка

Вероятность того, что бесконечная случайно сгенерированная строка текста будет содержать определенную конечную подстроку, равна 1. Однако это не означает, что отсутствие подстроки «невозможно», несмотря на то, что отсутствие имеет априорную вероятность 0. Например, бессмертная обезьяна может случайным образом набрать G в качестве своей первой буквы, G в качестве своей второй и G в качестве каждой отдельной буквы, после чего получится бесконечная строка из G; ни в какой момент обезьяна не должна быть «вынуждена» набрать что-либо еще. (Предположить обратное означает совершить ошибку игрока .) Какой бы длинной ни была случайно сгенерированная конечная строка, существует небольшая, но ненулевая вероятность того, что она окажется состоящей из одного и того же символа, повторяющегося на протяжении всей строки; эта вероятность стремится к нулю по мере того, как длина строки стремится к бесконечности. В такой монотонной последовательности нет ничего особенного, за исключением того, что ее легко описать; тот же факт применим к любой именуемой конкретной последовательности, например, «RGRGRG», повторяющейся вечно, или «ab-aa-bb-aaa-bbb-...», или «Три, Шесть, Девять, Двенадцать…».

Если у гипотетической обезьяны есть пишущая машинка с 90 равновероятными клавишами, которые включают цифры и знаки препинания, то первыми набранными клавишами могут быть «3.14» (первые три цифры числа pi ) с вероятностью (1/90) 4 , что составляет 1/65 610 000. Равновероятно и любая другая строка из четырех символов, разрешенная пишущей машинкой, например «GGGG», «mATh» или «q%8e». Вероятность того, что 100 случайно набранных клавиш будут состоять из первых 99 цифр числа pi (включая клавишу-разделитель) или любой другой конкретной последовательности такой длины, намного ниже: (1/90) 100 . Если выделенная обезьяне длина текста бесконечна, вероятность набора только цифры числа pi равна 0, что так же возможно (математически вероятно), как и набор только Gs (также вероятность 0).

То же самое относится к случаю набора определенной версии «Гамлета», за которой следуют бесконечные копии самой себя; или «Гамлета», за которым сразу следуют все цифры числа «пи»; эти конкретные строки одинаково бесконечны по длине, они не запрещены условиями мыслительной задачи, и каждая из них имеет априорную вероятность 0. Фактически, любая конкретная бесконечная последовательность, которую наберет бессмертная обезьяна, будет иметь априорную вероятность 0, даже если обезьяна должна что-то напечатать.

Это расширение принципа, согласно которому конечная строка случайного текста имеет все меньшую и меньшую вероятность быть определенной строкой, чем она длиннее (хотя все определенные строки одинаково маловероятны). Эта вероятность стремится к 0, когда строка стремится к бесконечности. Таким образом, вероятность того, что обезьяна наберет бесконечно длинную строку, например, все цифры числа пи по порядку, на 90-клавишной клавиатуре, составляет (1/90) , что равно (1/∞), что по сути равно 0. В то же время вероятность того, что последовательность содержит определенную подпоследовательность (например, слово MONKEY, или 12-ю по 999-ю цифры числа пи, или версию Библии короля Якова), увеличивается по мере увеличения общей строки. Эта вероятность стремится к 1, когда общая строка стремится к бесконечности, и, таким образом, исходная теорема верна.

Соответствие между строками и числами

Упрощение мысленного эксперимента: у обезьяны может быть пишущая машинка всего с двумя клавишами: 1 и 0. Бесконечно длинная строка, полученная таким образом, будет соответствовать двоичным цифрам конкретного действительного числа от 0 до 1. Счетно бесконечное множество возможных строк заканчивается бесконечными повторениями, что означает, что соответствующее действительное число является рациональным . Примерами служат строки, соответствующие одной трети (010101...), пяти шестым (11010101...) и пяти восьмым (1010000...). Только подмножество таких строк действительных чисел (хотя и счетно бесконечное подмножество) содержит весь Гамлет (предполагая, что текст подвергнут числовому кодированию, такому как ASCII ).

Между тем, существует несчетное бесконечное множество строк, которые не заканчиваются таким повторением; они соответствуют иррациональным числам . Их можно отсортировать на два несчетных бесконечных подмножества: те, которые содержат Hamlet , и те, которые не содержат. Однако «самое большое» подмножество всех действительных чисел — это те, которые не только содержат Hamlet , но и содержат все остальные возможные строки любой длины и с равным распределением таких строк. Эти иррациональные числа называются нормальными . Поскольку почти все числа являются нормальными, почти все возможные строки содержат все возможные конечные подстроки. Следовательно, вероятность того, что обезьяна наберет нормальное число, равна 1. Те ​​же принципы применяются независимо от количества клавиш, из которых обезьяна может выбирать; 90-клавишную клавиатуру можно рассматривать как генератор чисел, записанных в базе 90.

История

Статистическая механика

В одной из форм, в которой эта теорема известна теперь вероятностникам, с ее «дактилографическими» [т. е. печатающими] обезьянами ( фр . singes dactylographes ; французское слово singe охватывает как обезьян, так и человекообразных обезьян), она появилась в статье Эмиля Бореля 1913 года « Mécanique Statique et Irréversibilité » ( Статическая механика и необратимость ) [1] и в его книге «Le Hasard» в 1914 году [6]. Его «обезьяны» — это не настоящие обезьяны; скорее, они являются метафорой воображаемого способа создания большой случайной последовательности букв. Борель сказал, что если бы миллион обезьян печатали по десять часов в день, то крайне маловероятно, что их производительность в точности равнялась бы всем книгам самых богатых библиотек мира; и все же, в сравнении, еще менее вероятно, что законы статистической механики когда-либо будут нарушены, даже ненадолго.

Физик Артур Эддингтон развил идею Бореля в своей работе «Природа физического мира» (1928), написав:

Если я позволю своим пальцам праздно бродить по клавишам пишущей машинки, может случиться так, что моя тирада превратится в понятное предложение. Если бы армия обезьян бренчала на пишущих машинках, они могли бы написать все книги в Британском музее. Вероятность того, что они это сделают, определенно более благоприятна, чем вероятность того, что молекулы вернутся в одну половину сосуда. [7] [8]

Эти изображения предлагают читателю рассмотреть невероятную невероятность большого, но конечного числа обезьян, работающих в течение большого, но конечного количества времени, производящих значительную работу, и сравнить это с еще большей невероятностью определенных физических событий. Любой физический процесс, который еще менее вероятен, чем успех таких обезьян, фактически невозможен, и можно с уверенностью сказать, что такой процесс никогда не произойдет. [5] Из контекста ясно, что Эддингтон не предполагает, что вероятность этого события заслуживает серьезного рассмотрения. Напротив, это была риторическая иллюстрация того факта, что ниже определенных уровней вероятности термин « невероятный» функционально эквивалентен термину «невозможно» .

Истоки и «Полная библиотека»

В эссе 1939 года под названием «The Total Library» аргентинский писатель Хорхе Луис Борхес проследил концепцию бесконечной обезьяны до « Метафизики » Аристотеля . Объясняя взгляды Левкиппа , который считал, что мир возник через случайное сочетание атомов, Аристотель отмечает, что сами атомы однородны, а их возможные расположения отличаются только формой, положением и порядком. В « О возникновении и разрушении » греческий философ сравнивает это с тем, как трагедия и комедия состоят из одних и тех же «атомов», т. е . букв алфавита. [9] Три столетия спустя в трактате Цицерона « De natura deorum » ( «О природе богов ») высказывались возражения против эпикурейского атомистического мировоззрения:

Возможно ли, чтобы кто-либо видел эти вещи, и все же представлял себе, что определенные твердые и индивидуальные тела движутся под действием своей естественной силы и гравитации, и что мир, столь прекрасно украшенный, был создан их случайным скоплением? Тот, кто верит в это, может также поверить, что если бы большое количество двадцати одной буквы, составленной из золота или любого другого материала, было брошено на землю, они бы расположились в таком порядке, что разборчиво образовали бы Анналы Энния . Я сомневаюсь, что судьба могла бы сделать из них хотя бы один стих. [10]

Борхес прослеживает историю этого аргумента через Блеза Паскаля и Джонатана Свифта , [11] затем замечает, что в его время словарь изменился. К 1939 году идиома была такой: «полдюжины обезьян, снабженных пишущими машинками, за несколько вечностей произведут все книги в Британском музее». (К чему Борхес добавляет: «Строго говоря, одной бессмертной обезьяны было бы достаточно».) Затем Борхес представляет себе содержимое Полной библиотеки, которую это предприятие произведет, если довести его до крайности:

Все было бы в его слепых томах. Все: подробная история будущего, « Египтяне » Эсхила , точное число раз, которое воды Ганга отражали полет сокола, тайное и истинное имя Рима , энциклопедия, которую бы составил Новалис , мои сны и полусны на рассвете 14 августа 1934 года, доказательство теоремы Пьера Ферма , ненаписанные главы Эдвина Друда , те же главы, переведенные на язык, на котором говорят гараманты , парадоксы, придуманные Беркли относительно Времени, но не опубликованные, железные книги Уризена, преждевременные прозрения Стефана Дедала , которые были бы бессмысленны до цикла в тысячу лет, гностическое Евангелие Василида , песня, которую пели сирены , полный каталог Библиотеки, доказательство неточности этого каталога. Все: но на каждую осмысленную строку или точный факт пришлось бы миллионы бессмысленных какофоний, словесных кавардаков и лепетов. Все: но все поколения человечества могли бы пройти перед головокружительными полками — полками, которые стирают день и на которых лежит хаос — когда-нибудь вознаградить их сносной страницей. [12]

Концепция всеобщей библиотеки Борхеса стала главной темой его популярного рассказа 1941 года « Вавилонская библиотека », в котором описывается невообразимо огромная библиотека, состоящая из взаимосвязанных шестиугольных комнат, в которых вместе содержатся все возможные тома, которые можно составить из букв алфавита и некоторых знаков препинания.

Настоящие обезьяны

В 2002 году [13] преподаватели и студенты курса искусств MediaLab в Университете Плимута использовали грант в размере 2000 фунтов стерлингов от Художественного совета для изучения литературного творчества настоящих обезьян. Они оставили компьютерную клавиатуру в вольере шести хохлатых макак Celebes в зоопарке Пейнтона в Девоне, Англия, с 1 мая по 22 июня, с радиосвязью для трансляции результатов на веб-сайте. [14]

Обезьяны не только ничего не напечатали, но и напечатали целых пять страниц [15], в основном состоящих из буквы «S», [13] главный самец начал бить по клавиатуре камнем, а другие обезьяны последовали за ним, чтобы помочиться и испражниться на машине. [16] Майк Филлипс, директор университетского Института цифровых искусств и технологий (i-DAT), сказал, что финансируемый художниками проект был в первую очередь перформансом , и они узнали «ужасно много» из него. Он пришел к выводу, что обезьяны «не являются случайными генераторами. Они сложнее этого. ... Они были весьма заинтересованы в экране, и они видели, что когда они печатали букву, что-то происходило. Там был уровень намерения». [14] [17]

Заявки и критика

Эволюция

Томасу Хаксли иногда ошибочно приписывают предложение варианта этой теории в его дебатах с Сэмюэлем Уилберфорсом .

В своей книге 1931 года «Таинственная Вселенная » соперник Эддингтона Джеймс Джинс приписал притчу об обезьяне некоему «Гексли», предположительно имея в виду Томаса Генри Гексли . Эта атрибуция неверна. [18] Сегодня иногда сообщается, что Гексли применил этот пример в ныне легендарных дебатах по поводу книги Чарльза Дарвина «О происхождении видов» с англиканским епископом Оксфорда Сэмюэлем Уилберфорсом, состоявшихся на заседании Британской ассоциации содействия развитию науки в Оксфорде 30 июня 1860 года. Эта история страдает не только от отсутствия доказательств, но и от того факта, что в 1860 году пишущая машинка еще не была коммерчески доступна . [19]

Несмотря на изначальную путаницу, аргументы об обезьяне и пишущей машинке теперь распространены в спорах об эволюции. В качестве примера христианской апологетики Дуг Пауэлл утверждал, что даже если обезьяна случайно напечатает буквы Гамлета , она не сможет создать Гамлета, потому что у нее не было намерения общаться. Его параллельный вывод заключается в том, что естественные законы не могут производить информационное содержание в ДНК . [20] Более распространенный аргумент представлен преподобным Джоном Ф. Макартуром , который утверждал, что генетические мутации, необходимые для создания ленточного червя из амебы, столь же маловероятны, как и обезьяна, печатающая монолог Гамлета, и, следовательно, шансы против эволюции всей жизни невозможно преодолеть. [21]

Эволюционный биолог Ричард Докинз использует концепцию печатающей обезьяны в своей книге «Слепой часовщик», чтобы продемонстрировать способность естественного отбора производить биологическую сложность из случайных мутаций . В эксперименте по моделированию Докинз заставляет свою программу-ласку производить фразу Гамлета METHINKS IT IS LIKE A WEASEL , начиная со случайно типированного родителя, «размножая» последующие поколения и всегда выбирая наиболее близкое соответствие из потомства, которое является копиями родителя со случайными мутациями. Вероятность появления целевой фразы за один шаг крайне мала, однако Докинз показал, что ее можно быстро произвести (примерно за 40 поколений) с помощью кумулятивного отбора фраз. Случайный выбор дает сырой материал, в то время как кумулятивный отбор передает информацию. Однако, как признает Докинз, программа-ласка является несовершенной аналогией эволюции, поскольку фразы-«потомки» были отобраны «в соответствии с критерием сходства с отдаленной идеальной целью». Напротив, утверждает Докинз, эволюция не имеет долгосрочных планов и не движется к какой-то отдаленной цели (например, к людям). Программа Weasel вместо этого призвана проиллюстрировать разницу между неслучайным кумулятивным отбором и случайным одношаговым отбором. [22] В терминах аналогии с печатающей обезьяной это означает, что Ромео и Джульетта могли бы быть созданы относительно быстро, если бы были помещены под ограничения неслучайного отбора дарвиновского типа, потому что функция приспособленности будет иметь тенденцию сохранять на месте любые буквы, которые случайно совпадают с целевым текстом, улучшая каждое последующее поколение печатающих обезьян.

Другой путь исследования аналогии между эволюцией и неконтролируемой обезьяной заключается в проблеме, что обезьяна печатает только одну букву за раз, независимо от других букв. Хью Петри утверждает, что требуется более сложная установка, в его случае не для биологической эволюции, а для эволюции идей:

Чтобы получить правильную аналогию, нам пришлось бы снабдить обезьяну более сложной пишущей машинкой. Она должна была бы включать целые елизаветинские предложения и мысли. Она должна была бы включать елизаветинские убеждения о моделях человеческих действий и причинах, елизаветинскую мораль и науку, а также языковые модели для их выражения. Вероятно, она даже должна была бы включать описание видов опыта, которые сформировали структуру убеждений Шекспира как конкретного примера елизаветинца. Тогда, возможно, мы могли бы позволить обезьяне играть с такой пишущей машинкой и производить варианты, но невозможность получения шекспировской пьесы больше не очевидна. То, что варьируется, на самом деле инкапсулирует большую часть уже достигнутых знаний. [23]

Джеймс У. Валентайн , признавая, что классическая задача обезьяны невыполнима, находит, что существует стоящая аналогия между письменным английским языком и геномом многоклеточных животных в другом смысле: оба имеют «комбинаторные, иерархические структуры», которые существенно ограничивают огромное количество комбинаций на уровне алфавита. [24]

Закон Ципфа

Закон Ципфа гласит, что частота слов является степенной функцией его ранга частоты: где — действительные числа. Если предположить, что обезьяна печатает случайным образом, с фиксированной и ненулевой вероятностью нажатия каждой клавиши с буквой или пробела, то текст, созданный обезьяной, следует закону Ципфа. [25]

Литературная теория

В 1938 году Р. Г. Коллингвуд утверждал, что искусство не может быть создано случайно, и саркастически ответил своим критикам:

... некоторые ... отрицали это предложение, указывая, что если бы обезьяна играла с пишущей машинкой ... она бы напечатала ... полный текст Шекспира. Любой читатель, которому нечего делать, может развлечь себя, подсчитывая, сколько времени потребуется, чтобы вероятность стала стоящей ставки. Но интерес предложения заключается в раскрытии психического состояния человека, который может идентифицировать «произведения» Шекспира с серией букв, напечатанных на страницах книги ... [26]

Нельсон Гудман занял противоположную позицию, проиллюстрировав свою точку зрения вместе с Кэтрин Элджин на примере произведения Борхеса « Пьер Менар, автор «Дон Кихота »».

То, что написал Менар, — это просто еще одна запись текста. Любой из нас может сделать то же самое, как и печатные станки и фотокопировальные аппараты. Действительно, нам говорят, что если бы бесконечно много обезьян... в конечном итоге создали бы копию текста. Эта копия, как мы утверждаем, была бы таким же экземпляром произведения, как рукопись Сервантеса , рукопись Менара и каждая копия книги, которая когда-либо была или будет напечатана. [27]

В другом тексте Гудман поясняет: «То, что обезьяна могла предположительно создать свою копию случайным образом, не имеет значения. Это один и тот же текст, и он открыт для всех тех же интерпретаций...» Жерар Женетт отвергает аргумент Гудмана, как предвосхищающий вопрос . [28]

Для Хорхе Х. Э. Грасиа вопрос об идентичности текстов приводит к другому вопросу — вопросу об авторе. Если обезьяна способна напечатать Гамлета , несмотря на то, что у нее нет намерения что-то значить и, следовательно, она не может считаться автором, то, по-видимому, тексты не требуют авторов. Возможные решения включают утверждение, что тот, кто находит текст и идентифицирует его как Гамлета , является автором; или что Шекспир является автором, обезьяна — его агентом, а нашедший — просто пользователем текста. Эти решения имеют свои собственные трудности, поскольку текст, по-видимому, имеет смысл, отдельный от других агентов: что, если обезьяна действует до рождения Шекспира, или если Шекспир никогда не рождается, или если никто никогда не найдет машинописный текст обезьяны? [29]

Генерация случайных документов

Теорема касается мысленного эксперимента , который не может быть полностью реализован на практике, поскольку, как предсказывают, он потребует непомерно больших затрат времени и ресурсов. Тем не менее, она вдохновила на усилия по генерации конечного случайного текста.

Согласно статье в The New Yorker , одна компьютерная программа, запущенная Дэном Оливером из Скоттсдейла, штат Аризона, выдала результат 4 августа 2004 года: после того, как группа проработала 42 162 500 000 миллиардов миллиардов обезьяно-лет, одна из «обезьян» набрала: «ВАЛЕНТИНА. Прекратите Idor:eFLP0FRjWK78aXzVOwm)-';8.t«Первые 19 букв этой последовательности можно найти в «Двух веронцах». Другие команды воспроизвели 18 символов из «Тимона Афинского», 17 из «Троила и Крессиды» и 16 из «Ричарда II». [30]

Веб-сайт под названием The Monkey Shakespeare Simulator , запущенный 1 июля 2003 года, содержал Java-апплет , который имитировал большую популяцию обезьян, печатающих случайным образом, с заявленным намерением посмотреть, сколько времени потребуется виртуальным обезьянам, чтобы создать полную пьесу Шекспира от начала до конца. Например, он создал эту частичную строку из Генриха IV, часть 2 , сообщая, что потребовалось «2,737,850 миллионов миллиардов миллиардов миллиардов обезьяньих лет», чтобы достичь 24 совпадающих символов:

СЛУХ. Откройте уши; 9r"5j5&?OWTY Z0d

Из-за ограничений вычислительной мощности программа использовала вероятностную модель (используя генератор случайных чисел или ГСЧ) вместо фактической генерации случайного текста и сравнения его с Шекспиром. Когда симулятор «обнаруживал совпадение» (то есть ГСЧ генерировал определенное значение или значение в определенном диапазоне), симулятор имитировал совпадение, генерируя совпадающий текст. [31]

Тестирование генераторов случайных чисел

Вопросы о статистике, описывающей, как часто идеальная обезьяна должна набирать определенные строки, переводятся в практические тесты для генераторов случайных чисел ; они варьируются от простых до «довольно сложных». Профессора компьютерных наук Джордж Марсалья и Ариф Заман сообщают, что они называли одну такую ​​категорию тестов «перекрывающимися m- кортежными тестами» на лекциях, поскольку они касаются перекрывающихся m-кортежей последовательных элементов в случайной последовательности. Но они обнаружили, что называние их «обезьяньими тестами» помогло мотивировать эту идею у студентов. Они опубликовали отчет о классе тестов и их результатах для различных ГСЧ в 1993 году. [32]

В популярной культуре

Теорема о бесконечной обезьяне и связанные с ней образы считаются популярной и общеизвестной иллюстрацией математики вероятности, широко известной широкой публике из-за ее распространения через массовую культуру, а не через формальное образование. [i] Этому способствует врожденный юмор, вытекающий из образа настоящих обезьян, барабанящих на пишущих машинках, и являющийся популярной визуальной шуткой.

Цитата, приписываемая [33] [34] речи Роберта Виленски 1996 года, гласила: «Мы слышали, что миллион обезьян за миллионом клавиатур могли бы воспроизвести все произведения Шекспира; теперь, благодаря Интернету, мы знаем, что это неправда».

Устойчивая, широкая популярность теоремы была отмечена во введении к статье 2001 года «Обезьяны, пишущие машинки и сети: Интернет в свете теории случайного превосходства». [35] В 2002 году в статье в The Washington Post говорилось: «Многие люди развлекались с известной идеей о том, что бесконечное число обезьян с бесконечным числом пишущих машинок и бесконечным количеством времени могли бы в конечном итоге написать произведения Шекспира». [36] В 2003 году ранее упомянутый финансируемый Советом по искусству эксперимент с участием настоящих обезьян и компьютерной клавиатуры получил широкое освещение в прессе. [13] В 2007 году теорема была включена журналом Wired в список восьми классических мысленных экспериментов . [37]

Короткая одноактная пьеса американского драматурга Дэвида Айвза «Слова, слова, слова » из сборника «Всё вовремя » высмеивает концепцию теоремы о бесконечной обезьяне.

В 2015 году Balanced Software выпустила Monkey Typewriter в Microsoft Store. [38] Программное обеспечение генерирует случайный текст, используя формулу строки теоремы о бесконечной обезьяне. Программное обеспечение запрашивает сгенерированный текст на предмет введенных пользователем фраз. Однако программное обеспечение не следует считать реалистичным представлением теории. Это скорее практическое представление теории, а не научная модель того, как случайным образом генерировать текст.

Смотрите также

Примечания

  1. ^ Это показывает, что вероятность ввода слова «банан» в одном из предопределенных неперекрывающихся блоков из шести букв стремится к 1. Кроме того, слово может появиться в двух блоках, поэтому данная оценка является консервативной.
  2. ^ Первая теорема доказана аналогичным, хотя и более косвенным способом в работе Gut (2005). [4]
  3. ^ Почти 20 октиллионов
  4. ^ Использован текст «Гамлета» с сайта gutenberg.org., всего 132680 букв алфавита и 199749 символов
  5. ^ Для любой требуемой строки из 130 000 букв из набора 'a'-'z' среднее количество букв, которое необходимо набрать, чтобы строка появилась, составляет (округленно) 3,4 × 10 183 946 , за исключением случая, когда все буквы требуемой строки равны, в этом случае значение примерно на 4% больше, 3,6 × 10 183 946 . В этом случае отсутствие правильной строки, начинающейся с определенной позиции, снижает примерно на 4% вероятность правильной строки, начинающейся со следующей позиции (т. е. для перекрывающихся позиций события наличия правильной строки не являются независимыми; в этом случае существует положительная корреляция между двумя успехами, поэтому вероятность успеха после неудачи меньше, чем вероятность успеха в целом). Число 3,4 × 10 183 946 получено из n = 26 130 000 путем логарифмирования обеих частей: log 10 ( n ) = 1300 000 × log 10 (26) = 183946,5352, следовательно, n = 10 0,5352  × 10 183946 = 3,429 × 10 183946 .
  6. ^ 26 букв × 2 для заглавных букв, 12 для знаков препинания = 64, 199749×log 10 (64) = 4,4 × 10 360 783 (это щедрое число, поскольку предполагает, что заглавные буквы — это отдельные клавиши, а не комбинация клавиш, что значительно усложняет задачу).
  7. ^ В наблюдаемой Вселенной ≈10 80  протонов. Предположим, что обезьяны пишут в течение 10 38 лет (10 20  лет — это когда все остатки звезд либо будут выброшены из своих галактик, либо упадут в черные дыры , 10 38 лет — это когда все, кроме 0,1% протонов, распадутся ). Предположим, что обезьяны печатают без остановки со скоростью 400  слов в минуту (мировой рекорд — 216  ​​слов в минуту в течение одной минуты), это около 2000 символов в минуту (средняя длина слова Шекспира — чуть меньше 5 букв). В году около полумиллиона минут, это означает, что каждая обезьяна печатает полмиллиарда символов в год. Это дает в общей сложности 10 80 × 10 38 × 10 9 = 10 127 напечатанных букв, что все еще равно нулю по сравнению с 10 360 783. Для одного шанса из триллиона умножьте набранные буквы на триллион: 10 127 × 10 15 = 10 145. 10 360 783 / 10 145 = 10 360 641 .
  8. ^ Как объяснено в "More monkeys". Архивировано из оригинала 18 апреля 2015 года . Получено 4 декабря 2013 года .Задачу можно аппроксимировать еще больше: 10 145 /log 10 (64) = 78,9 символов.
  9. ^ Примеры теорем, упоминаемых как пословица, включают: Скулер, Джонатан В.; Дугал, Соня (1999). «Почему креативность не похожа на пословицу о печатающей обезьяне». Психологическое исследование . 10 (4).; и Кестлер, Артур (1972). Дело жабы-повитухи . Нью-Йорк. стр. 30. Неодарвинизм действительно доводит материализм девятнадцатого века до его крайних пределов — до пресловутой обезьяны за пишущей машинкой, которая по чистой случайности нажимает нужные клавиши, чтобы создать сонет Шекспира.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )Последнее взято из «Притчи об обезьянах»., сборник исторических ссылок на теорему в различных форматах.

Ссылки

  1. ^ аб Борель, Эмиль (1913). «Статическая механика и необратимость». Journal de Physique Théorique et Appliquée (на французском языке). 3 (1): 189–196. doi : 10.1051/jphystap: 019130030018900. ISSN  0368-3893. Мысли о том, что они одеты в миллион синглов, и их опасаются прикосновения к машине в écrire и que […] эти синглы-дактилографы трудятся вместе с миллионом машин в разных типах. […] Au bout d'un an, [leurs] тома se trouveraient Renfermer la копия точных книг всей природы и всех языков, сохраняемых в плюс богатых библиотеках мира.
  2. Хорхе Луис Борхес, «The Total Library», 1939. Включено в сборник Selected Non-fictions (1999). Под редакцией Элиота Вайнбергера. Нью-Йорк: Viking
  3. ^ Айзек, Ричард Э. (1995). Удовольствия вероятности . Нью-Йорк: Springer. С. 48–50. ISBN 0-387-94415-XOCLC  610945749– Айзек немедленно обобщает этот аргумент на переменный текст и размер алфавита; общий основной вывод находится на странице 50 .{{cite book}}: CS1 maint: постскриптум ( ссылка )
  4. ^ Гут, Аллан (2005). Вероятность: курс для выпускников . Springer. стр. 97–100. ISBN 0-387-22833-0.
  5. ^ ab Kittel, Charles ; Kroemer, Herbert (1980). Тепловая физика (2-е изд.). Сан-Франциско: WH Freeman Company. стр. 53. ISBN 0-7167-1088-9. OCLC  5171399.
  6. ^ Борель, Эмиль (1914). Ла Хазар (на французском языке). Париж: Феликс Алькан. п. 164.Альтернативный URL-адрес
  7. ^ Артур Эддингтон (1928). Природа физического мира: Гиффордские лекции. Нью-Йорк: Macmillan. С. 72. ISBN 0-8414-3885-4.
  8. ^ Эддингтон, Артур. "Глава IV: Разрушение Вселенной". Природа физического мира 1926–1927: Лекции Гиффорда . Архивировано из оригинала 2009-03-08 . Получено 2012-01-22 .
  9. ^ Аристотель, Περὶ γενέσεως καὶ φθορᾶς ( О порождении и коррупции ), 315b14.
  10. Марк Туллий Цицерон, De natura deorum , 2.37. Перевод из «Тускуланских рассуждений» Цицерона; также «Трактаты о природе богов» и «О государстве» , К. Д. Йонг, главный переводчик, Нью-Йорк, издательство Harper & Brothers, Franklin Square. (1877). Загружаемый текст.
  11. ^ В английском переводе "The Total Library" название эссе Свифта указано как "Trivial Essay on the Faculties of the Soul". Соответствующая ссылка вместо этого: Swift, Jonathan, Temple Scott et al. "A Tritical Essay upon the Faculties of the Mind". The Prose Works of Jonathan Swift, Volume 1. London: G. Bell, 1897, pp. 291-296. Архив Интернета
  12. ^ Борхес, Хорхе Луис (август 1939 г.). «La biblioteca total» [Общая библиотека]. Сур . № 59.переиздано в Selected Non-Fictions . Перевод Weinberger, Eliot . Penguin. 1999. ISBN 0-670-84947-2.
  13. ^ abc "Заметки к полному собранию сочинений Шекспира". vivaria.net . 2002. Архивировано из оригинала 2007-07-16.– некоторые вырезки из газет.
  14. ^ ab "Нет слов, чтобы описать игру обезьян". BBC News . 2003-05-09 . Получено 2009-07-25 .
  15. ^ "Заметки к полному собранию сочинений Шекспира" (PDF) . Архивировано из оригинала (PDF) 2009-03-18.
  16. ^ К., Альфред (апрель 2013 г.). «Конечные обезьяны не печатают: история об интерпретациях вероятности». Альфред К. Архивировано из оригинала 2022-03-31 . Получено 2023-05-11 .
  17. ^ "Обезьяны не пишут Шекспира". Wired News . 2003-05-09. Архивировано из оригинала 2004-02-01 . Получено 2007-03-02 .
  18. ^ Padmanabhan, Thanu (2005). «Темная сторона астрономии». Nature . 435 (7038): 20–21. Bibcode : 2005Natur.435...20P. doi : 10.1038/435020a . Платт, Сьюзи (1993). С уважением цитируется: словарь цитат . Barnes & Noble. С. 388–389. ISBN 0-88029-768-9.
  19. ^ Решер, Николас (2006). Исследования по философии науки: контрфактуальная перспектива квантовой запутанности. Ontos Verlag. стр. 103. ISBN 978-3-11-032646-8.
  20. ^ Powell, Doug (2006). Holman Quicksource Guide to Christian Apologetics . Broadman & Holman. стр. 60, 63. ISBN 0-8054-9460-X.
  21. ^ Макартур, Джон (2003). Думайте по-библейски!: Возвращение христианского мировоззрения . Crossway Books. стр. 78–79. ISBN 1-58134-412-0.
  22. ^ Докинз, Ричард (1996). Слепой часовщик. WW Norton & Co. стр. 46–50. ISBN 0-393-31570-3.
  23. Как цитируется в Blachowicz, James (1998). Of Two Minds: Nature of Inquiry . SUNY Press. стр. 109. ISBN 0-7914-3641-1.
  24. ^ Валентайн, Джеймс (2004). О происхождении Phyla . Издательство Чикагского университета. С. 77–80. ISBN 0-226-84548-6.
  25. ^ Конрад, Б.; Митценмахер, М. (июль 2004 г.). «Степень законов для обезьян, печатающих случайно: случай неравных вероятностей». Труды IEEE по теории информации . 50 (7): 1403–1414. doi :10.1109/TIT.2004.830752. ISSN  1557-9654. S2CID  8913575.
  26. ^ стр. 126 « Принципов искусства» , как их резюмировал и цитировал Склафани, Ричард Дж. (1975). «Логическая примитивность концепции произведения искусства». British Journal of Aesthetics . 15 (1): 14. doi :10.1093/bjaesthetics/15.1.14.
  27. ^ Джон, Эйлин; Доминик Лопес, ред. (2004). Философия литературы: современное и классическое чтение: антология . Блэквелл. стр. 96. ISBN 1-4051-1208-5.
  28. ^ Женетт, Жерар (1997). Произведение искусства: имманентность и трансцендентность . Cornell UP. ISBN 0-8014-8272-0.
  29. ^ Грасия, Хорхе (1996). Тексты: Онтологический статус, Идентичность, Автор, Аудитория . SUNY Press. С. 1–2, 122–125. ISBN 0-7914-2901-6.
  30. Акочелла, Джоан (9 апреля 2007 г.). «Жизнь машинистки: как раньше писали писатели». The New Yorker .– обзор Вершлера-Генри, Даррена (2007). Железный каприз: фрагментарная история машинописи . Издательство Корнеллского университета.
  31. ^ Инглис-Аркелл, Эстер (9 июня 2011 г.). «История проекта Monkey Shakespeare Simulator». io9 . gizmodo . Получено 24 февраля 2016 г. .
  32. ^ Марсалья, Джордж; Заман, Ариф (1993). «Обезьяньи тесты для генераторов случайных чисел». Компьютеры и математика с приложениями . 26 (9). Elsevier, Оксфорд: 1–10. doi : 10.1016/0898-1221(93)90001-C . ISSN  0898-1221.
  33. Сьюзан Рэтклифф, ред. (2016), «Роберт Виленски 1951–американский академик», Oxford Essential Quotations , Oxford University Press, в Mail on Sunday 16 февраля 1997 г. «Цитаты недели»
  34. ^ Льюис, Боб (1997-06-02). "В сегодняшней версии Старого Запада: Веб пришло время для некоторых законов о зонировании". Enterprise Computing, IS Survival Guide. InfoWorld . Vol. 19, no. 22. InfoWorld Media Group, Inc. p. 84. ISSN  0199-6649. Может также быть в "Bob Lewis's IS Survival Guide", опубликованном 19 марта 1999 г., ISBN 978-0672314377{{cite news}}: CS1 maint: постскриптум ( ссылка )
  35. ^ Хоффманн, Юте; Хофманн, Жанетт (2001). «Обезьяны, пишущие машинки и сети» (PDF) . Wissenschaftszentrum Berlin für Sozialforschung gGmbH (WZB). Архивировано из оригинала (PDF) 13 мая 2008 г.
  36. Рингл, Кен (28 октября 2002 г.). «Алло? Это Боб». The Washington Post . стр. C01. Архивировано из оригинала 15 ноября 2002 г.
  37. Лорге, Грета (май 2007 г.). «Лучшие мысленные эксперименты: кот Шредингера, обезьяны Бореля». Wired . Т. 15, № 6.
  38. ^ "Monkey Typewriter". Приложения Microsoft Store . Сбалансированное программное обеспечение. 2015-11-16. 9NBLGGH69FC8 . Получено 2022-02-14 .

Внешние ссылки