stringtranslate.com

Процесс Гальтона-Уотсона

Вероятности выживания Гальтона-Уотсона для различных экспоненциальных темпов роста популяции, если можно предположить, что число потомков каждого родительского узла следует распределению Пуассона . Для λ  ≤ 1 окончательное вымирание произойдет с вероятностью 1. Но вероятность выживания нового типа может быть довольно низкой, даже если λ  > 1 и популяция в целом испытывает довольно сильный экспоненциальный рост .

Процесс Гальтона-Уотсона — это ветвящийся стохастический процесс , возникающий из статистического исследования Фрэнсиса Гальтона вымирания фамилий . Процесс моделирует фамилии как патрилинейные (передаются от отца к сыну), в то время как потомство случайным образом либо мужское, либо женское, а фамилии вымирают, если линия фамилии вымирает (носители фамилии умирают, не оставив потомков мужского пола). Это точное описание передачи Y-хромосомы в генетике, и, таким образом, модель полезна для понимания гаплогрупп ДНК Y-хромосомы человека . Аналогично, поскольку митохондрии наследуются только по материнской линии, та же математическая формула описывает передачу митохондрий. Формула имеет ограниченную полезность для понимания фактического распределения фамилий, поскольку на практике фамилии меняются по многим другим причинам, и вымирание линии фамилии является лишь одним из факторов.

История

Среди викторианцев существовало беспокойство , что аристократические фамилии [ нужен пример ] вымирают.

В 1869 году Гальтон опубликовал труд «Наследственная гениальность» , в котором рассмотрел вымирание различных социальных групп.

Гальтон первоначально сформулировал математический вопрос относительно распределения фамилий в идеализированной популяции в выпуске The Educational Times за 1873 год: [1]

Большая нация, из которой мы будем интересоваться только взрослыми мужчинами, числом N , и которые носят отдельные фамилии, колонизирует округ. Их закон народонаселения таков, что в каждом поколении у a0 процентов взрослых мужчин нет детей мужского пола, достигших взрослой жизни; у a1 есть один такой ребенок мужского пола; у a2 есть двое; и так далее до a5, у которого пять. Найдите, какая часть их фамилий вымрет после r поколений; и сколько будет случаев, когда фамилию будут носить m человек.

Преподобный Генри Уильям Уотсон ответил решением. [2] Вместе они затем написали статью 1874 года под названием «О вероятности вымирания семей» в Журнале Антропологического института Великобритании и Ирландии (ныне Журнал Королевского антропологического института ). [3] Гальтон и Уотсон, по-видимому, вывели свой процесс независимо от более ранней работы И. Дж. Бьенеме ; см. [4] Их решение является неполным, согласно которому все фамилии вымирают с вероятностью 1.

Бьенеме опубликовал ответ на задачу в 1845 году [5], пообещав опубликовать вывод позже, однако не существует известных публикаций его решения. (Однако, Брю (1991) [6] претендует на реконструкцию доказательства). Он был вдохновлен Эмилем Литтре [7] и Луи-Франсуа Бенуастоном де Шатонефом (другом Бьенеме). [8] [9]

Курно опубликовал решение в 1847 году в главе 36 книги «Происхождение и пределы соответствия между алгеброй и геометрией». [10] Проблема в его формулировке такова:

Рассмотрим игрока, который покупает лотереи. Каждая лотерея стоит 1 экю и оплачивается вероятностями . Игрок всегда тратит все свои деньги на покупку лотерей. Если игрок начинает с долларов, какова вероятность банкротства?

Рональд А. Фишер в 1922 году изучал ту же проблему, сформулированную в терминах генетики. Вместо вымирания фамилий он изучал вероятность того, что мутантный ген в конечном итоге исчезнет в большой популяции. [11] Холдейн решил эту проблему в 1927 году. [12]

Агнер Краруп Эрланг был членом выдающегося рода Крарупов, который вымирал. В 1929 году он опубликовал ту же задачу посмертно (его некролог находится рядом с задачей). Эрланг умер бездетным. Стеффенсен решил ее в 1930 году.

Подробную историю см. в Kendall (1966 [13] и 1975 [9] ) и [14] , а также в разделе 17 [15] .

Концепции

Предположим, ради модели, что фамилии передаются всем детям мужского пола их отцом. Предположим, что число сыновей мужчины является случайной величиной, распределенной на множестве {0, 1, 2, 3, ...}. Далее предположим, что числа сыновей разных мужчин являются независимыми случайными величинами, имеющими одинаковое распределение.

Тогда простейший существенный математический вывод состоит в том, что если среднее число сыновей у мужчины равно 1 или меньше, то его фамилия почти наверняка вымрет, а если оно больше 1, то вероятность того, что она сохранится в течение любого заданного числа поколений, больше нуля.

Современные приложения включают вероятность выживания нового мутантного гена, или инициирование ядерной цепной реакции , или динамику вспышек заболеваний в их первых поколениях распространения, или вероятность вымирания небольшой популяции организмов ; а также объяснение (возможно, наиболее близкое к изначальному интересу Гальтона), почему только у небольшого числа мужчин в далеком прошлом человечества сейчас есть выжившие потомки по мужской линии, что отражено в довольно небольшом количестве отличительных гаплогрупп ДНК Y-хромосомы человека .

Следствием высокой вероятности вымирания является то, что если какая-то ветвь выжила , то, скорее всего, в ее ранних поколениях наблюдался (чисто случайно) необычно высокий темп роста, по крайней мере по сравнению с остальной частью популяции.

Математическое определение

Процесс Гальтона–Ватсона — это стохастический процесс { X n }, который развивается в соответствии с рекуррентной формулой X 0 = 1 и

где — набор независимых и одинаково распределенных натуральных числовых случайных величин.

По аналогии с фамилиями, X n можно рассматривать как число потомков (по мужской линии) в n -м поколении, и можно рассматривать как число (мужских) детей j -го из этих потомков. Рекуррентное соотношение гласит, что число потомков в n +1-м поколении равно сумме, по всем потомкам n -го поколения, числа детей этого потомка.

Вероятность вымирания (т.е. вероятность окончательного вымирания) определяется по формуле

Это, очевидно, равно нулю, если каждый член популяции имеет ровно одного потомка. За исключением этого случая (обычно называемого тривиальным случаем), существует простое необходимое и достаточное условие, которое приведено в следующем разделе.

Критерий угасания для процесса Гальтона-Уотсона

В нетривиальном случае вероятность окончательного вымирания равна 1, если E { ξ 1 } ≤ 1, и строго меньше 1, если E { ξ 1 } > 1.

Процесс можно проанализировать аналитически, используя метод функций генерации вероятностей .

Если число потомков ξ j в каждом узле следует распределению Пуассона с параметром λ, можно найти особенно простую рекуррентную зависимость для общей вероятности вымирания  x n для процесса, начинающегося с одной особи в момент времени n  = 0:

давая вышеуказанные кривые.

Бисексуальный процесс Гальтона-Уотсона

В классическом процессе фамилии семьи Гальтона-Уотсона, описанном выше, необходимо учитывать только мужчин, поскольку только мужчины передают свою фамилию потомкам. Это фактически означает, что размножение может быть смоделировано как бесполое. (Точно так же, если анализируется митохондриальная передача, необходимо учитывать только женщин, поскольку только женщины передают свои митохондрии потомкам.)

Модель, более точно отражающая фактическое половое размножение, — это так называемый «бисексуальный процесс Гальтона–Уотсона», в котором размножаются только пары. [ требуется ссылка ] ( Бисексуальный в этом контексте относится к числу вовлеченных полов, а не к сексуальной ориентации .) В этом процессе предполагается, что каждый ребенок является мужчиной или женщиной независимо друг от друга с определенной вероятностью, а так называемая «функция спаривания» определяет, сколько пар сформируется в данном поколении. Как и прежде, воспроизводство разных пар считается независимым друг от друга. Теперь аналог тривиального случая соответствует случаю, когда каждый мужчина и женщина размножаются ровно в одной паре, имея одного потомка мужского пола и одного женского пола, и что функция спаривания принимает значение минимума числа мужчин и женщин (которые затем остаются такими же, начиная со следующего поколения).

Поскольку общее воспроизводство в пределах поколения теперь сильно зависит от функции спаривания, в общем случае не существует простого необходимого и достаточного условия для окончательного вымирания, как в случае классического процесса Гальтона-Уотсона. [ необходима ссылка ] Однако, исключая нетривиальный случай, концепция усредненного среднего воспроизводства (Брусс (1984)) допускает общее достаточное условие для окончательного вымирания, которое рассматривается в следующем разделе.

Критерий вымирания

Если в нетривиальном случае усредненное среднее значение воспроизводства на пару остается ограниченным во всех поколениях и не превышает 1 для достаточно большого размера популяции, то вероятность окончательного вымирания всегда равна 1.

Примеры

Приводить исторические примеры процесса Гальтона-Уотсона сложно из-за истории фамилий, часто значительно отклоняющейся от теоретической модели. В частности, могут быть созданы новые имена, существующие имена могут быть изменены в течение жизни человека, и люди исторически часто брали имена неродственных людей, особенно дворян. Таким образом, небольшое количество фамилий в настоящее время само по себе не является доказательством того, что имена со временем вымерли или что это произошло из-за вымирания семейных линий — это требует, чтобы в прошлом было больше имен и чтобы они вымерли из-за вымирания линии, а не из-за изменения имени по другим причинам, например, когда вассалы принимали имя своего господина.

Китайские имена являются хорошо изученным примером вымирания фамилий: в настоящее время в Китае используется всего около 3100 фамилий, по сравнению с почти 12 000, зарегистрированными в прошлом, [16] [17] причем 22% населения носят имена Ли , Ван и Чжан (что составляет около 300 миллионов человек), а 200 самых популярных имен (6½%) охватывают 96% населения. Имена изменились или вымерли по разным причинам, таким как люди брали имена своих правителей, орфографические упрощения, табу на использование символов из имени императора и т. д. [17] Хотя вымирание семейных фамилий может быть фактором вымирания фамилий, это ни в коем случае не единственный или даже не существенный фактор. Действительно, наиболее существенным фактором, влияющим на частоту фамилий, являются другие этнические группы, идентифицирующие себя как хань и принимающие ханьские имена. [17] Кроме того, хотя по разным причинам и возникали новые названия, их количество перевешивалось исчезновением старых названий. [17]

Напротив, некоторые народы приняли фамилии только недавно. Это означает, что они не испытывали вымирания фамилий в течение длительного периода, и что имена были приняты, когда народ имел относительно большую численность населения, а не меньшую численность населения в древние времена. [17] Кроме того, эти имена часто выбирались творчески и очень разнообразны. Вот некоторые примеры:

С другой стороны, некоторые примеры высокой концентрации фамилий не являются следствием процесса Гальтона-Уотсона:

Смотрите также

Ссылки

  1. ^ Фрэнсис Гальтон (1873-03-01). "Problem 4001" (PDF) . Educational Times . 25 (143): 300. Архивировано из оригинала (PDF) 2017-01-23.
  2. Генри Уильям Уотсон (1873-08-01). "Problem 4001" (PDF) . Educational Times . 26 (148): 115. Архивировано из оригинала (PDF) 2016-12-01.
    Первое предложение, представленное GS Carr, по словам Гальтона, было «совершенно ошибочным»; см. GS Carr (1873-04-01). «Problem 4001» (PDF) . Educational Times . 26 (144): 17. Архивировано из оригинала (PDF) 2017-08-03.
  3. ^ Гальтон, Ф. и Уотсон, Х. У. (1875). «О вероятности вымирания семей». Журнал Королевского антропологического института , 4 , 138–144.
  4. ^ Heyde, CC ; Seneta, E. (1972). «Исследования по истории вероятности и статистики. XXXI. Простой ветвящийся процесс, тест поворотной точки и фундаментальное неравенство: историческая заметка об IJ Bienaymé». Biometrika . 59 (3): 680–683. doi :10.1093/biomet/59.3.680. ISSN  0006-3444.
  5. ^ Бьенем, IJ (1845). О законе умножения и долговечности семей . L'Institut, 589, Vol. 13, стр. 131–132. Соц. Филомат. Парижские Экстраиты, Сер. 5, 37–39. (Перепечатано в Kendall, DG (1975))
  6. ^ Брю, Бернард. «A la recherche de la démonstration perdue de Bienaymé». Mathématiques et Sciences Humanes 114 (1991): 5–17.
  7. ^ Литтре, Эмиль. Проанализируйте смысл курса позитивной философии Огюста Конта . 1845.
  8. ^ LF Бенуастон де Шатонеф, « Sur la durée des familles дворян де Франция », Séances et Travaux de l'Académie des Sciences Morales et Politiques: Comptes Rendus, 7 (1845), 210-240.
  9. ^ ab Kendall, David G. (ноябрь 1975 г.). «Генеалогия генеалогических ветвящихся процессов до (и после) 1873 г.». Бюллетень Лондонского математического общества . 7 (3): 225–253. doi :10.1112/blms/7.3.225.
  10. ^ Курно, А.А. (Антуан Огюстен) (1847). О происхождении и границах соответствия между алгеброй и геометрией. Университет Иллинойса Урбана-Шампейн. Париж: Л. Ашетт.
  11. ^ Фишер, РА (1922). "XXI.—О соотношении доминирования". Труды Королевского общества Эдинбурга . 42 : 321–341. doi :10.1017/S0370164600023993. ISSN  0370-1646.
  12. Холдейн, Дж. Б. С. (июль 1927 г.). «Математическая теория естественного и искусственного отбора, часть V: отбор и мутация». Математические труды Кембриджского философского общества . 23 (7): 838–844. Bibcode : 1927PCPS...23..838H. doi : 10.1017/S0305004100015644. ISSN  1469-8064. S2CID  86716613.
  13. ^ Кендалл, Дэвид Г. (1966). «Ветвящиеся процессы с 1873 года». Журнал Лондонского математического общества . s1-41 (1): 385–406. doi :10.1112/jlms/s1-41.1.385.
  14. ^ Альбертсен, К. (1995). «Вымирание семей». Международный статистический обзор / Revue Internationale de Statistique . 63 (2): 234–239. doi :10.2307/1403617. ISSN  0306-7734. JSTOR  1403617. S2CID  124630211.
  15. ^ Симкин, М. В.; Ройчоудхури, В. П. (2011-05-01). «Повторное изобретение Уиллиса». Physics Reports . 502 (1): 1–35. arXiv : physics/0601192 . Bibcode : 2011PhR...502....1S. doi : 10.1016/j.physrep.2010.12.004. ISSN  0370-1573. S2CID  88517297.
  16. ^ "O rare John Smith", The Economist (издание США), стр. 32, 3 июня 1995 г. В настоящее время в Китае используется только 3100 фамилий [...] по сравнению с почти 12 000 в прошлом. "Эволюционное сокращение" фамилий свойственно всем обществам. [...] [Б]отя в Китае, говорит [Ду], где фамилии использовались гораздо дольше, чем в большинстве других мест, их нехватка стала острой.
  17. ^ abcde Du, Ruofu; Yida, Yuan; Hwang, Juliana; Mountain, Joanna L.; Cavalli-Sforza, L. Luca (1992), Chinese Surnames and the Genetic Differences between North and South China (PDF) , Journal of Chinese Linguistics Monograph Series, стр. 18–22 (История китайских фамилий и источники данных для настоящего исследования), архивировано из оригинала (PDF) 2012-11-20, также часть рабочих документов Института Моррисона по изучению населения и ресурсов.
  18. ^ «Отчество — за именем».

Дальнейшее чтение

Внешние ссылки