stringtranslate.com

Мультимодальная дистрибуция

Рисунок 1. Простое бимодальное распределение, в данном случае смесь двух нормальных распределений с одинаковой дисперсией, но разными средними. На рисунке показана функция плотности вероятности (pdf), которая является равновзвешенным средним колоколообразных pdf двух нормальных распределений. Если бы веса не были равны, результирующее распределение все равно могло бы быть бимодальным, но с пиками разной высоты.
Рисунок 2. Бимодальное распределение.
Рисунок 3. Двумерное, многомодальное распределение
3D-график распределения вероятностей. Он волнистый и спиральный от начала координат, с единственным локальным максимумом вблизи начала координат.
Рисунок 4. Непример: унимодальное распределение, которое станет многомодальным, если его обусловить либо x, либо y.

В статистике мультимодальное распределение — это распределение вероятностей с более чем одной модой (т. е . более чем одним локальным пиком распределения). Они появляются как отдельные пики (локальные максимумы) в функции плотности вероятности , как показано на рисунках 1 и 2. Категориальные, непрерывные и дискретные данные могут образовывать мультимодальные распределения. Среди одномерных анализов мультимодальные распределения обычно являются бимодальными. [ необходима цитата ]

Терминология

Когда две моды не равны, большая мода называется основной модой, а другая — второстепенной модой. Наименее частое значение между модами называется антимода. Разница между основной и второстепенной модами называется амплитудой . Во временном ряду основная мода называется акрофазой, а антимода — батифазой. [ необходима цитата ]

Классификация Галтунга

Галтунг ввел систему классификации (AJUS) для распределений: [1]

С тех пор эта классификация была немного изменена:

Согласно этой классификации бимодальные распределения классифицируются как типы S или U.

Примеры

Бимодальные распределения встречаются как в математике, так и в естественных науках.

Распределение вероятностей

Важные бимодальные распределения включают арксинусное распределение и бета-распределение (если оба параметра a и b меньше 1). Другие включают U-квадратичное распределение .

Отношение двух нормальных распределений также распределено бимодально. Пусть

где a и b являются константами, а x и y распределены как нормальные переменные со средним значением 0 и стандартным отклонением 1. R имеет известную плотность, которая может быть выражена как конфлюэнтная гипергеометрическая функция . [2]

Распределение обратной величины t - распределенной случайной величины является бимодальным, когда степеней свободы больше одной. Аналогично, обратная величина нормально распределенной величины также является бимодальным.

Статистика t , полученная из набора данных, полученного из распределения Коши, является бимодальной. [3]

Появления в природе

Примерами переменных с бимодальным распределением являются время между извержениями определенных гейзеров , цвет галактик , размер рабочих муравьев-ткачей , возраст заболеваемости лимфомой Ходжкина , скорость инактивации препарата изониазид у взрослых в США, абсолютная величина новых звезд и циркадные модели активности тех сумеречных животных, которые активны как в утренние, так и в вечерние сумерки. В рыбохозяйственной науке мультимодальные распределения длины отражают различные годовые классы и, таким образом, могут использоваться для оценки распределения возраста и роста популяции рыб. [4] Осадки обычно распределены бимодальным образом. При отборе проб из горнодобывающих галерей, пересекающих либо вмещающую породу, либо минерализованные жилы, распределение геохимических переменных будет бимодальным. Бимодальные распределения также наблюдаются при анализе трафика, где пик трафика приходится на утренний час пик, а затем снова на вечерний час пик. Это явление также наблюдается при ежедневном распределении воды, поскольку потребность в воде для принятия душа, приготовления пищи и пользования туалетом обычно достигает пика в утренние и вечерние периоды.

Эконометрика

В эконометрических моделях параметры могут быть распределены бимодально. [5]

Происхождение

Математический

Бимодальное распределение обычно возникает как смесь двух различных унимодальных распределений (т.е. распределений, имеющих только одну моду). Другими словами, бимодально распределенная случайная величина X определяется как с вероятностью или с вероятностью, где Y и Z являются унимодальными случайными величинами, а является коэффициентом смеси.

Смеси с двумя различными компонентами не обязательно должны быть бимодальными, а двухкомпонентные смеси с унимодальными плотностями компонентов могут иметь более двух мод. Непосредственной связи между числом компонентов в смеси и числом мод результирующей плотности не существует.

Конкретные распределения

Бимодальные распределения, несмотря на их частое появление в наборах данных, изучались лишь изредка [ требуется ссылка ] . Это может быть связано с трудностями оценки их параметров как с помощью частотных, так и с помощью байесовских методов. Среди тех, которые были изучены, есть

Бимодальность также естественным образом возникает в распределении катастроф каспа .

Биология

В биологии известно пять факторов, которые способствуют бимодальному распределению размеров популяций [ необходима ссылка ] :

Бимодальное распределение размеров рабочих муравьев-ткачей возникает из-за существования двух различных классов рабочих, а именно основных рабочих и второстепенных рабочих. [10]

Распределение эффектов мутаций на приспособленность как для целых геномов [11] [12] , так и для отдельных генов [13] также часто оказывается бимодальным, при этом большинство мутаций либо нейтральны, либо летальны, а относительно небольшое число мутаций оказывают промежуточный эффект.

Общие свойства

Смесь двух унимодальных распределений с разными средними значениями не обязательно является бимодальной. Объединенное распределение роста мужчин и женщин иногда используется как пример бимодального распределения, но на самом деле разница в среднем росте мужчин и женщин слишком мала по сравнению с их стандартными отклонениями , чтобы создать бимодальность при объединении двух кривых распределения. [14]

Бимодальные распределения обладают особым свойством, заключающимся в том, что — в отличие от унимодальных распределений — среднее значение может быть более надежной выборочной оценкой, чем медиана. [15] Это, очевидно, имеет место, когда распределение имеет U-образную форму, как распределение арксинуса. Это может быть не так, когда распределение имеет один или несколько длинных хвостов.

Моменты смешения

Позволять

где g i — распределение вероятностей, а p — параметр смешивания.

Моменты f ( x ) равны [16]

где

а S i и K iасимметрия и эксцесс i- го распределения .

Смесь двух нормальных распределений

Нередко встречаются ситуации, когда исследователь полагает, что данные получены из смеси двух нормальных распределений. По этой причине эта смесь была изучена довольно подробно. [17]

Смесь двух нормальных распределений имеет пять параметров для оценки: два средних значения, две дисперсии и параметр смешивания. Смесь двух нормальных распределений с равными стандартными отклонениями является бимодальной только в том случае, если их средние значения отличаются по крайней мере на удвоенное общее стандартное отклонение. [14] Оценки параметров упрощаются, если дисперсии можно считать равными ( случай гомоскедастичности ).

Если средние значения двух нормальных распределений равны, то объединенное распределение является унимодальным. Условия унимодальности объединенного распределения были выведены Эйзенбергером. [18] Необходимые и достаточные условия для того, чтобы смесь нормальных распределений была бимодальной, были определены Рэем и Линдси. [19]

Смесь двух примерно равных по массе нормальных распределений имеет отрицательный эксцесс, поскольку две моды по обе стороны от центра масс эффективно уменьшают хвосты распределения.

Смесь двух нормальных распределений с крайне неравной массой имеет положительный эксцесс, поскольку меньшее распределение удлиняет хвост более доминирующего нормального распределения.

Смеси других распределений требуют оценки дополнительных параметров.

Тесты на унимодальность

Сводная статистика

Бимодальные распределения являются часто используемым примером того, как сводные статистики, такие как среднее значение , медиана и стандартное отклонение, могут быть обманчивыми при использовании на произвольном распределении. Например, в распределении на рисунке 1 среднее значение и медиана будут около нуля, хотя ноль не является типичным значением. Стандартное отклонение также больше отклонения каждого нормального распределения.

Хотя было предложено несколько, в настоящее время не существует общепринятой сводной статистики (или набора статистик) для количественной оценки параметров общего бимодального распределения. Для смеси двух нормальных распределений обычно используются средние значения и стандартные отклонения вместе с параметром смешивания (весом для комбинации) – всего пять параметров.

Эшман D

Статистика, которая может быть полезна, — это D Эшмана: [22]

где μ 1 , μ 2 — средние значения, а σ 1 , σ 2 — стандартные отклонения.

Для смеси двух нормальных распределений требуется D > 2 для четкого разделения распределений.

А ван дер Эйка

Эта мера представляет собой средневзвешенное значение степени согласия распределения частот. [23] A варьируется от -1 (совершенная бимодальность ) до +1 (совершенная унимодальность ). Она определяется как

где U — унимодальность распределения, S — число категорий, имеющих ненулевые частоты, а K — общее число категорий.

Значение U равно 1, если распределение имеет любую из трех следующих характеристик:

При других распределениях данные должны быть разделены на «слои». Внутри слоя ответы либо равны, либо равны нулю. Категории не обязательно должны быть смежными. Вычисляется значение A для каждого слоя ( A i ) и определяется средневзвешенное значение для распределения. Веса ( w i ) для каждого слоя — это количество ответов в этом слое. В символах

Равномерное распределение имеет A = 0: когда все ответы попадают в одну категорию, A = +1.

Одна из теоретических проблем с этим индексом заключается в том, что он предполагает, что интервалы распределены равномерно. Это может ограничить его применимость.

Бимодальное разделение

Этот индекс предполагает, что распределение представляет собой смесь двух нормальных распределений со средними значениями ( μ 1 и μ 2 ) и стандартными отклонениями ( σ 1 и σ 2 ): [24]

Коэффициент бимодальности

Коэффициент бимодальности Сарла b равен [25]

где γ — это асимметрия , а κ — это эксцесс . Эксцесс здесь определяется как стандартизированный четвертый момент вокруг среднего. Значение b лежит между 0 и 1. [26] Логика этого коэффициента заключается в том, что бимодальное распределение с легкими хвостами будет иметь очень низкий эксцесс, асимметричный характер или и то, и другое — все это увеличивает этот коэффициент.

Формула для конечной выборки [27]

где n — количество элементов в выборке, gасимметрия выборки , а k — избыточный эксцесс выборки .

Значение b для равномерного распределения равно 5/9. Это также его значение для экспоненциального распределения . Значения больше 5/9 могут указывать на бимодальное или мультимодальное распределение, хотя соответствующие значения могут также быть получены для сильно перекошенных унимодальных распределений. [28] Максимальное значение (1,0) достигается только распределением Бернулли только с двумя различными значениями или суммой двух различных дельта-функций Дирака (бидельта-распределение).

Распределение этой статистики неизвестно. Оно связано со статистикой, предложенной ранее Пирсоном – разницей между эксцессом и квадратом асимметрии ( см. ниже ).

Амплитуда бимодальности

Это определяется как [24]

где A 1 — амплитуда меньшего пика, а A an — амплитуда антимоды.

A B всегда < 1. Большие значения указывают на более четкие пики.

Бимодальное соотношение

Это отношение левого и правого пиков. [24] Математически

где A l и Ar амплитуды левого и правого пиков соответственно.

Параметр бимодальности

Этот параметр ( B ) принадлежит Уилкоку. [29]

где A l и Ar амплитуды левого и правого пиков соответственно, а P i — логарифм по основанию 2 доли распределения в i интервале. Максимальное значение ΣP равно 1, но значение B может быть больше этого.

Для использования этого индекса берется логарифм значений. Затем данные делятся на интервалы шириной Φ, значение которых равно log 2. Ширина пиков принимается равной четырем 1/4Φ с центром на их максимальных значениях.

Индексы бимодальности

индекс Вана

Индекс бимодальности, предложенный Ваном и др., предполагает, что распределение представляет собой сумму двух нормальных распределений с равными дисперсиями, но разными средними значениями. [30] Он определяется следующим образом:

где μ 1 , μ 2 — средние значения, а σ — общее стандартное отклонение.

где p — параметр смешивания.

индекс Старрока

Другой индекс бимодальности был предложен Старроком. [31]

Этот индекс ( B ) определяется как

Когда m = 2 и γ распределено равномерно, B распределено экспоненциально. [32]

Эта статистика является формой периодограммы . Она страдает от обычных проблем оценки и спектральной утечки, свойственных этой форме статистики.

Индекс де Микеле и Аккатино

Другой индекс бимодальности был предложен де Микеле и Аккатино. [33] Их индекс ( B ) равен

где μ — среднее арифметическое выборки и

где m i — количество точек данных в i бине, x i — центр i- го бина, а L — количество бинов.

Авторы предложили пороговое значение 0,1 для B , чтобы различать бимодальное ( B > 0,1) и унимодальное ( B < 0,1) распределение. Статистическое обоснование этого значения не было предложено.

Индекс Сэмбрука Смита

Еще один индекс ( B ) был предложен Сэмбруком Смитом и др . [34]

где p 1 и p 2 — это доля, содержащаяся в первичной (с большей амплитудой) и вторичной (с меньшей амплитудой) моде, а φ 1 и φ 2 — это φ -размеры первичной и вторичной моды. φ -размер определяется как минус один, умноженный на логарифм размера данных, взятый по основанию 2. Это преобразование обычно используется при изучении осадков.

Авторы рекомендовали пороговое значение 1,5, при этом B должно быть больше 1,5 для бимодального распределения и меньше 1,5 для унимодального распределения. Статистическое обоснование этого значения не было дано.

Метод Оцу

Метод Оцу для нахождения порога для разделения между двумя модами основан на минимизации величины, где n i - число точек данных в i субпопуляции, σ i 2 - дисперсия i- й субпопуляции, m - общий размер выборки, а σ 2 - дисперсия выборки. Некоторые исследователи (особенно в области цифровой обработки изображений ) применили эту величину более широко в качестве индекса для обнаружения бимодальности, с малым значением, указывающим на более бимодальное распределение. [35]

Статистические тесты

Существует ряд тестов, позволяющих определить, распределен ли набор данных бимодальным (или мультимодальным) образом.

Графические методы

При изучении осадков размер частиц часто бывает бимодальным. Эмпирически было обнаружено, что полезно построить график частоты против логарифма (размера) частиц. [36] [37] Обычно это дает четкое разделение частиц на бимодальное распределение. В геологических приложениях логарифм обычно берется по основанию 2. Логарифмически преобразованные значения называются единицами фи (Φ). Эта система известна как шкала Крумбейна (или фи).

Альтернативный метод — построить график логарифма размера частиц против кумулятивной частоты. Этот график обычно состоит из двух достаточно прямых линий с соединительной линией, соответствующей антимоде.

Статистика

Приблизительные значения для нескольких статистик можно получить из графических диаграмм. [36]

где Mean — среднее значение, StdDev — стандартное отклонение, Skew — асимметрия, Kurt — эксцесс, а φ x — значение переменной φ в x проценте распределения.

Унимодальное и бимодальное распределение

В 1894 году Пирсон первым разработал процедуру для проверки того, можно ли разложить распределение на два нормальных распределения. [38] Этот метод требовал решения полинома девятого порядка . В последующей статье Пирсон сообщил, что для любого распределения асимметрия 2 + 1 < эксцесс. [26] Позднее Пирсон показал, что [39]

где b 2 — эксцесс, а b 1 — квадрат асимметрии. Равенство справедливо только для двухточечного распределения Бернулли или суммы двух различных дельта-функций Дирака . Это самые крайние возможные случаи бимодальности. Эксцесс в обоих этих случаях равен 1. Поскольку они оба симметричны, их асимметрия равна 0, а разность равна 1.

Бейкер предложил преобразование для преобразования бимодального распределения в унимодальное. [40]

Было предложено несколько тестов унимодальности против бимодальности: Холдейн предложил тест, основанный на вторых центральных разностях. [41] Ларкин позже представил тест, основанный на F-тесте; [42] Бенетт создал тест, основанный на G-тесте Фишера . [43] Токеши предложил четвертый тест. [44] [45] Тест, основанный на отношении правдоподобия, был предложен Хольцманном и Фоллмером. [20]

Был предложен метод, основанный на оценке и тестах Вальда. [46] Этот метод позволяет различать унимодальные и бимодальные распределения, когда известны базовые распределения.

Тесты на антимод

Известны статистические тесты для антимода. [47]

Метод Оцу

Метод Оцу обычно применяется в компьютерной графике для определения оптимального разделения между двумя распределениями.

Общие тесты

Для проверки того, является ли распределение отличным от унимодального, было разработано несколько дополнительных тестов: тест полосы пропускания, [48] тест провала, [49] тест избыточной массы, [50] тест MAP, [51] тест существования моды, [52] тест ранта, [53] [54] тест размаха, [55] и седловой тест.

Реализация теста на провал доступна для языка программирования R. [ 56] Значения p для статистических значений провала находятся в диапазоне от 0 до 1. Значения p менее 0,05 указывают на значительную мультимодальность, а значения p более 0,05, но менее 0,10 указывают на мультимодальность с пограничной значимостью. [57]

тест Сильвермана

Сильверман представил метод бутстрапа для числа мод. [48] Тест использует фиксированную полосу пропускания, что снижает мощность теста и его интерпретируемость. Недосглаженные плотности могут иметь избыточное число мод, подсчет которых во время бутстрапа нестабилен.

Тест Баджгира-Аггарвала

Баджгиер и Аггарвал предложили тест, основанный на эксцессе распределения. [58]

Особые случаи

Для ряда особых случаев доступны дополнительные тесты:

Смесь двух нормальных распределений

Исследование плотности смеси данных двух нормальных распределений показало, что разделение на два нормальных распределения было затруднено, если только средние значения не были разделены на 4–6 стандартных отклонений. [59]

В астрономии алгоритм сопоставления среднего ядра используется для определения того, принадлежит ли набор данных одному нормальному распределению или смеси двух нормальных распределений.

Бета-нормальное распределение

Это распределение является бимодальным для определенных значений параметров. Тест для этих значений был описан. [60]

Оценка параметров и построение кривых

Предполагая, что распределение известно как бимодальное или было показано как бимодальное одним или несколькими из приведенных выше тестов, часто желательно подогнать кривую к данным. Это может быть сложно.

Байесовские методы могут быть полезны в сложных случаях.

Программное обеспечение

Два нормальных распределения

Пакет для R доступен для тестирования на бимодальность. [61] Этот пакет предполагает, что данные распределены как сумма двух нормальных распределений. Если это предположение неверно, результаты могут быть ненадежными. Он также включает функции для подгонки суммы двух нормальных распределений к данным.

Предполагая, что распределение представляет собой смесь двух нормальных распределений, то для определения параметров можно использовать алгоритм максимизации ожидания. Для этого доступно несколько программ, включая Cluster, [62] и пакет R nor1mix. [63]

Другие дистрибутивы

Пакет mixtools, доступный для R, может тестировать и оценивать параметры ряда различных распределений. [64] Доступен пакет для смеси двух правохвостых гамма-распределений. [65]

Для R доступно несколько других пакетов, соответствующих моделям смесей; к ним относятся flexmix, [66] mcclust, [67] agrmt, [68] и mixdist. [69]

Статистический язык программирования SAS также может соответствовать различным смешанным распределениям с помощью процедуры PROC FREQ.

Количество бегунов в парке по времени суток (X в часах) в бимодальном распределении вероятностей

В Python пакет Scikit-learn содержит инструмент для моделирования смесей [70]

Пример программного приложения

Программа CumFreqA [71] для подгонки составных распределений вероятностей к набору данных (X) может разделить набор на две части с различным распределением. На рисунке показан пример двойного обобщенного зеркального распределения Гумбеля , как в подгонке распределения с уравнениями кумулятивной функции распределения (CDF):

X < 8,10 : CDF = 1 - exp[-exp{-(0,092X ^ 0,01+935)}]X > 8,10 : CDF = 1 - exp[-exp{-(-0,0039X ^ 2,79+1,05)}]

Смотрите также

Ссылки

  1. ^ Галтунг, Дж. (1969). Теория и методы социальных исследований . Осло: Universitetsforlaget. ISBN 0-04-300017-7.
  2. ^ Fieller E (1932). «Распределение индекса в нормальной двумерной популяции». Biometrika . 24 (3–4): 428–440. doi :10.1093/biomet/24.3-4.428.
  3. ^ Fiorio, CV; HajivassILiou, VA; Phillips, PCB (2010). «Бимодальные t-коэффициенты: влияние толстых хвостов на вывод». The Econometrics Journal . 13 (2): 271–289. doi :10.1111/j.1368-423X.2010.00315.x. S2CID  363740.
  4. ^ Введение в оценку запасов тропических рыб
  5. ^ Филлипс, ПЦБ (2006). «Замечание о бимодальности и слабом инструментировании в оценке структурных уравнений» (PDF) . Эконометрическая теория . 22 (5): 947–960. doi :10.1017/S0266466606060439. S2CID  16775883.
  6. ^ Хассан, MY; Хиджази, RH (2010). «Бимодальное экспоненциальное распределение мощности». Pakistan Journal of Statistics . 26 (2): 379–396.
  7. ^ Элал-Оливеро, Д (2010). «Альфа-скошенно-нормальное распределение». Proyecciones Journal of Mathematics . 29 (3): 224–240. doi : 10.4067/s0716-09172010000300006 .
  8. ^ Хассан, MY; Эль-Бассиуни, MY (2016). «Бимодальное кососимметричное нормальное распределение». Communications in Statistics - Theory and Methods . 45 (5): 1527–1541. doi :10.1080/03610926.2014.882950. S2CID  124087015.
  9. ^ Bosea, S.; Shmuelib, G.; Sura, P.; Dubey, P. (2013). «Подгонка смесей Com-Poisson к бимодальным данным подсчета» (PDF) . Труды Международной конференции по информации, управлению операциями и статистике 2013 года (ICIOMS2013), Куала-Лумпур, Малайзия . стр. 1–8.
  10. ^ Вебер, NA (1946). «Диморфизм у африканских рабочих Oecophylla и аномалия (Hym.: Formicidae)» (PDF) . Анналы энтомологического общества Америки . 39 : 7–10. doi :10.1093/aesa/39.1.7.
  11. ^ Санхуан, Р. (27 июня 2010 г.). «Эффекты мутационной приспособленности в вирусах РНК и одноцепочечной ДНК: общие закономерности, выявленные с помощью исследований направленного мутагенеза». Philosophical Transactions of the Royal Society of London B: Biological Sciences . 365 (1548): 1975–82. doi :10.1098/rstb.2010.0063. PMC 2880115. PMID  20478892. 
  12. ^ Эйр-Уокер, А.; Кейтли, П.Д. (август 2007 г.). «Распределение эффектов приспособленности новых мутаций». Nature Reviews Genetics . 8 (8): 610–8. doi :10.1038/nrg2146. PMID  17637733. S2CID  10868777.
  13. ^ Hietpas, RT; Jensen, JD; Bolon, DN (10 мая 2011 г.). «Экспериментальное освещение ландшафта приспособленности». Труды Национальной академии наук Соединенных Штатов Америки . 108 (19): 7896–901. Bibcode : 2011PNAS..108.7896H. doi : 10.1073 /pnas.1016024108 . PMC 3093508. PMID  21464309. 
  14. ^ abc Шиллинг, Марк Ф.; Уоткинс, Энн Э .; Уоткинс, Уильям (2002). «Является ли рост человека бимодальным?». The American Statistician . 56 (3): 223–229. doi :10.1198/00031300265. S2CID  53495657.
  15. ^ Mosteller, F.; Tukey, JW (1977). Анализ данных и регрессия: Второй курс по статистике . Reading, Mass: Addison-Wesley. ISBN 0-201-04854-X.
  16. ^ Ким, Т.-Х.; Уайт, Х. (2003). «О более надежной оценке асимметрии и эксцесса: моделирование и применение к индексу S & P 500».
  17. ^ Робертсон, Калифорния; Фрайер, Дж. Г. (1969). «Некоторые описательные свойства нормальных смесей». Скандинависк Актуариетидскрифт . 69 (3–4): 137–146. дои : 10.1080/03461238.1969.10404590.
  18. ^ Эйзенбергер, И (1964). «Происхождение бимодальных распределений». Технометрика . 6 (4): 357–363. doi :10.1080/00401706.1964.10490199.
  19. ^ Рэй, С.; Линдсей, Б. Г. (2005). «Топография многомерных нормальных смесей». Annals of Statistics . 33 (5): 2042–2065. arXiv : math/0602238 . doi :10.1214/009053605000000417. S2CID  36234163.
  20. ^ ab Хольцманн, Хайо; Фоллмер, Себастьян (2008). «Тест отношения правдоподобия для бимодальности в двухкомпонентных смесях с применением к региональному распределению доходов в ЕС». AStA Advances in Statistical Analysis . 2 (1): 57–69. doi :10.1007/s10182-008-0057-2. S2CID  14470055.
  21. ^ ab Behboodian, J (1970). «О модах смеси двух нормальных распределений». Technometrics . 12 (1): 131–139. doi :10.2307/1267357. JSTOR  1267357.
  22. ^ Эшман КМ; Бёрд СМ; Цепф СЭ (1994). «Обнаружение бимодальности в астрономических наборах данных». The Astronomical Journal . 108 : 2348–2361. arXiv : astro-ph/9408030 . Bibcode : 1994AJ....108.2348A. doi : 10.1086/117248. S2CID  13464256.
  23. ^ Ван дер Эйк, К. (2001). «Измерение согласия в упорядоченных рейтинговых шкалах». Качество и количество . 35 (3): 325–341. doi :10.1023/a:1010374114305. S2CID  189822180.
  24. ^ abc Zhang, C; Mapes, BE; Soden, BJ (2003). «Бимодальность в тропическом водяном паре». Quarterly Journal of the Royal Meteorological Society . 129 (594): 2847–2866. Bibcode : 2003QJRMS.129.2847Z. doi : 10.1256/qj.02.166. S2CID  17153773.
  25. ^ Эллисон, AM (1987). «Влияние диморфизма семян на динамику экспериментальных популяций Atriplex triangularis (Chenopodiaceae) в зависимости от плотности». Американский журнал ботаники . 74 (8): 1280–1288. doi :10.2307/2444163. JSTOR  2444163.
  26. ^ ab Pearson, K (1916). "Математический вклад в теорию эволюции, XIX: Второе дополнение к мемуару о косой вариации". Philosophical Transactions of the Royal Society A . 216 (538–548): 429–457. Bibcode :1916RSPTA.216..429P. doi : 10.1098/rsta.1916.0009 . JSTOR  91092.
  27. ^ SAS Institute Inc. (2012). Руководство пользователя SAS/STAT 12.1. Кэри, Северная Каролина: Автор.
  28. ^ Пфистер, Р.; Шварц, КА; Янчик, М.; Дейл, Р.; Фримен, Дж. Б. (2013). «Хорошие вещи достигают пика парами: заметка о коэффициенте бимодальности». Frontiers in Psychology . 4 : 700. doi : 10.3389/fpsyg.2013.00700 . PMC 3791391. PMID  24109465 . 
  29. ^ Уилкок, PR (1993). «Критическое напряжение сдвига природных осадков». Журнал гидравлической инженерии . 119 (4): 491–505. doi :10.1061/(asce)0733-9429(1993)119:4(491).
  30. ^ Ван, Дж.; Вэнь, С.; Симманс, В. Ф.; Пустай, Л.; Кумбс, К. Р. (2009). «Индекс бимодальности: критерий обнаружения и ранжирования бимодальных сигнатур из данных профилирования экспрессии генов рака». Cancer Informatics . 7 : 199–216. doi :10.4137/CIN.S2846. PMC 2730180. PMID 19718451  . 
  31. ^ Sturrock, P (2008). «Анализ бимодальности в гистограммах, сформированных из данных солнечных нейтрино GALLEX и GNO». Solar Physics . 249 (1): 1–10. arXiv : 0711.0216 . Bibcode : 2008SoPh..249....1S. doi : 10.1007/s11207-008-9170-3. S2CID  118389173.
  32. ^ Скаргл, Дж. Д. (1982). «Исследования по анализу астрономических временных рядов. II – Статистические аспекты спектрального анализа неравномерно распределенных данных». The Astrophysical Journal . 263 (1): 835–853. Bibcode : 1982ApJ...263..835S. doi : 10.1086/160554.
  33. ^ Де Мишель, К.; Аккатино, Ф. (2014). «Бимодальность древесного покрова в саваннах и лесах, возникающая в результате переключения между двумя динамиками пожаров». PLOS ONE . 9 (3): e91195. Bibcode : 2014PLoSO...991195D. doi : 10.1371/journal.pone.0091195 . PMC 3963849. PMID  24663432 . 
  34. ^ Сэмбрук Смит, GH; Николас, AP; Фергюсон, RI (1997). «Измерение и определение бимодальных осадков: проблемы и последствия». Water Resources Research . 33 (5): 1179–1185. Bibcode : 1997WRR....33.1179S. doi : 10.1029/97wr00365 .
  35. ^ Чаудхури, Д.; Агравал, А. (2010). «Процедура разделения и слияния для сегментации изображения с использованием подхода обнаружения бимодальности». Журнал оборонной науки . 60 (3): 290–301. doi :10.14429/dsj.60.356.
  36. ^ ab Folk, RL; Ward, WC (1957). "Brazos River bar: a study in the significant of grain size settings". Journal of Sedimentary Research . 27 (1): 3–26. Bibcode : 1957JSedR..27....3F. doi : 10.1306/74d70646-2b21-11d7-8648000102c1865d.
  37. ^ Дайер, KR (1970). «Параметры размера зерна для песчаных гравийных пород». Журнал седиментационных исследований . 40 (2): 616–620. doi :10.1306/74D71FE6-2B21-11D7-8648000102C1865D.
  38. ^ Пирсон, К (1894). «Вклад в математическую теорию эволюции: О рассечении асимметричных частотных кривых». Philosophical Transactions of the Royal Society A. 185 : 71–90. Bibcode : 1894RSPTA.185...71P. doi : 10.1098/rsta.1894.0003 .
  39. ^ Пирсон, К (1929). «Редакционная заметка». Biometrika . 21 : 370–375.
  40. ^ Бейкер, GA (1930). «Преобразования бимодальных распределений». Annals of Mathematical Statistics . 1 (4): 334–344. doi : 10.1214/aoms/1177733063 .
  41. ^ Холдейн, Дж. Б. С. (1951). «Простые тесты на бимодальность и битангенциальность». Annals of Eugenics . 16 (1): 359–364. doi :10.1111/j.1469-1809.1951.tb02488.x. PMID  14953132.
  42. ^ Ларкин, РП (1979). «Алгоритм оценки бимодальности против унимодальности в одномерном распределении». Методы и инструменты исследования поведения . 11 (4): 467–468. doi : 10.3758/BF03205709 .
  43. ^ Беннетт, СК (1992). «Половой диморфизм птеранодона и других птерозавров с комментариями по поводу черепных гребней». Журнал палеонтологии позвоночных . 12 (4): 422–434. doi :10.1080/02724634.1992.10011472.
  44. ^ Токеши, М (1992). «Динамика и распределение в сообществах животных; теория и анализ». Исследования по экологии популяций . 34 (2): 249–273. doi :10.1007/bf02514796. S2CID  22912914.
  45. ^ Баррето, С.; Борхес, ПАВ; Го, К. (2003). «Ошибка при печати в тесте Токеши на бимодальность». Глобальная экология и биогеография . 12 (2): 173–174. doi :10.1046/j.1466-822x.2003.00018.x. hdl : 10400.3/1408 .
  46. ^ Carolan, AM; Rayner, JCW (2001). «Однообразцовые тесты для определения местоположения режимов ненормальных данных». Журнал прикладной математики и принятия решений . 5 (1): 1–19. CiteSeerX 10.1.1.504.4999 . doi : 10.1155/s1173912601000013 . 
  47. ^ Hartigan, JA (2000). «Тестирование на антимод». В Gaul W; Opitz O; Schader M (ред.). Анализ данных . Исследования по классификации, анализу данных и организации знаний. Springer. стр. 169–181. ISBN 3-540-67731-3.
  48. ^ ab Silverman, BW (1981). «Использование оценок плотности ядра для исследования мультимодальности». Журнал Королевского статистического общества, серия B. 43 ( 1): 97–99. Bibcode :1981JRSSB..43...97S. doi :10.1111/j.2517-6161.1981.tb01155.x. JSTOR  2985156.
  49. ^ Хартиган, JA; Хартиган, PM (1985). «Провал теста на унимодальность». Annals of Statistics . 13 (1): 70–84. doi : 10.1214/aos/1176346577 .
  50. ^ Мюллер, Д. В.; Савицки, Г. (1991). «Оценки избыточной массы и тесты на мультимодальность». Журнал Американской статистической ассоциации . 86 (415): 738–746. doi :10.1080/01621459.1991.10475103. JSTOR  2290406.
  51. ^ Rozál, GPM Hartigan JA (1994). «Тест MAP для мультимодальности». Журнал классификации . 11 (1): 5–36. doi :10.1007/BF01201021. S2CID  118500771.
  52. ^ Миннотт, MC (1997). «Непараметрическое тестирование существования мод». Annals of Statistics . 25 (4): 1646–1660. doi : 10.1214/aos/1031594735 .
  53. ^ Hartigan, JA; Mohanty, S (1992). «Тест RUNT для мультимодальности». Журнал классификации . 9 : 63–70. doi :10.1007/bf02618468. S2CID  121960832.
  54. ^ Андрушкив Р.И.; Клюшин Д.Д.; Петунин Ю.И. (2008). «Новый тест на унимодальность». Теория случайных процессов . 14 (1): 1–6.
  55. ^ Hartigan, JA (1988). "The Span Test of Multimodality". В Bock, HH (ред.). Классификация и связанные с ней методы анализа данных . Амстердам: Северная Голландия. С. 229–236. ISBN 0-444-70404-3.
  56. ^ Рингах, Мартин Мейхлер (первоначально из Fortran и S.-plus Дарио; NYU.edu) (5 декабря 2016 г.). «diptest: Статистика теста погружения Хартигана для унимодальности — исправлено» — через R-Packages.
  57. ^ Freeman; Dale (2012). «Оценка бимодальности для обнаружения наличия двойственного когнитивного процесса» (PDF) . Методы исследования поведения . 45 (1): 83–97. doi : 10.3758/s13428-012-0225-x . PMID  22806703. S2CID  14500508.
  58. ^ Bajgier SM; Aggarwal LK (1991). «Мощь тестов согласия при обнаружении сбалансированных смешанных нормальных распределений». Образовательные и психологические измерения . 51 (2): 253–269. doi :10.1177/0013164491512001. S2CID  121113601.
  59. ^ Джексон, PR; Такер, GT; Вудс, HF (1989). «Тестирование бимодальности в частотных распределениях данных, предполагающих полиморфизмы метаболизма лекарств — проверка гипотез». British Journal of Clinical Pharmacology . 28 (6): 655–662. doi :10.1111/j.1365-2125.1989.tb03558.x. PMC 1380036. PMID  2611088 . 
  60. ^ Famoye, Felix; Lee, Carl; Eugene, Nicholas. "Бета-нормальное распределение: свойства бимодальности и применение". Joint Statistical Meetings - Section on Physical & Engineering Sciences (SPES) (PDF) . American Statistical Society. стр. 951–956. Архивировано из оригинала (PDF) 2016-03-04.
  61. ^ "Архивная копия" (PDF) . Архивировано из оригинала (PDF) 2013-11-03 . Получено 2013-11-01 .{{cite web}}: CS1 maint: archived copy as title (link)
  62. ^ "Домашняя страница кластера". engineering.purdue.edu .
  63. ^ Мэхлер, Мартин (25 августа 2016 г.). «nor1mix: Нормальные (1-d) модели смесей (классы и методы S3)» – через R-Packages.
  64. ^ Янг, Дерек; Беналья, Татьяна; Шово, Дидье; Хантер, Дэвид; Элмор, Райан; Хеттманспергер, Томас; Томас, Хобен; Сюань, Фэнцзюань (10 марта 2017 г.). «mixtools: Инструменты для анализа моделей конечных смесей» – через R-Packages.
  65. ^ "discrimARTs" (PDF) . cran.r-project.org . Получено 22 марта 2018 г. .
  66. ^ Грюн, Беттина; Лейш, Фридрих; Саркар, Дипаян; Мортье, Фредерик; Пикар, Николя (28 апреля 2017 г.). «flexmix: гибкое моделирование смесей» – через R-Packages.
  67. ^ Фрейли, Крис; Рафтери, Адриан Э.; Скрукка, Лука; Мерфи, Томас Брендан; Фоп, Майкл (21 мая 2017 г.). «mclust: моделирование гауссовой смеси для кластеризации на основе моделей, классификации и оценки плотности» – через R-Packages.
  68. Рюден, Дидье (2 апреля 2016 г.). "agrmt". cran.r-project.org.
  69. ^ Макдональд, Питер; Ду, при участии Хуана (29 октября 2012 г.). «mixdist: Модели распределения конечных смесей» – через R-Packages.
  70. ^ "Gaussian mix models". scikit-learn.org . Получено 30 ноября 2023 г. .
  71. ^ CumFreq, бесплатная программа для подгонки распределений вероятностей к набору данных. Онлайн: [1]