В математике унимодальность означает обладание уникальным модусом . В более общем смысле унимодальность означает , что существует только одно наивысшее значение, каким-то образом определенное, некоторого математического объекта . [1]
В статистике унимодальное распределение вероятностей или унимодальное распределение — это распределение вероятностей , которое имеет один пик. Термин «мода» в этом контексте относится к любому пику распределения, а не только к строгому определению моды , которое обычно используется в статистике.
Если есть одна мода, функция распределения называется «унимодальной». Если у нее больше мод, она «бимодальная» (2), «тримодальная» (3) и т. д., или в общем случае «мультимодальная». [2] Рисунок 1 иллюстрирует нормальные распределения , которые являются унимодальными. Другие примеры унимодальных распределений включают распределение Коши , t -распределение Стьюдента , распределение хи-квадрат и экспоненциальное распределение . Среди дискретных распределений биномиальное распределение и распределение Пуассона можно рассматривать как унимодальные, хотя для некоторых параметров они могут иметь два соседних значения с одинаковой вероятностью.
Рисунки 2 и 3 иллюстрируют бимодальные распределения.
Существуют и другие определения унимодальности функций распределения.
В непрерывных распределениях унимодальность может быть определена через поведение кумулятивной функции распределения (cdf). [3] Если cdf выпукла при x < m и вогнута при x > m , то распределение унимодальное, где m — мода. Обратите внимание, что в рамках этого определения равномерное распределение унимодальное, [4] как и любое другое распределение, в котором максимальное распределение достигается для диапазона значений, например, трапециевидное распределение. Обычно это определение допускает разрыв в моде; обычно в непрерывном распределении вероятность любого отдельного значения равна нулю, в то время как это определение допускает ненулевую вероятность или «атом вероятности» в моде.
Критерии унимодальности также могут быть определены через характеристическую функцию распределения [3] или через ее преобразование Лапласа–Стилтьеса [5] .
Другой способ определения унимодального дискретного распределения — это возникновение изменений знака в последовательности разностей вероятностей. [6] Дискретное распределение с функцией массы вероятности , , называется унимодальным, если последовательность имеет ровно одно изменение знака (когда нули не учитываются).
Одной из причин важности унимодальности распределения является то, что она позволяет получить несколько важных результатов. Ниже приведены несколько неравенств , которые действительны только для унимодальных распределений. Таким образом, важно оценить, происходит ли заданный набор данных из унимодального распределения. Несколько тестов на унимодальность приведены в статье о многомодальном распределении .
Первый важный результат — неравенство Гаусса . [7] Неравенство Гаусса дает верхнюю границу вероятности того, что значение лежит дальше любого заданного расстояния от его моды. Это неравенство зависит от унимодальности.
Второе — это неравенство Высочанского–Петунина , [8] уточнение неравенства Чебышева . Неравенство Чебышева гарантирует, что в любом распределении вероятностей «почти все» значения «близки» к среднему значению. Неравенство Высочанского–Петунина уточняет это до еще более близких значений, при условии, что функция распределения непрерывна и унимодальна. Дальнейшие результаты были показаны Селлке и Селлке. [9]
Гаусс также показал в 1823 году, что для унимодального распределения [10]
и
где медиана равна ν , среднее значение равно μ , а ω — среднеквадратичное отклонение от моды.
Для унимодального распределения можно показать, что медиана ν и среднее значение μ лежат в пределах (3/5) 1/2 ≈ 0,7746 стандартных отклонений друг от друга. [11] В символах:
где | . | — абсолютное значение .
В 2020 году Бернард, Каззи и Вандуффель обобщили предыдущее неравенство, выведя максимальное расстояние между симметричным квантильным средним и средним значением [12]
Стоит отметить, что максимальное расстояние минимизируется при (т.е. когда симметричное квантильное среднее равно ), что действительно мотивирует общий выбор медианы в качестве надежной оценки для среднего. Более того, когда граница равна , что является максимальным расстоянием между медианой и средним значением унимодального распределения.
Аналогичное соотношение существует между медианой и модой θ : они лежат в пределах 3 1/2 ≈ 1,732 стандартных отклонений друг от друга:
Можно также показать, что среднее значение и мода находятся в пределах 3 1/2 друг от друга:
Рохатги и Секей утверждали, что асимметрия и эксцесс унимодального распределения связаны неравенством: [13]
где κ — эксцесс, а γ — асимметрия. Клаассен, Моквелд и ван Эс показали, что это применимо только в определенных условиях, таких как набор унимодальных распределений, где мода и среднее значение совпадают. [14]
Они вывели более слабое неравенство, которое применимо ко всем унимодальным распределениям: [14]
Эта граница является точной, поскольку она достигается смесью равновесовых равномерного распределения на [0,1] и дискретного распределения на {0}.
Поскольку термин «модальный» применяется к наборам данных и распределению вероятностей, а не к функциям в целом , приведенные выше определения не применяются. Определение «унимодальный» было распространено также на функции действительных чисел .
Общее определение таково: функция f ( x ) является унимодальной функцией , если для некоторого значения m она монотонно возрастает при x ≤ m и монотонно убывает при x ≥ m . В этом случае максимальное значение f ( x ) равно f ( m ) и других локальных максимумов нет.
Доказательство унимодальности часто бывает сложным. Один из способов состоит в использовании определения этого свойства, но он оказывается пригодным только для простых функций. Существует общий метод, основанный на производных , [15], но он не работает для каждой функции, несмотря на свою простоту.
Примерами унимодальных функций являются квадратичные полиномиальные функции с отрицательным квадратичным коэффициентом, функции тентового отображения и другие.
Вышесказанное иногда связывают ссильная унимодальность , из того факта, что подразумеваемая монотонность являетсясильной монотонностью. Функцияf(x) являетсяслабо унимодальной функциейесли существует значениеm, для которого она слабо монотонно возрастает приx ≤ mи слабо монотонно убывает приx ≥ m. В этом случае максимальное значениеf(m) может быть достигнуто для непрерывного диапазона значенийx. Примером слабо унимодальной функции, которая не является сильно унимодальной, является каждая вторая строка втреугольнике Паскаля.
В зависимости от контекста, унимодальная функция может также относиться к функции, которая имеет только один локальный минимум, а не максимум. [16] Например, локальная унимодальная выборка , метод выполнения численной оптимизации, часто демонстрируется с помощью такой функции. Можно сказать, что унимодальная функция при таком расширении — это функция с одним локальным экстремумом .
Одним из важных свойств унимодальных функций является то, что экстремум можно найти с помощью алгоритмов поиска, таких как поиск золотого сечения , тернарный поиск или последовательная параболическая интерполяция . [17]
Функция f ( x ) является «S-унимодальной» (часто называемой «S-унимодальным отображением»), если ее производная Шварца отрицательна для всех , где — критическая точка. [18]
В вычислительной геометрии, если функция унимодальная, это позволяет разрабатывать эффективные алгоритмы для нахождения экстремумов функции. [19]
Более общее определение, применимое к функции f ( X ) векторной переменной X , заключается в том, что f является унимодальной, если существует взаимно-однозначное дифференцируемое отображение X = G ( Z ) такое, что f ( G ( Z )) является выпуклой. Обычно хотелось бы, чтобы G ( Z ) была непрерывно дифференцируемой с невырожденной матрицей Якоби.
Квазивыпуклые функции и квазивогнутые функции распространяют концепцию унимодальности на функции, аргументы которых принадлежат евклидовым пространствам более высокой размерности .