В статистике оценка максимального интервала ( MSE или MSP ) или оценка максимального произведения интервала (MPS) — это метод оценки параметров одномерной статистической модели . [1] Метод требует максимизации геометрического среднего интервалов в данных, которые представляют собой разности между значениями кумулятивной функции распределения в соседних точках данных.
Концепция, лежащая в основе метода, основана на интегральном преобразовании вероятности , в том смысле, что набор независимых случайных выборок, полученных из любой случайной величины, должен в среднем быть равномерно распределен относительно кумулятивной функции распределения случайной величины. Метод MPS выбирает значения параметров, которые делают наблюдаемые данные максимально однородными, в соответствии с определенной количественной мерой однородности.
Один из наиболее распространенных методов оценки параметров распределения по данным, метод максимального правдоподобия (ММП), может дать сбой в различных случаях, например, при использовании определенных смесей непрерывных распределений. [2] В этих случаях метод оценки максимального интервала может оказаться успешным.
Помимо использования в чистой математике и статистике, сообщалось о пробных применениях метода с использованием данных из таких областей, как гидрология , [3] эконометрика , [4] магнитно-резонансная томография , [5] и других. [6]
Метод MSE был выведен независимо Расселом Ченгом и Ником Амином из Института науки и технологий Уэльского университета и Бо Раннеби из Шведского университета сельскохозяйственных наук . [2] Авторы объяснили, что из-за преобразования интеграла вероятности при истинном параметре «расстояние» между каждым наблюдением должно быть равномерно распределено. Это означало бы, что разница между значениями кумулятивной функции распределения при последовательных наблюдениях должна быть одинаковой. Это тот случай, который максимизирует геометрическое среднее таких расстояний, поэтому решение для параметров, которые максимизируют геометрическое среднее, достигнет «наилучшего» соответствия, как определено таким образом. Раннеби (1984) обосновал метод, продемонстрировав, что он является оценщиком расхождения Кульбака–Лейблера , похожим на оценку максимального правдоподобия , но с более надежными свойствами для некоторых классов задач.
Существуют определенные распределения, особенно с тремя или более параметрами, чьи вероятности могут стать бесконечными вдоль определенных путей в пространстве параметров . Использование максимального правдоподобия для оценки этих параметров часто дает сбой, когда один параметр стремится к определенному значению, которое делает вероятность бесконечной, делая другие параметры несогласованными. Однако метод максимальных интервалов, зависящий от разницы между точками на кумулятивной функции распределения, а не от отдельных точек правдоподобия, не имеет этой проблемы и вернет достоверные результаты по гораздо более широкому массиву распределений. [1]
Распределения, которые, как правило, имеют проблемы с правдоподобием, часто используются для моделирования физических явлений. Холл и др. (2004) стремятся проанализировать методы смягчения последствий наводнений, что требует точных моделей эффектов речных наводнений. Распределения, которые лучше моделируют эти эффекты, представляют собой трехпараметрические модели, которые страдают от проблемы бесконечного правдоподобия, описанной выше, что привело к исследованию Холлом процедуры максимального расстояния. Вонг и Ли (2006), сравнивая метод с максимальным правдоподобием, используют различные наборы данных, начиная от набора по самому старшему возрасту смерти в Швеции между 1905 и 1958 годами до набора, содержащего ежегодные максимальные скорости ветра.
Дана случайная выборка iid { x 1 , ..., x n } размера n из одномерного распределения с непрерывной кумулятивной функцией распределения F ( x ; θ 0 ), где θ 0 ∈ Θ — неизвестный параметр, подлежащий оценке , пусть { x (1) , ..., x ( n ) } — соответствующая упорядоченная выборка, которая является результатом сортировки всех наблюдений от наименьшего к наибольшему. Для удобства также обозначим x (0) = −∞ и x ( n +1) = +∞.
Определим интервалы как «пробелы» между значениями функции распределения в соседних упорядоченных точках: [7]
Тогда максимальная оценка расстояния θ 0 определяется как значение, которое максимизирует логарифм геометрического среднего расстояния между выборками:
По неравенству средних арифметических и геометрических значений функция S n ( θ ) ограничена сверху величиной −ln( n +1), и, таким образом, максимум должен существовать, по крайней мере, в смысле супремума .
Обратите внимание, что некоторые авторы определяют функцию S n ( θ ) несколько иначе. В частности, Раннеби (1984) умножает каждый D i на коэффициент ( n +1), тогда как Ченг и Стивенс (1989) опускают множитель 1 ⁄ n +1 перед суммой и добавляют знак «−», чтобы превратить максимизацию в минимизацию. Поскольку это константы относительно θ , модификации не изменяют местоположение максимума функции S n .
В этом разделе представлены два примера расчета оценки максимального расстояния.
Предположим, что два значения x (1) = 2, x (2) = 4 были выбраны из экспоненциального распределения F ( x ; λ ) = 1 − e − xλ , x ≥ 0 с неизвестным параметром λ > 0. Чтобы построить MSE, мы должны сначала найти интервалы:
Процесс продолжается путем нахождения λ , которое максимизирует геометрическое среднее столбца «разность». Используя соглашение, которое игнорирует взятие корня ( n +1), это превращается в максимизацию следующего произведения: (1 − e −2 λ ) · (e −2 λ − e −4 λ ) · (e −4 λ ). Полагая μ = e −2 λ , задача становится нахождением максимума μ 5 −2 μ 4 + μ 3 . Дифференцируя, μ должно удовлетворять 5 μ 4 −8 μ 3 +3 μ 2 = 0. Это уравнение имеет корни 0, 0,6 и 1. Поскольку μ на самом деле равно e −2 λ , оно должно быть больше нуля, но меньше единицы. Поэтому единственным приемлемым решением является , которое соответствует экспоненциальному распределению со средним значением 1 ⁄ λ ≈ 3,915. Для сравнения, оценка максимального правдоподобия λ является обратной величиной выборочного среднего значения, 3, поэтому λ MLE = ⅓ ≈ 0,333.
Предположим, что { x (1) , ..., x ( n ) } — упорядоченная выборка из равномерного распределения U ( a , b ) с неизвестными конечными точками a и b . Кумулятивная функция распределения равна F ( x ; a , b ) = ( x − a )/( b − a ), когда x ∈[ a , b ]. Поэтому индивидуальные интервалы задаются как
Вычислив геометрическое среднее и затем взяв логарифм, статистика S n будет равна Здесь только три члена зависят от параметров a и b . Дифференцируя по этим параметрам и решая полученную линейную систему, максимальные оценки интервала будут
Известно, что они являются оценочными функциями с равномерно минимальной дисперсией и несмещенными функциями (UMVU) для непрерывного равномерного распределения. [1] Для сравнения, оценки максимального правдоподобия для этой задачи являются смещенными и имеют более высокую среднеквадратичную ошибку .
Оценка максимального интервала является последовательной оценкой в том смысле, что она сходится по вероятности к истинному значению параметра θ 0 , когда размер выборки увеличивается до бесконечности. [2] Последовательность оценки максимального интервала сохраняется при гораздо более общих условиях, чем для оценок максимального правдоподобия . В частности, в случаях, когда базовое распределение имеет форму буквы J, максимальное правдоподобие не будет работать там, где MSE работает. [1] Примером плотности в форме буквы J является распределение Вейбулла , в частности смещенный Вейбулл , с параметром формы меньше 1. Плотность будет стремиться к бесконечности, когда x приближается к параметру местоположения, делая оценки других параметров несостоятельными.
Оценки максимального интервала также по крайней мере столь же асимптотически эффективны , как и оценки максимального правдоподобия, где последние существуют. Однако MSE могут существовать в случаях, когда MLE отсутствуют. [1]
Оценки максимального интервала чувствительны к близко расположенным наблюдениям, и особенно к связям. [8] Учитывая, что мы получаем
Когда связи обусловлены множественными наблюдениями, повторяющиеся интервалы (те, которые в противном случае были бы равны нулю) следует заменить соответствующей вероятностью. [1] То есть следует заменить на , поскольку .
Когда связи возникают из-за ошибки округления, Ченг и Стивенс (1989) предлагают другой метод устранения эффектов. [примечание 1] При наличии r связанных наблюдений от x i до x i + r −1 пусть δ представляет ошибку округления . Все истинные значения должны тогда попадать в диапазон . Соответствующие точки распределения теперь должны попадать между и . Ченг и Стивенс предлагают предположить, что округленные значения равномерно распределены в этом интервале, определяя
Метод MSE также чувствителен к вторичной кластеризации. [8] Одним из примеров этого явления является ситуация, когда набор наблюдений считается полученным из одного нормального распределения , но на самом деле он получен из смеси нормалей с разными средними. Вторым примером является ситуация, когда данные считаются полученными из экспоненциального распределения , но на самом деле они получены из гамма-распределения . В последнем случае в нижнем хвосте могут встречаться меньшие интервалы. Высокое значение M ( θ ) будет указывать на этот эффект вторичной кластеризации и предполагать необходимость более внимательного изучения данных. [8]
Статистика S n ( θ ) также является формой статистики Морана или Морана-Дарлинга, M ( θ ), которая может использоваться для проверки согласия . [примечание 2] Было показано, что статистика, если ее определить как , является асимптотически нормальной , и что для малых выборок существует приближение хи-квадрат. [8] В случае, когда мы знаем истинный параметр , Ченг и Стивенс (1989) показывают, что статистика имеет нормальное распределение с , где γ — константа Эйлера–Маскерони, которая приблизительно равна 0,57722. [примечание 3]
Распределение также может быть аппроксимировано с помощью , где , в котором и где следует распределение хи-квадрат со степенями свободы . Поэтому для проверки гипотезы о том, что случайная выборка значений происходит из распределения , можно рассчитать статистику . Затем следует отклонить со значимостью , если значение больше критического значения соответствующего распределения хи-квадрат. [8]
Где θ 0 оценивается с помощью , Ченг и Стивенс (1989) показали, что имеет то же асимптотическое среднее и дисперсию, что и в известном случае. Однако тестовая статистика, которая будет использоваться, требует добавления члена коррекции смещения и равна: где — число параметров в оценке.
Раннеби и Экстрём (1997) обобщили метод MSE для аппроксимации других мер помимо меры Кульбака–Лейблера. Экстрём (1997) далее расширил метод для исследования свойств оценщиков, использующих интервалы более высокого порядка, где интервал m -го порядка будет определен как .
Ranneby & al. (2005) обсуждают расширенные методы максимального интервала для многомерного случая. Поскольку для нет естественного порядка , они обсуждают два альтернативных подхода: геометрический подход, основанный на ячейках Дирихле , и вероятностный подход, основанный на метрике «ближайшего соседнего шара».