Квантильная регрессия — это тип регрессионного анализа, используемый в статистике и эконометрике. В то время как метод наименьших квадратов оценивает условное среднее значение переменной отклика по значениям переменных-предикторов, квантильная регрессия оценивает условную медиану (или другие квантили ) переменной отклика. [Существует также метод прогнозирования условного геометрического среднего переменной отклика, [1] .] Квантильная регрессия — это расширение линейной регрессии, используемое, когда условия линейной регрессии не выполняются.
Преимущества и применение
Одним из преимуществ квантильной регрессии по сравнению с обычной регрессией наименьших квадратов является то, что оценки квантильной регрессии более устойчивы к выбросам в измерениях отклика. Однако основная привлекательность квантильной регрессии выходит за рамки этого и выгодна, когда интерес представляют условные квантильные функции. Различные меры центральной тенденции и статистической дисперсии могут использоваться для более полного анализа взаимосвязи между переменными. [2]
В экологии квантильная регрессия была предложена и использована как способ обнаружения более полезных предсказательных связей между переменными в случаях, когда нет никакой связи или есть только слабая связь между средними значениями таких переменных. Необходимость и успех квантильной регрессии в экологии были приписаны сложности взаимодействий между различными факторами, приводящими к данным с неравной вариацией одной переменной для различных диапазонов другой переменной. [3]
Другое применение квантильной регрессии — это области диаграмм роста, где процентильные кривые обычно используются для скрининга аномального роста. [4] [5]
История
Идея оценки наклона медианной регрессии, основная теорема о минимизации суммы абсолютных отклонений и геометрический алгоритм построения медианной регрессии были предложены в 1760 году Руджером Йосипом Бошковичем , католическим священником-иезуитом из Дубровника. [2] : 4 [6] Он интересовался эллиптичностью Земли, основываясь на предположении Исаака Ньютона о том, что ее вращение может привести к ее выпячиванию на экваторе с соответствующим сплющиванием на полюсах. [7] Он, наконец, создал первую геометрическую процедуру для определения экватора вращающейся планеты по трем наблюдениям поверхностного элемента. Что еще более важно для квантильной регрессии, он смог разработать первое доказательство наименьшего абсолютного критерия и опередил наименьшие квадраты, введенные Лежандром в 1805 году, на пятьдесят лет. [8]
Другие мыслители начали развивать идею Бошковича, например, Пьер-Симон Лаплас , который разработал так называемый «methode de situation». Это привело к появлению множественной медианы Фрэнсиса Эджворта [9] — геометрического подхода к медианной регрессии — и признано предшественником симплексного метода . [8] Работы Бошковича, Лапласа и Эджворта были признаны прелюдией к вкладу Роджера Кёнкера в квантильную регрессию.
Вычисления медианной регрессии для больших наборов данных довольно утомительны по сравнению с методом наименьших квадратов, по этой причине он исторически не пользовался популярностью среди статистиков вплоть до широкого внедрения компьютеров во второй половине 20-го века.
Предыстория: квантили
Квантильная регрессия выражает условные квантили зависимой переменной как линейную функцию объясняющих переменных. Решающее значение для практичности квантильной регрессии имеет то, что квантили могут быть выражены как решение задачи минимизации, как мы покажем в этом разделе, прежде чем обсуждать условные квантили в следующем разделе.
Определим функцию потерь как , где — индикаторная функция . Конкретный квантиль можно найти, минимизировав ожидаемые потери относительно : [2] (стр. 5–6):
Это можно показать, вычислив производную ожидаемых потерь по с помощью интегрального правила Лейбница , установив ее равной 0 и позволив быть решением уравнения
Это уравнение сводится к
а затем к
Если решение не является единственным, то нам нужно взять наименьшее такое решение, чтобы получить -й квантиль случайной величины Y.
Пример
Пусть будет дискретной случайной величиной, которая принимает значения с равными вероятностями. Задача состоит в том, чтобы найти медиану Y, и, следовательно, выбирается значение. Тогда ожидаемый убыток равен
Поскольку является константой, ее можно вынести из функции ожидаемых потерь (это верно только при ). Тогда при u =3
Предположим, что u увеличивается на 1 единицу. Тогда ожидаемый убыток изменится на при изменении u на 4. Если u = 5, ожидаемый убыток составит
и любое изменение в u увеличит ожидаемые потери. Таким образом, u =5 является медианой. Таблица ниже показывает ожидаемые потери (деленные на ) для различных значений u .
Интуиция
Рассмотрим и пусть q будет начальным предположением для . Ожидаемый убыток, оцененный при q, равен
Чтобы минимизировать ожидаемые потери, мы немного сдвинем значение q , чтобы увидеть, вырастет или упадет ожидаемая потеря. Предположим, мы увеличиваем q на 1 единицу. Тогда изменение ожидаемой потери будет
Первый член уравнения равен , а второй член уравнения равен . Таким образом, изменение функции ожидаемых потерь отрицательно тогда и только тогда, когда , то есть тогда и только тогда, когда q меньше медианы. Аналогично, если мы уменьшим q на 1 единицу, изменение функции ожидаемых потерь отрицательно тогда и только тогда, когда q больше медианы.
Чтобы минимизировать ожидаемую функцию потерь, мы увеличиваем (уменьшаем) L ( q ), если q меньше (больше) медианы, пока q не достигнет медианы. Идея минимизации заключается в подсчете количества точек (взвешенных с плотностью), которые больше или меньше q , а затем перемещении q в точку, где q больше % точек.
Квантильная выборка
Квантиль выборки можно получить, используя оценку важности выборки и решив следующую задачу минимизации:
,
где функция — наклонная функция абсолютного значения. Интуиция та же, что и для квантиля популяции.
Мы используем заглавную букву для обозначения условного квантиля, чтобы указать, что это случайная величина.
В квантильной регрессии для y-го квантиля мы предполагаем, что y-й условный квантиль задан как линейная функция объясняющих переменных:
.
Учитывая функцию распределения , можно получить путем решения
Решение аналогового примера дает оценку .
Обратите внимание, что когда функция потерь пропорциональна функции абсолютного значения, и, таким образом, медианная регрессия совпадает с линейной регрессией по наименьшим абсолютным отклонениям .
Расчет оценок параметров регрессии
Математические формы, возникающие из квантильной регрессии, отличаются от тех, которые возникают в методе наименьших квадратов . Метод наименьших квадратов приводит к рассмотрению задач в пространстве внутреннего произведения , включая проекцию на подпространства, и, таким образом, задача минимизации квадратичных ошибок может быть сведена к задаче в числовой линейной алгебре . Квантильная регрессия не имеет этой структуры, и вместо этого задача минимизации может быть переформулирована как задача линейного программирования
Прямая оценка асимптотической матрицы дисперсии-ковариации не всегда удовлетворительна. Вывод для параметров квантильной регрессии может быть сделан с помощью тестов рангов регрессии или с помощью методов бутстрапа. [10]
Если — неубывающая функция от , то применяется следующее свойство инвариантности :
Пример (1):
Если и , то . Средняя регрессия не имеет того же свойства, поскольку
Вывод
Интерпретация параметров наклона
Линейная модель неверно определяет истинное систематическое отношение , когда является нелинейным. Однако минимизирует взвешенное расстояние до среди линейных моделей. [11] Более того, параметры наклона линейной модели можно интерпретировать как взвешенные средние производных , чтобы их можно было использовать для причинно-следственной связи. [12] В частности, гипотеза для всех подразумевает гипотезу , которую можно проверить с помощью оценщика и его предельного распределения.
Качество соответствия
Степень соответствия квантильной регрессии для квантиля можно определить как: [13]
где — сумма квадратов условного квантиля, а — сумма квадратов безусловного квантиля.
Варианты
Байесовские методы для квантильной регрессии
Поскольку квантильная регрессия обычно не предполагает параметрического правдоподобия для условных распределений Y|X, байесовские методы работают с рабочим правдоподобием. Удобным выбором является асимметричное лапласовское правдоподобие [14], поскольку мода результирующего апостериорного распределения при плоском априоре является обычными оценками квантильной регрессии. Однако апостериорный вывод следует интерпретировать с осторожностью. Янг, Ван и Хэ [15] предоставили корректировку апостериорной дисперсии для обоснованного вывода. Кроме того, Янг и Хэ [16] показали, что можно иметь асимптотически обоснованный апостериорный вывод, если рабочее правдоподобие выбрано как эмпирическое правдоподобие.
Методы машинного обучения для квантильной регрессии
Помимо простой линейной регрессии, существует несколько методов машинного обучения, которые можно расширить до квантильной регрессии. Переход от квадратичной ошибки к наклонной функции потери абсолютного значения (также известной как потеря пинбольного шарика [17] ) позволяет алгоритмам обучения на основе градиентного спуска изучать указанный квантиль вместо среднего. Это означает, что мы можем применять все алгоритмы нейронных сетей и глубокого обучения к квантильной регрессии, [18] [19] которая затем называется непараметрической квантильной регрессией. [20]
Алгоритмы обучения на основе деревьев также доступны для квантильной регрессии (см., например, Леса квантильной регрессии [21] как простое обобщение Случайных лесов ).
Цензурированная квантильная регрессия
Если переменная отклика подвергается цензурированию, условное среднее не может быть идентифицировано без дополнительных предположений о распределении, но условный квантиль часто идентифицируем. Для недавних работ по регрессии цензурированного квантиля см.: Portnoy [22]
и Wang and Wang [23]
Пример (2):
Пусть и . Тогда . Это модель цензурированной квантильной регрессии: оценочные значения могут быть получены без каких-либо предположений о распределении, но за счет вычислительной сложности, [24] часть которой можно избежать, используя простую трехшаговую процедуру цензурированной квантильной регрессии в качестве приближения. [25]
Для случайного цензурирования переменных отклика цензурированная квантильная регрессия Портного (2003) [22] обеспечивает согласованные оценки всех идентифицируемых квантильных функций на основе соответствующего повторного взвешивания каждой цензурированной точки.
R предлагает несколько пакетов , реализующих квантильную регрессию, наиболее известный quantregиз которых принадлежит Роджеру Кенкеру [ 29] , а также [30]gbm , [31] [32] и [33].quantregForestqrnnqgam
Python , через Scikit-garden[34] и statsmodels[35]
SAS через proc quantreg(версию 9.2) [36] и proc quantselect(версию 9.3). [37]
^ Tofallis (2015). «Лучшая мера относительной точности прогнозирования для выбора и оценки модели», Журнал общества операционных исследований , 66(8):1352-1362. [1]
^ abcde Koenker, Roger (2005). Квантильная регрессия . Cambridge University Press. С. 146–7. ISBN978-0-521-60827-5.
^ Кейд, Брайан С.; Нун, Барри Р. (2003). «Несложное введение в квантильную регрессию для экологов» (PDF) . Frontiers in Ecology and the Environment . 1 (8): 412–420. doi :10.2307/3868138. JSTOR 3868138.
^ Wei, Y.; Pere, A.; Koenker, R.; He, X. (2006). «Методы квантильной регрессии для справочных диаграмм роста». Статистика в медицине . 25 (8): 1369–1382. doi :10.1002/sim.2271. PMID 16143984. S2CID 7830193.
^ Wei, Y.; He, X. (2006). «Условные диаграммы роста (с обсуждениями)». Annals of Statistics . 34 (5): 2069–2097 и 2126–2131. arXiv : math/0702634 . doi :10.1214/009053606000000623. S2CID 88516697.
^ Стиглер, С. (1984). «Боскович, Симпсон и рукописная заметка 1760 года о подгонке линейного отношения». Biometrika . 71 (3): 615–620. doi :10.1093/biomet/71.3.615.
^ Koenker, Roger (2005). Квантильная регрессия . Кембридж: Cambridge University Press. С. 2. ISBN9780521845731.
^ ab Furno, Marilena; Vistocco, Domenico (2018). Квантильная регрессия: оценка и моделирование . Хобокен, Нью-Джерси: John Wiley & Sons. стр. xv. ISBN9781119975281.
^ Koenker, Roger (август 1998 г.). «Гальтон, Эджворт, Фриш и перспективы квантильной регрессии в экономике» (PDF) . UIUC.edu . Получено 22 августа 2018 г. .
^ Кочергинский, М.; Хе, X.; Му, Y. (2005). «Практические доверительные интервалы для квантилей регрессии». Журнал вычислительной и графической статистики . 14 (1): 41–55. doi :10.1198/106186005X27563. S2CID 120598656.
^ Angrist, J.; Chernozhukov, V.; Fernandez-Val, I. (2006). «Квантильная регрессия при неправильной спецификации с применением к структуре заработной платы в США» (PDF) . Econometrica . 74 (2): 539–563. doi :10.1111/j.1468-0262.2006.00671.x.
^ Като, Р.; Сасаки, Ю. (2017). «Об использовании линейных квантильных регрессий для причинно-следственной связи». Эконометрическая теория . 33 (3): 664–690. doi : 10.1017/S0266466616000177 .
^ Роджер Кенкер и Хосе А. Ф. Мачадо (1999) Качество соответствия и связанные с ним процессы вывода для квантильной регрессии, Журнал Американской статистической ассоциации, 94:448, 1296-1310, DOI: 10.1080/01621459.1999.10473882
^ Kozumi, H.; Kobayashi, G. (2011). «Методы выборки Гиббса для байесовской квантильной регрессии» (PDF) . Журнал статистических вычислений и моделирования . 81 (11): 1565–1578. doi :10.1080/00949655.2010.496117. S2CID 44015988.
^ Yang, Y.; Wang, HX; He, X. (2016). «Апостериорный вывод в байесовской квантильной регрессии с асимметричным правдоподобием Лапласа». International Statistical Review . 84 (3): 327–344. doi : 10.1111/insr.12114. hdl : 2027.42/135059 . S2CID 14947362.
^ Yang, Y.; He, X. (2010). «Байесовское эмпирическое правдоподобие для квантильной регрессии». Annals of Statistics . 40 (2): 1102–1131. arXiv : 1207.5378 . doi : 10.1214/12-AOS1005. S2CID 88519086.
^ Steinwart, Ingo; Christmann, Andreas (2011). «Оценка условных квантилей с помощью проигрыша пинбольного мяча». Бернулли . 17 (1). Общество Бернулли по математической статистике и вероятности: 211–225. arXiv : 1102.2101 . doi : 10.3150/10-BEJ267.
^ Петнехази, Габор (21 августа 2019 г.). «QCNN: Квантильная сверточная нейронная сеть». arXiv : 1908.07978 [cs.LG].
^ Родригес, Филипе; Перейра, Франциско К. (2018-08-27). «За пределами ожиданий: Глубокая совместная средняя и квантильная регрессия для пространственно-временных проблем». arXiv : 1808.08798 [stat].
^ "quantreg: Квантильная регрессия". Проект R. 2018-12-18.
^ "gbm: Обобщенные усиленные регрессионные модели". Проект R. 2019-01-14.
^ "quantregForest: Леса квантильной регрессии". Проект R. 2017-12-19.
^ "qrnn: Квантильная регрессия нейронных сетей". Проект R. 2018-06-26.
^ "qgam: Модели гладкой аддитивной квантильной регрессии". Проект R. 2019-05-23.
^ "Квантильные регрессионные леса". Scikit-garden . Получено 3 января 2019 г.
^ «Модели статистики: квантильная регрессия». Статистические модели . Проверено 15 ноября 2019 г. .
^ "Введение в квантильную регрессию и процедуру QUANTREG" (PDF) . Поддержка SAS .
^ "Процедура QUANTSELECT". Поддержка SAS .
^ "qreg — Квантильная регрессия" (PDF) . Stata Manual .
^ Кэмерон, А. Колин; Триведи, Правин К. (2010). «Квантильная регрессия». Микроэконометрика с использованием Stata (пересмотренное издание). College Station: Stata Press. стр. 211–234. ISBN978-1-59718-073-3.
^ "ДжонЛэнгфорд/vowpal_wabbit". Гитхаб . Проверено 9 июля 2016 г.
^ "QuantileRegression.m". MathematicaForPrediction . Получено 3 января 2019 г. .
^ "QuantileRegression". Репозиторий функций Wolfram . Получено 14 сентября 2022 г.