В статистике степенной закон — это функциональная связь между двумя величинами, где относительное изменение одной величины приводит к относительному изменению другой величины, пропорциональному изменению, возведенному в постоянную степень : одна величина изменяется как степень другой. Изменение не зависит от начального размера этих величин.
Например, площадь квадрата имеет степенную зависимость от длины его стороны, так как если длина удваивается, площадь умножается на 2 2 , а если длина утраивается, площадь умножается на 3 2 , и так далее. [1]
Распределения самых разных физических, биологических и созданных человеком явлений приблизительно следуют степенному закону в широком диапазоне величин: к ним относятся размеры кратеров на Луне и солнечных вспышек , [2] размеры облаков, [3] схема добычи пищи различными видами, [4] размеры моделей активности нейронных популяций, [5] частоты слов в большинстве языков, частоты фамилий , видовое богатство в кладах организмов, [6] размеры отключений электроэнергии , извержений вулканов, [7] человеческие суждения об интенсивности стимула [8] [9] и многие другие величины. [10] Эмпирические распределения могут соответствовать степенному закону только для ограниченного диапазона значений, поскольку чистый степенной закон допускал бы произвольно большие или малые значения. Акустическое затухание следует частотным степенным законам в широких частотных диапазонах для многих сложных сред. Аллометрические законы масштабирования для отношений между биологическими переменными являются одними из самых известных степенных функций в природе.
Модель степенного закона не подчиняется заветной парадигме статистической полноты. Особенно границы вероятности, предполагаемая причина типичных явлений изгиба и/или уплощения в высоко- и низкочастотных графических сегментах, параметрически отсутствуют в стандартной модели. [11]
Одним из атрибутов степенных законов является их масштабная инвариантность . При наличии отношения масштабирование аргумента на постоянный множитель вызывает только пропорциональное масштабирование самой функции. То есть,
где обозначает прямую пропорциональность . То есть масштабирование на константу просто умножает исходное степенное отношение на константу . Таким образом, следует, что все степенные законы с определенным показателем масштабирования эквивалентны с точностью до постоянных множителей, поскольку каждый из них является просто масштабированной версией других. Это поведение является тем, что создает линейную зависимость, когда логарифмы берутся от обоих и , а прямая линия на графике в двойном логарифмическом масштабе часто называется сигнатурой степенного закона. С реальными данными такая прямолинейность является необходимым, но не достаточным условием для данных, следующих степенному отношению. Фактически, существует много способов генерировать конечные объемы данных, которые имитируют это поведение сигнатуры, но в своем асимптотическом пределе не являются истинными степенными законами. [ необходима ссылка ] Таким образом, точная подгонка и проверка моделей степенного закона является активной областью исследований в статистике; см. ниже.
Степенной закон имеет четко определенное среднее значение только в том случае, если , и имеет конечную дисперсию только в том случае, если ; большинство выявленных степенных законов в природе имеют показатели, такие, что среднее значение четко определено, но дисперсия — нет, что подразумевает, что они способны к поведению черного лебедя . [2] Это можно увидеть в следующем мысленном эксперименте: [12] представьте себе комнату с друзьями и оцените средний ежемесячный доход в комнате. Теперь представьте, что в комнату входит самый богатый человек в мире с ежемесячным доходом около 1 миллиарда долларов США. Что происходит со средним доходом в комнате? Доход распределяется в соответствии со степенным законом, известным как распределение Парето (например, чистая стоимость активов американцев распределяется в соответствии со степенным законом с показателем 2).
С одной стороны, это делает некорректным применение традиционной статистики, основанной на дисперсии и стандартном отклонении (например, регрессионный анализ ). [13] С другой стороны, это также позволяет проводить экономически эффективные вмешательства. [12] Например, учитывая, что выхлопные газы автомобилей распределяются по степенному закону среди автомобилей (очень немногие автомобили вносят наибольший вклад в загрязнение), было бы достаточно убрать эти очень немногие автомобили с дороги, чтобы существенно сократить общий объем выхлопных газов. [14]
Однако медиана существует: для степенного закона x – k с показателем она принимает значение 2 1/( k – 1) x min , где x min – минимальное значение, для которого выполняется степенной закон. [2]
Эквивалентность степенных законов с определенным показателем масштабирования может иметь более глубокое происхождение в динамических процессах, которые порождают степенное отношение. Например, в физике фазовые переходы в термодинамических системах связаны с возникновением степенных распределений определенных величин, показатели которых называются критическими показателями системы. С помощью теории ренормгрупп можно показать, что различные системы с одинаковыми критическими показателями, то есть которые демонстрируют одинаковое поведение масштабирования по мере приближения к критичности , имеют одну и ту же фундаментальную динамику. Например, поведение воды и CO2 в точках кипения попадает в один и тот же класс универсальности, поскольку они имеют одинаковые критические показатели. [ необходима цитата ] [ необходима уточнение ] Фактически, почти все материальные фазовые переходы описываются небольшим набором классов универсальности. Аналогичные наблюдения были сделаны, хотя и не столь всесторонне, для различных самоорганизованных критических систем, где критическая точка системы является аттрактором . Формально такое разделение динамики называется универсальностью , и говорят, что системы с точно такими же критическими показателями принадлежат к одному и тому же классу универсальности .
Научный интерес к степенным отношениям частично обусловлен легкостью, с которой некоторые общие классы механизмов их порождают. [15] Демонстрация степенного отношения в некоторых данных может указывать на определенные виды механизмов, которые могут лежать в основе рассматриваемого природного явления, и может указывать на глубокую связь с другими, на первый взгляд не связанными системами; [16] см. также универсальность выше. Повсеместность степенных отношений в физике частично обусловлена размерными ограничениями , в то время как в сложных системах степенные законы часто считаются сигнатурами иерархии или определенных стохастических процессов . Несколько примечательных примеров степенных законов — закон распределения доходов Парето , структурное самоподобие фракталов и законы масштабирования в биологических системах . Исследование происхождения степенных отношений и попытки наблюдать и подтверждать их в реальном мире являются активной темой исследований во многих областях науки, включая физику , информатику , лингвистику , геофизику , нейронауку , систематику , социологию , экономику и другие.
Однако большая часть недавнего интереса к степенным законам исходит из изучения распределений вероятностей : распределения самых разных величин, по-видимому, следуют форме степенного закона, по крайней мере в их верхнем хвосте (крупные события). Поведение этих крупных событий связывает эти величины с изучением теории больших отклонений (также называемой теорией экстремальных значений ), которая рассматривает частоту крайне редких событий, таких как крахи фондового рынка и крупные стихийные бедствия . Название «степенной закон» используется в первую очередь при изучении статистических распределений.
В эмпирических контекстах приближение к степенному закону часто включает в себя термин отклонения , который может представлять неопределенность в наблюдаемых значениях (возможно, ошибки измерения или выборки) или обеспечивать простой способ отклонения наблюдений от функции степенного закона (возможно, по стохастическим причинам):
Математически строгий степенной закон не может быть распределением вероятностей, но распределение, которое является усеченной степенной функцией , возможно: для где показатель степени (греческая буква альфа , не путать с масштабным коэффициентом, использованным выше) больше 1 (иначе хвост имеет бесконечную площадь), необходимо минимальное значение, в противном случае распределение имеет бесконечную площадь, когда x стремится к 0, а константа C является масштабным коэффициентом, чтобы гарантировать, что общая площадь равна 1, как того требует распределение вероятностей. Чаще используют асимптотический степенной закон — тот, который верен только в пределе; подробности см. ниже в разделе степенные распределения вероятностей. Обычно показатель степени попадает в диапазон , хотя и не всегда. [10]
Более сотни степенных распределений были выявлены в физике (например, песчаные лавины), биологии (например, вымирание видов и масса тела) и социальных науках (например, размеры городов и доход). [17] Среди них:
Ломаный степенной закон — это кусочная функция , состоящая из двух или более степенных законов, объединенных с порогом. Например, с двумя степенными законами: [47]
Части нарушенного степенного закона можно плавно соединить вместе, чтобы построить плавно нарушенный степенной закон.
Существуют различные возможные способы объединения степенных законов. Один из примеров: [48] где .
Когда функция представлена в виде логарифмического графика с горизонтальной осью и вертикальной осью , график состоит из линейных сегментов с наклонами , разделенных на , плавно соединенных вместе. Размер определяет резкость соединения между сегментами .
Степенной закон с экспоненциальным ограничением — это просто степенной закон, умноженный на экспоненциальную функцию: [10]
В более широком смысле степенное распределение вероятностей — это распределение, функция плотности которого (или функция массы в дискретном случае) имеет вид для больших значений [ 50]
где , а — медленно меняющаяся функция , которая является любой функцией, которая удовлетворяет для любого положительного фактора . Это свойство непосредственно следует из требования быть асимптотически масштабно инвариантным; таким образом, форма контролирует только форму и конечную протяженность нижнего хвоста. Например, если — постоянная функция, то мы имеем степенной закон, который справедлив для всех значений . Во многих случаях удобно предположить нижнюю границу , из которой справедлив закон. Объединяя эти два случая, и где — непрерывная переменная, степенной закон имеет вид распределения Парето
где префактор to — это нормирующая константа . Теперь мы можем рассмотреть несколько свойств этого распределения. Например, его моменты задаются как
что хорошо определено только для . То есть, все моменты расходятся: когда , среднее и все моменты более высокого порядка бесконечны; когда , среднее существует, но дисперсия и моменты более высокого порядка бесконечны и т. д. Для выборок конечного размера, взятых из такого распределения, это поведение подразумевает, что центральные оценки моментов (такие как среднее и дисперсия) для расходящихся моментов никогда не сойдутся — по мере накопления большего количества данных они продолжают расти. Эти степенные распределения вероятностей также называются распределениями типа Парето, распределениями с хвостами Парето или распределениями с регулярно меняющимися хвостами.
Модификация, которая не удовлетворяет общей форме выше, с экспоненциальным отсечением, [10 ]
В этом распределении экспоненциальный член распада в конечном итоге подавляет поведение степенного закона при очень больших значениях . Это распределение не масштабируется [ необходимо дополнительное объяснение ] и, таким образом, не является асимптотически как степенной закон; однако, оно приблизительно масштабируется в конечной области до отсечки. Чистая форма выше является подмножеством этого семейства, с . Это распределение является распространенной альтернативой асимптотическому степенному распределению, поскольку оно естественным образом улавливает эффекты конечного размера.
Распределения Твиди представляют собой семейство статистических моделей, характеризующихся закрытостью при аддитивной и репродуктивной свертке, а также при масштабном преобразовании. Следовательно, все эти модели выражают степенную зависимость между дисперсией и средним значением. Эти модели играют фундаментальную роль в качестве фокусов математической сходимости, аналогичную роли, которую нормальное распределение играет в качестве фокуса в центральной предельной теореме . Этот эффект сходимости объясняет, почему закон дисперсии к среднему так широко проявляется в естественных процессах, как в случае закона Тейлора в экологии и масштабирования флуктуаций [51] в физике. Можно также показать, что этот закон дисперсии к среднему значению, продемонстрированный методом расширяющихся бинов , подразумевает наличие шума 1/ f и что шум 1/ f может возникнуть как следствие этого эффекта сходимости Твиди. [52]
Хотя были предложены более сложные и надежные методы, наиболее часто используемыми графическими методами идентификации степенных распределений вероятностей с использованием случайных выборок являются графики квантилей-квантилей Парето (или графики Q–Q Парето ), [ требуется ссылка ] графики средней остаточной продолжительности жизни [53] [54] и графики в логарифмических координатах . Другой, более надежный графический метод использует пучки функций остаточных квантилей. [55] (Пожалуйста, имейте в виду, что степенные распределения также называются распределениями типа Парето.) Здесь предполагается, что случайная выборка получена из распределения вероятностей, и что мы хотим узнать, следует ли хвост распределения степенному закону (другими словами, мы хотим узнать, есть ли у распределения «хвост Парето»). Здесь случайная выборка называется «данными».
Диаграммы Парето Q–Q сравнивают квантили логарифмически преобразованных данных с соответствующими квантилями экспоненциального распределения со средним значением 1 (или с квантилями стандартного распределения Парето) путем построения графика первого против второго. Если полученная диаграмма рассеивания предполагает, что нанесенные на график точки асимптотически сходятся к прямой линии, то следует подозревать распределение по степенному закону. Ограничением диаграмм Парето Q–Q является то, что они ведут себя плохо, когда индекс хвоста (также называемый индексом Парето) близок к 0, поскольку диаграммы Парето Q–Q не предназначены для идентификации распределений с медленно меняющимися хвостами. [55]
С другой стороны, в своей версии для идентификации степенных распределений вероятностей график средней остаточной жизни состоит из первого логарифмического преобразования данных, а затем построения среднего значения тех логарифмически преобразованных данных, которые выше статистики i -го порядка, по сравнению со статистикой i -го порядка, для i = 1, ..., n , где n — размер случайной выборки. Если полученная диаграмма рассеяния предполагает, что нанесенные точки имеют тенденцию стабилизироваться около горизонтальной прямой линии, то следует подозревать степенное распределение. Поскольку график средней остаточной жизни очень чувствителен к выбросам (он не является надежным), он обычно создает графики, которые трудно интерпретировать; по этой причине такие графики обычно называют графиками ужасов Хилла. [56]
Логарифмические графики являются альтернативным способом графического исследования хвоста распределения с использованием случайной выборки. Логарифмирование степенного закона вида приводит к: [57]
которая образует прямую линию с наклоном в двойном логарифмическом масштабе. Однако следует проявлять осторожность, поскольку график в двойном логарифмическом масштабе является необходимым, но недостаточным доказательством степенной зависимости, поскольку многие нестепенные распределения будут отображаться в виде прямых линий на графике в двойном логарифмическом масштабе. [10] [58] Этот метод заключается в построении логарифма оценочной функции вероятности того, что определенное число распределения встречается в сравнении с логарифмом этого конкретного числа. Обычно эта оценочная функция представляет собой долю раз, когда число встречается в наборе данных. Если точки на графике имеют тенденцию сходиться к прямой линии для больших чисел по оси x, то исследователь приходит к выводу, что распределение имеет степенной хвост. Были опубликованы примеры применения этих типов графиков. [59] Недостатком этих графиков является то, что для того, чтобы они обеспечивали надежные результаты, они требуют огромных объемов данных. Кроме того, они подходят только для дискретных (или сгруппированных) данных.
Был предложен еще один графический метод идентификации степенных распределений вероятностей с использованием случайных выборок. [55] Эта методология состоит из построения графика пучка для логарифмически преобразованной выборки . Первоначально предложенный как инструмент для исследования существования моментов и функции генерации моментов с использованием случайных выборок, методология пучка основана на остаточных квантильных функциях (RQF), также называемых остаточными процентильными функциями, [60] [61] [62] [63] [64] [65] [66], которые обеспечивают полную характеристику поведения хвоста многих известных распределений вероятностей, включая степенные распределения, распределения с другими типами тяжелых хвостов и даже распределения без тяжелых хвостов. Графики пучка не имеют недостатков графиков Парето Q–Q, графиков средней остаточной продолжительности жизни и графиков логарифмов, упомянутых выше (они устойчивы к выбросам, позволяют визуально идентифицировать степенные законы с малыми значениями и не требуют сбора большого количества данных). [ необходима цитата ] Кроме того, с помощью диаграмм пучков можно определить и другие типы поведения хвоста.
В общем, степенные распределения строятся на двойных логарифмических осях , что подчеркивает верхнюю хвостовую область. Наиболее удобный способ сделать это — использовать (дополнительное) кумулятивное распределение (ccdf), то есть функцию выживания , ,
Функция cdf также является степенной функцией, но с меньшим показателем масштабирования. Для данных эквивалентной формой cdf является подход ранг-частота, в котором мы сначала сортируем наблюдаемые значения в порядке возрастания и наносим их на график против вектора .
Хотя может быть удобно логарифмировать данные или иным образом сглаживать функцию плотности вероятности (массы) напрямую, эти методы вносят неявное смещение в представление данных, и поэтому их следует избегать. [10] [67] Функция выживания, с другой стороны, более устойчива к (но не без) таким смещениям в данных и сохраняет линейную сигнатуру на двойных логарифмических осях. Хотя представление функции выживания предпочтительнее, чем представление pdf при подгонке степенного закона к данным с помощью линейного метода наименьших квадратов, оно не лишено математической неточности. Таким образом, при оценке показателей степенного распределения рекомендуется использовать оценку максимального правдоподобия.
Существует много способов оценки значения показателя масштабирования для хвоста степенного закона, однако не все из них дают непредвзятые и последовательные ответы . Некоторые из наиболее надежных методов часто основаны на методе максимального правдоподобия . Альтернативные методы часто основаны на создании линейной регрессии либо на логарифмической вероятности, либо на логарифмической кумулятивной функции распределения, либо на логарифмически сгруппированных данных, но этих подходов следует избегать, поскольку все они могут привести к сильно предвзятым оценкам показателя масштабирования. [10]
Для действительных, независимых и одинаково распределенных данных мы подбираем степенное распределение вида
к данным , где коэффициент включен для обеспечения нормализации распределения . При выборе для функция логарифмического правдоподобия становится:
Максимум этого правдоподобия находится путем дифференцирования по параметру , приравнивая результат к нулю. После перестановки это дает уравнение оценки:
где — точки данных . [2] [68] Эта оценка демонстрирует небольшое смещение конечного размера выборки порядка , которое мало при n > 100. Кроме того, стандартная ошибка оценки равна . Эта оценка эквивалентна популярной [ требуется цитирование ] оценке Хилла из количественной финансовой теории и теории экстремальных значений . [ требуется цитирование ]
Для набора из n целочисленных точек данных , где снова каждая , показатель максимального правдоподобия является решением трансцендентного уравнения
где — неполная дзета-функция . Неопределенность в этой оценке следует той же формуле, что и для непрерывного уравнения. Однако два уравнения для не эквивалентны, и непрерывная версия не должна применяться к дискретным данным, и наоборот.
Кроме того, обе эти оценки требуют выбора . Для функций с нетривиальной функцией выбор слишком малого значения приводит к значительному смещению в , тогда как выбор слишком большого значения увеличивает неопределенность в , и снижает статистическую мощность нашей модели. В целом, лучший выбор сильно зависит от конкретной формы нижнего хвоста, представленного выше.
Более подробную информацию об этих методах и условиях, при которых их можно использовать, можно найти в [10] . Кроме того, в этой комплексной обзорной статье представлен пригодный для использования код (Matlab, Python, R и C++) для процедур оценки и тестирования степенных распределений.
Другой метод оценки показателя степенного закона, который не предполагает независимости и одинакового распределения (iid) данных, использует минимизацию статистики Колмогорова–Смирнова , , между кумулятивными функциями распределения данных и степенным законом:
с
где и обозначают cdfs данных и степенной закон с показателем , соответственно. Поскольку этот метод не предполагает iid данных, он предоставляет альтернативный способ определения показателя степенного закона для наборов данных, в которых временная корреляция не может быть проигнорирована. [5]
Этот критерий [69] может быть применен для оценки показателя степенного закона в случае безмасштабных распределений и обеспечивает более сходящуюся оценку, чем метод максимального правдоподобия. Он был применен для изучения вероятностных распределений апертур трещин. В некоторых контекстах распределение вероятностей описывается не кумулятивной функцией распределения , а кумулятивной частотой свойства X , определяемой как число элементов на метр (или единицу площади, секунду и т. д.), для которых применяется X > x , где x — переменное действительное число. Например, [ требуется ссылка ] кумулятивное распределение апертуры трещины X для выборки из N элементов определяется как «число трещин на метр, имеющих апертуру больше x» . Использование кумулятивной частоты имеет некоторые преимущества, например, оно позволяет помещать на одну и ту же диаграмму данные, собранные с линий выборки разной длины в разных масштабах (например, с обнажения и с микроскопа).
Хотя степенные соотношения привлекательны по многим теоретическим причинам, демонстрация того, что данные действительно следуют степенному соотношению, требует большего, чем просто подгонка конкретной модели к данным. [34] Это важно для понимания механизма, который приводит к распределению: внешне похожие распределения могут возникать по существенно разным причинам, и разные модели дают разные прогнозы, такие как экстраполяция.
Например, логнормальное распределение часто ошибочно принимают за степенное распределение: [70] набор данных, полученный из логнормального распределения, будет приблизительно линейным для больших значений (что соответствует верхнему хвосту логнормального распределения, близкому к степенному закону) [ необходимо пояснение ] , но для малых значений логнормальное распределение будет значительно падать (прогибаться), что соответствует малому нижнему хвосту логнормального распределения (в степенном законе очень мало малых значений, а не много малых значений). [ необходимо цитирование ]
Например, закон Жибрата о пропорциональных процессах роста создает распределения, которые являются логнормальными, хотя их графики логарифмического распределения выглядят линейными в ограниченном диапазоне. Объяснение этого заключается в том, что хотя логарифм логарифмической нормальной функции плотности является квадратичным по log( x ) , что дает «изогнутую» форму на графике логарифмического распределения, если квадратичный член мал по сравнению с линейным членом, то результат может казаться почти линейным, а логарифмическое поведение заметно только тогда, когда доминирует квадратичный член, что может потребовать значительно больше данных. Следовательно, график логарифмического распределения, который слегка «изогнут» вниз, может отражать логарифмически нормальное распределение, а не степенной закон.
В целом, многие альтернативные функциональные формы могут в некоторой степени следовать форме степенного закона. [71] Stumpf & Porter (2012) предложили построить график эмпирической кумулятивной функции распределения в области двойного логарифма и заявили, что кандидат на степенной закон должен охватывать по крайней мере два порядка величины. [72] Кроме того, исследователи обычно сталкиваются с проблемой принятия решения о том, следует ли распределение вероятностей в реальном мире степенному закону. В качестве решения этой проблемы Диас [55] предложил графическую методологию, основанную на случайных выборках, которые позволяют визуально различать различные типы поведения хвостов. Эта методология использует пучки остаточных квантильных функций, также называемых процентильными остаточными функциями жизни, которые характеризуют множество различных типов хвостов распределения, включая как тяжелые, так и нетяжелые хвосты. Однако Stumpf & Porter (2012) заявили о необходимости как статистической, так и теоретической основы для поддержки степенного закона в базовом механизме, управляющем процессом генерации данных. [72]
Один из методов проверки степенного отношения проверяет множество ортогональных предсказаний конкретного генеративного механизма по данным. Простая подгонка степенного отношения к определенному виду данных не считается рациональным подходом. Таким образом, проверка утверждений степенного права остается очень активной областью исследований во многих областях современной науки. [10]
Примечания
Библиография