stringtranslate.com

Индекс Тейла

Индекс Тейла — это статистика, которая в основном используется для измерения экономического неравенства [1] и других экономических явлений, хотя он также используется для измерения расовой сегрегации. [2] [3]

Индекс Тейла T T — это то же самое, что избыточность в теории информации , которая представляет собой максимально возможную энтропию данных минус наблюдаемая энтропия. Это частный случай обобщенного индекса энтропии . Его можно рассматривать как меру избыточности, отсутствия разнообразия, изоляции, сегрегации, неравенства, неслучайности и сжимаемости. Его предложил голландский эконометрик Анри Тейл (1924–2000) из Роттердамского университета Эразма . [3]

Сам Анри Тейль сказал (1967): «Индекс (Тейла) можно интерпретировать как ожидаемое информационное содержание косвенного сообщения, которое преобразует доли населения как априорные вероятности в доли доходов как апостериорные вероятности». [4]

Амартия Сен отметил: «Но факт остается фактом: индекс Тейла — это произвольная формула, и среднее значение логарифмов обратных величин долей дохода, взвешенных по доходу, не является мерой, которая точно переполнена интуитивным смыслом». [4]

Формула

Для популяции из N «агентов», каждый из которых имеет характеристику x , ситуация может быть представлена ​​списком x i ( i  = 1,..., N ), где x i — характеристика агента i . Например, если характеристикой является доход, то x i — это доход агента i .

Индекс Тейла Т определяется как [5]

а индекс Тейла L определяется как [5]

где средний доход:

Theil-L — это дисэнтропия распределения дохода на человека, измеренная относительно максимальной энтропии (... которая достигается при полном равенстве).

(В альтернативной интерпретации Тейл-L представляет собой натуральный логарифм среднего геометрического отношения: (средний доход)/(доход i) по всем доходам. Соответствующее соотношение Аткинсона (1) равно всего 1 минус среднее геометрическое (доход i)/(средний доход) по распределению дохода.)

Поскольку трансферт между более высоким и меньшим доходом изменит соотношение меньшего дохода больше, чем соотношение большего дохода, этот индекс удовлетворяет принципу трансферта.

Эквивалентно, если ситуация характеризуется дискретной функцией распределения f k ( k  = 0,..., W ), где f k — доля населения с доходом k , а W = — общий доход, тогда и индекс:

где снова средний доход:

Обратите внимание, что в этом случае доход k является целым числом, а k=1 представляет собой наименьшее возможное приращение дохода (например, в центах).

если ситуация характеризуется непрерывной функцией распределения f ( k ) (поддерживаемой от 0 до бесконечности), где f ( kdk — это доля населения с доходом от k до k  +  dk , то индекс Тейла равен:

где среднее значение:

Индексы Тейла для некоторых распространенных непрерывных распределений вероятностей приведены в таблице ниже:

Если у всех одинаковый доход, то T T равен 0. Если весь доход принадлежит одному человеку, то T T дает результат , который представляет собой максимальное неравенство. Деление T T на может нормализовать уравнение до диапазона от 0 до 1, но тогда аксиома независимости нарушается: и не может квалифицироваться как мера неравенства.

Индекс Тейла измеряет энтропийное «расстояние», на котором население находится от эгалитарного состояния, когда все имеют одинаковый доход. Числовой результат выражен в терминах отрицательной энтропии, так что большее число указывает на больший порядок, который находится дальше от полного равенства. Формулировка индекса для представления отрицательной энтропии вместо энтропии позволяет ему быть мерой неравенства, а не равенства.

Связь с индексом Аткинсона

Индекс Тейла можно преобразовать в индекс Аткинсона , который имеет диапазон от 0 до 1 (0% и 100%), где 0 указывает на полное равенство, а 1 (100%) указывает на максимальное неравенство. (Информацию о преобразовании см. в разделе «Обобщенный индекс энтропии» .)

Вывод из энтропии

Индекс Тейла получен из меры Шеннона информационной энтропии , где энтропия является мерой случайности в данном наборе информации. В теории информации, физике и индексе Тейла общая форма энтропии равна

где
  • — это отдельный элемент множества (например, отдельный член совокупности или отдельный байт из компьютерного файла).
  • — вероятность найти случайную выборку из множества.
  • является константой. [примечание 1]
  • представляет собой логарифм с основанием, равным . [заметка 2]

При рассмотрении распределения доходов среди населения он равен отношению дохода конкретного человека к общему доходу всего населения. Это дает наблюдаемую энтропию популяции:

где
  • это доход конкретного человека.
  • представляет собой совокупный доход всего населения, при этом
  • это количество особей в популяции.
  • («x bar») — средний доход населения.
  • является натуральным логарифмом : .

Индекс Тейла измеряет, насколько далека наблюдаемая энтропия ( , которая показывает, насколько случайным образом распределяется доход) от максимально возможной энтропии ( , [примечание 3] , которая представляет собой максимальное распределение дохода среди отдельных лиц в популяции – распределение, аналогичное [наиболее вероятный] результат бесконечного числа случайных подбрасываний монеты: равное распределение орла и решки). Следовательно, индекс Тейла представляет собой разницу между теоретической максимальной энтропией (которая была бы достигнута, если бы доходы каждого человека были равны) минус наблюдаемая энтропия:


Когда выражается в единицах популяции/вида, это мера биоразнообразия и называется индексом Шеннона . Если индекс Тейла используется с x = популяция/вид, это мера неравенства популяций среди набора видов или «биоизоляции», а не «изоляции богатства».

Индекс Тейла измеряет то, что в теории информации называется избыточностью . [5] Оставшееся «информационное пространство», которое не было использовано для передачи информации, снижает эффективность ценового сигнала . [ оригинальное исследование? ] Индекс Тейла — это показатель избыточности дохода (или другого показателя богатства) у некоторых людей. Избыточность у одних людей подразумевает дефицит у других. Высокий индекс Тейла указывает на то, что общий доход не распределяется равномерно среди людей, точно так же, как несжатый текстовый файл не имеет одинакового количества байтовых ячеек, присвоенных доступным уникальным байтовым символам.

Разложимость

По данным Всемирного банка ,

«Самыми известными мерами энтропии являются Тейла T ( ) и Тейла L ( ), оба из которых позволяют разложить неравенство на часть, которая обусловлена ​​неравенством внутри территорий (например, в городах, сельской местности), и часть, которая обусловлена ​​различиями. между областями (например, разница в доходах между деревней и городом). Обычно по крайней мере три четверти неравенства в стране обусловлено внутригрупповым неравенством, а оставшаяся четверть — различиями между группами». [7]

Если население разделить на подгруппы и

тогда индекс Тейла равен

для

Например, неравенство в Соединенных Штатах — это среднее неравенство внутри каждого штата, взвешенное по доходу штата, плюс неравенство между штатами.

Карта экономического неравенства в США с использованием индекса Тейла. Высокий положительный индекс Тил указывает на то, что доход превышает численность населения, а отрицательное значение указывает на то, что численность населения превышает доходы. Нулевое значение показывает равенство между населением и доходом.
Карта экономического неравенства в США с использованием индекса Тейла. Высокий положительный индекс Тил указывает на то, что доход превышает численность населения, а отрицательное значение указывает на то, что численность населения превышает доходы. Нулевое значение показывает равенство между населением и доходом.
Примечание . Это изображение не представляет собой индекс Тейла в каждом регионе Соединенных Штатов, а представляет собой вклад в индекс Тейла для США по каждому региону. Индекс Тейла всегда положителен, хотя индивидуальный вклад в индекс Тейла может быть отрицательным или положительным.

Разложение индекса Тейла, которое определяет долю, приходящуюся на межрегиональный компонент, становится полезным инструментом для позитивного анализа регионального неравенства, поскольку оно предполагает относительную важность пространственного измерения неравенства. [8]

Тейла Т против Л Тейла

И T Тейла , и L Тейла разложимы. Разница между ними основана на той части распределения результатов, для которой используется каждый из них. Индексы неравенства в семействе обобщенной энтропии (GE) более чувствительны к различиям в доле доходов среди бедных или среди богатых в зависимости от параметра, определяющего индекс GE. Чем меньше значение параметра для GE, тем более он чувствителен к различиям в нижней части распределения. [9]

GE(0) = L Тейла и более чувствителен к различиям в нижней части распределения. Его также называют мерой среднего логарифмического отклонения .
GE(1) = T Тейла и более чувствителен к различиям в верхней части распределения.

Разложимость — это свойство индекса Тейла, которого нет в более популярном коэффициенте Джини . Коэффициент Джини более понятен многим людям, поскольку он основан на кривой Лоренца . Однако его нелегко разложить, как Тейла.

Приложения

Помимо множества экономических применений, индекс Тейла применялся для оценки производительности ирригационных систем [10] и распределения показателей программного обеспечения . [11]

Смотрите также

Примечания

  1. ^ Когда это уравнение используется в физике, оно обычно представляет собой константу Больцмана . В теории информации или статистике обычно равен 1 (например, в индексе Тейла).
  2. ^ В теории информации, когда информация дается в двоичных цифрах, используется двоичный логарифм ( равный 2). В физике, а также при расчете индекса Тейла используется натуральный логарифм ( равный e ).
  3. ^ Когда доход каждого человека равен среднему доходу,

Рекомендации

  1. ^ Введение в индекс Тейла Техасского университета.
  2. ^ «Меры сегрегации». www.urban.org . Городской институт . Проверено 5 февраля 2018 г.
  3. ^ Аб Паркер, Лорен (20 июля 2015 г.). «Расовая и этническая сегрегация: в новостях и на карте политики». Карта Политики . Проверено 5 февраля 2018 г.
  4. ^ аб Консейсао, Педро НМИ2; Феррейра, Педро М. (2000). «Путеводитель по индексу Тейла для молодежи: предложение интуитивных интерпретаций и исследование аналитических приложений». Электронный журнал ССРН . дои : 10.2139/ssrn.228703. ISSN  1556-5068. S2CID  19009769.{{cite journal}}: CS1 maint: numeric names: authors list (link)
  5. ^ abc http://www.poorcity.richcity.org (меры избыточности, энтропии и неравенства)
  6. ^ Макдональд, Джеймс Б; Дженсен, Бартелл К. (декабрь 1979 г.). «Анализ некоторых свойств альтернативных показателей неравенства доходов на основе функции гамма-распределения». Журнал Американской статистической ассоциации . 74 (368): 856–860. дои : 10.1080/01621459.1979.10481042.
  7. ^ «6. Меры неравенства». Руководство по борьбе с бедностью (PDF) . Всемирный банк . 8 августа 2005 г. с. 95 . Проверено 4 февраля 2018 г.
  8. ^ Новотны, Дж. (2007). «Об измерении регионального неравенства: имеет ли значение пространственный размер неравенства доходов?» (PDF) . Анналы региональной науки . 41 (3): 563–580. дои : 10.1007/s00168-007-0113-y. S2CID  51753883.
  9. ^ «Меры неравенства». www.urban.org . Городской институт . Проверено 5 февраля 2018 г.
  10. ^ Раджан К. Сампат. Меры справедливости для оценки эффективности ирригации. Water International, 13 (1), 1988.
  11. ^ А. Серебреник, М. ван ден Бранд. Индекс Тейла для агрегирования значений метрик программного обеспечения. 26-я Международная конференция IEEE по сопровождению программного обеспечения. Компьютерное общество IEEE.

Внешние ссылки