stringtranslate.com

Вспомогательная статистика

В статистике вспомогательность — это свойство статистики , вычисляемое на выборочном наборе данных по отношению к параметрической модели набора данных. Вспомогательная статистика имеет одинаковое распределение независимо от значений параметров и, таким образом, не предоставляет никакой информации о них. [ 1] [2] [3] Она противоположна концепции полной статистики, которая не содержит никакой вспомогательной информации. Она тесно связана с концепцией достаточной статистики , которая содержит всю информацию, которую набор данных предоставляет о параметрах.

Вспомогательная статистика — это частный случай основной величины , которая вычисляется только из данных, а не из параметров. Они могут использоваться для построения интервалов прогнозирования . Они также используются в связи с теоремой Басу для доказательства независимости между статистиками. [4]

Эта концепция была впервые введена Рональдом Фишером в 1920-х годах [5], но ее формальное определение было предоставлено только в 1964 году Дебабратой Басу . [6] [7]

Примеры

Предположим, что X 1 , ..., X n независимы и одинаково распределены , причем распределены нормально с неизвестным ожидаемым значением μ и известной дисперсией 1. Пусть

быть выборочным средним .

Следующие статистические меры дисперсии выборки

все это вспомогательные статистики , потому что их выборочные распределения не меняются при изменении μ . С точки зрения вычислений это происходит потому, что в формулах члены μ сокращаются — добавление постоянного числа к распределению (и всем выборкам) изменяет его выборочный максимум и минимум на ту же величину, поэтому это не меняет их разность, и аналогично для других: эти меры дисперсии не зависят от местоположения.

Наоборот, если заданы независимые нормальные переменные с известным средним 1 и неизвестной дисперсией σ 2 , то выборочное среднее не является вспомогательной статистикой дисперсии, поскольку выборочное распределение выборочного среднего равно N (1,  σ 2 / n ), которое зависит от σ 2 – эта мера местоположения (в частности, ее стандартная ошибка ) зависит от дисперсии. [8]

В семьях, привязанных к местоположению

В семействе распределений по местоположению является вспомогательной статистикой.

В масштабном семействе распределений является вспомогательной статистикой.

В семействе распределений масштаба местоположения , где — дисперсия выборки, — вспомогательная статистика. [3] [9]

В восстановлении информации

Оказывается, если является недостаточной статистикой и является вспомогательной, иногда можно восстановить всю информацию о неизвестном параметре, содержащуюся во всех данных, сообщая при этом обусловливая наблюдаемое значение . Это известно как условный вывод . [3]

Например, предположим, что следуют распределению, где неизвестно. Обратите внимание, что, хотя недостаточно для (поскольку его информация Фишера равна 1, тогда как информация Фишера полной статистики равна 2), дополнительно сообщая вспомогательную статистику , можно получить совместное распределение с информацией Фишера 2. [3]

Вспомогательное дополнение

Если статистика T недостаточна , то вспомогательное дополнение — это статистика U , которая является вспомогательной и такой, что ( TU ) достаточно. [2] Интуитивно понятно, что вспомогательное дополнение «добавляет недостающую информацию» (не дублируя ее).

Статистика особенно полезна, если взять T в качестве оценщика максимального правдоподобия , что в общем случае будет недостаточно; тогда можно попросить вспомогательное дополнение. В этом случае Фишер утверждает, что необходимо обусловить вспомогательное дополнение, чтобы определить информационное содержание: следует считать информационное содержание Фишера T не пределом T , а условным распределением T , учитывая U : сколько информации добавляет T ? В общем случае это невозможно, поскольку не требуется никакого вспомогательного дополнения, а если оно существует, оно не обязательно должно быть уникальным, и не существует максимального вспомогательного дополнения.

Пример

В бейсболе предположим, что скаут наблюдает за отбивающим в N отбивках. Предположим (нереалистично), что число N выбирается некоторым случайным процессом, который не зависит от способностей отбивающего — скажем, монета подбрасывается после каждого отбива, и результат определяет, останется ли скаут наблюдать за следующим отбивающим. Окончательными данными являются число N отбивок и число X попаданий: данные ( XN ) являются достаточной статистикой. Наблюдаемое среднее отбивание X / N не передает всей информации, имеющейся в данных, поскольку оно не сообщает число N отбивок (например, среднее отбивание 0,400, что очень высоко , основанное только на пяти отбивках, не внушает такой же уверенности в способностях игрока, как среднее 0,400, основанное на 100 отбивках). Число N выходов на биту является вспомогательной статистикой, поскольку

Эта вспомогательная статистика является вспомогательным дополнением к наблюдаемому среднему показателю отбивания X / N , т. е. средний показатель отбивания X / N не является достаточной статистикой , поскольку он передает не всю необходимую информацию в данных, но в сочетании с N он становится достаточным.

Смотрите также

Примечания

  1. ^ Lehmann, EL; Scholz, FW (1992). "Ancilarity" (PDF) . Lecture Notes-Monograph Series . Institute of Mathematical Statistics Lecture Notes - Monograph Series. 17 : 32–51. doi :10.1214/lnms/1215458837. ISBN 0-940600-24-2. ISSN  0749-2170. JSTOR  4355624.
  2. ^ ab Ghosh, M.; Reid, N.; Fraser, DAS (2010). «Вспомогательная статистика: обзор». Statistica Sinica . 20 (4): 1309–1332. ISSN  1017-0405. JSTOR  24309506.
  3. ^ abcd Mukhopadhyay, Nitis (2000). Вероятность и статистический вывод . Соединенные Штаты Америки: Marcel Dekker, Inc. стр. 309–318. ISBN 0-8247-0379-0.
  4. ^ Давид, Филип (2011), ДасГупта, Анирбан (ред.), «Басу о вспомогательности», Избранные работы Дебабраты Басу , Нью-Йорк, Нью-Йорк: Springer, стр. 5–8, doi : 10.1007/978-1-4419 -5825-9_2 , ISBN 978-1-4419-5825-9
  5. ^ Фишер, РА (1925). «Теория статистической оценки». Математические труды Кембриджского философского общества . 22 (5): 700–725. Bibcode :1925PCPS...22..700F. doi :10.1017/S0305004100009580. hdl : 2440/15186 . ISSN  0305-0041.
  6. ^ Басу, Д. (1964). «Восстановление вспомогательной информации». Санкхья: Индийский журнал статистики, серия A (1961-2002) . 26 (1): 3–16. ISSN  0581-572X. JSTOR  25049300.
  7. ^ Стиглер, Стивен М. (2001), Вспомогательная история, Конспект лекций Института математической статистики - Серия монографий, Бичвуд, Огайо: Институт математической статистики, стр. 555–567, doi : 10.1214/lnms/1215090089 , ISBN 978-0-940600-50-8, получено 2023-04-24
  8. ^ Бюлер, Роберт Дж. (1982). «Некоторые вспомогательные статистики и их свойства». Журнал Американской статистической ассоциации . 77 (379): 581–589. doi : 10.1080/01621459.1982.10477850. hdl : 11299/199392 . ISSN  0162-1459.
  9. ^ "Вспомогательная статистика" (PDF) .