stringtranslate.com

Информант (статистика)

В статистике информатор [1] (или оценка ) представляет собой градиент логарифмической функции правдоподобия относительно вектора параметров . Оценка, оцениваемая в конкретной точке вектора параметров, указывает на крутизну функции логарифмического правдоподобия и, следовательно, на чувствительность к бесконечно малым изменениям значений параметров. Если функция логарифмического правдоподобия непрерывна в пространстве параметров , оценка будет равна нулю при локальном максимуме или минимуме ; этот факт используется при оценке максимального правдоподобия , чтобы найти значения параметров, которые максимизируют функцию правдоподобия.

Поскольку оценка является функцией наблюдений , которые подвержены ошибкам выборки , она поддается тестовой статистике , известной как тест оценки , в которой параметр удерживается на определенном значении. Кроме того, отношение двух функций правдоподобия , оцененных при двух различных значениях параметров, можно понимать как определенный интеграл оценочной функции. [2]

Определение

Оценка представляет собой градиент (вектор частных производных ) натурального логарифма функции правдоподобия по отношению к m -мерному вектору параметров .

Это дифференцирование дает вектор-строку для каждого значения и и указывает чувствительность вероятности (ее производная, нормализованная по ее значению).

В более старой литературе [ нужна ссылка ] «линейная оценка» может относиться к оценке относительно бесконечно малого перевода данной плотности. Это соглашение возникло в то время, когда основным интересующим параметром было среднее значение или медиана распределения. В этом случае вероятность наблюдения определяется плотностью формы [ нужны разъяснения ] . «Линейная оценка» тогда определяется как

Характеристики

Иметь в виду

Хотя оценка является функцией , она также зависит от наблюдений, при которых оценивается функция правдоподобия, и ввиду случайного характера выборки можно взять ее ожидаемое значение по выборочному пространству . При определенных условиях регулярности функций плотности случайных величин [3] [4] ожидаемое значение оценки, оцененное при истинном значении параметра , равно нулю. Чтобы убедиться в этом, перепишем функцию правдоподобия как функцию плотности вероятности и обозначим выборочное пространство . Затем:

Предполагаемые условия регулярности допускают замену производной и интеграла (см. интегральное правило Лейбница ), поэтому приведенное выше выражение можно переписать как [ необходимы пояснения ]

Стоит переформулировать приведенный выше результат словами: ожидаемое значение оценки при истинном значении параметра равно нулю. Таким образом, если бы кто-то неоднократно производил выборку из некоторого распределения и неоднократно вычислял оценку, то среднее значение оценок асимптотически стремилось бы к нулю .

Дисперсия

Дисперсия оценки может быть получена из приведенного выше выражения для ожидаемого значения.

Следовательно, дисперсия оценки равна отрицательному ожидаемому значению матрицы Гессе логарифмического правдоподобия. [5]

Последняя известна как информация Фишера и записывается . Обратите внимание, что информация Фишера не является функцией какого-либо конкретного наблюдения, поскольку случайная величина усреднена. Эта концепция информации полезна при сравнении двух методов наблюдения за некоторым случайным процессом .

Примеры

Процесс Бернулли

Представьте себе, что вы наблюдаете за первыми n попытками процесса Бернулли и видите, что A из них являются успешными, а остальные B — неудачными, где вероятность успеха равна  θ .

Тогда вероятность

так что оценка s равна

Теперь мы можем убедиться, что математическое ожидание оценки равно нулю. Отмечая, что математическое ожидание A равно , а математическое ожидание B равно n (1 −  θ ) (напомним, что A и B — случайные величины), мы можем видеть, что математическое ожидание s равно

Мы также можем проверить дисперсию . Мы знаем, что A + B = n (поэтому Bn  −  A ), а дисперсия A равна (1 −  θ ), поэтому дисперсия s равна

Модель двоичного результата

Для моделей с двоичными результатами ( Y = 1 или 0) модель можно оценить с помощью логарифма прогнозов.

где p — вероятность в оцениваемой модели, а S — оценка. [6]

Приложения

Алгоритм подсчета очков

Алгоритм оценки представляет собой итерационный метод численного определения оценки максимального правдоподобия .

Оценка теста

Обратите внимание, что это функция и наблюдение , так что, вообще говоря, это не статистика . Однако в некоторых приложениях, таких как тест на оценку , оценка оценивается по определенному значению (например, значению нулевой гипотезы), и в этом случае результатом является статистика. Интуитивно понятно, что если ограниченная оценка близка к максимуму функции правдоподобия, оценка не должна отличаться от нуля более чем на ошибку выборки . В 1948 году Ч.Р. Рао впервые доказал , что квадрат результата, разделенный на информационную матрицу, подчиняется асимптотическому 2 -распределению при нулевой гипотезе. [7]

Также обратите внимание, что критерий отношения правдоподобия определяется выражением

это означает, что тест отношения правдоподобия можно понимать как область под оценочной функцией между и . [8]

Сопоставление оценок (машинное обучение)

Сопоставление оценок описывает процесс применения алгоритмов машинного обучения (обычно нейронных сетей ) для аппроксимации оценочной функции неизвестного распределения на основе конечных выборок. Изученную функцию затем можно использовать в генеративном моделировании для получения новых образцов из файлов . [9]

Может показаться странным, что слово «оценка» использовалось для обозначения , поскольку оно не является функцией правдоподобия и не имеет производной по параметрам. Дополнительную информацию об этом определении см. в указанном документе. [10]

История

Термин «оценочная функция» на первый взгляд может показаться несвязанным с его современным значением, которое сосредоточено вокруг производной логарифмической функции правдоподобия в статистических моделях. Это очевидное несоответствие можно проследить до исторического происхождения этого термина. Понятие «оценочной функции» было впервые введено британским статистиком Рональдом Фишером в его статье 1935 года под названием «Обнаружение связи с «доминантными» аномалиями». [11] Фишер использовал этот термин в контексте генетического анализа, особенно для семей, где у родителей была доминантная генетическая аномалия. Со временем применение и значение «оценочной функции» изменились, отклонившись от первоначального контекста, но сохранив свои основополагающие принципы. [12] [13]

Первоначально Фишер использовал этот термин в контексте анализа генетических признаков в семьях, где один из родителей обладал генетической аномалией. Он разделил детей таких родителей на четыре класса на основе двух бинарных признаков: унаследовали ли они аномалию или нет, а также их зиготного статуса как гомозиготного или гетерозиготного. Фишер разработал метод присвоения каждой семье «балла», рассчитанного на основе количества детей, попадающих в каждую из четырех категорий. Этот показатель использовался для оценки того, что он называл «параметром сцепления», который описывал вероятность наследования генетической аномалии. Фишер оценил эффективность своего правила оценки, сравнив его с альтернативным правилом и с тем, что он назвал «идеальным результатом». Идеальная оценка определялась как производная логарифма плотности выборки, как упоминалось на странице 193 его работы. [11]

Термин «оценка» позже развился в ходе последующих исследований, заметно выйдя за рамки конкретного применения в генетике, к которому первоначально обращался Фишер. Различные авторы адаптировали оригинальную методологию Фишера к более обобщенному статистическому контексту. В этих более широких приложениях термин «оценка» или «эффективная оценка» стал чаще относиться к производной логарифмической функции правдоподобия рассматриваемой статистической модели. На это концептуальное расширение значительное влияние оказала статья Ч.Р. Рао 1948 года, в которой были представлены «эффективные тесты оценки», в которых использовалась производная логарифмической функции правдоподобия. [14]

Таким образом, то, что начиналось как специальный термин в области генетической статистики, превратилось в фундаментальную концепцию более широкой статистической теории, часто связанную с производной логарифмической функции правдоподобия.


Смотрите также

Примечания

  1. ^ Информатор в Математической энциклопедии
  2. ^ Пиклз, Эндрю (1985). Введение в анализ правдоподобия. Норидж: WH Hutchins & Sons. стр. 24–29. ISBN 0-86094-190-6.
  3. ^ Серфлинг, Роберт Дж. (1980). Аппроксимационные теоремы математической статистики . Нью-Йорк: Джон Уайли и сыновья. п. 145. ИСБН 0-471-02403-1.
  4. ^ Гринберг, Эдвард; Вебстер, Чарльз Э. младший (1983). Продвинутая эконометрика: мост к литературе. Нью-Йорк: Джон Уайли и сыновья. п. 25. ISBN 0-471-09077-8.
  5. ^ Сарган, Денис (1988). Лекции по углубленной эконометрике . Оксфорд: Бэзил Блэквелл. стр. 16–18. ISBN 0-631-14956-2.
  6. ^ Штайерберг, EW; Викерс, Эй Джей; Кук, Северная Каролина; Гердс, Т.; Гонен, М.; Обуховский, Н. ; Пенчина, MJ; Каттан, Миссури (2010). «Оценка эффективности моделей прогнозирования. Основа для традиционных и новых мер». Эпидемиология . 21 (1): 128–138. doi : 10.1097/EDE.0b013e3181c30fb2. ПМЦ 3575184 . ПМИД  20010215. 
  7. ^ Рао, К. Радхакришна (1948). «Большие выборочные проверки статистических гипотез, касающихся нескольких параметров, с применением к задачам оценки». Математические труды Кембриджского философского общества . 44 (1): 50–57. Бибкод : 1948PCPS...44...50R. дои : 10.1017/S0305004100023987. S2CID  122382660.
  8. ^ Бусе, А. (1982). «Отношение правдоподобия, тесты Вальда и множителей Лагранжа: пояснительная записка». Американский статистик . 36 (3а): 153–157. дои : 10.1080/00031305.1982.10482817.
  9. ^ Ян Сун; Яша Золь-Дикштейн; Дидерик П. Кингма; Абхишек Кумар; Стефано Эрмон; Бен Пул (2020). «Генераторное моделирование на основе оценок с помощью стохастических дифференциальных уравнений». arXiv : 2011.13456 [cs.LG].
  10. ^ https://www.jmlr.org/papers/volume6/hyvarinen05a/hyvarinen05a.pdf
  11. ^ аб Фишер, Рональд Эйлмер. «Обнаружение связи с «доминирующими» аномалиями». Анналы евгеники 6.2 (1935): 187-201.
  12. ^ Бен (https://stats.stackexchange.com/users/173082/ben), Интерпретация «оценки», URL (версия: 17 апреля 2019 г.): https://stats.stackexchange.com/q/342374
  13. ^ Миллер, Джефф. «Самые ранние известные варианты использования некоторых математических слов (S)». Заметки по истории математики. Последняя редакция: 14 апреля 2020 г. https://mathshistory.st-andrews.ac.uk/Miller/mathword/s/.
  14. ^ Радхакришна Рао, К. (1948). Большие выборочные проверки статистических гипотез, касающихся нескольких параметров, с применением к задачам оценки. Математические труды Кембриджского философского общества, 44 (1), 50-57. doi:10.1017/S0305004100023987

Рекомендации