stringtranslate.com

Тест отношения правдоподобия

В статистике тест отношения правдоподобия — это проверка гипотезы , которая включает сравнение степени соответствия двух конкурирующих статистических моделей , обычно одной, найденной путем максимизации по всему пространству параметров , и другой, найденной после наложения некоторого ограничения , на основе отношения их правдоподобий . Если более ограниченная модель (т. е. нулевая гипотеза ) поддерживается наблюдаемыми данными , два правдоподобия не должны отличаться более чем на ошибку выборки . [1] Таким образом, тест отношения правдоподобия проверяет, значительно ли отличается это отношение от единицы или, что эквивалентно, значительно ли отличается его натуральный логарифм от нуля.

Тест отношения правдоподобия, также известный как тест Уилкса , [2] является старейшим из трех классических подходов к проверке гипотез, вместе с тестом множителей Лагранжа и тестом Вальда . [3] Фактически, последние два могут быть концептуализированы как приближения к тесту отношения правдоподобия, и они асимптотически эквивалентны. [4] [5] [6] В случае сравнения двух моделей, каждая из которых не имеет неизвестных параметров , использование теста отношения правдоподобия может быть оправдано леммой Неймана–Пирсона . Лемма показывает, что тест имеет самую высокую мощность среди всех конкурентов. [7]

Определение

Общий

Предположим, что у нас есть статистическая модель с пространством параметров . Нулевая гипотеза часто формулируется как утверждение, что параметр лежит в указанном подмножестве . Альтернативная гипотеза , таким образом, заключается в том, что лежит в дополнении к , т.е. в , что обозначается как . Статистика теста отношения правдоподобия для нулевой гипотезы определяется как: [8]

где величина внутри скобок называется отношением правдоподобия. Здесь обозначение относится к супремуму . Поскольку все правдоподобия положительны, а ограниченный максимум не может превышать неограниченный максимум, отношение правдоподобия ограничено нулем и единицей.

Часто статистика теста отношения правдоподобия выражается как разница между логарифмами правдоподобия

где

— логарифм максимизированной функции правдоподобия , а — максимальное значение в частном случае, когда нулевая гипотеза верна (но не обязательно значение, которое максимизируется для выборочных данных) и

обозначают соответствующие аргументы максимумов и допустимые диапазоны, в которые они встроены. Умножение на −2 математически гарантирует, что (по теореме Уилкса ) сходится асимптотически к χ ²-распределению, если нулевая гипотеза оказывается верной. [9] Распределения конечной выборки статистик отношения правдоподобия, как правило, неизвестны. [10]

Тест отношения правдоподобия требует, чтобы модели были вложенными – т. е. более сложная модель может быть преобразована в более простую модель путем наложения ограничений на параметры первой. Многие общие тестовые статистики являются тестами для вложенных моделей и могут быть сформулированы как логарифмические отношения правдоподобия или их приближения: например, Z -тест , F -тест , G -тест и критерий хи-квадрат Пирсона ; для иллюстрации с одновыборочным t -тестом см. ниже.

Если модели не являются вложенными, то вместо теста отношения правдоподобия обычно можно использовать обобщение теста: подробнее см. в разделе относительное правдоподобие .

Случай простых гипотез

Проверка гипотез «простой против простого» имеет полностью определенные модели как при нулевой гипотезе, так и при альтернативной гипотезе, которые для удобства записаны в терминах фиксированных значений воображаемого параметра :

В этом случае, при любой из гипотез, распределение данных полностью определено: нет неизвестных параметров для оценки. Для этого случая доступен вариант теста отношения правдоподобия: [11] [12]

В некоторых старых источниках в качестве определения может использоваться обратная величина функции, указанной выше. [13] Таким образом, отношение правдоподобия невелико, если альтернативная модель лучше нулевой модели.

Тест отношения правдоподобия обеспечивает следующее правило принятия решения:

Если , не отклоняйте ;
Если , отклонить ;
Если , то отвергаем с вероятностью .

Значения и обычно выбираются для получения определенного уровня значимости с помощью соотношения

Лемма Неймана –Пирсона утверждает, что этот тест отношения правдоподобия является наиболее мощным среди всех уровневых тестов для этого случая. [7] [12]

Интерпретация

Отношение правдоподобия является функцией данных ; следовательно, это статистика , хотя необычная в том смысле, что значение статистики зависит от параметра, . Тест отношения правдоподобия отвергает нулевую гипотезу, если значение этой статистики слишком мало. То, насколько мало значение, зависит от уровня значимости теста, т. е. от того, какая вероятность ошибки I типа считается допустимой (ошибки I типа состоят в отклонении нулевой гипотезы, которая верна).

Числитель соответствует вероятности наблюдаемого результата при нулевой гипотезе . Знаменатель соответствует максимальной вероятности наблюдаемого результата, изменяя параметры по всему пространству параметров. Числитель этого отношения меньше знаменателя; таким образом, отношение правдоподобия находится в диапазоне от 0 до 1. Низкие значения отношения правдоподобия означают, что наблюдаемый результат имел гораздо меньшую вероятность наступления при нулевой гипотезе по сравнению с альтернативой. Высокие значения статистики означают, что наблюдаемый результат имел почти такую ​​же вероятность наступления при нулевой гипотезе, как и при альтернативе, и поэтому нулевая гипотеза не может быть отвергнута.

Пример

Следующий пример адаптирован и сокращен из Stuart, Ord & Arnold (1999, §22.2).

Предположим, что у нас есть случайная выборка размера n из нормально распределенной популяции. Среднее значение μ и стандартное отклонение σ популяции неизвестны. Мы хотим проверить, равно ли среднее значение заданному значению μ 0 .

Таким образом, наша нулевая гипотеза — H 0μ = μ 0  , а наша альтернативная гипотеза — H 1μμ 0  . Функция правдоподобия имеет вид

С помощью некоторых вычислений (здесь они опущены) можно показать, что

где tt -статистика с n  − 1 степенями свободы. Следовательно, мы можем использовать известное точное распределение t n −1 для выводов.

Асимптотическое распределение: теорема Уилкса

Если распределение отношения правдоподобия, соответствующее определенной нулевой и альтернативной гипотезе, может быть явно определено, то его можно напрямую использовать для формирования областей принятия решений (для подтверждения или отклонения нулевой гипотезы). Однако в большинстве случаев точное распределение отношения правдоподобия, соответствующее определенным гипотезам, очень сложно определить. [ необходима цитата ]

Предполагая, что H 0 истинно, существует фундаментальный результат Сэмюэля С. Уилкса : по мере того, как размер выборки приближается к , и если нулевая гипотеза лежит строго внутри пространства параметров, тестовая статистика, определенная выше, будет асимптотически распределена по закону хи-квадрат ( ) со степенями свободы, равными разнице размерностей и . [14] Это подразумевает, что для большого разнообразия гипотез мы можем вычислить отношение правдоподобия для данных, а затем сравнить наблюдаемое со значением, соответствующим желаемой статистической значимости, в качестве приблизительного статистического теста. Существуют и другие расширения. [ which? ]

Смотрите также

Ссылки

  1. ^ Кинг, Гэри (1989). Унификация политической методологии: теория правдоподобия статистического вывода. Нью-Йорк: Cambridge University Press. стр. 84. ISBN 0-521-36697-6.
  2. ^ Ли, Бин; Бабу, Г. Джогеш (2019). Выпускной курс по статистическому выводу . Springer. стр. 331. ISBN 978-1-4939-9759-6.
  3. ^ Маддала, GS ; Лахири, Каджал (2010). Введение в эконометрику (Четвертое изд.). Нью-Йорк: Уайли. п. 200.
  4. ^ Buse, A. (1982). «Отношение правдоподобия, тесты Вальда и множителей Лагранжа: пояснительная записка». The American Statistician . 36 (3a): 153–157. doi :10.1080/00031305.1982.10482817.
  5. ^ Пиклз, Эндрю (1985). Введение в анализ правдоподобия. Норвич: WH Hutchins & Sons. С. 24–27. ISBN 0-86094-190-6.
  6. ^ Северини, Томас А. (2000). Методы правдоподобия в статистике . Нью-Йорк: Oxford University Press. С. 120–121. ISBN 0-19-850650-3.
  7. ^ ab Нейман, Дж.; Пирсон , Э.С. (1933), «О проблеме наиболее эффективных проверок статистических гипотез» (PDF) , Philosophical Transactions of the Royal Society of London A , 231 (694–706): 289–337, Bibcode : 1933RSPTA.231..289N, doi : 10.1098/rsta.1933.0009 , JSTOR  91247
  8. ^ Кох, Карл-Рудольф (1988). Оценка параметров и проверка гипотез в линейных моделях . Нью-Йорк: Springer. стр. 306. ISBN 0-387-18840-1.
  9. ^ Силви, SD (1970). Статистический вывод . Лондон: Chapman & Hall. С. 112–114. ISBN 0-412-13820-4.
  10. ^ Миттельхаммер, Рон К.; Джадж , Джордж Г .; Миллер, Дуглас Дж. (2000). Основы эконометрики . Нью-Йорк: Cambridge University Press. стр. 66. ISBN 0-521-62394-4.
  11. ^ Mood, AM; Graybill, FA; Boes, DC (1974). Введение в теорию статистики (3-е изд.). McGraw-Hill . §9.2.
  12. ^ ab Стюарт, А.; Орд, К.; Арнольд, С. (1999), Продвинутая теория статистики Кендалла , т. 2A, Арнольд , §§20.10–20.13
  13. ^ Кокс, DR ; Хинкли, DV (1974), Теоретическая статистика , Chapman & Hall , стр. 92, ISBN 0-412-12420-3
  14. ^ Уилкс, СС (1938). «Распределение отношения правдоподобия для большой выборки при проверке составных гипотез». Annals of Mathematical Statistics . 9 (1): 60–62. doi : 10.1214/aoms/1177732360 .

Дальнейшее чтение

Внешние ссылки