Тест на нормальность
В статистике тест Харке-Бера — это тест согласия, определяющий, имеют ли выборочные данные асимметрию и эксцесс, соответствующие нормальному распределению . Тест назван в честь Карлоса Харке и Анила К. Беры . Статистика теста всегда неотрицательна. Если она далека от нуля, это означает, что данные не имеют нормального распределения.
Тестовая статистика JB определяется как
где n — число наблюдений (или степеней свободы в целом); S — асимметрия выборки , K — эксцесс выборки :
где и — оценки третьего и четвертого центральных моментов соответственно, — выборочное среднее , а — оценка второго центрального момента, дисперсия .
Если данные получены из нормального распределения, статистика JB асимптотически имеет распределение хи-квадрат с двумя степенями свободы , поэтому статистику можно использовать для проверки гипотезы о том, что данные получены из нормального распределения . Нулевая гипотеза является совместной гипотезой о том, что асимметрия равна нулю, а избыточный эксцесс равен нулю. Выборки из нормального распределения имеют ожидаемую асимметрию 0 и ожидаемый избыточный эксцесс 0 (что то же самое, что и эксцесс 3). Как показывает определение JB , любое отклонение от этого увеличивает статистику JB.
Для небольших выборок аппроксимация хи-квадрат слишком чувствительна, часто отвергая нулевую гипотезу, когда она верна. Более того, распределение p -значений отклоняется от равномерного распределения и становится скошенным вправо унимодальным распределением , особенно для небольших p -значений. Это приводит к большой частоте ошибок типа I. В таблице ниже показаны некоторые p -значения, аппроксимированные распределением хи-квадрат, которые отличаются от их истинных уровней альфа для небольших выборок.
(Эти значения были аппроксимированы с помощью моделирования Монте-Карло в Matlab )
В реализации MATLAB аппроксимация хи-квадрат для распределения статистики JB используется только для больших размеров выборки (> 2000). Для меньших выборок используется таблица, полученная из моделирования Монте-Карло, для интерполяции p -значений. [1]
История
Статистические данные были получены Карлосом М. Харке и Анилом К. Бера во время работы над их докторской диссертацией в Австралийском национальном университете.
Тест Харке-Бера в регрессионном анализе
По мнению Роберта Холла, Дэвида Лилиена и др. (1995), при использовании этого теста вместе с множественным регрессионным анализом правильная оценка выглядит следующим образом:
где n — число наблюдений, а k — число регрессоров при исследовании остатков уравнения.
Реализации
- ALGLIB включает реализацию теста Жака–Бера на C++, C#, Delphi, Visual Basic и т. д.
- gretl включает реализацию теста Харке-Бера
- Julia включает реализацию теста Жака-Бера JarqueBeraTest в пакет HypothesisTests . [2]
- MATLAB включает реализацию теста Жака–Бера, функцию «jbtest».
- Python statsmodels включает реализацию теста Жака–Бера, «statsmodels.stats.stattools.py».
- R включает реализации теста Жака–Бера: jarque.bera.test в пакете tseries [3] например , и jarque.test в пакете moments [4] .
- Wolfram включает встроенную функцию JarqueBeraALMTest [5] и не ограничивается тестированием по гауссовскому распределению.
Смотрите также
Ссылки
- ^ "Анализ JB-Test в MATLAB". MathWorks . Получено 24 мая 2009 г.
- ^ "Тесты временных рядов". juliastats.org . Получено 2020-02-04 .
- ^ "tseries: Анализ временных рядов и вычислительные финансы". Проект R.
- ^ "моменты: Моменты, кумулянты, асимметрия, эксцесс и связанные тесты". Проект R.
- ^ "JarqueBeraALMTest—Документация по языку Wolfram". reference.wolfram.com . Получено 26.10.2017 .
Дальнейшее чтение
- Jarque, Carlos M .; Bera, Anil K. (1980). «Эффективные тесты на нормальность, гомоскедастичность и серийную независимость остатков регрессии». Economics Letters . 6 (3): 255–259. doi :10.1016/0165-1765(80)90024-5.
- Jarque, Carlos M .; Bera, Anil K. (1981). «Эффективные тесты на нормальность, гомоскедастичность и серийную независимость остатков регрессии: доказательства Монте-Карло». Economics Letters . 7 (4): 313–318. doi :10.1016/0165-1765(81)90035-5.
- Jarque, Carlos M.; Bera, Anil K. (1987). «Тест на нормальность наблюдений и остатков регрессии». International Statistical Review . 55 (2): 163–172. doi :10.2307/1403192. JSTOR 1403192.
- Джадж и др. (1988). Введение в теорию и практику эконометрики (3-е изд.). С. 890–892.
- Холл, Роберт Э.; Лилиен, Дэвид М.; и др. (1995). Руководство пользователя EViews . п. 141.