Критерий идентификации и исключения выбросов
В статистике тест Q Диксона или просто тест Q используется для идентификации и отбраковки выбросов . Это предполагает нормальное распределение и, по мнению Роберта Дина, Уилфрида Диксона и других, этот тест следует использовать экономно и не чаще одного раза в наборе данных. Чтобы применить тест Q к плохим данным, расположите данные в порядке возрастания значений и вычислите Q , как определено:
Где gap — это абсолютная разница между рассматриваемым выбросом и ближайшим к нему числом. Если Q > Q table , где Q table — это опорное значение, соответствующее размеру выборки и уровню достоверности, то отклоните сомнительную точку. Обратите внимание, что с помощью Q -теста можно отклонить только одну точку из набора данных .
Пример
Рассмотрим набор данных:
Теперь переставьте в порядке возрастания:
Мы предполагаем, что 0,167 является выбросом. Рассчитаем Q :
При 10 наблюдениях и 90%-ной достоверности Q = 0,455 > 0,412 = Q table , поэтому мы приходим к выводу, что 0,167 действительно является выбросом. Однако при 95%-ной достоверности Q = 0,455 < 0,466 = Q table 0,167 не считается выбросом.
Макбейн [1] отмечает: Диксон предоставил похожие тесты, предназначенные для поиска более чем одного выброса, но они используются гораздо реже, чем версии r 10 или Q , предназначенные для устранения одного выброса.
Стол
В этой таблице приведены предельные значения двустороннего Q- критерия Диксона .
Смотрите также
Ссылки
- ^ Халперн, Артур М. "Экспериментальная физическая химия: лабораторный учебник". 3-е изд. / Артур М. Халперн, Джордж К. Макбейн. Нью-Йорк: WH Freeman, c2006 Библиотека Конгресса [ постоянная мертвая ссылка ]
Дальнейшее чтение
- Роберт Б. Дин и Уилфрид Дж. Диксон (1951) «Упрощенная статистика для малого числа наблюдений». Anal. Chem., 1951, 23 (4), 636–638. Аннотация Полный текст PDF Архивировано 01.05.2015 на Wayback Machine
- Рорабахер, ДБ (1991) «Статистическая обработка для отклонения отклоняющихся значений: критические значения параметра Диксона Q и соответствующие отношения поддиапазонов на уровне 95 процентов достоверности». Anal. Chem., 63 (2), 139–146. PDF (включая большие таблицы предельных значений)
- Макбейн, Джордж К. (2006) «Программы для вычисления функций распределения и критических значений для отношений экстремальных значений для обнаружения выбросов». J. Statistical Software 16(3):1–9, 2006 Статья (PDF) и программное обеспечение (Fortan-90, Zipfile)
- Шиваншу Шривастава, А. Раджеш, П.К. Бора (2014) «Тесты Диксона со скользящим окном для подавления злонамеренных пользователей в системе кооперативного зондирования спектра» IET Communications, 2014, 8 (7)
- WJ Dixon. Анналы математической статистики. Том 21, № 4 (декабрь 1950 г.), стр. 488–506 doi :10.1214/aoms/1177729747
Внешние ссылки
- Главная страница пакета GNU R «outlier» включает функцию «dixon.test».
- Тест Диксона в коммуникациях – использование теста Диксона в когнитивной радиосвязи (Шиваншу Шривастава)