График нормальной вероятности представляет собой графический метод выявления существенных отклонений от нормальности . Сюда входит выявление выбросов , асимметрии , эксцесса , необходимости преобразований и смесей . Графики нормальной вероятности состоят из необработанных данных, остатков от подгонок модели и расчетных параметров.
На графике нормальной вероятности (также называемом «нормальным графиком») отсортированные данные отображаются в зависимости от значений, выбранных так, чтобы результирующее изображение выглядело близко к прямой линии, если данные примерно нормально распределены. Отклонения от прямой линии предполагают отклонения от нормальности. Построение графика можно выполнить вручную, используя специальную миллиметровую бумагу , называемую нормальной вероятностной бумагой . На современных компьютерах обычные графики обычно создаются с помощью программного обеспечения.
График нормальной вероятности является частным случаем графика вероятности Q – Q для нормального распределения. Теоретические квантили обычно выбираются так, чтобы аппроксимировать среднее или медиану статистики соответствующего порядка .
График нормальной вероятности формируется путем отображения отсортированных данных в зависимости от аппроксимации средних значений или медиан статистики соответствующего порядка ; см. ранкит . Некоторые отображают данные по вертикальной оси; [1] другие откладывают данные на горизонтальной оси. [2] [3]
В разных источниках используются несколько разные приблизительные значения рангов . Формула, используемая функцией «qqnorm» в базовом пакете «stats» в R (язык программирования), выглядит следующим образом:
для i = 1, 2, ..., n , где
и Φ −1 — стандартная нормальная функция квантиля .
Если данные соответствуют выборке из нормального распределения, точки должны лежать близко к прямой линии. В качестве ориентира к точкам можно подогнать прямую линию. Чем дальше точки отклоняются от этой линии, тем больше признак отклонения от нормальности. Если среднее значение выборки равно 0, стандартное отклонение равно 1, то можно использовать линию, проходящую через 0, с наклоном 1.
При большем количестве точек случайные отклонения от линии будут менее выражены. Нормальные графики часто используются всего лишь с 7 точками, например, при построении графика эффектов в насыщенной модели из двухуровневого дробного факторного эксперимента . При меньшем количестве баллов становится труднее отличить случайную изменчивость от существенного отклонения от нормальности.
Вероятностные графики для распределений, отличных от нормального, рассчитываются точно таким же образом. Обычная функция квантиля Φ −1 просто заменяется функцией квантиля искомого распределения. Таким образом, вероятностный график можно легко построить для любого распределения, для которого есть функция квантиля.
При использовании семейства распределений в масштабе местоположения параметры местоположения и масштаба распределения можно оценить по точке пересечения и наклону линии. Для других распределений необходимо сначала оценить параметры, прежде чем можно будет построить вероятностный график.
Это выборка размером 50 из нормального распределения, построенная как в виде гистограммы, так и в виде нормального вероятностного графика.
Это выборка размером 50 из право-скошенного распределения, построенная как в виде гистограммы, так и в виде нормального вероятностного графика.
Это выборка размером 50 из равномерного распределения, построенная как в виде гистограммы, так и в виде нормального вероятностного графика.
Эта статья включает общедоступные материалы Национального института стандартов и технологий.