Нормальный вероятностный график — это графический метод для выявления существенных отклонений от нормальности . Он включает в себя выявление выбросов , асимметрии , эксцесса , необходимости преобразований и смесей . Нормальные вероятностные графики строятся на основе необработанных данных, остатков от подгонки модели и оценочных параметров.
На нормальном вероятностном графике (также называемом «нормальным графиком») отсортированные данные наносятся на график в зависимости от значений, выбранных таким образом, чтобы полученное изображение выглядело близко к прямой линии, если данные распределены приблизительно нормально. Отклонения от прямой линии указывают на отклонения от нормальности. Построение графика можно выполнить вручную с помощью специальной миллиметровой бумаги , называемой нормальной вероятностной бумагой . На современных компьютерах нормальные графики обычно создаются с помощью программного обеспечения.
Нормальный график вероятности является частным случаем графика вероятности Q–Q для нормального распределения. Теоретические квантили обычно выбираются для аппроксимации либо среднего значения, либо медианы соответствующих порядковых статистик .
Нормальный график вероятности формируется путем построения графика отсортированных данных в сравнении с приближением к средним или медианным значениям соответствующих порядковых статистик ; см. rankit . Некоторые строят графики данных на вертикальной оси; [1] другие строят графики данных на горизонтальной оси. [2] [3]
Различные источники используют немного разные приближения для rankits . Формула, используемая функцией "qqnorm" в базовом пакете "stats" в R (язык программирования), выглядит следующим образом:
для i = 1, 2, ..., n , где
а Φ −1 — стандартная нормальная функция квантиля .
Если данные соответствуют выборке из нормального распределения, точки должны лежать близко к прямой линии. В качестве ориентира можно подогнать прямую линию к точкам. Чем дальше точки отклоняются от этой линии, тем больше указание на отклонение от нормальности. Если выборка имеет среднее значение 0, стандартное отклонение 1, то можно использовать линию, проходящую через 0 с наклоном 1.
При большем количестве точек случайные отклонения от линии будут менее выраженными. Нормальные графики часто используются всего с 7 точками, например, при построении графиков эффектов в насыщенной модели из 2-уровневого дробного факторного эксперимента . При меньшем количестве точек становится сложнее отличить случайную изменчивость от существенного отклонения от нормальности.
Вероятностные графики для распределений, отличных от нормального, вычисляются точно таким же образом. Нормальная функция квантиля Φ −1 просто заменяется функцией квантиля желаемого распределения. Таким образом, вероятностный график может быть легко сгенерирован для любого распределения, для которого имеется функция квантиля.
С семейством распределений масштаба-местоположения параметры распределения масштаба и местоположения можно оценить по пересечению и наклону линии . Для других распределений параметры должны быть сначала оценены, прежде чем можно будет построить график вероятности.
Это выборка размером 50 из нормального распределения, представленная как гистограмма и график нормальной вероятности.
Это выборка размером 50 из распределения со смещением вправо, представленная как гистограмма и график нормальной вероятности.
Это выборка размером 50 из равномерного распределения, представленная как гистограмма и график нормальной вероятности.
В статье использованы материалы, являющиеся общественным достоянием Национального института стандартов и технологий.