В статистике ранги набора данных — это ожидаемые значения порядковых статистик выборки из стандартного нормального распределения того же размера, что и данные. Они в основном используются в нормальном вероятностном графике , графическом методе проверки нормальности .
Это, пожалуй, проще всего понять на примере. Если взять выборку iid из шести элементов из нормально распределенной совокупности с ожидаемым значением 0 и дисперсией 1 ( стандартное нормальное распределение ), а затем отсортировать в порядке возрастания, то ожидаемые значения результирующих порядковых статистик будут следующими:
Предположим, что числа в наборе данных следующие:
Затем их можно отсортировать и выстроить в ряд по соответствующим рангам; в том порядке, в котором они расположены
что дает баллы:
Затем эти точки отображаются в виде вертикальных и горизонтальных координат диаграммы рассеяния .
В качестве альтернативы, вместо сортировки точек данных, можно ранжировать их и переставлять ранги соответствующим образом. Это дает те же пары чисел, но в другом порядке.
Для:
соответствующие ранги:
т. е. число, идущее первым, является 5-м наименьшим, число, идущее вторым, является 6-м наименьшим, число, идущее третьим, является наименьшим, число, идущее четвертым, является 2-м наименьшим и т. д. Соответственно перестраивают ожидаемую нормальную статистику порядка, получая ранги этого набора данных:
График, отображающий ранги на горизонтальной оси, а точки данных на вертикальной оси, называется рангитом или графиком нормальной вероятности . Такой график обязательно неубывающий. В больших выборках из нормально распределенной популяции такой график будет приближаться к прямой линии. Существенные отклонения от прямолинейности считаются свидетельством против нормальности распределения.
Диаграммы рангитов обычно используются для визуальной демонстрации того, соответствуют ли данные заданному распределению вероятностей .
График рангов — это разновидность графика Q–Q — он отображает порядковые статистики (квантили) выборки против определенных квантилей (ранкитов) предполагаемого нормального распределения. Однако графики Q–Q могут использовать другие квантили для нормального распределения.
График Ранкита и само слово Ранкит были введены биологом и статистиком Честером Иттнером Блиссом (1899–1979).