В статистике ранги набора данных — это ожидаемые значения статистики порядка выборки из стандартного нормального распределения того же размера , что и данные. Они в основном используются в графике нормальной вероятности , графическом методе проверки нормальности .
Пожалуй, легче всего это понять на примере. Если выборка iid из шести элементов берется из нормально распределенной совокупности с ожидаемым значением 0 и дисперсией 1 ( стандартное нормальное распределение ), а затем сортируется в порядке возрастания, ожидаемые значения результирующей статистики порядка будут следующими:
Предположим, что числа в наборе данных
Затем их можно отсортировать и сопоставить с соответствующими рангами; в том порядке, в котором они
что дает очки:
Эти точки затем отображаются как вертикальные и горизонтальные координаты диаграммы рассеяния .
Альтернативно, вместо того, чтобы сортировать точки данных, можно ранжировать их и соответствующим образом переупорядочить ранги. В результате получаются те же пары чисел, но в другом порядке.
Для:
соответствующие ранги:
т. е. число, появляющееся первым, является 5-м наименьшим, число, появляющееся вторым, является 6-м наименьшим, число, появляющееся третьим, является наименьшим, число, появляющееся четвертым, является 2-м наименьшим и т. д. Соответственно перестраивают ожидаемую статистику нормального порядка, получая ранги этого набора данных:
График, на котором ранги располагаются по горизонтальной оси, а точки данных — по вертикальной оси, называется графиком рангов или графиком нормальной вероятности . Такой сюжет обязательно неубывающий. В больших выборках из нормально распределенной совокупности такой график будет приближаться к прямой линии. Существенные отклонения от прямолинейности считаются свидетельством против нормальности распределения.
Графики Ранкита обычно используются для визуальной демонстрации того, соответствуют ли данные заданному распределению вероятностей .
График рангов — это своего рода график Q–Q : он отображает порядковую статистику (квантили) выборки в сравнении с определенными квантилями (рангами) предполагаемого нормального распределения. Однако на графиках Q–Q могут использоваться другие квантили нормального распределения.
График ранкита и слово ранкит были введены биологом и статистиком Честером Иттнером Блиссом (1899–1979).