В теории вероятности и статистики 97,5-я процентильная точка стандартного нормального распределения — это число, обычно используемое для статистических расчетов. Приблизительное значение этого числа равно 1,96 , что означает, что 95% площади под нормальной кривой лежит в пределах приблизительно 1,96 стандартных отклонений от среднего значения . Из-за центральной предельной теоремы это число используется при построении приблизительных 95% доверительных интервалов . Его повсеместное распространение обусловлено произвольным, но общим соглашением об использовании доверительных интервалов с 95% вероятностью в науке и частотной статистике, хотя иногда используются и другие вероятности (90%, 99% и т. д.). [1] [2] [3] [4] Это соглашение, по-видимому, особенно распространено в медицинской статистике, [5] [6] [7] , но также распространено в других областях применения, таких как науки о Земле, [8] социальные науки и бизнес-исследования. [9]
Единого общепринятого названия для этого числа не существует; его также обычно называют «стандартным нормальным отклонением », « нормальным баллом » или « Z-баллом » для точки 97,5 процентиля, точки 0,975 или просто ее приблизительного значения 1,96.
Если X имеет стандартное нормальное распределение, т.е. X ~ N(0,1),
и поскольку нормальное распределение симметрично,
Одной из записей для этого числа является z .975 . [10] Из функции плотности вероятности стандартного нормального распределения точное значение z .975 определяется как
Использование этого числа в прикладной статистике можно проследить под влиянием классического учебника Рональда Фишера « Статистические методы для научных работников» , впервые опубликованного в 1925 году:
«Значение, для которого P = 0,05, или 1 из 20, равно 1,96 или почти 2; удобно принять эту точку за предел при оценке того, следует ли считать отклонение значимым или нет». [11]
В Таблице 1 той же работы он дал более точное значение 1,959964. [12] В 1970 году значение, усеченное до 20 знаков после запятой, было рассчитано как
Таким образом, обычно используемое приблизительное значение 1,96 имеет точность, превышающую одну 50 000-ю часть, что более чем достаточно для прикладной работы.
Некоторые люди даже используют значение 2 вместо 1,96, сообщая о 95,4% доверительном интервале как о 95% доверительном интервале. Это не рекомендуется, но иногда встречается. [15]
Обратное значение стандартной нормальной функции CDF может быть использовано для вычисления значения. Ниже приведена таблица вызовов функций, которые возвращают 1,96 в некоторых часто используемых приложениях:
Почему 95% достоверности? Почему не какой-то другой уровень достоверности ? Использование 95% отчасти условно, но также используются такие уровни, как 90%, 98% и иногда 99,9%.
Хотя выбор коэффициента доверия несколько произволен, на практике часто используются интервалы 90%, 95% и 99%, причем наиболее распространенным является 95%.
могут быть выбраны и другие, более строгие или менее строгие пределы, статистики очень часто отдают предпочтение 95-процентному интервалу.
В современной прикладной практике почти все доверительные интервалы указываются на уровне 95%.
Для стандартных оригинальных исследовательских статей предоставьте следующие заголовки и информацию: [...] результаты – основные результаты с (для количественных исследований) 95% доверительными интервалами и, где это уместно, точный уровень статистической значимости и количество, которое необходимо лечить/наносить вред
мы принимаем общепринятое в науках о Земле соглашение о 95% доверительном интервале.
Большинство исследователей используют 95-процентный доверительный интервал