В статистике согласованность процедур, таких как вычисление доверительных интервалов или проведение проверок гипотез , является желаемым свойством их поведения, поскольку количество элементов в наборе данных, к которым они применяются, увеличивается неограниченно. В частности , согласованность требует, чтобы по мере увеличения размера набора данных результат процедуры приближался к правильному результату. [1] Использование этого термина в статистике происходит от сэра Рональда Фишера в 1922 году. [2]
Использование терминов согласованность и последовательность в статистике ограничено случаями, когда по сути одна и та же процедура может быть применена к любому количеству элементов данных. В сложных приложениях статистики может быть несколько способов, которыми может увеличиваться количество элементов данных. Например, записи об осадках в пределах области могут увеличиваться тремя способами: записи за дополнительные периоды времени; записи для дополнительных участков с фиксированной площадью; записи для дополнительных участков, полученных путем расширения размера области. В таких случаях свойство согласованности может быть ограничено одним или несколькими возможными способами, которыми может увеличиваться размер выборки.
Состоятельная оценка — это оценка, для которой, если рассматривать оценку как случайную величину , индексированную по числу n элементов в наборе данных, при увеличении n оценки сходятся по вероятности к значению, для оценки которого предназначена данная оценка.
Оценкой, обладающей согласованностью по Фишеру, является та, для которой, если бы она была применена ко всей генеральной совокупности, а не к выборке, было бы получено истинное значение оцениваемого параметра.
Последовательный тест — это тест, для которого мощность теста для фиксированной ложной гипотезы увеличивается до единицы по мере увеличения количества элементов данных. [1]
В статистической классификации последовательным классификатором является тот, для которого вероятность правильной классификации при заданном обучающем наборе приближается по мере увеличения размера обучающего набора к наилучшей теоретически возможной вероятности, если бы распределения популяции были полностью известны.
Оценка или тест могут быть последовательными, не будучи несмещенными. [3] Классическим примером является стандартное отклонение выборки , которое является смещенной оценкой, но сходится к ожидаемому стандартному отклонению почти наверняка по закону больших чисел . Иначе говоря, несмещенность не является требованием для согласованности, поэтому смещенные оценки и тесты могут использоваться на практике с ожиданием того, что результаты будут надежными, особенно когда размер выборки большой (вспомните определение согласованности). Напротив, оценку или тест, которые не являются согласованными, может быть трудно обосновать на практике, поскольку сбор дополнительных данных не имеет асимптотической гарантии улучшения качества результата.