В статистике доверительная область — это многомерное обобщение доверительного интервала . Это набор точек в n -мерном пространстве, часто представленный в виде эллипсоида вокруг точки, которая является предполагаемым решением проблемы, хотя могут встречаться и другие формы.
Доверительная область рассчитывается таким образом, что если набор измерений повторялся много раз и доверительная область рассчитывалась одинаково для каждого набора измерений, то в определенный процент времени (например, 95%) доверительная область будет включите точку, представляющую «истинные» значения набора оцениваемых переменных. Однако если не сделаны определенные предположения об априорных вероятностях , это не означает, что при расчете одной доверительной области существует 95% вероятность того, что «истинные» значения лежат внутри этой области, поскольку мы не предполагаем никакой конкретной вероятности. распределение «истинных» значений, и мы можем иметь или не иметь другую информацию о том, где они могут находиться.
Предположим, мы нашли решение следующей переопределенной задачи:
где Y — n -мерный вектор-столбец, содержащий наблюдаемые значения зависимой переменной , X — матрица наблюдаемых значений независимых переменных размером nxp (которая может представлять физическую модель), которая, как предполагается, точно известна, представляет собой вектор-столбец, содержащий p- параметры, которые необходимо оценить, и представляет собой n -мерный вектор-столбец ошибок, которые, как предполагается, независимо распределены с нормальными распределениями с нулевым средним значением и каждый из которых имеет одинаковую неизвестную дисперсию .
Совместная доверительная область 100(1 − α ) % для элементов представлена набором значений вектора b , которые удовлетворяют следующему неравенству: [1]
где переменная b представляет любую точку в доверительной области, p — количество параметров, т. е. число элементов вектора — это вектор оцениваемых параметров, а s 2 — приведенный хи-квадрат , несмещенная оценка , равная
Кроме того, F — квантильная функция F -распределения , где p и степени свободы — уровень статистической значимости , а символ означает транспонирование .
Выражение можно переписать как:
где – ковариационная матрица, масштабированная по методу наименьших квадратов .
Вышеупомянутое неравенство определяет эллипсоидальную область в p -мерном декартовом пространстве параметров R p . Центр эллипсоида находится по оценке . По мнению Пресса и др., эллипсоид легче построить после выполнения разложения по сингулярным значениям . Длины осей эллипсоида пропорциональны обратным значениям на диагоналях диагональной матрицы, а направления этих осей задаются строками 3-й матрицы разложения.
Теперь рассмотрим более общий случай, когда некоторые отдельные элементы имеют известную ненулевую ковариацию (другими словами, ошибки в наблюдениях не распределяются независимо) и/или не все стандартные отклонения ошибок равны. Предположим, что ковариационная матрица is , где V — несингулярная матрица размером n x n , равная в более конкретном случае, описанном в предыдущем разделе (где I — единичная матрица ), но здесь допускается ненулевое значение -диагональные элементы, представляющие ковариацию пар отдельных наблюдений, а также не обязательно имеющие равные все диагональные элементы.
Можно найти [2] неособую симметричную матрицу P такую, что
По сути, P является квадратным корнем из ковариационной матрицы V.
Задача наименьших квадратов
затем может быть преобразовано путем умножения каждого члена слева на обратное P , образуя новую формулировку проблемы
где
Тогда совместная доверительная область для параметров, т.е. для элементов , ограничивается эллипсоидом, определяемым следующим образом: [3]
Здесь F представляет собой процентную точку F -распределения , а величины p и np представляют собой степени свободы , которые являются параметрами этого распределения.
Доверительные области могут быть определены для любого распределения вероятностей. Экспериментатор может выбрать уровень значимости и форму области, после чего размер области определяется распределением вероятностей. Естественный выбор — использовать в качестве границы набор точек с постоянными значениями ( хи-квадрат ).
Один из подходов состоит в том, чтобы использовать линейную аппроксимацию нелинейной модели, которая может быть близкой аппроксимацией вблизи решения, а затем применить анализ линейной задачи, чтобы найти приблизительную доверительную область. Это может быть разумным подходом, если доверительная область не очень велика и вторые производные модели также не очень велики.
Также можно использовать подходы начальной загрузки . [4]