stringtranslate.com

Доверительная область

В статистике доверительная область — это многомерное обобщение доверительного интервала . Это набор точек в n -мерном пространстве, часто представленный в виде эллипсоида вокруг точки, которая является предполагаемым решением проблемы, хотя могут встречаться и другие формы.

Интерпретация

Доверительная область рассчитывается таким образом, что если набор измерений повторялся много раз и доверительная область рассчитывалась одинаково для каждого набора измерений, то в определенный процент времени (например, 95%) доверительная область будет включите точку, представляющую «истинные» значения набора оцениваемых переменных. Однако если не сделаны определенные предположения об априорных вероятностях , это не означает, что при расчете одной доверительной области существует 95% вероятность того, что «истинные» значения лежат внутри этой области, поскольку мы не предполагаем никакой конкретной вероятности. распределение «истинных» значений, и мы можем иметь или не иметь другую информацию о том, где они могут находиться.

Случай независимых одинаково нормально распределенных ошибок

Предположим, мы нашли решение следующей переопределенной задачи:

где Yn -мерный вектор-столбец, содержащий наблюдаемые значения зависимой переменной , X — матрица наблюдаемых значений независимых переменных размером nxp (которая может представлять физическую модель), которая, как предполагается, точно известна, представляет собой вектор-столбец, содержащий p- параметры, которые необходимо оценить, и представляет собой n -мерный вектор-столбец ошибок, которые, как предполагается, независимо распределены с нормальными распределениями с нулевым средним значением и каждый из которых имеет одинаковую неизвестную дисперсию .

Совместная доверительная область 100(1 −  α ) % для элементов представлена ​​набором значений вектора b , которые удовлетворяют следующему неравенству: [1]

где переменная b представляет любую точку в доверительной области, p — количество параметров, т. е. число элементов вектора — это вектор оцениваемых параметров, а s 2приведенный хи-квадрат , несмещенная оценка , равная

Кроме того, Fквантильная функция F -распределения , где p и степени свободы — уровень статистической значимости , а символ означает транспонирование .

Выражение можно переписать как:

где – ковариационная матрица, масштабированная по методу наименьших квадратов .

Вышеупомянутое неравенство определяет эллипсоидальную область в p -мерном декартовом пространстве параметров R p . Центр эллипсоида находится по оценке . По мнению Пресса и др., эллипсоид легче построить после выполнения разложения по сингулярным значениям . Длины осей эллипсоида пропорциональны обратным значениям на диагоналях диагональной матрицы, а направления этих осей задаются строками 3-й матрицы разложения.

Взвешенные и обобщенные методы наименьших квадратов

Теперь рассмотрим более общий случай, когда некоторые отдельные элементы имеют известную ненулевую ковариацию (другими словами, ошибки в наблюдениях не распределяются независимо) и/или не все стандартные отклонения ошибок равны. Предположим, что ковариационная матрица is , где V — несингулярная матрица размером n x n , равная в более конкретном случае, описанном в предыдущем разделе (где Iединичная матрица ), но здесь допускается ненулевое значение -диагональные элементы, представляющие ковариацию пар отдельных наблюдений, а также не обязательно имеющие равные все диагональные элементы.

Можно найти [2] неособую симметричную матрицу P такую, что

По сути, P является квадратным корнем из ковариационной матрицы V.

Задача наименьших квадратов

затем может быть преобразовано путем умножения каждого члена слева на обратное P , образуя новую формулировку проблемы

где

и

Тогда совместная доверительная область для параметров, т.е. для элементов , ограничивается эллипсоидом, определяемым следующим образом: [3]

Здесь F представляет собой процентную точку F -распределения , а величины p и np представляют собой степени свободы , которые являются параметрами этого распределения.

Нелинейные задачи

Доверительные области могут быть определены для любого распределения вероятностей. Экспериментатор может выбрать уровень значимости и форму области, после чего размер области определяется распределением вероятностей. Естественный выбор — использовать в качестве границы набор точек с постоянными значениями ( хи-квадрат ).

Один из подходов состоит в том, чтобы использовать линейную аппроксимацию нелинейной модели, которая может быть близкой аппроксимацией вблизи решения, а затем применить анализ линейной задачи, чтобы найти приблизительную доверительную область. Это может быть разумным подходом, если доверительная область не очень велика и вторые производные модели также не очень велики.

Также можно использовать подходы начальной загрузки . [4]

Смотрите также

Примечания

  1. ^ Дрейпер и Смит (1981, стр. 94)
  2. ^ Дрейпер и Смит (1981, стр. 108)
  3. ^ Дрейпер и Смит (1981, стр. 109)
  4. ^ Хаттон Т.Дж., Бакстон Б.Ф., Хаммонд П., Поттс HWW (2003). Оценка средних траекторий роста в пространстве форм с использованием сглаживания ядра. Транзакции IEEE по медицинской визуализации , 22 (6):747-53

Рекомендации