stringtranslate.com

Распространение неопределенности

В статистике распространение неопределенности (или распространение ошибки ) — это влияние неопределенностей переменных (или ошибок , точнее случайных ошибок ) на неопределенность функции, основанной на них. Когда переменные являются значениями экспериментальных измерений, они имеют неопределенности из-за ограничений измерения (например, точности прибора ) , которые распространяются из-за комбинации переменных в функции.

Неопределенность u может быть выражена несколькими способами. Она может быть определена с помощью абсолютной погрешности Δ x . Неопределенности также могут быть определены с помощью относительной погрешности x )/ x , которая обычно записывается в процентах. Чаще всего неопределенность величины количественно определяется с помощью стандартного отклонения σ , которое является положительным квадратным корнем дисперсии . Значение величины и ее погрешность затем выражаются как интервал x ± u . Однако наиболее общий способ характеризовать неопределенность — это указать ее распределение вероятностей . Если распределение вероятностей переменной известно или может быть предположено, теоретически можно получить любую ее статистику. В частности, можно вывести доверительные пределы для описания области, в которой может быть найдено истинное значение переменной. Например, 68% доверительные пределы для одномерной переменной, принадлежащей нормальному распределению, составляют приблизительно ± одно стандартное отклонение σ от центрального значения x , что означает, что область x ± σ будет охватывать истинное значение примерно в 68% случаев.

Если неопределенности коррелируют, то необходимо учитывать ковариацию . Корреляция может возникнуть из двух разных источников. Во-первых, ошибки измерения могут быть коррелированы. Во-вторых, когда базовые значения коррелируют по всей популяции, неопределенности в средних значениях группы будут коррелированы. [1]

В общем контексте, где нелинейная функция изменяет неопределенные параметры (коррелированные или нет), стандартными инструментами для распространения неопределенности и вывода результирующего распределения вероятностей/статистики являются методы выборки из семейства методов Монте-Карло . [2] Для очень обширных данных или сложных функций вычисление распространения ошибки может быть очень обширным, поэтому может потребоваться суррогатная модель [3] или стратегия параллельных вычислений [4] [5] [6] .

В некоторых частных случаях расчет распространения неопределенности может быть выполнен с помощью упрощенных алгебраических процедур. Некоторые из этих сценариев описаны ниже.

Линейные комбинации

Пусть будет набором из m функций, которые являются линейными комбинациями переменных с коэффициентами комбинации : или в матричной записи,

Также пусть матрица дисперсии-ковариации x = ( x 1 , ..., x n ) обозначается как , а среднее значение обозначается как : — внешнее произведение .

Тогда матрица дисперсии-ковариации функции f определяется как

В компонентной записи уравнение выглядит следующим образом:

Это наиболее общее выражение для распространения ошибки из одного набора переменных в другой. Когда ошибки по x некоррелированы, общее выражение упрощается до , где - дисперсия k -го элемента вектора x . Обратите внимание, что даже если ошибки по x могут быть некоррелированными, ошибки по f в общем случае коррелированы; другими словами, даже если - диагональная матрица, - в общем случае полная матрица.

Общие выражения для скалярной функции f немного проще (здесь a — вектор-строка):

Каждый ковариационный член может быть выражен через коэффициент корреляции следующим образом : , так что альтернативное выражение для дисперсии f имеет вид

В случае, если переменные в x не коррелируют, это упрощается еще больше:

В простом случае одинаковых коэффициентов и дисперсий находим

Для среднего арифметического результатом является стандартная ошибка среднего :

Нелинейные комбинации

Когда f представляет собой набор нелинейных комбинаций переменных x , можно выполнить интервальное распространение для вычисления интервалов, содержащих все согласованные значения переменных. В вероятностном подходе функция f обычно должна быть линеаризована путем приближения к разложению в ряд Тейлора первого порядка , хотя в некоторых случаях можно вывести точные формулы, которые не зависят от разложения, как в случае точной дисперсии произведений. [7] Разложение Тейлора будет выглядеть так: где обозначает частную производную f k по отношению к i -й переменной, вычисленную по среднему значению всех компонентов вектора x . Или в матричной записи , где J - матрица Якоби . Поскольку f 0 является константой, она не вносит вклад в ошибку в f. Следовательно, распространение ошибки следует линейному случаю, описанному выше, но заменяя линейные коэффициенты A ki и A kj частными производными и . В матричной записи [8]

То есть, якобиан функции используется для преобразования строк и столбцов матрицы дисперсии-ковариации аргумента. Обратите внимание, что это эквивалентно матричному выражению для линейного случая с .

Упрощение

Пренебрежение корреляциями или предположение о независимости переменных приводит к общей формуле среди инженеров и ученых-экспериментаторов для расчета распространения ошибок — формуле дисперсии: [9] где представляет собой стандартное отклонение функции , представляет собой стандартное отклонение , представляет собой стандартное отклонение и т. д.

Эта формула основана на линейных характеристиках градиента и, следовательно, является хорошей оценкой для стандартного отклонения, если они достаточно малы. В частности, линейная аппроксимация должна быть близка к внутри окрестности радиуса . [10]

Пример

Любая нелинейная дифференцируемая функция двух переменных и может быть разложена как Если мы возьмем дисперсию с обеих сторон и применим формулу [11] для дисперсии линейной комбинации переменных, то получим где — стандартное отклонение функции , — стандартное отклонение , — стандартное отклонение и — ковариация между и .

В частном случае, когда , , . Тогда или где есть корреляция между и .

Когда переменные и некоррелированы, . Тогда

Предостережения и предупреждения

Оценки ошибок для нелинейных функций смещены из-за использования усеченного расширения ряда. Степень этого смещения зависит от природы функции. Например, смещение ошибки, вычисленной для log(1+ x ), увеличивается с ростом x , поскольку расширение до x является хорошим приближением только тогда, когда x близок к нулю.

Для сильно нелинейных функций существует пять категорий вероятностных подходов к распространению неопределенности; [12] см . подробности в разделе Количественная оценка неопределенности .

Взаимные и смещенные взаимные

В особом случае обратного или обратного распределения , когда следует стандартное нормальное распределение , результирующее распределение является обратным стандартным нормальным распределением, и не существует определяемой дисперсии. [13]

Однако в несколько более общем случае смещенной обратной функции для следования общему нормальному распределению, тогда статистики среднего и дисперсии существуют в смысле главного значения , если разница между полюсом и средним значением является действительной. [14]

Коэффициенты

Соотношения также проблематичны; при определенных условиях существуют нормальные приближения.

Примеры формул

В этой таблице показаны дисперсии и стандартные отклонения простых функций действительных переменных со стандартными отклонениями, ковариацией и корреляцией. Действительные коэффициенты и предполагаются точно известными (детерминированными), т.е.

В правых столбцах таблицы и — это ожидаемые значения , а — значение функции, рассчитанное при этих значениях.

Для некоррелированных переменных ( , ) выражения для более сложных функций могут быть получены путем объединения более простых функций. Например, повторное умножение, предполагающее отсутствие корреляции, дает

Для этого случая у нас также есть выражение Гудмана [7] для точной дисперсии: для некоррелированного случая оно равно и поэтому мы имеем

Влияние корреляции на различия

Если A и B не коррелируют, их разность AB будет иметь большую дисперсию, чем любая из них. Увеличивающаяся положительная корреляция ( ) уменьшит дисперсию разности, сходясь к нулевой дисперсии для идеально коррелированных переменных с той же дисперсией . С другой стороны, отрицательная корреляция ( ) еще больше увеличит дисперсию разности по сравнению с некоррелированным случаем.

Например, самовычитание f = AA имеет нулевую дисперсию только в том случае, если переменная полностью автокоррелирована ( ). Если A некоррелирована, то выходная дисперсия в два раза больше входной дисперсии, а если A полностью антикоррелирована, то входная дисперсия в четыре раза больше выходной (обратите внимание на f = aAaA в таблице выше).

Примеры расчетов

Функция арктангенса

Мы можем рассчитать распространение неопределенности для функции арктангенса в качестве примера использования частных производных для распространения ошибки.

Определим , где абсолютная неопределенность нашего измерения x . Производная f ( x ) по x равна

Следовательно, наша распространенная неопределенность равна , где — абсолютная распространенная неопределенность.

Измерение сопротивления

Практическим применением является эксперимент , в котором измеряют ток I и напряжение V на резисторе , чтобы определить сопротивление R , используя закон Ома R = V / I.

Учитывая измеренные переменные с неопределенностями, I ± σ I и V ± σ V , и пренебрегая их возможной корреляцией, неопределенность вычисляемой величины, σ R , равна:

Смотрите также

Ссылки

  1. ^ Киршнер, Джеймс. "Data Analysis Toolkit #5: Uncertainty Analysis and Error Propagation" (PDF) . Berkeley Seismology Laboratory . University of California . Получено 22 апреля 2016 г. .
  2. ^ Kroese, DP; Taimre, T.; Botev, ZI (2011). Справочник по методам Монте-Карло . John Wiley & Sons.
  3. ^ Ранфтл, Саша; фон дер Линден, Вольфганг (13.11.2021). «Байесовский суррогатный анализ и распространение неопределенности». Physical Sciences Forum . 3 (1): 6. arXiv : 2101.04038 . doi : 10.3390/psf2021003006 . ISSN  2673-9984.
  4. ^ Атанасова, Е.; Гуров, Т.; Караиванова, А.; Ивановска, С.; Дурхова, М.; Димитров, Д. (2016). «О подходах к распараллеливанию для архитектуры Intel MIC». Труды конференции AIP . 1773 (1): 070001. Bibcode : 2016AIPC.1773g0001A. doi : 10.1063/1.4964983.
  5. ^ Кунья младший, А.; Нассер, Р.; Сампайо, Р.; Лопес, Х.; Брейтман, К. (2014). «Количественная оценка неопределенности с помощью метода Монте-Карло в условиях облачных вычислений». Computer Physics Communications . 185 (5): 1355–1363. arXiv : 2105.09512 . Bibcode : 2014CoPhC.185.1355C. doi : 10.1016/j.cpc.2014.01.006. S2CID  32376269.
  6. ^ Линь, И.; Ван, Ф.; Лю, Б. (2018). «Генератор случайных чисел для крупномасштабного параллельного моделирования Монте-Карло на ПЛИС». Журнал вычислительной физики . 360 : 93–103. Bibcode : 2018JCoPh.360...93L. doi : 10.1016/j.jcp.2018.01.029.
  7. ^ ab Goodman, Leo (1960). «О точной дисперсии продуктов». Журнал Американской статистической ассоциации . 55 (292): 708–713. doi :10.2307/2281592. JSTOR  2281592.
  8. ^ Ochoa1, Benjamin; Belongie, Serge "Распространение ковариации для управляемого сопоставления" Архивировано 20 июля 2011 г. на Wayback Machine
  9. ^ Ku, HH (октябрь 1966 г.). «Заметки об использовании распространения формул ошибок». Журнал исследований Национального бюро стандартов . 70C (4): 262. doi : 10.6028/jres.070c.025 . ISSN  0022-4316 . Получено 3 октября 2012 г.
  10. ^ Клиффорд, А.А. (1973). Многомерный анализ ошибок: справочник по распространению и вычислению ошибок в многопараметрических системах . John Wiley & Sons. ISBN 978-0470160558.[ нужна страница ]
  11. ^ Soch, Joram (2020-07-07). "Дисперсия линейной комбинации двух случайных величин". The Book of Statistical Proofs . Получено 29-01-2022 .
  12. ^ Ли, Ш.; Чен, В. (2009). «Сравнительное исследование методов распространения неопределенности для задач типа «черный ящик»». Structural and Multidisciplinary Optimization . 37 (3): 239–253. doi :10.1007/s00158-008-0234-7. S2CID  119988015.
  13. ^ Джонсон, Норман Л.; Коц, Сэмюэл; Балакришнан, Нараянасвами (1994). Непрерывные одномерные распределения, том 1. Wiley. стр. 171. ISBN 0-471-58495-9.
  14. ^ Lecomte, Christophe (май 2013 г.). «Точная статистика систем с неопределенностями: аналитическая теория стохастических динамических систем ранга один». Journal of Sound and Vibration . 332 (11): 2750–2776. doi :10.1016/j.jsv.2012.12.009.
  15. ^ "A Summary of Error Propagation" (PDF) . стр. 2. Архивировано из оригинала (PDF) 2016-12-13 . Получено 2016-04-04 .
  16. ^ "Распространение неопределенности посредством математических операций" (PDF) . стр. 5 . Получено 2016-04-04 .
  17. ^ "Стратегии оценки дисперсии" (PDF) . стр. 37 . Получено 2013-01-18 .
  18. ^ ab Harris, Daniel C. (2003), Количественный химический анализ (6-е изд.), Macmillan, стр. 56, ISBN 978-0-7167-4464-1
  19. ^ "Учебник по распространению ошибок" (PDF) . Foothill College . 9 октября 2009 г. . Получено 01.03.2012 .

Дальнейшее чтение

Внешние ссылки