Влияние неопределенности переменных на неопределенность функции, основанной на них
В статистике распространение неопределенности (или распространение ошибки ) — это влияние неопределенностей переменных (или ошибок , точнее случайных ошибок ) на неопределенность функции, основанной на них. Когда переменные являются значениями экспериментальных измерений, они имеют неопределенности из-за ограничений измерения (например, точности прибора ) , которые распространяются из-за комбинации переменных в функции.
Неопределенность u может быть выражена несколькими способами. Она может быть определена с помощью абсолютной погрешности Δ x . Неопределенности также могут быть определены с помощью относительной погрешности (Δ x )/ x , которая обычно записывается в процентах. Чаще всего неопределенность величины количественно определяется с помощью стандартного отклонения σ , которое является положительным квадратным корнем дисперсии . Значение величины и ее погрешность затем выражаются как интервал x ± u . Однако наиболее общий способ характеризовать неопределенность — это указать ее распределение вероятностей . Если распределение вероятностей переменной известно или может быть предположено, теоретически можно получить любую ее статистику. В частности, можно вывести доверительные пределы для описания области, в которой может быть найдено истинное значение переменной. Например, 68% доверительные пределы для одномерной переменной, принадлежащей нормальному распределению, составляют приблизительно ± одно стандартное отклонение σ от центрального значения x , что означает, что область x ± σ будет охватывать истинное значение примерно в 68% случаев.
Если неопределенности коррелируют, то необходимо учитывать ковариацию . Корреляция может возникнуть из двух разных источников. Во-первых, ошибки измерения могут быть коррелированы. Во-вторых, когда базовые значения коррелируют по всей популяции, неопределенности в средних значениях группы будут коррелированы. [1]
В общем контексте, где нелинейная функция изменяет неопределенные параметры (коррелированные или нет), стандартными инструментами для распространения неопределенности и вывода результирующего распределения вероятностей/статистики являются методы выборки из семейства методов Монте-Карло . [2] Для очень обширных данных или сложных функций вычисление распространения ошибки может быть очень обширным, поэтому может потребоваться суррогатная модель [3] или стратегия параллельных вычислений [4] [5] [6] .
В некоторых частных случаях расчет распространения неопределенности может быть выполнен с помощью упрощенных алгебраических процедур. Некоторые из этих сценариев описаны ниже.
Линейные комбинации
Пусть будет набором из m функций, которые являются линейными комбинациями переменных с коэффициентами комбинации :
или в матричной записи,
Также пусть матрица дисперсии-ковариации x = ( x 1 , ..., x n ) обозначается как , а среднее значение обозначается как : — внешнее произведение .
Тогда матрица дисперсии-ковариации функции f определяется как
В компонентной записи уравнение
выглядит следующим образом:
Это наиболее общее выражение для распространения ошибки из одного набора переменных в другой. Когда ошибки по x некоррелированы, общее выражение упрощается до ,
где - дисперсия k -го элемента вектора x . Обратите внимание, что даже если ошибки по x могут быть некоррелированными, ошибки по f в общем случае коррелированы; другими словами, даже если - диагональная матрица, - в общем случае полная матрица.
Общие выражения для скалярной функции f немного проще (здесь a — вектор-строка):
Каждый ковариационный член может быть выражен через коэффициент корреляции следующим образом : , так что альтернативное выражение для дисперсии f имеет вид
В случае, если переменные в x не коррелируют, это упрощается еще больше:
В простом случае одинаковых коэффициентов и дисперсий находим
Для среднего арифметического результатом является стандартная ошибка среднего :
Нелинейные комбинации
Когда f представляет собой набор нелинейных комбинаций переменных x , можно выполнить интервальное распространение для вычисления интервалов, содержащих все согласованные значения переменных. В вероятностном подходе функция f обычно должна быть линеаризована путем приближения к разложению в ряд Тейлора первого порядка , хотя в некоторых случаях можно вывести точные формулы, которые не зависят от разложения, как в случае точной дисперсии произведений. [7] Разложение Тейлора будет выглядеть так:
где обозначает частную производную f k по отношению к i -й переменной, вычисленную по среднему значению всех компонентов вектора x . Или в матричной записи , где
J - матрица Якоби . Поскольку f 0 является константой, она не вносит вклад в ошибку в f. Следовательно, распространение ошибки следует линейному случаю, описанному выше, но заменяя линейные коэффициенты A ki и A kj частными производными и . В матричной записи [8]
То есть, якобиан функции используется для преобразования строк и столбцов матрицы дисперсии-ковариации аргумента. Обратите внимание, что это эквивалентно матричному выражению для линейного случая с .
Упрощение
Пренебрежение корреляциями или предположение о независимости переменных приводит к общей формуле среди инженеров и ученых-экспериментаторов для расчета распространения ошибок — формуле дисперсии: [9]
где представляет собой стандартное отклонение функции , представляет собой стандартное отклонение , представляет собой стандартное отклонение и т. д.
Эта формула основана на линейных характеристиках градиента и, следовательно, является хорошей оценкой для стандартного отклонения, если они достаточно малы. В частности, линейная аппроксимация должна быть близка к внутри окрестности радиуса . [10]
Пример
Любая нелинейная дифференцируемая функция двух переменных и может быть разложена как
Если мы возьмем дисперсию с обеих сторон и применим формулу [11] для дисперсии линейной комбинации переменных,
то получим
где — стандартное отклонение функции , — стандартное отклонение , — стандартное отклонение и — ковариация между и .
В частном случае, когда , , . Тогда
или
где есть корреляция между и .
Когда переменные и некоррелированы, . Тогда
Предостережения и предупреждения
Оценки ошибок для нелинейных функций смещены из-за использования усеченного расширения ряда. Степень этого смещения зависит от природы функции. Например, смещение ошибки, вычисленной для log(1+ x ), увеличивается с ростом x , поскольку расширение до x является хорошим приближением только тогда, когда x близок к нулю.
Для сильно нелинейных функций существует пять категорий вероятностных подходов к распространению неопределенности; [12] см . подробности в разделе Количественная оценка неопределенности .
Взаимные и смещенные взаимные
В особом случае обратного или обратного распределения , когда следует стандартное нормальное распределение , результирующее распределение является обратным стандартным нормальным распределением, и не существует определяемой дисперсии. [13]
Однако в несколько более общем случае смещенной обратной функции для следования общему нормальному распределению, тогда статистики среднего и дисперсии существуют в смысле главного значения , если разница между полюсом и средним значением является действительной. [14]
Коэффициенты
Соотношения также проблематичны; при определенных условиях существуют нормальные приближения.
Примеры формул
В этой таблице показаны дисперсии и стандартные отклонения простых функций действительных переменных со стандартными отклонениями, ковариацией и корреляцией. Действительные коэффициенты и предполагаются точно известными (детерминированными), т.е.
В правых столбцах таблицы и — это ожидаемые значения , а — значение функции, рассчитанное при этих значениях.
Для некоррелированных переменных ( , ) выражения для более сложных функций могут быть получены путем объединения более простых функций. Например, повторное умножение, предполагающее отсутствие корреляции, дает
Для этого случая у нас также есть выражение Гудмана [7] для точной дисперсии: для некоррелированного случая оно равно
и поэтому мы имеем
Влияние корреляции на различия
Если A и B не коррелируют, их разность A − B будет иметь большую дисперсию, чем любая из них. Увеличивающаяся положительная корреляция ( ) уменьшит дисперсию разности, сходясь к нулевой дисперсии для идеально коррелированных переменных с той же дисперсией . С другой стороны, отрицательная корреляция ( ) еще больше увеличит дисперсию разности по сравнению с некоррелированным случаем.
Например, самовычитание f = A − A имеет нулевую дисперсию только в том случае, если переменная полностью автокоррелирована ( ). Если A некоррелирована, то выходная дисперсия в два раза больше входной дисперсии, а если A полностью антикоррелирована, то входная дисперсия в четыре раза больше выходной (обратите внимание на f = aA − aA в таблице выше).
Примеры расчетов
Функция арктангенса
Мы можем рассчитать распространение неопределенности для функции арктангенса в качестве примера использования частных производных для распространения ошибки.
Определим
, где абсолютная неопределенность нашего измерения x . Производная f ( x ) по x равна
Следовательно, наша распространенная неопределенность равна ,
где — абсолютная распространенная неопределенность.
Измерение сопротивления
Практическим применением является эксперимент , в котором измеряют ток I и напряжение V на резисторе , чтобы определить сопротивление R , используя закон Ома R = V / I.
Учитывая измеренные переменные с неопределенностями, I ± σ I и V ± σ V , и пренебрегая их возможной корреляцией, неопределенность вычисляемой величины, σ R , равна:
Смотрите также
Ссылки
- ^ Киршнер, Джеймс. "Data Analysis Toolkit #5: Uncertainty Analysis and Error Propagation" (PDF) . Berkeley Seismology Laboratory . University of California . Получено 22 апреля 2016 г. .
- ^ Kroese, DP; Taimre, T.; Botev, ZI (2011). Справочник по методам Монте-Карло . John Wiley & Sons.
- ^ Ранфтл, Саша; фон дер Линден, Вольфганг (13.11.2021). «Байесовский суррогатный анализ и распространение неопределенности». Physical Sciences Forum . 3 (1): 6. arXiv : 2101.04038 . doi : 10.3390/psf2021003006 . ISSN 2673-9984.
- ^ Атанасова, Е.; Гуров, Т.; Караиванова, А.; Ивановска, С.; Дурхова, М.; Димитров, Д. (2016). «О подходах к распараллеливанию для архитектуры Intel MIC». Труды конференции AIP . 1773 (1): 070001. Bibcode : 2016AIPC.1773g0001A. doi : 10.1063/1.4964983.
- ^ Кунья младший, А.; Нассер, Р.; Сампайо, Р.; Лопес, Х.; Брейтман, К. (2014). «Количественная оценка неопределенности с помощью метода Монте-Карло в условиях облачных вычислений». Computer Physics Communications . 185 (5): 1355–1363. arXiv : 2105.09512 . Bibcode : 2014CoPhC.185.1355C. doi : 10.1016/j.cpc.2014.01.006. S2CID 32376269.
- ^ Линь, И.; Ван, Ф.; Лю, Б. (2018). «Генератор случайных чисел для крупномасштабного параллельного моделирования Монте-Карло на ПЛИС». Журнал вычислительной физики . 360 : 93–103. Bibcode : 2018JCoPh.360...93L. doi : 10.1016/j.jcp.2018.01.029.
- ^ ab Goodman, Leo (1960). «О точной дисперсии продуктов». Журнал Американской статистической ассоциации . 55 (292): 708–713. doi :10.2307/2281592. JSTOR 2281592.
- ^ Ochoa1, Benjamin; Belongie, Serge "Распространение ковариации для управляемого сопоставления" Архивировано 20 июля 2011 г. на Wayback Machine
- ^ Ku, HH (октябрь 1966 г.). «Заметки об использовании распространения формул ошибок». Журнал исследований Национального бюро стандартов . 70C (4): 262. doi : 10.6028/jres.070c.025 . ISSN 0022-4316 . Получено 3 октября 2012 г.
- ^ Клиффорд, А.А. (1973). Многомерный анализ ошибок: справочник по распространению и вычислению ошибок в многопараметрических системах . John Wiley & Sons. ISBN 978-0470160558.[ нужна страница ]
- ^ Soch, Joram (2020-07-07). "Дисперсия линейной комбинации двух случайных величин". The Book of Statistical Proofs . Получено 29-01-2022 .
- ^ Ли, Ш.; Чен, В. (2009). «Сравнительное исследование методов распространения неопределенности для задач типа «черный ящик»». Structural and Multidisciplinary Optimization . 37 (3): 239–253. doi :10.1007/s00158-008-0234-7. S2CID 119988015.
- ^ Джонсон, Норман Л.; Коц, Сэмюэл; Балакришнан, Нараянасвами (1994). Непрерывные одномерные распределения, том 1. Wiley. стр. 171. ISBN 0-471-58495-9.
- ^ Lecomte, Christophe (май 2013 г.). «Точная статистика систем с неопределенностями: аналитическая теория стохастических динамических систем ранга один». Journal of Sound and Vibration . 332 (11): 2750–2776. doi :10.1016/j.jsv.2012.12.009.
- ^ "A Summary of Error Propagation" (PDF) . стр. 2. Архивировано из оригинала (PDF) 2016-12-13 . Получено 2016-04-04 .
- ^ "Распространение неопределенности посредством математических операций" (PDF) . стр. 5 . Получено 2016-04-04 .
- ^ "Стратегии оценки дисперсии" (PDF) . стр. 37 . Получено 2013-01-18 .
- ^ ab Harris, Daniel C. (2003), Количественный химический анализ (6-е изд.), Macmillan, стр. 56, ISBN 978-0-7167-4464-1
- ^ "Учебник по распространению ошибок" (PDF) . Foothill College . 9 октября 2009 г. . Получено 01.03.2012 .
Дальнейшее чтение
- Бевингтон, Филип Р.; Робинсон, Д. Кит (2002), Обработка данных и анализ ошибок для физических наук (3-е изд.), McGraw-Hill, ISBN 978-0-07-119926-1
- Форназини, Паоло (2008), Неопределенность физических измерений: введение в анализ данных в физической лаборатории, Springer, стр. 161, ISBN 978-0-387-78649-0
- Мейер, Стюарт Л. (1975), Анализ данных для ученых и инженеров , Wiley, ISBN 978-0-471-59995-1
- Перальта, М. (2012), Распространение ошибок: как математически предсказать ошибки измерения , CreateSpace
- Руо, М. (2013), Вероятность, статистика и оценка: распространение неопределенностей в экспериментальных измерениях (PDF) (краткое изд.)
- Тейлор, Дж. Р. (1997), Введение в анализ ошибок: изучение неопределенностей в физических измерениях (2-е изд.), University Science Books
- Ван, CM; Айер, Хари К. (2005-09-07). «О поправках высшего порядка для распространяющихся неопределенностей». Metrologia . 42 (5): 406–410. doi :10.1088/0026-1394/42/5/011. ISSN 0026-1394. S2CID 122841691.
Внешние ссылки
- Подробное обсуждение измерений и распространения неопределенности, объясняющее преимущества использования формул распространения ошибок и моделирования Монте-Карло вместо простой арифметики значимости.
- GUM, Руководство по выражению неопределенности в измерениях
- EPFL Введение в распространение ошибок, вывод, значение и примеры Cy = Fx Cx Fx'
- пакет неопределенностей, программа/библиотека для прозрачного выполнения расчетов с неопределенностями (и корреляциями ошибок).
- Пакет soerp, программа/библиотека Python для прозрачного выполнения вычислений *второго порядка* с неопределенностями (и корреляциями ошибок).
- Объединенный комитет по руководствам по метрологии (2011). JCGM 102: Оценка данных измерений — Дополнение 2 к «Руководству по выражению неопределенности измерений» — Расширение на любое количество выходных величин (PDF) (Технический отчет). JCGM . Получено 13 февраля 2013 г.
- Калькулятор неопределенности Распространить неопределенность для любого выражения