stringtranslate.com

Распространение неопределенности

В статистике распространение неопределенности (или распространение ошибки ) — это влияние неопределенностей переменных (или ошибок , точнее случайных ошибок ) на неопределенность основанной на них функции . Когда переменные представляют собой значения экспериментальных измерений, они имеют неопределенности из-за ограничений измерения (например, точности прибора ), которые распространяются из-за комбинации переменных в функции.

Неопределенность u может быть выражена разными способами. Ее можно определить по абсолютной ошибке Δ x . Неопределенности также можно определить с помощью относительной ошибки (Δx ) / x , которая обычно выражается в процентах. Чаще всего неопределенность величины выражается количественно через стандартное отклонение σ , которое представляет собой положительный квадратный корень из дисперсии . Значение величины и ее ошибка тогда выражаются как интервал x ± u . Однако наиболее общий способ охарактеризовать неопределенность — указать ее распределение вероятностей . Если распределение вероятностей переменной известно или можно предположить, теоретически можно получить любую ее статистику. В частности, можно вывести доверительные пределы для описания области, в которой может быть найдено истинное значение переменной. Например, доверительные пределы 68% для одномерной переменной, принадлежащей нормальному распределению, составляют примерно ± одно стандартное отклонение σ от центрального значения x , что означает, что область x ± σ будет охватывать истинное значение примерно в 68% случаев. случаи.

Если неопределенности коррелируют , то необходимо учитывать ковариацию . Корреляция может возникать из двух разных источников. Во-первых, ошибки измерения могут быть коррелированы. Во-вторых, когда основные значения коррелируют среди населения, неопределенности в средних группах будут коррелировать. [1]

В общем контексте, когда нелинейная функция изменяет неопределенные параметры (коррелированные или нет), стандартными инструментами для распространения неопределенности и вывода результирующего распределения вероятностей/статистики величин являются методы выборки из семейства методов Монте-Карло . [2] Для очень обширных данных или сложных функций расчет распространения ошибки может быть очень обширным, поэтому может потребоваться суррогатная модель [3] или стратегия параллельных вычислений [4] [5] [6] .

В некоторых частных случаях расчет распространения неопределенности можно выполнить с помощью упрощенных алгебраических процедур. Некоторые из этих сценариев описаны ниже.

Линейные комбинации

Пусть — набор из m функций, которые представляют собой линейные комбинации переменных с коэффициентами комбинации :

Также пусть матрица дисперсии-ковариации x = ( x 1 , ..., x n ) обозначается как и пусть среднее значение обозначается как :

внешний продукт

Тогда дисперсионно-ковариационная матрица f определяется выражением

В обозначениях компонентов уравнение

Это наиболее общее выражение распространения ошибки от одного набора переменных к другому. Когда ошибки по x некоррелированы, общее выражение упрощается до

kxxf

Общие выражения для скалярной функции f немного проще (здесь a — вектор-строка):

Каждый член ковариации может быть выражен через коэффициент корреляции , так что альтернативное выражение для дисперсии f имеет вид

В случае, когда переменные в x некоррелированы, это еще больше упрощается до

В простом случае одинаковых коэффициентов и дисперсий находим

Для среднего арифметического результат представляет собой стандартную ошибку среднего :

Нелинейные комбинации

Когда f представляет собой набор нелинейной комбинации переменных x , можно выполнить распространение по интервалам , чтобы вычислить интервалы, которые содержат все согласованные значения переменных. В вероятностном подходе функцию f обычно необходимо линеаризовать путем приближения к разложению в ряд Тейлора первого порядка , хотя в некоторых случаях можно вывести точные формулы, которые не зависят от разложения, как в случае точной дисперсии произведений . [7] Расширение Тейлора будет таким:

производную f kixматричной записи
матрица Якобиана0A kiA kj[8]

То есть якобиан функции используется для преобразования строк и столбцов дисперсионно-ковариационной матрицы аргумента. Обратите внимание, что это эквивалентно матричному выражению для линейного случая с .

Упрощение

Пренебрежение корреляциями или допущение независимых переменных приводит к общей формуле среди инженеров и ученых-экспериментаторов для расчета распространения ошибок - формуле дисперсии: [9]

Важно отметить, что эта формула основана на линейных характеристиках градиента и, следовательно, является хорошей оценкой стандартного отклонения, если оно достаточно мало. В частности, линейная аппроксимация должна быть близка к окрестности радиуса . [10]

Пример

Любая нелинейная дифференцируемая функция двух переменных и может быть расширена как

[11]

следовательно:

В частном случае , , . Затем

Когда переменные и некоррелированы, . Затем

Предостережения и предупреждения

Оценки ошибок для нелинейных функций смещены из-за использования разложения в усеченный ряд. Степень этой предвзятости зависит от характера функции. Например, смещение ошибки, рассчитанной для log(1+ x ), увеличивается с увеличением x , поскольку разложение до x является хорошим приближением только тогда, когда x близок к нулю.

Для сильно нелинейных функций существует пять категорий вероятностных подходов к распространению неопределенности; [12] Подробности см. в разделе «Количественная оценка неопределенности» .

Взаимный и смещенный взаимный

В частном случае обратного или взаимного распределения , когда следует стандартное нормальное распределение , результирующее распределение является обратным стандартным нормальным распределением, и не существует определяемой дисперсии. [13]

Однако в несколько более общем случае смещенной обратной функции для следования общему нормальному распределению статистика среднего и дисперсии действительно существует в смысле главного значения , если разница между полюсом и средним значением имеет действительное значение. [14]

Соотношения

Соотношения также проблематичны; нормальные приближения существуют при определенных условиях.

Примеры формул

В этой таблице показаны дисперсии и стандартные отклонения простых функций реальных переменных , а также ковариация стандартных отклонений и корреляция . Действительные коэффициенты и предполагаются точно известными (детерминированными), т. е. .

В правых столбцах таблицы и — ожидаемые значения , а — значение функции, рассчитанное по этим значениям.

Для некоррелированных переменных ( , ) выражения для более сложных функций можно получить путем объединения более простых функций. Например, повторное умножение, при условии отсутствия корреляции, дает

Для этого случая у нас также есть выражение Гудмана [7] для точной дисперсии: для некоррелированного случая оно равно

Влияние корреляции на различия

Если A и B некоррелированы, их разница AB будет иметь большую дисперсию, чем любая из них. Увеличение положительной корреляции ( ) уменьшит дисперсию разницы, приближаясь к нулевой дисперсии для идеально коррелирующих переменных с одинаковой дисперсией . С другой стороны, отрицательная корреляция ( ) еще больше увеличит дисперсию разницы по сравнению с некоррелированным случаем.

Например, самовычитание f=AA имеет нулевую дисперсию только в том случае, если переменная полностью автокоррелирована ( ). Если A некоррелировано, то выходное отклонение в два раза превышает входное отклонение . И если A полностью антикоррелирован, то входная дисперсия увеличивается в четыре раза на выходе (обратите внимание на f = aA - aA в таблице выше).

Пример расчетов

Функция обратного тангенса

Мы можем рассчитать распространение неопределенности для функции обратного тангенса в качестве примера использования частных производных для распространения ошибки.

Определять

xf ( x )x

Следовательно, наша распространяемая неопределенность равна

Измерение сопротивления

Практическое применение — это эксперимент , в котором измеряют ток I и напряжение V на резисторе , чтобы определить сопротивление R , используя закон Ома R = V / I .

Учитывая измеряемые переменные с неопределенностями I ± σ I и V ± σ V и пренебрегая их возможной корреляцией, неопределенность вычисленной величины σ R составляет:

Смотрите также

Рекомендации

  1. ^ Киршнер, Джеймс. «Набор инструментов для анализа данных № 5: анализ неопределенностей и распространение ошибок» (PDF) . Сейсмологическая лаборатория Беркли . Калифорнийский университет . Проверено 22 апреля 2016 г.
  2. ^ Крозе, ДП; Таймре, Т.; Ботев, З.И. (2011). Справочник по методам Монте-Карло . Джон Уайли и сыновья.
  3. ^ Ранфтл, Саша; фон дер Линден, Вольфганг (13 ноября 2021 г.). «Байесовский суррогатный анализ и распространение неопределенности». Форум физических наук . 3 (1): 6. arXiv : 2101.04038 . дои : 10.3390/psf2021003006 . ISSN  2673-9984.
  4. ^ Атанасова, Э.; Гуров Т.; Караиванова А.; Ивановская, С.; Дурчова, М.; Димитров, Д. (2016). «О подходах к распараллеливанию архитектуры Intel MIC». Материалы конференции AIP . 1773 (1): 070001. Бибкод : 2016AIPC.1773g0001A. дои : 10.1063/1.4964983.
  5. ^ Кунья-младший, А.; Насер, Р.; Сампайо, Р.; Лопес, Х.; Брейтман, К. (2014). «Количественная оценка неопределенности с помощью метода Монте-Карло в условиях облачных вычислений». Компьютерная физика. Коммуникации . 185 (5): 1355–1363. arXiv : 2105.09512 . Бибкод : 2014CoPhC.185.1355C. дои :10.1016/j.cpc.2014.01.006. S2CID  32376269.
  6. ^ Лин, Ю.; Ван, Ф.; Лю, Б. (2018). «Генератор случайных чисел для крупномасштабного параллельного моделирования Монте-Карло на FPGA». Журнал вычислительной физики . 360 : 93–103. Бибкод : 2018JCoPh.360...93L. дои : 10.1016/j.jcp.2018.01.029.
  7. ^ аб Гудман, Лео (1960). «О точном отклонении продуктов». Журнал Американской статистической ассоциации . 55 (292): 708–713. дои : 10.2307/2281592. JSTOR  2281592.
  8. ^ Очоа1, Бенджамин; Белонги, Серж «Распространение ковариации для управляемого сопоставления». Архивировано 20 июля 2011 г. в Wayback Machine.
  9. ^ Ку, HH (октябрь 1966 г.). «Заметки по использованию формул распространения ошибок». Журнал исследований Национального бюро стандартов . 70C (4): 262. doi : 10.6028/jres.070c.025 . ISSN  0022-4316 . Проверено 3 октября 2012 г.
  10. ^ Клиффорд, А.А. (1973). Многомерный анализ ошибок: справочник по распространению ошибок и расчетам в многопараметрических системах . Джон Уайли и сыновья. ISBN 978-0470160558.[ нужна страница ]
  11. ^ Соч, Йорам (07.07.2020). «Дисперсия линейной комбинации двух случайных величин». Книга статистических доказательств . Проверено 29 января 2022 г.
  12. ^ Ли, SH; Чен, В. (2009). «Сравнительное исследование методов распространения неопределенности для задач типа черного ящика». Структурная и междисциплинарная оптимизация . 37 (3): 239–253. дои : 10.1007/s00158-008-0234-7. S2CID  119988015.
  13. ^ Джонсон, Норман Л.; Коц, Сэмюэл; Балакришнан, Нараянасвами (1994). Непрерывные одномерные распределения, Том 1 . Уайли. п. 171. ИСБН 0-471-58495-9.
  14. ^ Леконт, Кристоф (май 2013 г.). «Точная статистика систем с неопределенностями: аналитическая теория стохастических динамических систем первого ранга». Журнал звука и вибрации . 332 (11): 2750–2776. дои : 10.1016/j.jsv.2012.12.009.
  15. ^ «Краткая информация о распространении ошибок» (PDF) . п. 2. Архивировано из оригинала (PDF) 13 декабря 2016 г. Проверено 4 апреля 2016 г.
  16. ^ «Распространение неопределенности посредством математических операций» (PDF) . п. 5 . Проверено 4 апреля 2016 г.
  17. ^ «Стратегии оценки дисперсии» (PDF) . п. 37 . Проверено 18 января 2013 г.
  18. ^ Аб Харрис, Дэниел К. (2003), Количественный химический анализ (6-е изд.), Macmillan, стр. 56, ISBN 978-0-7167-4464-1
  19. ^ «Учебное пособие по распространению ошибок» (PDF) . Футхиллский колледж . 9 октября 2009 года . Проверено 1 марта 2012 г.

дальнейшее чтение

Внешние ссылки