Обратная задача

Обратная задача в науке — это процесс расчета по совокупности наблюдений причинных факторов, их породивших: например, расчет изображения в рентгеновской компьютерной томографии , реконструкция источника в акустике или расчет плотности Земли по измерениям его гравитационное поле . Это называется обратной задачей, потому что она начинается со следствий, а затем вычисляет причины. Это обратная задача, которая начинается с причин, а затем рассчитывает последствия.

Обратные задачи являются одними из наиболее важных математических задач в науке и математике , поскольку они сообщают нам о параметрах, которые мы не можем наблюдать напрямую. Они имеют широкое применение в идентификации систем , оптике , радаре , акустике , теории связи , обработке сигналов , медицинской визуализации , компьютерном зрении , ^[1]^[2] геофизике , океанографии , астрономии , дистанционном зондировании , обработке естественного языка , машинном обучении , ^{[3 ] ]} неразрушающий контроль , анализ устойчивости откосов ^[4] и многие другие области. ^{[ нужна цитата ]}

История

Начинать со следствий и искать причины волновало физиков на протяжении веков. Историческим примером являются расчеты Адамса и Леверье , приведшие к открытию Нептуна по возмущенной траектории Урана . Однако формальное исследование обратных задач началось только в 20 веке.

Один из самых ранних примеров решения обратной задачи был открыт Германом Вейлем и опубликован в 1911 году, описывая асимптотическое поведение собственных значений оператора Лапласа–Бельтрами . ^[5] Сегодня известный как закон Вейля , его, пожалуй, легче всего понять как ответ на вопрос, можно ли услышать форму барабана . Вейль предположил, что собственные частоты барабана будут связаны с площадью и периметром барабана определенным уравнением, и этот результат был улучшен более поздними математиками.

К области обратных задач позднее затронул советско - армянский физик Виктор Амбарцумян . ^[6]^[7]

Еще будучи студентом, Амбарцумян тщательно изучил теорию атомного строения, образования энергетических уровней, уравнение Шрёдингера и его свойства, а когда освоил теорию собственных значений дифференциальных уравнений , указал на кажущуюся аналогию между дискретными уровнями энергии. и собственные значения дифференциальных уравнений. Затем он спросил: возможно ли, учитывая семейство собственных значений, найти форму уравнений, собственными значениями которых они являются? По сути, Амбарцумян исследовал обратную задачу Штурма–Лиувилля , которая касалась определения уравнений колеблющейся струны. Эта статья была опубликована в 1929 году в немецком физическом журнале Zeitschrift für Physik и довольно долгое время оставалась в безвестности. Описывая эту ситуацию спустя многие десятилетия, Амбарцумян сказал: «Если астроном опубликует в физическом журнале статью математического содержания, то, скорее всего, с ним произойдет забвение».

Тем не менее, к концу Второй мировой войны эта статья, написанная 20-летним Амбарцумяном, была найдена шведскими математиками и послужила отправной точкой для целого направления исследований обратных задач, став фундаментом целой дисциплина.

Затем важные усилия были посвящены «прямому решению» обратной задачи рассеяния, особенно Гельфандом и Левитаном в Советском Союзе. ^[8] Они предложили аналитический конструктивный метод определения решения. Когда стали доступны компьютеры, некоторые авторы исследовали возможность применения своего подхода к аналогичным задачам, таким как обратная задача в одномерном волновом уравнении. Но быстро выяснилось, что инверсия — нестабильный процесс: шум и ошибки могут значительно усилиться, что сделает прямое решение практически невозможным. Затем, примерно в семидесятые годы, появились методы наименьших квадратов и вероятностные подходы, которые оказались очень полезными для определения параметров, участвующих в различных физических системах. Этот подход имел большой успех. В настоящее время обратные задачи исследуются и в других областях, помимо физики, таких как химия, экономика и информатика. В конце концов, когда числовые модели станут преобладать во многих частях общества, мы можем ожидать появления обратной проблемы, связанной с каждой из этих числовых моделей.

Концептуальное понимание

Со времен Ньютона учёные активно пытались смоделировать мир. В частности, когда доступна математическая модель (например, закон гравитации Ньютона или уравнение электростатики Кулона), мы можем предвидеть, учитывая некоторые параметры, описывающие физическую систему (например, распределение массы или распределение электрических зарядов), поведение системы. Этот подход известен как математическое моделирование, а вышеупомянутые физические параметры называются параметрами модели или просто моделью . Точнее, введем понятие состояния физической системы : это решение уравнения математической модели. В теории оптимального управления эти уравнения называются уравнениями состояния . Во многих ситуациях нас действительно интересует не физическое состояние, а лишь его влияние на некоторые объекты (например, влияние гравитационного поля на конкретную планету). Следовательно, мы должны ввести еще один оператор, называемый оператором наблюдения , который преобразует состояние физической системы (здесь предсказанное гравитационное поле) в то, что мы хотим наблюдать (здесь движение рассматриваемой планеты). Теперь мы можем представить так называемую прямую задачу , которая состоит из двух шагов:

определение состояния системы по описывающим ее физическим параметрам
применение оператора наблюдения к предполагаемому состоянию системы, чтобы предсказать поведение того, что мы хотим наблюдать.

Это приводит к введению другого оператора ( F означает «вперед»), который отображает параметры модели в данные, которые предсказывает модель, и которые являются результатом этой двухэтапной процедуры. Оператор называется оператором вперед или картой вперед . В этом подходе мы в основном пытаемся предсказать последствия, зная причины. $F$ ${\ displaystyle p}$ ${\ displaystyle F (p)}$ ${\ displaystyle p}$ $F$

В приведенной ниже таблице показаны параметры модели, описывающие систему, физическая величина, описывающая состояние физической системы, а также наблюдения, обычно проводимые за состоянием системы (при рассмотрении Земли как физической системы и для различных физических явлений).

В подходе обратной задачи мы, грубо говоря, пытаемся узнать причины с учетом следствий.

Общая постановка обратной задачи

Обратная задача является «обратной» прямой задаче: вместо определения данных, полученных с помощью определенных параметров модели, мы хотим определить параметры модели, которые производят данные, которые представляют собой записанное нами наблюдение (индекс obs означает «наблюдаемое»). . Другими словами, наша цель – определить такие параметры модели, чтобы (хотя бы приблизительно) $d_{\text{obs}}$ ${\ displaystyle p}$

d_{\text{obs}}=F(p)

F

M

N

Пространство моделей , обозначаемое : векторным пространством , охватываемым параметрами модели; у него есть размеры; $P$ $M$
Пространство данных, обозначаемое : если мы организуем измеренные образцы в вектор с компонентами (если наши измерения состоят из функций, это векторное пространство с бесконечными размерностями); $D$ $D=\mathbb {R} ^{N}$ $N$ $D$
${\ displaystyle F (p)}$ : реакция модели ; он состоит из данных, предсказанных моделью ; ${\ displaystyle p}$ ${\ displaystyle p}$
$F(P)$ : изображение прямой карты, это подмножество (но не подпространство, если оно не является линейным), состоящее из ответов всех моделей; $P$ $D$ $F$
$d_{\text{obs}}-F(p)$ : несоответствия данных (или остатки), связанные с моделью : их можно упорядочить как вектор, элемент . ${\ displaystyle p}$ $D$

Понятие остатков очень важно: в рамках поиска модели, соответствующей данным, их анализ показывает, можно ли рассматриваемую модель считать реалистичной или нет . Систематические нереалистичные расхождения между данными и ответами модели также показывают, что прогнозная карта неадекватна, и могут дать представление об улучшенной перспективной карте.

Когда оператор линеен, обратная задача линейна. В противном случае, что чаще всего, обратная задача является нелинейной. Кроме того, модели не всегда могут быть описаны конечным числом параметров. Это тот случай, когда мы ищем распределенные параметры (например, распределение скоростей волн): в таких случаях целью обратной задачи является получение одной или нескольких функций. Такие обратные задачи являются обратными задачами бесконечной размерности. $F$

Линейные обратные задачи

В случае линейного прямого отображения и когда мы имеем дело с конечным числом параметров модели, прямое отображение можно записать в виде линейной системы

d=Fp

матрица

F

Элементарный пример: гравитационное поле Земли.

Лишь немногие физические системы действительно линейны по отношению к параметрам модели. Одной из таких систем геофизики является гравитационное поле Земли . Гравитационное поле Земли определяется распределением плотности Земли в недрах. Поскольку литология Земли меняется весьма существенно, мы можем наблюдать мельчайшие различия в гравитационном поле Земли на поверхности Земли. Из нашего понимания гравитации (закона гравитации Ньютона) мы знаем, что математическое выражение гравитации таково:

d={\frac {Gp}{r^{2}}};

универсальная гравитационная постоянная

d

G

{\ displaystyle p}

г

Дискретизируя приведенное выше выражение, мы можем связать дискретные данные наблюдений на поверхности Земли с параметрами дискретной модели (плотностью) в недрах, о которых мы хотим узнать больше. Например, рассмотрим случай, когда у нас есть измерения, проведенные в 5 точках на поверхности Земли. В этом случае наш вектор данных представляет собой вектор-столбец размерности (5×1): его -й компонент связан с -м местом наблюдения. Мы также знаем, что у нас есть только пять неизвестных масс в недрах (нереалистично, но используется для демонстрации концепции) с известным местоположением: мы обозначаем расстоянием между -м местом наблюдения и -й массой. Таким образом, мы можем построить линейную систему, связывающую пять неизвестных масс с пятью точками данных следующим образом: $d$ $я$ $я$ $p_{j}$ $r_{ij}$ $я$ $j$

d=Fp,

d={\begin{bmatrix}d_{1}\\d_{2}\\d_{3}\\d_{4}\\d_{5}\end{bmatrix}},\quad p= {\begin{bmatrix}p_{1}\\p_{2}\\p_{3}\\p_{4}\\p_{5}\end{bmatrix}},

F={\begin{bmatrix}{\frac {G}{r_{11}^{2}}}&{\frac {G}{r_{12}^{2}}}&{\frac {G}{r_{13}^{2}}}&{\frac {G}{r_{14}^{2}}}&{\frac {G}{r_{15}^{2}}}\\{\frac {G}{r_{21}^{2}}}&{\frac {G}{r_{22}^{2}}}&{\frac {G}{r_{23}^{2}}}&{\frac {G}{r_{24}^{2}}}&{\frac {G}{r_{25}^{2}}}\\{\frac {G}{r_{31}^{2}}}&{\frac {G}{r_{32}^{2}}}&{\frac {G}{r_{33}^{2}}}&{\frac {G}{r_{34}^{2}}}&{\frac {G}{r_{35}^{2}}}\\{\frac {G}{r_{41}^{2}}}&{\frac {G}{r_{42}^{2}}}&{\frac {G}{r_{43}^{2}}}&{\frac {G}{r_{44}^{2}}}&{\frac {G}{r_{45}^{2}}}\\{\frac {G}{r_{51}^{2}}}&{\frac {G}{r_{52}^{2}}}&{\frac {G}{r_{53}^{2}}}&{\frac {G}{r_{54}^{2}}}&{\frac {G}{r_{55}^{2}}}\end{bmatrix}}

Чтобы найти параметры модели, соответствующие нашим данным, мы могли бы инвертировать матрицу , чтобы напрямую преобразовать измерения в параметры нашей модели. Например: $F$

p=F^{-1}d_{\text{obs}}

F

Однако даже квадратная матрица не может иметь обратной: матрица может иметь дефектный ранг (т.е. иметь нулевые собственные значения) и решение системы неединственно. Тогда решение обратной задачи будет неопределенным. Это первая трудность. У переопределенных систем (больше уравнений, чем неизвестных) есть и другие проблемы. Также шум может исказить наши наблюдения, выходя за пределы пространства возможных реакций на параметры модели, так что решение системы может не существовать. Это еще одна трудность. $F$ $p=F^{-1}d_{\text{obs}}$ $d$ $F(P)$ $p=F^{-1}d_{\text{obs}}$

Инструменты для преодоления первой трудности

Первая трудность отражает важную проблему: наши наблюдения не содержат достаточно информации и требуются дополнительные данные. Дополнительные данные могут быть получены из физической априорной информации о значениях параметров, об их пространственном распределении или, в более общем плане, об их взаимной зависимости. Это также может быть результатом других экспериментов: например, мы можем подумать об интеграции данных, записанных гравиметрами и сейсмографами, для лучшей оценки плотности. Интеграция этой дополнительной информации, по сути, является проблемой статистики . Именно эта дисциплина может ответить на вопрос: Как смешивать количества разной природы? Мы будем более точны в разделе «Байесовский подход» ниже.

Что касается распределенных параметров, априорная информация об их пространственном распределении часто состоит из информации о некоторых производных этих распределенных параметров. Кроме того, обычной практикой, хотя и несколько искусственной, является поиск «простейшей» модели, которая разумно соответствует данным. Обычно это достигается путем штрафования нормы градиента (или общего изменения ) параметров (этот подход также называется максимизацией энтропии). Модель также можно упростить за счет параметризации, при которой степени свободы вводятся только при необходимости. $L^{1}$

Дополнительная информация также может быть интегрирована посредством ограничений-неравенств на параметры модели или некоторые их функции. Такие ограничения важны, чтобы избежать нереалистичных значений параметров (например, отрицательных значений). В этом случае пространство, охватываемое параметрами модели, будет уже не векторным пространством, а подмножеством допустимых моделей , обозначаемым в дальнейшем. $P_{\text{adm}}$

Инструменты для преодоления второй трудности

Как упоминалось выше, шум может быть таким, что наши измерения не являются отражением какой-либо модели, поэтому мы не можем искать модель, которая производит данные, а скорее ищем лучшую (или оптимальную) модель : то есть ту, которая лучше всего соответствует данным. Это приводит нас к минимизации целевой функции , а именно функционала , который количественно определяет, насколько велики остатки или насколько далеки прогнозируемые данные от наблюдаемых данных. Конечно, когда у нас есть идеальные данные (т. е. нет шума), восстановленная модель должна идеально соответствовать наблюдаемым данным. Стандартная целевая функция имеет вид: где – евклидова норма (она будет нормой , когда измерения представляют собой функции, а не выборки) остатков. Этот подход сводится к использованию обычного метода наименьших квадратов , подхода, широко используемого в статистике. Однако известно, что евклидова норма очень чувствительна к выбросам: чтобы избежать этой трудности, мы можем подумать об использовании других расстояний, например нормы , вместо нормы . $\varphi$ $\varphi (p)=\|Fp-d_{\text{obs}}\|^{2}$ $\|\cdot \|$ $L^{2}$ $L^{1}$ $L^{2}$

Байесовский подход

Вероятностный подход очень похож на метод наименьших квадратов: если мы знаем статистику шума, который загрязняет данные, мы можем подумать о поиске наиболее вероятной модели m, которая соответствует критерию максимального правдоподобия . Если шум является гауссовым , критерий максимального правдоподобия выглядит как критерий наименьших квадратов, при этом евклидово скалярное произведение в пространстве данных заменяется скалярным произведением, включающим ковариацию шума . Кроме того, если бы была доступна предварительная информация о параметрах модели, мы могли бы подумать об использовании байесовского вывода для формулировки решения обратной задачи. Подробно этот подход описан в книге Тарантолы. ^[9]

Численное решение нашего элементарного примера

Здесь мы используем евклидову норму для количественной оценки несоответствия данных. Поскольку мы имеем дело с линейной обратной задачей, целевая функция является квадратичной. Для его минимизации классическим способом является вычисление градиента, используя то же обоснование (как если бы мы минимизировали функцию только одной переменной). В оптимальной модели этот градиент исчезает, что можно записать как: $p_{\text{opt}}$

\nabla _{p}\varphi =2(F^{\mathrm {T} }Fp_{\text{opt}}-F^{\mathrm {T} }d_{\text{obs}})=0

F ^TтранспонированиеF

F^{\mathrm {T} }Fp_{\text{opt}}=F^{\mathrm {T} }d_{\text{obs}}

Это выражение известно как нормальное уравнение и дает нам возможное решение обратной задачи. В нашем примере матрица обычно имеет полный ранг, так что приведенное выше уравнение имеет смысл и однозначно определяет параметры модели: нам не нужно интегрировать дополнительную информацию, чтобы получить уникальное решение. $F^{\mathrm {T} }F$

Математические и вычислительные аспекты

Обратные задачи обычно некорректны, в отличие от корректных задач, обычно встречающихся при математическом моделировании. Из трех условий корректности задачи , предложенных Жаком Адамаром (существование, единственность и устойчивость решения или решений), чаще всего нарушается условие устойчивости. В смысле функционального анализа обратная задача представляет собой отображение метрических пространств . Хотя обратные задачи часто формулируются в бесконечномерных пространствах, ограничения на конечное число измерений и практическое рассмотрение восстановления только конечного числа неизвестных параметров могут привести к тому, что проблемы будут переформулированы в дискретной форме. В этом случае обратная задача обычно будет плохо обусловленной . В этих случаях можно использовать регуляризацию , чтобы ввести мягкие предположения о решении и предотвратить переобучение . Многие случаи регуляризованных обратных задач можно интерпретировать как частные случаи байесовского вывода . ^[10]

Численное решение задачи оптимизации

Некоторые обратные задачи имеют очень простое решение, например, когда у вас есть набор нерешаемых функций , то есть набор функций, вычисление которых в различных точках дает набор линейно независимых векторов. Это означает, что при наличии линейной комбинации этих функций коэффициенты можно вычислить, расположив векторы в виде столбцов матрицы и затем инвертировав эту матрицу. Простейшим примером функций несостоятельности являются полиномы, построенные с использованием теоремы о несостоятельности так, чтобы быть несостоятельными. Конкретно это делается путем обращения матрицы Вандермонда . Но это очень специфическая ситуация. $n$ $n$

В общем случае решение обратной задачи требует сложных алгоритмов оптимизации. Когда модель описывается большим количеством параметров (количество неизвестных, участвующих в некоторых приложениях дифракционной томографии, может достигать одного миллиарда), решение линейной системы, связанной с нормальными уравнениями, может быть громоздким. Численный метод, который будет использоваться для решения задачи оптимизации, зависит, в частности, от затрат, необходимых для вычисления решения прямой задачи. После выбора подходящего алгоритма решения прямой задачи (простое умножение матрицы на вектор может оказаться недостаточным, если матрица огромна), соответствующий алгоритм проведения минимизации можно найти в учебниках, посвященных численным методам решения линейных систем. и для минимизации квадратичных функций (см., например, Чиарле ^[11] или Носедаля ^[12] ). $Fp$ $F$

Кроме того, пользователь может пожелать добавить к моделям физические ограничения: в этом случае он должен быть знаком с методами оптимизации с ограничениями , что само по себе является предметом. Во всех случаях вычисление градиента целевой функции часто является ключевым элементом решения задачи оптимизации. Как упоминалось выше, информация о пространственном распределении распределенного параметра может быть введена посредством параметризации. Можно также подумать об адаптации этой параметризации во время оптимизации. ^[13]

Если целевая функция будет основана на норме, отличной от евклидовой, нам придется выйти из области квадратичной оптимизации. В результате задача оптимизации усложняется. В частности, когда норма используется для количественной оценки несоответствия данных, целевая функция больше не является дифференцируемой: ее градиент больше не имеет смысла. Появляются специальные методы (см., например, Лемарешаль ^[14] ) из недифференцируемой оптимизации. $L^{1}$

После того как оптимальная модель вычислена, нам необходимо ответить на вопрос: «Можем ли мы доверять этой модели?» Вопрос можно сформулировать следующим образом: Насколько велик набор моделей, которые соответствуют данным «почти так же хорошо», как и эта модель? В случае квадратичных целевых функций этот набор содержится в гиперэллипсоиде, подмножестве ( — количество неизвестных), размер которого зависит от того, что мы подразумеваем под «почти также», то есть от уровня шума. Направление наибольшей оси этого эллипсоида ( собственный вектор , связанный с наименьшим собственным значением матрицы ) — это направление плохо определенных компонентов: если мы будем следовать этому направлению, мы можем внести сильное возмущение в модель, не меняя существенно значения цели. функции и, таким образом, в конечном итоге получаем существенно другую квазиоптимальную модель. Мы ясно видим, что ответ на вопрос «можем ли мы доверять этой модели» определяется уровнем шума и собственными значениями гессиана целевой функции или, что то же самое, в случае, когда регуляризация не была интегрирована, сингулярными значениями матрицы . Конечно, использование регуляризации (или других видов априорной информации) уменьшает размер набора почти оптимальных решений и, в свою очередь, увеличивает уверенность, которую мы можем выразить в вычисленном решении. $R^{M}$ $M$ $F^{T}F$ $F$

Стабильность, регуляризация и дискретизация модели в бесконечном измерении

Здесь мы сосредоточимся на восстановлении распределенного параметра. При поиске распределенных параметров нам приходится дискретизировать эти неизвестные функции. Поступая так, мы уменьшаем размерность проблемы до чего-то конечного. Но теперь возникает вопрос: существует ли какая-либо связь между решением, которое мы вычисляем, и решением исходной задачи? Тогда другой вопрос: что мы подразумеваем под решением исходной задачи? Поскольку конечное число данных не позволяет определить бесконечное количество неизвестных, исходный функционал несоответствия данных должен быть регуляризован, чтобы гарантировать уникальность решения. Во многих случаях сведение неизвестных к конечномерному пространству обеспечивает адекватную регуляризацию: вычисленное решение будет выглядеть как дискретная версия искомого решения. Например, для решения проблемы деконволюции часто подойдет наивная дискретизация : она будет работать до тех пор, пока мы не позволяем пропущенным частотам проявляться в численном решении. Но во многих случаях регуляризацию приходится явно интегрировать в целевую функцию.

Чтобы понять, что может произойти, нужно иметь в виду, что решение такой линейной обратной задачи равносильно решению интегрального уравнения Фредгольма первого рода:

d(x)=\int _{\Omega }K(x,y)p(y)dy

где - ядро, и - векторы , и - область определения в . Это справедливо для 2D-приложения. Для 3D-приложения мы рассматриваем . Обратите внимание, что здесь параметры модели состоят из функции и что ответ модели также состоит из функции, обозначенной . Это уравнение является расширением до бесконечной размерности матричного уравнения, заданного в случае дискретных задач. $K$ $x$ $y$ $R^{2}$ $\Omega$ $R^{2}$ $x,y\in R^{3}$ $p$ $d(x)$ $d=Fp$

Для достаточно гладкого оператор, определенный выше, компактен на разумных банаховых пространствах, таких как . Теория Ф. Рисса утверждает, что множество сингулярных значений такого оператора содержит ноль (следовательно, существует нуль-пространство), конечно или не более чем счетно, и в последнем случае они составляют последовательность, стремящуюся к нулю. . В случае симметричного ядра мы имеем бесконечное количество собственных значений, а соответствующие собственные векторы составляют гильбертов базис ядра . Таким образом, любое решение этого уравнения определяется с точностью до аддитивной функции в нулевом пространстве, а в случае бесконечности сингулярных значений решение (которое включает обратную величину произвольных малых собственных значений) неустойчиво: два ингредиента, которые составляют решение этого интегрального уравнения — типичная некорректная задача! Однако мы можем определить решение через псевдообратное прямое отображение (опять же с точностью до произвольной аддитивной функции). Когда прямое отображение компактно, классическая регуляризация Тихонова будет работать, если мы используем ее для интегрирования априорной информации, утверждая, что норма решения должна быть как можно меньшей: это сделает обратную задачу корректной. Тем не менее, как и в случае конечного измерения, мы должны поставить под сомнение уверенность, которую мы можем выразить в вычисленном решении. Опять же, по сути, информация содержится в собственных значениях оператора Гессе. Если для вычисления решения исследовать подпространства, содержащие собственные векторы, связанные с малыми собственными значениями, то решению вряд ли можно доверять: некоторые его компоненты будут плохо определены. Наименьшее собственное значение равно весу, введенному в регуляризацию Тихонова. $K$ $L^{2}$ $L^{2}$ $L^{2}$

Нерегулярные ядра могут дать прямое отображение, которое не будет компактным и даже неограниченным, если мы наивно снабдим пространство моделей нормой . В таких случаях гессиан не является ограниченным оператором, и понятие собственного значения больше не имеет смысла. Чтобы сделать его ограниченным оператором и спроектировать корректную задачу, необходим математический анализ : иллюстрацию можно найти в ^[15]. Опять же, мы должны подвергнуть сомнению уверенность, которую мы можем выразить в вычисленном решении, и нам придется обобщить понятие собственного значения, чтобы получить ответ. ^[16] $L^{2}$

Таким образом, анализ спектра оператора Гессе является ключевым элементом для определения надежности вычисленного решения. Однако такой анализ обычно представляет собой очень трудную задачу. Это побудило нескольких авторов исследовать альтернативные подходы в случае, когда нас интересуют не все компоненты неизвестной функции, а только поднеизвестные, которые являются изображениями неизвестной функции с помощью линейного оператора. Эти подходы называются «методом Бэкуса и Гилберта ^[17] », подходом «дозорных» Лайонса ^[18] и методом SOLA: ^[19] эти подходы оказались тесно связанными друг с другом, как объяснено в Чавенте ^{[ 19]. 20]} Наконец, концепция ограниченного разрешения , часто используемая физиками, представляет собой не что иное, как специфическое представление о том, что некоторые плохо определенные компоненты могут исказить решение. Но, вообще говоря, эти плохо детерминированные компоненты модели не обязательно связаны с высокими частотами.

Некоторые классические линейные обратные задачи восстановления распределенных параметров

Упомянутые ниже проблемы соответствуют различным версиям интеграла Фредгольма: каждая из них связана с определенным ядром . $K$

Деконволюция

Целью деконволюции является восстановление исходного изображения или сигнала , который на данных выглядит зашумленным и размытым . ^[21] С математической точки зрения ядро здесь зависит только от разницы между и . $p(x)$ $d(x)$ $K(x,y)$ $x$ $y$

Томографические методы

В этих методах мы пытаемся восстановить распределенный параметр, наблюдение состоит в измерении интегралов от этого параметра, осуществляемом вдоль семейства линий. Обозначим линией этого семейства соответствующую точку измерения . Таким образом , наблюдение можно записать как: $\Gamma _{x}$ $x$ $x$

d(x)=\int _{\Gamma _{x}}w(x,y)p(y)\,dy

дельта-функцию

s

{\Gamma _{x}}

w(x,y)

K(x,y)

{\Gamma _{x}}

Компьютерная томография

В рентгеновской компьютерной томографии линии, по которым интегрируется параметр, представляют собой прямые линии: томографическая реконструкция распределения параметра основана на обращении преобразования Радона . Хотя с теоретической точки зрения многие линейные обратные задачи хорошо изучены, проблемы, связанные с преобразованием Радона и его обобщениями, по-прежнему представляют собой множество теоретических проблем, а вопросы достаточности данных до сих пор не решены. К таким проблемам относятся неполные данные для рентгеновского преобразования в трех измерениях и проблемы, связанные с обобщением рентгеновского преобразования на тензорные поля. Исследуемые решения включают в себя метод алгебраической реконструкции , обратное проецирование с фильтром , а по мере увеличения вычислительной мощности итерационные методы реконструкции , такие как итерационная разреженная асимптотическая минимальная дисперсия . ^[22]

Дифракционная томография

Дифракционная томография — это классическая линейная обратная задача в разведочной сейсмологии: амплитуда, зарегистрированная в один момент времени для данной пары источник-приемник, представляет собой сумму вкладов, возникающих от таких точек, что сумма расстояний, измеренных во временах пробега, от источника и приемника соответственно равно соответствующему времени записи. В 3D параметр интегрируется не по линиям, а по поверхностям. Если скорость распространения постоянна, такие точки распределяются на эллипсоиде. Обратная задача состоит в восстановлении распределения дифрагирующих точек по сейсмограммам, записанным по ходу съемки, при известном распределении скоростей. Прямое решение было первоначально предложено Бейлкиным и Ламбаре и др.: ^[23] эти работы послужили отправной точкой подходов, известных как миграция с сохранением амплитуды (см. Бейлкин ^[24]^[25] и Блейстейн ^[26] ). Если для решения волнового уравнения используются методы геометрической оптики (т.е. лучи), то эти методы оказываются тесно связанными с так называемыми методами миграции наименьших квадратов [ ^27] , вытекающими из подхода наименьших квадратов (см. Лайли, [27 ^{]) . 28]} Тарантола ^[29] ).

Допплеровская томография (астрофизика)

Если мы рассмотрим вращающийся звездный объект, спектральные линии, которые мы можем наблюдать на спектральном профиле, будут смещены из-за эффекта Доплера. Целью доплеровской томографии является преобразование информации, содержащейся в спектральном мониторинге объекта, в двумерное изображение излучения (в зависимости от лучевой скорости и фазы периодического вращательного движения) звездной атмосферы. Как объяснил Том Марш ^[30], эта линейная обратная задача похожа на томографию: нам нужно восстановить распределенный параметр, который был проинтегрирован вдоль линий, чтобы произвести его влияние на записи.

Обратная теплопроводность

Ранние публикации по обратной теплопроводности возникли в результате определения поверхностного теплового потока во время входа в атмосферу с помощью подземных датчиков температуры. ^[31]^[32] Другие применения, где необходим поверхностный тепловой поток, но поверхностные датчики непрактичны, включают: внутри поршневых двигателей, внутри ракетных двигателей; и испытания компонентов ядерного реактора. ^[33] Для устранения некорректности и чувствительности к ошибкам измерения, вызванным затуханием и запаздыванием температурного сигнала, были разработаны различные численные методы. ^[34]^[35]^[36]

Нелинейные обратные задачи

Нелинейные обратные задачи представляют собой по своей сути более сложное семейство обратных задач. Здесь прямое отображение является нелинейным оператором. Моделирование физических явлений часто основано на решении уравнения в частных производных (см. таблицу выше, за исключением закона гравитации): хотя эти уравнения в частных производных часто являются линейными, физические параметры, входящие в эти уравнения, зависят нелинейным образом от состояние системы и, следовательно, на наблюдения, которые мы делаем над ней. $F$

Некоторые классические нелинейные обратные задачи

Обратная задача рассеяния

^{В то время как линейные обратные задачи были полностью решены с теоретической точки зрения} в конце девятнадцатого века ^{, только} один класс нелинейных обратных задач был таковым до 1970 года: обратные спектральные и (одно пространственное измерение) обратные задачи рассеяния. , после плодотворных работ русской математической школы ( Крейна , Гельфанда , Левитана, Марченко ). Большой обзор результатов дан Чаданом и Сабатье в книге «Обратные задачи квантовой теории рассеяния» (два издания на английском языке, одно — на русском).

В задачах такого рода данные представляют собой свойства спектра линейного оператора, описывающие рассеяние. Спектр состоит из собственных значений и собственных функций , образующих вместе «дискретный спектр», и обобщений, называемых непрерывным спектром. Весьма примечательным физическим моментом является то, что эксперименты по рассеянию дают информацию только о непрерывном спектре и что знание его полного спектра необходимо и достаточно для восстановления оператора рассеяния. Следовательно, у нас есть невидимые параметры, гораздо более интересные, чем нулевое пространство, которое обладает аналогичным свойством в линейных обратных задачах. Кроме того, существуют физические движения, в которых вследствие такого движения спектр такого оператора сохраняется. Это явление определяется специальными нелинейными эволюционными уравнениями в частных производных, например уравнением Кортевега-де Фриза . Если спектр оператора свести к одному собственному значению, то соответствующее ему движение будет движением одиночного удара, распространяющегося с постоянной скоростью и без деформации, — уединенной волны, называемой «солитоном » .

Совершенный сигнал и его обобщения для уравнения Кортевега – де Фриза или других интегрируемых нелинейных уравнений в частных производных представляют большой интерес и имеют множество возможных применений. Эта область изучается как раздел математической физики с 1970-х годов. Нелинейные обратные задачи в настоящее время изучаются также во многих областях прикладной науки (акустика, механика, квантовая механика, электромагнитное рассеяние - в частности, радиолокационное зондирование, сейсмическое зондирование и почти все методы визуализации).

Последний пример, связанный с гипотезой Римана , был приведен Ву и Спрунгом. Идея состоит в том, что в квазиклассической старой квантовой теории обратный потенциал внутри гамильтониана пропорционален полупроизводной функции подсчета собственных значений (энергий) n ( Икс ).

Согласование проницаемости нефтяных и газовых пластов

Цель состоит в том, чтобы восстановить коэффициент диффузии в параболическом уравнении в частных производных , которое моделирует потоки однофазной жидкости в пористой среде. Эта проблема была объектом многих исследований, начиная с новаторской работы, проведенной в начале семидесятых годов. ^[37] Что касается двухфазных потоков, важной проблемой является оценка относительных проницаемостей и капиллярных давлений. ^[38]

Обратные задачи в волновых уравнениях

Цель состоит в том, чтобы восстановить скорости волн (P и S-волны) и распределения плотности по сейсмограммам . Такие обратные задачи представляют основной интерес в сейсмологии и разведочной геофизике . В основном мы можем рассмотреть две математические модели:

Уравнение акустической волны (в котором S-волны игнорируются, когда размеры пространства равны 2 или 3)
Уравнение эластодинамики , в котором скорости продольных и поперечных волн могут быть получены из параметров Ламе и плотности.

Эти базовые гиперболические уравнения можно усовершенствовать, включив в них затухание , анизотропию ,...

Решение обратной задачи в одномерном волновом уравнении было предметом многих исследований. Это одна из немногих нелинейных обратных задач, для которой можно доказать единственность решения. ^[8] Еще одной проблемой стал анализ устойчивости решения. ^[39] Были разработаны практические приложения с использованием метода наименьших квадратов. ^[39]^[40] Расширение на 2D или 3D задачи и уравнения эластодинамики предпринималось с 80-х годов, но оказалось очень трудным! Эта проблема, часто называемая полной инверсией формы волны (FWI), еще не решена полностью: среди основных трудностей — наличие негауссова шума в сейсмограммах, проблемы пропуска циклов (также известные как фазовая неоднозначность) и хаотичная поведение функции несоответствия данных. ^[41] Некоторые авторы исследовали возможность переформулировать обратную задачу, чтобы сделать целевую функцию менее хаотичной, чем функция несоответствия данных. ^[42]^[43]

Томография времени путешествия

Понимая, насколько сложна обратная задача волнового уравнения, сейсмологи исследовали упрощенный подход с использованием геометрической оптики. В частности, они стремились инвертировать распределение скоростей распространения, зная времена прихода волновых фронтов, наблюдаемых на сейсмограммах. Эти волновые фронты могут быть связаны с прямыми приходами или с отражениями, связанными с отражателями, геометрию которых необходимо определить вместе с распределением скорости.

Распределение времени прибытия ( точка в физическом пространстве) волнового фронта, исходящего из точечного источника, удовлетворяет уравнению Эйконала : ${\tau }(x)$ $x$

\|\nabla \tau (x)\|=s(x),

медленности лучами

s(x)

\|\cdot \|

Эта проблема похожа на томографию: измеренное время прихода представляет собой интеграл по траектории луча медленности. Но эта задача, подобная томографии, является нелинейной, главным образом потому, что неизвестная геометрия траектории лучей зависит от распределения скорости (или медленности). Несмотря на свой нелинейный характер, томография времени пробега оказалась очень эффективной для определения скорости распространения в Земле или в недрах, причем последний аспект является ключевым элементом для построения сейсмических изображений, в частности с использованием методов, упомянутых в разделе «Дифракция». томография".

Математические аспекты: вопросы Адамара

Вопросы касаются корректности: имеет ли задача наименьших квадратов единственное решение, которое постоянно зависит от данных (проблема устойчивости)? Это первый вопрос, но он также труден из-за нелинейности . Чтобы понять, откуда возникают трудности, Шавент ^[44] предложил концептуально разбить минимизацию функции несоответствия данных на два последовательных шага ( – подмножество допустимых моделей): $F$ $P_{\text{adm}}$

шаг проекции: задано нахождение проекции (ближайшая точка в соответствии с расстоянием, участвующим в определении целевой функции) $d_{\text{obs}}$ $F(P_{\text{adm}})$ $F(P_{\text{adm}})$
по этой проекции найдите один прообраз, который является моделью, изображение которой с помощью оператора является этой проекцией. $F$

Трудности могут (и обычно возникают) возникнуть на обоих этапах:

оператор вряд ли будет однозначным, поэтому может быть более одного прообраза, $F$
даже если оно взаимно однозначно, его инверсия не может быть непрерывной по , $F$ $F(P)$
проекция на может не существовать, если это множество не замкнуто, $F(P_{\text{adm}})$
проекция на может быть неоднозначной и ненепрерывной, поскольку она может быть невыпуклой из-за нелинейности . $F(P_{\text{adm}})$ $F$

Мы отсылаем к Шавану ^[44] за математическим анализом этих моментов.

Вычислительные аспекты

Невыпуклая функция несоответствия данных

Поскольку прямая карта нелинейна, функция несоответствия данных, вероятно, будет невыпуклой, что делает методы локальной минимизации неэффективными. Для преодоления этой трудности было исследовано несколько подходов:

использование методов глобальной оптимизации, таких как выборка апостериорной функции плотности и алгоритм Метрополиса в вероятностной структуре обратной задачи, ^[45] генетические алгоритмы (отдельно или в сочетании с алгоритмом Метрополиса: см. ^[46] для применения к определению проницаемостей, которые сопоставление существующих данных о проницаемости), нейронные сети, методы регуляризации, включая многомасштабный анализ;
переформулировать целевую функцию метода наименьших квадратов, чтобы сделать ее более гладкой ( обратную задачу в волновых уравнениях см. в ^[42],^{[43] ).}

Вычисление градиента целевой функции

Обратные задачи, особенно в бесконечной размерности, могут иметь большой размер, что требует значительного вычислительного времени. Когда прямая карта нелинейна, вычислительные трудности возрастают, и минимизация целевой функции может оказаться затруднительной. В отличие от линейной ситуации, явное использование матрицы Гессе для решения нормальных уравнений здесь не имеет смысла: матрица Гессе варьируется в зависимости от модели. Гораздо более эффективной является оценка градиента целевой функции для некоторых моделей. Важные вычислительные усилия можно сэкономить, если мы сможем избежать очень тяжелых вычислений якобиана ( часто называемых « производными Фреше »): метод сопряженных состояний, предложенный Шаваном и Лайонсом ^[47] , направлен на то, чтобы избежать этих очень тяжелых вычислений. Сейчас он очень широко используется. ^[48]

Приложения

Теория обратной задачи широко используется в прогнозировании погоды, океанографии, гидрологии и нефтяной инженерии. ^[49]^[50]^[51]

Обратные задачи встречаются также в области теплопередачи, где поверхностный тепловой поток ^[52] оценивается на основании температурных данных, измеренных внутри твердого тела; и в понимании мер контроля за разложением растительных веществ. ^[53] Линейная обратная задача также является основой спектральной оценки и оценки направления прибытия (DOA) при обработке сигналов .

Обратная литография применяется при изготовлении фотошаблонов для изготовления полупроводниковых приборов .

Смотрите также

Академические журналы

Четыре основных академических журнала в целом освещают обратные задачи:

Обратная задача
Журнал обратных и некорректных задач ^[54]
Обратные задачи в науке и технике ^[55]
Обратные задачи и изображения ^[56]

Во многих журналах по медицинской визуализации, геофизике, неразрушающему контролю и т. д. преобладают обратные задачи в этих областях.

дальнейшее чтение

К.В. Гроетч (1999). Обратные задачи: занятия для студентов . Издательство Кембриджского университета. ISBN 978-0-88385-716-8.

Внешние ссылки

Международная ассоциация обратных задач. Архивировано 15 июня 2017 г. в Wayback Machine.
Евразийская ассоциация по обратным задачам
Финское общество обратных задач
Сеть обратных задач
На веб-сайте Альберта Тарантолы есть бесплатная PDF-версия его книги «Теория обратных задач» и несколько онлайн-статей по обратным задачам.
Страница обратных задач в Университете Алабамы. Архивировано 5 апреля 2014 г. в Wayback Machine.
Проект обратных задач и геостатистики, Институт Нильса Бора, Копенгагенский университет
Страница ресурсов Энди Ганса по геофизической обратной теории
Финский центр передового опыта в области исследования обратных задач