В вычислительной математике итерационный метод — это математическая процедура , которая использует начальное значение для генерации последовательности улучшающихся приближенных решений для класса задач, в которой i -е приближение (называемое «итерацией») выводится из предыдущих.
Конкретная реализация с критериями завершения для заданного итеративного метода, такого как градиентный спуск , восхождение на холм , метод Ньютона или квазиньютоновские методы , такие как BFGS , является алгоритмом итеративного метода или метода последовательного приближения . Итеративный метод называется сходящимся, если соответствующая последовательность сходится для заданных начальных приближений. Обычно выполняется математически строгий анализ сходимости итеративного метода; однако также распространены итеративные методы, основанные на эвристиках .
Напротив, прямые методы пытаются решить проблему с помощью конечной последовательности операций. При отсутствии ошибок округления прямые методы дадут точное решение (например, решение линейной системы уравнений методом исключения Гаусса ). Итерационные методы часто являются единственным выбором для нелинейных уравнений . Однако итерационные методы часто полезны даже для линейных задач, включающих много переменных (иногда порядка миллионов), где прямые методы были бы чрезмерно дорогими (а в некоторых случаях и невозможными) даже при наличии наилучшей доступной вычислительной мощности. [1]
Если уравнение можно представить в виде f ( x ) = x , а решение x является притягивающей неподвижной точкой функции f , то можно начать с точки x 1 в области притяжения x , и пусть x n +1 = f ( x n ) для n ≥ 1 , и последовательность { x n } n ≥ 1 будет сходиться к решению x . Здесь x n является n -ым приближением или итерацией x , а x n +1 является следующей или n + 1 итерацией x . С другой стороны, верхние индексы в скобках часто используются в численных методах, чтобы не мешать нижним индексам с другими значениями. (Например, x ( n +1) = f ( x ( n ) ).) Если функция f непрерывно дифференцируема , достаточным условием сходимости является то, что спектральный радиус производной строго ограничен единицей в окрестности неподвижной точки. Если это условие выполняется в фиксированной точке, то должна существовать достаточно малая окрестность (область притяжения).
В случае системы линейных уравнений двумя основными классами итерационных методов являются стационарные итерационные методы и более общие методы подпространства Крылова .
Стационарные итерационные методы решают линейную систему с оператором , приближающим исходную; и на основе измерения ошибки в результате ( остаток ) формируют «уравнение коррекции», для которого этот процесс повторяется. Хотя эти методы просты в выводе, реализации и анализе, сходимость гарантируется только для ограниченного класса матриц.
Итеративный метод определяется как
и для данной линейной системы с точным решением ошибка на
Итерационный метод называется линейным, если существует матрица такая, что
и эта матрица называется матрицей итерации . Итерационный метод с заданной матрицей итерации называется сходящимся, если выполняется следующее
Важная теорема утверждает, что для данного итерационного метода и его итерационной матрицы он сходится тогда и только тогда, когда его спектральный радиус меньше единицы, то есть
Основные итерационные методы работают путем разбиения матрицы на
и здесь матрица должна быть легко обратимой . Итерационные методы теперь определяются как
Из этого следует, что итерационная матрица имеет вид
Простейшие примеры стационарных итерационных методов используют разбиение матрицы, например:
где — только диагональная часть , а — строгая нижняя треугольная часть . Соответственно, — строгая верхняя треугольная часть .
Линейные стационарные итерационные методы также называются методами релаксации .
Методы подпространства Крылова работают, формируя базис последовательности последовательных степеней матрицы, умноженных на начальную невязку ( последовательность Крылова ). Приближения к решению затем формируются путем минимизации невязки по сформированному подпространству. Прототипическим методом в этом классе является метод сопряженных градиентов (CG), который предполагает, что системная матрица симметрична положительно определена . Для симметричных (и, возможно, неопределенных) матриц работает метод минимальной невязки (MINRES). В случае несимметричных матриц были выведены такие методы, как обобщенный метод минимальной невязки (GMRES) и метод бисопряженного градиента (BiCG).
Поскольку эти методы составляют основу, очевидно, что метод сходится за N итераций, где N — размер системы. Однако при наличии ошибок округления это утверждение не выполняется; более того, на практике N может быть очень большим, и итерационный процесс достигает достаточной точности уже гораздо раньше. Анализ этих методов сложен, так как зависит от сложной функции спектра оператора .
Приближающий оператор, который появляется в стационарных итерационных методах, может быть также включен в методы подпространства Крылова, такие как GMRES (альтернативно, предобусловленные методы Крылова можно рассматривать как ускорения стационарных итерационных методов), где они становятся преобразованиями исходного оператора в предположительно лучше обусловленный. Построение предобуславливателей является большой областью исследований.
Математические методы, относящиеся к последовательному приближению, включают:
Джамшид аль-Каши использовал итерационные методы для вычисления синуса 1° и π в «Трактате о хорде и синусе» с высокой точностью. Ранний итерационный метод решения линейной системы появился в письме Гаусса к своему ученику. Он предложил решать систему уравнений 4 на 4, повторно решая компонент, в котором остаток был наибольшим [ требуется ссылка ] .
Теория стационарных итерационных методов была прочно установлена с работой DM Young, начавшейся в 1950-х годах. Метод сопряженных градиентов также был изобретен в 1950-х годах с независимыми разработками Cornelius Lanczos , Magnus Hestenes и Eduard Stiefel , но его природа и применимость были неправильно поняты в то время. Только в 1970-х годах стало ясно, что методы, основанные на сопряжении, очень хорошо работают для уравнений с частными производными , особенно эллиптического типа.