stringtranslate.com

Теорема Тейлора

Экспоненциальная функция (красная) и соответствующий ей полином Тейлора четвертой степени (пунктирная зеленая линия) вокруг начала координат.

В исчислении теорема Тейлора дает приближение -раз дифференцируемой функции вокруг заданной точки полиномом степени , называемым полиномом Тейлора -го порядка . Для гладкой функции полином Тейлора является усечением в порядке ряда Тейлора функции. Полином Тейлора первого порядка является линейным приближением функции, а полином Тейлора второго порядка часто называют квадратичным приближением . [1] Существует несколько версий теоремы Тейлора, некоторые из которых дают явные оценки погрешности приближения функции ее полиномом Тейлора.

Теорема Тейлора названа в честь математика Брука Тейлора , который сформулировал ее версию в 1715 году [2], хотя более ранняя версия результата была уже упомянута в 1671 году Джеймсом Грегори [3] .

Теорема Тейлора преподается на вводных курсах исчисления и является одним из центральных элементарных инструментов в математическом анализе . Она дает простые арифметические формулы для точного вычисления значений многих трансцендентных функций, таких как показательная функция и тригонометрические функции . Она является отправной точкой изучения аналитических функций и является фундаментальной в различных областях математики, а также в численном анализе и математической физике . Теорема Тейлора также обобщается на многомерные и векторные функции. Она обеспечила математическую основу для некоторых знаковых ранних вычислительных машин: Разностная машина Чарльза Бэббиджа вычисляла синусы, косинусы, логарифмы и другие трансцендентные функции путем численного интегрирования первых 7 членов их рядов Тейлора.

Мотивация

График (синий) с его линейной аппроксимацией (красный) при .

Если вещественная функция дифференцируема в точке , то она имеет линейное приближение вблизи этой точки. Это означает, что существует функция h 1 ( x ) такая, что

Здесь

является линейным приближением для x вблизи точки a , график которого является касательной к графику при x = a . Ошибка приближения равна:

По мере того как x стремится к  a, эта ошибка стремится к нулю гораздо быстрее, чем , что дает полезное приближение.

График (синий) с его квадратичной аппроксимацией (красный) при . Обратите внимание на улучшение аппроксимации.

Для лучшего приближения к можно использовать квадратичный полином вместо линейной функции:

Вместо того чтобы просто сопоставлять одну производную от при , этот полином имеет те же самые первые и вторые производные, что очевидно при дифференцировании.

Теорема Тейлора гарантирует, что квадратичное приближение в достаточно малой окрестности , точнее линейного приближения. В частности,

Здесь ошибка в аппроксимации равна

который, учитывая предельное поведение , стремится к нулю быстрее, чем когда x стремится к  a .

Аппроксимация (синего) его полиномами Тейлора порядка с центром в (красном) и (зеленом). Аппроксимации вообще не улучшаются за пределами и , соответственно.

Аналогично, мы могли бы получить еще лучшие приближения к f, если бы использовали полиномы более высокой степени, поскольку тогда мы можем сопоставить еще больше производных с f в выбранной базовой точке.

В общем случае ошибка приближения функции полиномом степени k будет стремиться к нулю гораздо быстрее, чем при стремлении  x к a . Однако существуют функции, даже бесконечно дифференцируемые, для которых увеличение степени аппроксимирующего полинома не увеличивает точность приближения: мы говорим, что такая функция не является аналитической при x = a : она (локально) не определяется своими производными в этой точке.

Теорема Тейлора имеет асимптотическую природу: она только говорит нам, что ошибка в приближении полиномом Тейлора -го порядка P k стремится к нулю быстрее, чем любой ненулевой полином -й степени , как . Она не говорит нам, насколько велика ошибка в любой конкретной окрестности центра расширения, но для этой цели существуют явные формулы для остаточного члена (приведенные ниже), которые справедливы при некоторых дополнительных предположениях регулярности относительно f . Эти улучшенные версии теоремы Тейлора обычно приводят к равномерным оценкам ошибки приближения в малой окрестности центра расширения, но оценки не обязательно справедливы для окрестностей, которые слишком велики, даже если функция f является аналитической . В этой ситуации может потребоваться выбрать несколько полиномов Тейлора с различными центрами расширения, чтобы иметь надежные приближения Тейлора исходной функции (см. анимацию справа.)

Остаточный член можно использовать несколькими способами:

  1. Оцените погрешность для полинома P k ( x ) степени k, оценивающего на заданном интервале ( ar , a + r ). (Зная интервал и степень, находим погрешность.)
  2. Найдите наименьшую степень k, для которой полином P k ( x ) приближается с точностью до заданного допуска погрешности на заданном интервале ( ar , a + r ). (Зная интервал и допуск погрешности, мы находим степень.)
  3. Найдите наибольший интервал ( ar , a + r ), на котором P k ( x ) приближается с заданной погрешностью. (Учитывая степень и погрешность, мы находим интервал.)

Теорема Тейлора с одной действительной переменной

Формулировка теоремы

Точная формулировка самой базовой версии теоремы Тейлора выглядит следующим образом:

Теорема Тейлора [4] [5] [6]  —  Пусть k  ≥ 1 — целое число и пусть функция f  : RR дифференцируема k раз в точке aR. Тогда существует функция h k  : R R такая , что

и это называется формой Пеано остатка .

Полином, появляющийся в теореме Тейлора, является полиномом Тейлора -го порядка.

функции f в точке a . Полином Тейлора является единственным полиномом «наилучшего асимптотического соответствия» в том смысле, что если существует функция h k  : RR и полином -го порядка p такие, что

тогда p  =  P k . Теорема Тейлора описывает асимптотическое поведение остаточного члена

что является ошибкой аппроксимации при аппроксимации f ее полиномом Тейлора. Используя обозначение с маленькой буквой «о» , утверждение в теореме Тейлора читается как

Явные формулы для остатка

При более сильных предположениях о регулярности функции f существует несколько точных формул для остаточного члена R k полинома Тейлора, наиболее распространенными из которых являются следующие.

Формы среднего значения остатка  —  Пусть f  : RR будет k  + 1 раз дифференцируемой на открытом интервале с f ( k ) непрерывной на замкнутом интервале между и . [7] Тогда

для некоторого действительного числа между и . Это форма Лагранжа [8] остатка.

Сходным образом,

для некоторого действительного числа между и . Это форма Коши [9] остатка.

Оба можно рассматривать как частные случаи следующего результата: Рассмотрим

для некоторого действительного числа между и . Это форма Шлемильха остатка (иногда называемая формой Шлемильха- Роша ). Выбор — форма Лагранжа, в то время как выбор — форма Коши.

Эти уточнения теоремы Тейлора обычно доказываются с помощью теоремы о среднем значении , откуда и название. Кроме того, обратите внимание, что это именно теорема о среднем значении , когда . Также можно найти другие подобные выражения. Например, если G ( t ) непрерывна на замкнутом интервале и дифференцируема с ненулевой производной на открытом интервале между и , то

для некоторого числа между и . Эта версия охватывает формы Лагранжа и Коши остатка как особые случаи и доказывается ниже с использованием теоремы Коши о среднем значении . Форма Лагранжа получается взятием , а форма Коши получается взятием .

Утверждение для интегральной формы остатка является более продвинутым, чем предыдущие, и требует понимания теории интегрирования Лебега для полной общности. Однако оно справедливо также в смысле интеграла Римана при условии, что ( k  + 1)-я производная функции f непрерывна на замкнутом интервале [ a , x ].

Интегральная форма остатка [10]  —  Пусть абсолютно непрерывна на замкнутом интервале между и . Тогда

Ввиду абсолютной непрерывности f ( k ) на замкнутом интервале между и , ее производная f ( k +1) существует как L 1 -функция, и результат может быть доказан формальным вычислением с использованием основной теоремы исчисления и интегрирования по частям .

Оценки для остатка

Часто на практике бывает полезно оценить остаточный член, появляющийся в приближении Тейлора, а не иметь точную формулу для него. Предположим, что f является ( k + 1) -раз непрерывно дифференцируемой в интервале I, содержащем a . Предположим, что существуют действительные константы q и Q такие, что

на протяжении I. Тогда остаточный член удовлетворяет неравенству [11]

если x > a , и аналогичная оценка если x < a . Это простое следствие формы Лагранжа остатка. В частности, если

на интервале I = ( ar , a + r ) с некоторыми , то

для всех x ∈( ar , a + r ). Второе неравенство называется равномерной оценкой , поскольку оно выполняется равномерно для всех x на интервале ( ar , a + r ).

Пример

Аппроксимация (синего) его полиномами Тейлора порядка с центром в (красном).

Предположим, что мы хотим найти приближенное значение функции на интервале , гарантируя, что ошибка в приближении не превысит 10−5 . В этом примере мы делаем вид, что знаем только следующие свойства показательной функции:

Из этих свойств следует, что для всех , и в частности, . Следовательно, полином Тейлора -го порядка от при и его остаточный член в форме Лагранжа определяются как

где — некоторое число между 0 и x . Поскольку e x увеличивается на ( ), мы можем просто использовать для для оценки остатка на подынтервале . Чтобы получить верхнюю границу для остатка на , мы используем свойство для для оценки

используя разложение Тейлора второго порядка. Затем мы решаем для e x, чтобы вывести, что

просто максимизируя числитель и минимизируя знаменатель . Объединяя эти оценки для e x, мы видим, что

поэтому требуемая точность, безусловно, достигается, когда

(См. факториал или вычислите вручную значения и .) В заключение, теорема Тейлора приводит к приближению

Например, это приближение дает десятичное выражение с точностью до пяти знаков после запятой.

Отношение к аналитичности

Разложения Тейлора действительных аналитических функций

Пусть IRоткрытый интервал . По определению функция f  : IR является действительно аналитической , если она локально определяется сходящимся степенным рядом . Это означает, что для каждого a  ∈  I существует некоторое r  > 0 и последовательность коэффициентов c k  ∈  R, такие, что ( ar , a + r ) ⊂ I и

В общем случае радиус сходимости степенного ряда можно вычислить по формуле Коши–Адамара

Этот результат основан на сравнении с геометрическим рядом , и тот же метод показывает, что если степенной ряд, основанный на a, сходится для некоторого bR , он должен сходиться равномерно на замкнутом интервале , где . Здесь рассматривается только сходимость степенного ряда, и вполне может быть, что ( aR , a + R ) выходит за пределы области I функции f .

Полиномы Тейлора действительной аналитической функции f в точке a — это просто конечные усечения

его локально определяющего степенного ряда, а соответствующие остаточные члены локально задаются аналитическими функциями

Здесь функции

также являются аналитическими, поскольку их определяющие степенные ряды имеют тот же радиус сходимости, что и исходный ряд. Предполагая, что [ ar , a + r ]I и r  <  R , все эти ряды сходятся равномерно на ( ar , a + r ) . Естественно, в случае аналитических функций можно оценить остаточный член по хвосту последовательности производных f′ ( a ) в центре разложения, но с использованием комплексного анализа возникает и другая возможность, которая описана ниже.

Теорема Тейлора и сходимость рядов Тейлора

Ряд Тейлора функции f будет сходиться в некотором интервале, в котором все ее производные ограничены и не растут слишком быстро при стремлении k к бесконечности. (Однако, даже если ряд Тейлора сходится, он может не сходиться к f , как объясняется ниже; в таком случае f называется неаналитическим . )

Можно вспомнить ряд Тейлора

бесконечно много раз дифференцируемой функции f  : RR как ее "многочлен Тейлора бесконечного порядка" в точке a . Теперь оценки остатка подразумевают, что если для любого r известно , что производные функции f ограничены по ( a  −  r , a  +  r ), то для любого порядка k и для любого r  > 0 существует константа M k,r > 0 такая, что

для каждого x  ∈ ( a  −  r , a  +  r ). Иногда константы M k,r можно выбрать таким образом, что M k,r ограничено сверху, для фиксированного r и всех k . Тогда ряд Тейлора функции f равномерно сходится к некоторой аналитической функции

(Сходимость также достигается, даже если M k,r не ограничено сверху, при условии, что оно растет достаточно медленно.)

Предельная функция T f по определению всегда аналитична, но она не обязательно равна исходной функции f , даже если f бесконечно дифференцируема. В этом случае мы говорим, что f является неаналитической гладкой функцией , например, плоской функцией :

Повторно используя цепное правило методом математической индукции , можно показать, что для любого порядка  k ,

для некоторого полинома p k степени 2( k − 1). Функция стремится к нулю быстрее, чем любой полином как , поэтому f бесконечно много раз дифференцируема и f ( k ) (0) = 0 для каждого положительного целого числа k . Все вышеприведенные результаты справедливы в этом случае:

Однако по мере увеличения k при фиксированном r значение M k,r растет быстрее, чем r k , и ошибка не стремится к нулю .

Теорема Тейлора в комплексном анализе

Теорема Тейлора обобщается на функции f  : CC , которые являются комплексно дифференцируемыми в открытом подмножестве U  ⊂  C комплексной плоскости . Однако ее полезность затмевается другими общими теоремами комплексного анализа . А именно, более сильные версии связанных результатов могут быть выведены для комплексно дифференцируемых функций f  :  U  →  C с использованием интегральной формулы Коши следующим образом.

Пусть r  > 0, такой, что замкнутый круг B ( zr ) ∪  S ( zr ) содержится в U. Тогда интегральная формула Коши с положительной параметризацией γ ( t ) = z + re it окружности S ( z , r ) с дает

Здесь все подынтегральные функции непрерывны на окружности S ( zr ), что оправдывает дифференцирование под знаком интеграла. В частности, если f один раз комплексно дифференцируема на открытом множестве U , то она на самом деле бесконечно много раз комплексно дифференцируема на U . Также получаются оценки Коши [12]

для любых z  ∈  U и r  > 0 таких, что B ( zr ) ∪  S ( cr ) ⊂  U. Эти оценки подразумевают, что комплексный ряд Тейлора

из f сходится равномерно на любом открытом круге с в некоторую функцию T f . Кроме того, используя формулы контурного интеграла для производных f ( k ) ( c ),

поэтому любая комплексная дифференцируемая функция f в открытом множестве U  ⊂  C на самом деле является комплексной аналитической . Все, что здесь сказано для действительных аналитических функций, справедливо и для комплексных аналитических функций с заменой открытого интервала I на открытое подмножество U  ∈  C и a -центрированными интервалами ( a  −  ra  +  r ) на c -центрированные диски B ( cr ). В частности, разложение Тейлора справедливо в виде

где остаточный член R k является комплексно-аналитическим. Методы комплексного анализа дают некоторые мощные результаты относительно разложений Тейлора. Например, используя интегральную формулу Коши для любой положительно ориентированной жордановой кривой , которая параметризует границу области , можно получить выражения для производных f ( j ) ( c ), как указано выше, и слегка изменив вычисление для T f ( z ) = f ( z ) , можно прийти к точной формуле

Важной особенностью здесь является то, что качество аппроксимации полиномом Тейлора на области определяется значениями самой функции f на границе . Аналогично, применяя оценки Коши к выражению ряда для остатка, получаем равномерные оценки

Пример

Комплексный график . Модуль показан высотой, а аргумент — цветом: голубой =  , синий =  , фиолетовый =  , красный =  , желтый =  , зеленый =  .

Функция

является действительно аналитической , то есть локально определяется своим рядом Тейлора. Эта функция была построена выше, чтобы проиллюстрировать тот факт, что некоторые элементарные функции не могут быть аппроксимированы полиномами Тейлора в окрестностях центра расширения, которые слишком велики. Такое поведение легко понять в рамках комплексного анализа. А именно, функция f расширяется до мероморфной функции

на компактифицированной комплексной плоскости. Он имеет простые полюса в и , и он аналитичен в других местах. Теперь его ряд Тейлора с центром в z 0 сходится на любом диске B ( z 0 , r ) с r < | z  −  z 0 |, где тот же ряд Тейлора сходится при z  ∈  C . Следовательно, ряд Тейлора функции f с центром в 0 сходится на B (0, 1) и не сходится ни для какого zC с | z | > 1 из-за полюсов в i и − i . По той же причине ряд Тейлора функции f с центром в 1 сходится на и не сходится ни для какого z  ∈  C с .

Обобщения теоремы Тейлора

Дифференцируемость высшего порядка

Функция f : R nR дифференцируема в точке a R n тогда и только тогда, когда существуют линейный функционал L  : R nR и функция h  : R nR такие, что

Если это так, то есть ( однозначно определенный) дифференциал f в точке a . Более того, тогда частные производные f существуют в a , а дифференциал f в a задается выражением

Введение в многоиндексную нотацию

для αN n и xR n . Если все частные производные -го порядка функции f  : R nR непрерывны в точке aR n , то по теореме Клеро можно изменить порядок смешанных производных в точке a , поэтому запись

для частных производных более высокого порядка оправдано в этой ситуации. То же самое верно, если все частные производные ( k − 1 )-го порядка функции f существуют в некоторой окрестности a и дифференцируемы в точке a . [13] Тогда мы говорим, что f является k раз дифференцируемой в точке  a .

Теорема Тейлора для многомерных функций

Используя обозначения предыдущего раздела, получаем следующую теорему.

Многомерная версия теоремы Тейлора [14]  —  Пусть f  : R nR — k -кратно непрерывно дифференцируемая функция в точке aR n . Тогда существуют функции h α  : R nR , где такие, что

Если функция f  : R nR является k + 1 раз непрерывно дифференцируемой в замкнутом шаре для некоторого , то можно вывести точную формулу для остатка в терминах частных производных ( k +1 )-го порядка от f в этой окрестности. [15] А именно,

В этом случае в силу непрерывности частных производных ( k +1 )-го порядка в компактном множестве B сразу получаются равномерные оценки

Пример в двух измерениях

Например, полином Тейлора третьего порядка гладкой функции равен, обозначая ,

Доказательства

Доказательство теоремы Тейлора с одной действительной переменной

Пусть [16]

где, как и в формулировке теоремы Тейлора,

Достаточно показать, что

Доказательство здесь основано на повторном применении правила Лопиталя . Обратите внимание, что для каждого , . Следовательно, каждая из первых производных числителя в обращается в нуль при , и то же самое верно для знаменателя. Кроме того, поскольку условие, что функция должна быть дифференцируема в точке, требует дифференцируемости вплоть до порядка в окрестности указанной точки (это верно, поскольку дифференцируемость требует, чтобы функция была определена во всей окрестности точки), числитель и его производные дифференцируемы в окрестности . Очевидно, что знаменатель также удовлетворяет указанному условию и, кроме того, не обращается в нуль, если , поэтому все условия, необходимые для правила Лопиталя, выполнены, и его использование оправдано. Так что

где предпоследнее равенство следует из определения производной при .

Альтернативное доказательство теоремы Тейлора с одной действительной переменной

Пусть — любая непрерывная действительная функция, которую нужно аппроксимировать полиномом Тейлора.

Шаг 1: Пусть и будут функциями. Положим и будем

Шаг 2: Свойства и :

Сходным образом,

Шаг 3: использование теоремы Коши о среднем значении

Пусть и будут непрерывными функциями на . Так как , то мы можем работать с интервалом . Пусть и будут дифференцируемы на . Предположим для всех . Тогда существует такое, что

Примечание: в и так

для некоторых .

Это также можно выполнить для :

для некоторых . Это может быть продолжено до .

Это дает раздел в :

с

Набор :

Шаг 4: Верните на место

По правилу степеней, повторяющиеся производные от , , так что:

Это приводит к:

Переставляя, получаем:

или потому что в конечном итоге:

Вывод для форм среднего значения остатка

Пусть G — любая вещественная функция, непрерывная на замкнутом интервале между и и дифференцируемая с ненулевой производной на открытом интервале между и , и определим

Для . Тогда, по теореме Коши о среднем значении ,

для некоторых на открытом интервале между и . Обратите внимание, что здесь числитель — это в точности остаток полинома Тейлора для . Вычислить

вставьте его в ( ★★★ ) и переставьте члены, чтобы найти, что

Это форма остаточного члена, упомянутая после фактического утверждения теоремы Тейлора с остатком в форме среднего значения. Форма Лагранжа остатка находится выбором , а форма Коши — выбором .

Замечание. Используя этот метод, можно также восстановить интегральную форму остатка, выбрав

но требования к f, необходимые для использования теоремы о среднем значении, слишком сильны, если кто-то стремится доказать утверждение в случае, когда f ( k ) является только абсолютно непрерывным . Однако, если вместо интеграла Лебега использовать интеграл Римана , предположения не могут быть ослаблены.

Вывод для интегральной формы остатка

Ввиду абсолютной непрерывности на замкнутом интервале между и , ее производная существует как -функция, и мы можем использовать фундаментальную теорему исчисления и интегрирования по частям . Это же доказательство применимо к интегралу Римана, предполагая, что непрерывна на замкнутом интервале и дифференцируема на открытом интервале между и , и это приводит к тому же результату, что и при использовании теоремы о среднем значении .

Основная теорема исчисления гласит, что

Теперь мы можем интегрировать по частям и снова использовать основную теорему исчисления, чтобы увидеть, что

что в точности является теоремой Тейлора с остатком в интегральной форме в случае . Общее утверждение доказывается с помощью индукции . Предположим, что

Интегрируя оставшийся член по частям, приходим к

Подстановка этого в формулу ( eq1 ) показывает, что если это справедливо для значения , то это также должно справедливо для значения . Следовательно, поскольку это справедливо для , это должно справедливо для каждого положительного целого числа .

Вывод остатка многомерных полиномов Тейлора

Мы доказываем частный случай, где имеет непрерывные частные производные вплоть до порядка в некотором замкнутом шаре с центром . Стратегия доказательства заключается в применении однопеременного случая теоремы Тейлора к ограничению на отрезок прямой, примыкающий к и . [17] Параметризуем отрезок прямой между и с помощью Мы применяем однопеременную версию теоремы Тейлора к функции :

Применение цепного правила для нескольких переменных дает

где - коэффициент полинома . Поскольку , то получаем:

Смотрите также

Сноски

  1. ^ (2013). «Линейная и квадратичная аппроксимация» Получено 6 декабря 2018 г.
  2. ^ Тейлор, Брук (1715). Methodus Incrementorum Directa et Inversa [ Прямой и обратный методы приращения ] (на латыни). Лондон. п. 21–23 (т. VII, Фем. 3, Кор. 2).Перевод на английский язык: Struik, DJ (1969). A Source Book in Mathematics 1200–1800 . Кембридж, Массачусетс: Harvard University Press. С. 329–332.
  3. Клайн 1972, стр. 442, 464.
  4. ^ Дженокки, Анджело; Пеано, Джузеппе (1884), Calcolo Differentziale e principii di Calcolo Integrale , (N. 67, стр. XVII–XIX): Fratelli Bocca ed.{{citation}}: CS1 maint: location (link)
  5. ^ Спивак, Майкл (1994), Calculus (3-е изд.), Хьюстон, Техас: Publish or Perish, стр. 383, ISBN 978-0-914098-89-8
  6. ^ "Формула Тейлора", Энциклопедия математики , EMS Press , 2001 [1994]
  7. ^ Гипотеза о том, что f ( k ) непрерывна на замкнутом интервале между и не является избыточной . Хотя f является k + 1 раз  дифференцируемой на открытом интервале между и подразумевает, что f ( k ) непрерывна на открытом интервале между и , это не означает , что f ( k ) непрерывна на замкнутом интервале между и , т . е. это не означает, что f ( k ) непрерывна в конечных точках этого интервала . Рассмотрим , например, функцию f :  [0,1] → R, определенную как равную на и с . Она не непрерывна в 0 , но непрерывна на . Более того, можно показать, что эта функция имеет первообразную . Следовательно, эта первообразная дифференцируема на , ее производная ( функция f ) непрерывна на открытом интервале , но ее производная f не непрерывна на замкнутом интервале . Поэтому теорема в этом случае неприменима.
  8. ^ Клайн 1998, §20.3; Апостол 1967, §7.7.
  9. ^ Апостол 1967, §7.7.
  10. ^ Апостол 1967, §7.5.
  11. ^ Апостол 1967, §7.6
  12. ^ Рудин 1987, §10.26
  13. ^ Это следует из итерационного применения теоремы о том, что если частные производные функции f существуют в окрестности a и непрерывны в a , то функция дифференцируема в a . См., например, Apostol 1974, теорема 12.11.
  14. ^ Кенигсбергский анализ 2, с. 64 и далее.
  15. ^ Фолланд, ГБ "Производные высшего порядка и формула Тейлора для нескольких переменных" (PDF) . Кафедра математики | Вашингтонский университет . Получено 21.02.2024 .
  16. ^ Штромберг 1981
  17. ^ Хёрмандер 1976, стр. 12–13.

Ссылки

Внешние ссылки