stringtranslate.com

Дифференциал функции

В исчислении дифференциал представляет собой главную часть изменения функции относительно изменений независимой переменной. Дифференциал определяется как , где — производная f относительно , ​​а — дополнительная действительная переменная (так что — функция и ). Обозначение таково, что уравнение

выполняется, где производная представлена ​​в обозначениях Лейбница , и это согласуется с рассмотрением производной как частного дифференциалов. Также можно записать

Точное значение переменных и зависит от контекста приложения и требуемого уровня математической строгости. Область этих переменных может иметь особое геометрическое значение, если дифференциал рассматривается как особая дифференциальная форма , или аналитическое значение, если дифференциал рассматривается как линейное приближение к приращению функции. Традиционно переменные и считаются очень малыми ( бесконечно малыми ), и эта интерпретация делается строгой в нестандартном анализе .

История и использование

Дифференциал был впервые введен посредством интуитивного или эвристического определения Исааком Ньютоном и развит Готфридом Лейбницем , который считал дифференциал  dy бесконечно малым (или бесконечно малым ) изменением значения  y функции, соответствующим бесконечно малому изменению  dx аргумента функции  x . По этой причине мгновенная скорость изменения y относительно x , которая является значением производной функции , обозначается дробью

в так называемой нотации Лейбница для производных. Частное не бесконечно мало; скорее это действительное число .

Использование бесконечно малых в этой форме широко критиковалось, например, в знаменитой брошюре «Аналитик» епископа Беркли. Огюстен-Луи Коши (1823) определил дифференциал без апелляции к атомизму бесконечно малых Лейбница. [1] [2] Вместо этого Коши, следуя Даламберу , перевернул логический порядок Лейбница и его последователей: сама производная стала фундаментальным объектом, определенным как предел разностных отношений, и дифференциалы затем были определены в его терминах. То есть, можно было свободно определять дифференциал выражением , в котором и являются просто новыми переменными, принимающими конечные действительные значения, [3] а не фиксированными бесконечно малыми, как это было у Лейбница. [4]

Согласно Бойеру (1959, стр. 12), подход Коши был значительным логическим улучшением по сравнению с подходом Лейбница к бесконечно малым, поскольку вместо того, чтобы ссылаться на метафизическое понятие бесконечно малых, величины и теперь могли манипулироваться точно так же, как и любые другие действительные величины осмысленным образом. Общий концептуальный подход Коши к дифференциалам остается стандартным в современных аналитических трактовках, [5] хотя последнее слово о строгости, полностью современное понятие предела, в конечном счете принадлежит Карлу Вейерштрассу . [6]

В физических трактовках, например, применяемых к теории термодинамики , по-прежнему преобладает точка зрения бесконечно малых величин. Курант и Джон (1999, стр. 184) примиряют физическое использование бесконечно малых дифференциалов с их математической невозможностью следующим образом. Дифференциалы представляют собой конечные ненулевые значения, которые меньше степени точности, требуемой для конкретной цели, для которой они предназначены. Таким образом, «физическим бесконечно малым» не нужно обращаться к соответствующей математической бесконечно малой величине, чтобы иметь точный смысл.

После достижений двадцатого века в математическом анализе и дифференциальной геометрии стало ясно, что понятие дифференциала функции может быть расширено различными способами. В реальном анализе более желательно иметь дело непосредственно с дифференциалом как с главной частью приращения функции. Это приводит непосредственно к представлению о том, что дифференциал функции в точке является линейным функционалом приращения . Этот подход позволяет разрабатывать дифференциал (как линейное отображение) для множества более сложных пространств, в конечном итоге приводя к таким понятиям, как производная Фреше или Гато . Аналогично, в дифференциальной геометрии дифференциал функции в точке является линейной функцией касательного вектора («бесконечно малое смещение»), что представляет его как своего рода одну форму: внешнюю производную функции. В нестандартном исчислении дифференциалы рассматриваются как бесконечно малые, которые сами по себе могут быть поставлены на строгую основу (см. дифференциал (бесконечно малый) ).

Определение

Дифференциал функции в точке .

Дифференциал определяется в современных трактовках дифференциального исчисления следующим образом. [7] Дифференциал функции одной действительной переменной является функцией двух независимых действительных переменных и задается формулой

Один или оба аргумента могут быть опущены, т. е. можно увидеть или просто . Если , дифференциал также можно записать как . Поскольку , принято записывать так, чтобы выполнялось следующее равенство:

Это понятие дифференциала широко применимо, когда ищется линейное приближение к функции, в котором значение приращения достаточно мало. Точнее, если - дифференцируемая функция при , то разность значений

удовлетворяет

где ошибка в аппроксимации удовлетворяет как . Другими словами, имеет место приближенная идентичность

в котором ошибка может быть сделана сколь угодно малой относительно путем ограничения быть достаточно малой; то есть, как . По этой причине дифференциал функции известен как главная (линейная) часть в приращении функции: дифференциал является линейной функцией приращения , и хотя ошибка может быть нелинейной, она быстро стремится к нулю, как стремится к нулю.

Дифференциалы по нескольким переменным

Согласно Гурса (1904, I, §15), для функций более чем одной независимой переменной,

частный дифференциал y по любой из переменных  x 1 — это главная часть изменения y, возникающего в результате изменения  dx 1 этой одной переменной. Частный дифференциал, таким образом, равен

включающая частную производную y по  x 1. Сумма частных дифференциалов по всем независимым переменным является полным дифференциалом

что является основной частью изменения y в результате изменений независимых переменных  x i .

Точнее, в контексте многомерного исчисления, следуя Куранту (1937b), если f — дифференцируемая функция, то по определению дифференцируемости приращение

где члены ошибки ε i  стремятся к нулю, поскольку приращения Δ x i совместно стремятся к нулю. Полный дифференциал тогда строго определяется как

Поскольку, с этим определением, мы имеем

Как и в случае одной переменной, имеет место приблизительное тождество

в котором общая ошибка может быть сделана сколь угодно малой относительно путем сосредоточения внимания на достаточно малых приращениях.

Применение полного дифференциала к оценке погрешности

При измерении полный дифференциал используется для оценки погрешности функции на основе погрешностей параметров . Предполагая, что интервал достаточно короток для того, чтобы изменение было приблизительно линейным:

и что все переменные независимы, то для всех переменных,

Это происходит потому, что производная по конкретному параметру дает чувствительность функции к изменению , в частности, к ошибке . Поскольку предполагается, что они независимы, анализ описывает наихудший сценарий. Используются абсолютные значения компонентных ошибок, поскольку после простого вычисления производная может иметь отрицательный знак. Из этого принципа выводятся правила ошибок суммирования, умножения и т. д., например:

Пусть . Тогда конечную ошибку можно аппроксимировать как

Оценка производных: деление на f , что равно a × b

То есть при умножении общая относительная погрешность представляет собой сумму относительных погрешностей параметров.

Чтобы проиллюстрировать, как это зависит от рассматриваемой функции, рассмотрим случай, когда вместо этого функция. Затем можно вычислить, что оценка ошибки имеет дополнительный фактор ' ln b ', которого нет в случае простого произведения. Этот дополнительный фактор имеет тенденцию уменьшать ошибку, поскольку ln b не так велик, как голый  b .

Дифференциалы высшего порядка

Дифференциалы высшего порядка функции y = f ( x ) одной переменной x могут быть определены с помощью: [8] и, в общем, Неформально, это мотивирует обозначение Лейбница для производных высшего порядка Когда самой независимой переменной x разрешено зависеть от других переменных, то выражение становится более сложным, так как оно должно включать также дифференциалы высшего порядка по самой x . Так, например, и т. д.

Аналогичные соображения применимы к определению дифференциалов более высокого порядка функций нескольких переменных. Например, если f является функцией двух переменных x и y , то где — биномиальный коэффициент . При большем количестве переменных аналогичное выражение справедливо, но с соответствующим многочленным разложением вместо биномиального разложения. [9]

Дифференциалы более высокого порядка в нескольких переменных также становятся более сложными, когда независимым переменным самим разрешено зависеть от других переменных. Например, для функции f от x и y , которым разрешено зависеть от вспомогательных переменных, имеем

Из-за этой громоздкости обозначений использование дифференциалов более высокого порядка подверглось резкой критике со стороны Адамара (1935), который пришел к следующему выводу:

Enfin, который означает или представляет равенство

Мой совет, без всего.

То есть: Наконец, что подразумевается или представляется равенством [...]? По моему мнению, вообще ничего. Несмотря на этот скептицизм, дифференциалы более высокого порядка действительно появились как важный инструмент анализа. [10]

В этих контекстах дифференциал n -го порядка функции f, примененный к приращению Δ x, определяется с помощью или эквивалентного выражения, например, где — nпрямая разность с приращением t Δ x .

Это определение имеет смысл также, если f является функцией нескольких переменных (для простоты взятых здесь как векторный аргумент). Тогда n -й дифференциал, определенный таким образом, является однородной функцией степени n по векторному приращению Δ x . Более того, ряд Тейлора функции f в точке x задается выражением Производная Гато более высокого порядка обобщает эти соображения на бесконечномерные пространства.

Характеристики

Ряд свойств дифференциала вытекают непосредственно из соответствующих свойств производной, частной производной и полной производной. К ним относятся: [11]

Операция d с этими двумя свойствами известна в абстрактной алгебре как вывод . Они подразумевают правило мощности. Кроме того, существуют различные формы правила цепи , в возрастающем уровне общности: [12]

Общая формулировка

Последовательное понятие дифференциала может быть разработано для функции f  : R nR m между двумя евклидовыми пространствами . Пусть x , Δ xR n — пара евклидовых векторов . Приращение функции f равно Если существует матрица A размера m × n, такая, что вектор ε → 0 при Δ x → 0 , то f по определению дифференцируема в точке x . Матрицу A иногда называют матрицей Якоби , а линейное преобразование , которое сопоставляет приращению Δ xR n вектор A Δ xR m , в этой общей постановке называют дифференциалом df ( x ) функции f в точке x . Это в точности производная Фреше , и ту же конструкцию можно применить для функции между любыми банаховыми пространствами .

Другая плодотворная точка зрения заключается в определении дифференциала непосредственно как вида производной по направлению : что является подходом, уже принятым для определения дифференциалов более высокого порядка (и наиболее близко к определению, данному Коши). Если t представляет время и положение x , то h представляет скорость, а не смещение, как мы считали до сих пор. Это дает еще одно уточнение понятия дифференциала: оно должно быть линейной функцией кинематической скорости. Множество всех скоростей через заданную точку пространства известно как касательное пространство , и поэтому df дает линейную функцию на касательном пространстве: дифференциальную форму . При такой интерпретации дифференциал f известен как внешняя производная и имеет широкое применение в дифференциальной геометрии, поскольку понятие скоростей и касательного пространства имеет смысл на любом дифференцируемом многообразии . Если, кроме того, выходное значение f также представляет положение (в евклидовом пространстве), то анализ размерностей подтверждает, что выходное значение df должно быть скоростью. Если рассматривать дифференциал таким образом, то он известен как проталкивание , поскольку он «проталкивает» скорости из исходного пространства в скорости в целевом пространстве.

Другие подходы

Хотя понятие наличия бесконечно малого приращения dx не является четко определенным в современном математическом анализе , существует множество методов определения бесконечно малого дифференциала, так что дифференциал функции может быть обработан таким образом, чтобы не конфликтовать с обозначениями Лейбница . К ним относятся:

Примеры и приложения

Дифференциалы могут эффективно использоваться в численном анализе для изучения распространения экспериментальных ошибок в расчетах и, таким образом, общей численной устойчивости задачи (Courant 1937a). Предположим, что переменная x представляет собой результат эксперимента, а y — результат численного вычисления, примененного к x . Вопрос в том, в какой степени ошибки в измерении x влияют на результат вычисления y . Если x известен с точностью до Δ x от своего истинного значения, то теорема Тейлора дает следующую оценку ошибки Δ y в вычислении y : где ξ = x + θ Δ x для некоторого 0 < θ < 1. Если Δ x мало, то член второго порядка пренебрежимо мал, так что Δ y для практических целей хорошо аппроксимируется выражением dy = f' ( x ) Δ x .

Дифференциал часто бывает полезен для переписывания дифференциального уравнения в форме , в частности, когда требуется разделить переменные .

Примечания

  1. ^ Подробный исторический отчет о дифференциале см. в Boyer 1959, особенно на стр. 275, где описывается вклад Коши по этому вопросу. Сокращенный отчет можно найти в Kline 1972, глава 40.
  2. ^ Коши открыто отрицал возможность существования действительно бесконечно малых и бесконечных величин (Boyer 1959, стр. 273–275) и придерживался радикально иной точки зрения, согласно которой «переменная величина становится бесконечно малой, когда ее численное значение бесконечно уменьшается таким образом, что стремится к нулю» (Cauchy 1823, стр. 12; перевод из Boyer 1959, стр. 273).
  3. ^ Бойер 1959, стр. 275
  4. Бойер 1959, стр. 12: «Дифференциалы, определенные таким образом, являются лишь новыми переменными , а не фиксированными бесконечно малыми величинами...»
  5. Курант 1937a, II, §9: «Здесь мы лишь мимоходом отметим, что можно использовать это приближенное представление приращения с помощью линейного выражения для построения логически удовлетворительного определения «дифференциала», как это сделал, в частности, Коши».
  6. ^ Бойер 1959, стр. 284
  7. ^ См., например, влиятельные трактаты Courant 1937a, Kline 1977, Goursat 1904 и Hardy 1908. Третичные источники для этого определения включают также Tolstov 2001 и Itô 1993, §106.
  8. Коши 1823. См. также, например, Гурса 1904, I, §14.
  9. Гурса 1904, I, §14
  10. ^ В частности, к бесконечномерной голоморфности (Хилле и Филлипс, 1974) и численному анализу посредством исчисления конечных разностей .
  11. Гурса 1904, I, §17
  12. ^ Гурса 1904, I, §§14,16
  13. ^ Эйзенбуд и Харрис 1998.
  14. ^ См. Kock 2006 и Moerdijk & Reyes 1991.
  15. См. Робинсон 1996 и Кейслер 1986.

Смотрите также

Ссылки

Внешние ссылки