stringtranslate.com

Дифференциальное исчисление

График функции, нарисованный черным цветом, и касательная к этой функции, нарисованная красным цветом. Наклон касательной равен производной функции в отмеченной точке.

В математике дифференциальное исчисление — это подраздел исчисления , который изучает скорости изменения величин. [1] Это один из двух традиционных разделов исчисления, другой — интегральное исчисление — изучение площади под кривой. [2]

Основными объектами изучения дифференциального исчисления являются производная функции , связанные с ней понятия, такие как дифференциал , и их приложения. Производная функции при выбранном входном значении описывает скорость изменения функции вблизи этого входного значения. Процесс нахождения производной называется дифференцированием . Геометрически производная в точке — это наклон касательной к графику функции в этой точке, при условии, что производная существует и определена в этой точке. Для действительной функции одной действительной переменной производная функции в точке обычно определяет наилучшее линейное приближение к функции в этой точке.

Дифференциальное исчисление и интегральное исчисление связаны основной теоремой исчисления , которая гласит, что дифференцирование — это процесс, обратный интегрированию .

Дифференциация имеет приложения почти во всех количественных дисциплинах. В физике производная смещения движущегося тела по времени — это скорость тела, а производная скорости по времени — это ускорение . Производная импульса тела по времени равна силе, приложенной к телу; перестановка этого производного выражения приводит к знаменитому уравнению F = ma , связанному со вторым законом движения Ньютона . Скорость химической реакции является производной. В исследовании операций производные определяют наиболее эффективные способы транспортировки материалов и проектирования заводов.

Производные часто используются для нахождения максимумов и минимумов функции. Уравнения, включающие производные, называются дифференциальными уравнениями и являются основополагающими в описании природных явлений . Производные и их обобщения появляются во многих областях математики, таких как комплексный анализ , функциональный анализ , дифференциальная геометрия , теория меры и абстрактная алгебра .

Производный

График произвольной функции . Оранжевая линия касается , то есть в этой точке наклон кривой и прямой линии одинаковы.
Производная в разных точках дифференцируемой функции

Производная в точке — это наклон касательной к . [3] Чтобы получить интуитивное представление об этом, нужно сначала познакомиться с нахождением наклона линейного уравнения, записанного в виде . Наклон уравнения — это его крутизна. Его можно найти, выбрав любые две точки и разделив изменение на изменение , что означает, что . Так как график имеет наклон , как показано на диаграмме ниже:

График

Для краткости часто записывается как , где — греческая буква дельта, означающая «изменение в». Наклон линейного уравнения постоянен, что означает, что крутизна везде одинакова. Однако многие графики, такие как , различаются по своей крутизне. Это означает, что вы больше не можете выбрать любые две произвольные точки и вычислить наклон. Вместо этого наклон графика можно вычислить, рассмотрев касательную — линию, которая «только касается» определенной точки. [a] Наклон кривой в определенной точке равен наклону касательной к этой точке. Например, имеет наклон в , потому что наклон касательной к этой точке равен :

График функции , с прямой линией, касательной к . Наклон касательной равен . (Оси графика не используют масштаб 1:1.)


Производная функции тогда просто является наклоном этой касательной. [b] Несмотря на то, что касательная касается только одной точки в точке касания, ее можно аппроксимировать линией, проходящей через две точки. Это известно как секущая линия . Если две точки, через которые проходит секущая линия, расположены близко друг к другу, то секущая линия очень похожа на касательную, и, как следствие, ее наклон также очень похож:

Пунктирная линия проходит через точки и , которые обе лежат на кривой . Поскольку эти две точки расположены довольно близко друг к другу, пунктирная линия и касательная имеют одинаковый наклон. По мере того, как две точки становятся ближе друг к другу, ошибка, создаваемая секущей линией, становится исчезающе малой.


Преимущество использования секущей линии в том, что ее наклон можно рассчитать напрямую. Рассмотрим две точки на графике и , где — небольшое число. Как и прежде, наклон линии, проходящей через эти две точки, можно рассчитать по формуле . Это дает

По мере приближения к наклон секущей линии становится все ближе и ближе к наклону касательной линии. Это формально записывается как

Вышеприведенное выражение означает «по мере приближения к 0 наклон секущей линии становится все ближе и ближе к определенному значению». Значение, к которому приближаются, является производной от ; это можно записать как . Если , производную также можно записать как , представляя бесконечно малое изменение. Например, представляет бесконечно малое изменение x. [c] Подводя итог, если , то производная от равна

при условии, что такой предел существует. [4] [d] Таким образом, нам удалось правильно определить производную функции, что означает, что «наклон касательной» теперь имеет точное математическое значение. Дифференцирование функции с использованием приведенного выше определения известно как дифференцирование из первых принципов. Вот доказательство с использованием дифференцирования из первых принципов, что производная равна :

Как приближается , приближается . Следовательно, . Это доказательство можно обобщить, чтобы показать, что если и являются константами . Это известно как правило мощности . Например, . Однако многие другие функции не могут быть дифференцированы так же легко, как полиномиальные функции , а это означает, что иногда требуются дополнительные методы для нахождения производной функции. Эти методы включают в себя правило цепочки , правило произведения и правило частного . Другие функции вообще не могут быть дифференцированы, что приводит к понятию дифференцируемости .

Тесно связанным понятием производной функции является ее дифференциал . Когда x и y являются действительными переменными, производная f в точке x является наклоном касательной к графику f в точке x . Поскольку источник и цель f являются одномерными, производная f является действительным числом. Если x и y являются векторами, то наилучшее линейное приближение к графику f зависит от того, как f изменяется в нескольких направлениях одновременно. Взятие наилучшего линейного приближения в одном направлении определяет частную производную , которая обычно обозначается у/х . Линеаризация f по всем направлениям одновременно называется полной производной .

История дифференциации

Концепция производной в смысле касательной линии очень старая, знакомая древнегреческим математикам , таким как Евклид (ок. 300 г. до н. э.), Архимед (ок. 287–212 г. до н. э.) и Аполлоний Пергский (ок. 262–190 г. до н. э.). [5] Архимед также использовал неделимые , хотя они в основном использовались для изучения площадей и объемов, а не производных и касательных (см. Метод механических теорем ). Использование бесконечно малых для вычисления скоростей изменения было значительно развито Бхаскарой II (1114–1185); действительно, утверждается [6], что многие из ключевых понятий дифференциального исчисления можно найти в его работе, например, « Теорема Ролля ». [7]

Математик Шараф ад-Дин ат-Туси (1135–1213) в своем «Трактате об уравнениях» установил условия, при которых некоторые кубические уравнения имеют решения, путем нахождения максимумов соответствующих кубических многочленов. Например, он получил, что максимум (для положительных x ) кубического уравнения ax 2x 3 достигается при x = 2 a / 3 , и заключил из этого, что уравнение ax 2 = x 3 + c имеет ровно одно положительное решение при c = 4 a 3 / 27 и два положительных решения при 0 < c < 4 a 3 / 27 . [8] [ нужна страница ] Историк науки Рошди Рашед [ 8] [ нужна страница ] утверждал, что ат-Туси, должно быть, использовал производную кубического уравнения, чтобы получить этот результат. Однако вывод Рашеда был оспорен другими учеными, которые утверждают, что он мог получить результат другими методами, не требующими знания производной функции. [8] [ нужна страница ]

Современное развитие исчисления обычно приписывают Исааку Ньютону (1643–1727) и Готфриду Вильгельму Лейбницу (1646–1716), которые предложили независимые [e] и единые подходы к дифференцированию и производным. Однако ключевым открытием, которое принесло им эту славу, стала фундаментальная теорема исчисления, связывающая дифференцирование и интегрирование: это сделало устаревшими большинство предыдущих методов вычисления площадей и объемов. [f] В своих идеях о производных и Ньютон, и Лейбниц опирались на значительные более ранние работы таких математиков, как Пьер де Ферма (1607–1665), Исаак Барроу (1630–1677), Рене Декарт (1596–1650), Христиан Гюйгенс (1629–1695), Блез Паскаль (1623–1662) и Джон Уоллис (1616–1703). Что касается влияния Ферма, Ньютон однажды написал в письме, что « я получил намек на этот метод [флюксий] из способа Ферма проводить касательные, и, применив его к абстрактным уравнениям, напрямую и в обратном порядке, я сделал его общим » . [9] Обычно заслуга за раннюю разработку производной приписывается Исааку Барроу. [10] Тем не менее, Ньютон и Лейбниц остаются ключевыми фигурами в истории дифференциации, не в последнюю очередь потому, что Ньютон был первым, кто применил дифференциацию к теоретической физике , в то время как Лейбниц систематически разработал большую часть обозначений, которые используются и сегодня.

Начиная с XVII века многие математики внесли свой вклад в теорию дифференциации. В XIX веке исчисление было поставлено на гораздо более строгую основу такими математиками, как Огюстен Луи Коши (1789–1857), Бернхард Риман (1826–1866) и Карл Вейерштрасс (1815–1897). Также в этот период дифференциация была обобщена на евклидово пространство и комплексную плоскость .

20-й век принес два важных шага к нашему современному пониманию и практике вывода: интегрирование Лебега , помимо расширения интегрального исчисления на многие другие функции, прояснило связь между выводом и интегрированием с помощью понятия абсолютной непрерывности . Позднее теория распределений (после Лорана Шварца ) распространила вывод на обобщенные функции (например, дельта-функцию Дирака, ранее введенную в квантовой механике ) и стала основополагающей для современного прикладного анализа, особенно за счет использования слабых решений уравнений в частных производных .

Применение производных инструментов

Оптимизация

Если fдифференцируемая функция на (или открытом интервале ), а xлокальный максимум или локальный минимум f , то производная f в точке x равна нулю. Точки, в которых f' ( x ) = 0, называются критическими точками или стационарными точками (а значение f в точке x называется критическим значением ). Если не предполагается, что f всюду дифференцируема, то точки, в которых она не является дифференцируемой, также называются критическими точками.

Если f дважды дифференцируема, то, наоборот, критическую точку x функции f можно проанализировать, рассмотрев вторую производную функции f в точке x  :

Это называется тестом второй производной . Альтернативный подход, называемый тестом первой производной , включает рассмотрение знака f' по обе стороны от критической точки.

Поэтому взятие производных и решение для критических точек часто является простым способом нахождения локальных минимумов или максимумов, что может быть полезно при оптимизации . По теореме об экстремальном значении непрерывная функция на замкнутом интервале должна достигать своих минимальных и максимальных значений по крайней мере один раз. Если функция дифференцируема, минимумы и максимумы могут возникать только в критических точках или конечных точках.

Это также применимо к построению графиков: как только локальные минимумы и максимумы дифференцируемой функции найдены, можно получить приблизительный график графика, наблюдая, что он будет либо возрастать, либо убывать между критическими точками.

В более высоких размерностях критическая точка скалярной функции — это точка, в которой градиент равен нулю. Тест второй производной все еще можно использовать для анализа критических точек, рассматривая собственные значения матрицы Гессе вторых частных производных функции в критической точке. Если все собственные значения положительны, то точка является локальным минимумом; если все собственные значения отрицательны, то это локальный максимум. Если есть некоторые положительные и некоторые отрицательные собственные значения, то критическая точка называется « седловой точкой », а если ни один из этих случаев не выполняется (т. е. некоторые собственные значения равны нулю), то тест считается неокончательным.

Вариационное исчисление

Один из примеров задачи оптимизации: найти кратчайшую кривую между двумя точками на поверхности, предполагая, что кривая также должна лежать на поверхности. Если поверхность является плоскостью, то кратчайшая кривая — это линия. Но если поверхность, например, имеет форму яйца, то кратчайший путь не сразу ясен. Эти пути называются геодезическими , и одной из самых фундаментальных проблем в вариационном исчислении является нахождение геодезических. Другой пример: найти поверхность наименьшей площади, заполняющую замкнутую кривую в пространстве. Эта поверхность называется минимальной поверхностью , и ее тоже можно найти с помощью вариационного исчисления.

Физика

Исчисление имеет жизненно важное значение в физике: многие физические процессы описываются уравнениями, включающими производные, называемыми дифференциальными уравнениями . Физика особенно интересуется тем, как величины изменяются и развиваются с течением времени, и концепция « производной по времени » — скорости изменения с течением времени — имеет важное значение для точного определения нескольких важных понятий. В частности, производные по времени положения объекта имеют важное значение в ньютоновской физике :

Например, если положение объекта на линии задано как

тогда скорость объекта равна

и ускорение объекта равно

что является постоянным.

Дифференциальные уравнения

Дифференциальное уравнение — это соотношение между набором функций и их производными. Обыкновенное дифференциальное уравнение — это дифференциальное уравнение, связывающее функции одной переменной с их производными по этой переменной. Уравнение с частными производными — это дифференциальное уравнение, связывающее функции более чем одной переменной с их частными производными . Дифференциальные уравнения естественным образом возникают в физических науках, в математическом моделировании и в самой математике. Например, второй закон Ньютона , описывающий соотношение между ускорением и силой, можно сформулировать как обыкновенное дифференциальное уравнение

Уравнение теплопроводности с одной пространственной переменной, описывающее, как тепло распространяется через прямой стержень, представляет собой уравнение в частных производных

Здесь u ( x , t ) — температура стержня в точке x и времени t , а α — константа, зависящая от того, насколько быстро тепло распространяется через стержень.

Теорема о среднем значении

Теорема о среднем значении: Для каждой дифференцируемой функции с существует с .

Теорема о среднем значении устанавливает связь между значениями производной и значениями исходной функции. Если f ( x ) — действительная функция, а a и b — числа, причем a < b , то теорема о среднем значении утверждает, что при умеренных гипотезах наклон между двумя точками ( a , f ( a )) и ( b , f ( b )) равен наклону касательной к f в некоторой точке c между a и b . Другими словами,

На практике теорема о среднем значении контролирует функцию с точки зрения ее производной. Например, предположим, что f имеет производную, равную нулю в каждой точке. Это означает, что ее касательная горизонтальна в каждой точке, поэтому функция также должна быть горизонтальной. Теорема о среднем значении доказывает, что это должно быть верно: наклон между любыми двумя точками на графике f должен быть равен наклону одной из касательных линий f . Все эти наклоны равны нулю, поэтому любая линия из одной точки на графике в другую точку также будет иметь нулевой наклон. Но это говорит о том, что функция не движется вверх или вниз, поэтому она должна быть горизонтальной линией. Более сложные условия на производную приводят к менее точной, но все еще очень полезной информации об исходной функции.

Полиномы Тейлора и ряды Тейлора

Производная дает наилучшее возможное линейное приближение функции в заданной точке, но оно может сильно отличаться от исходной функции. Один из способов улучшить приближение — взять квадратичное приближение. То есть, линеаризация действительной функции f ( x ) в точке x 0 представляет собой линейный многочлен a + b ( xx 0 ) , и может быть возможно получить лучшее приближение, рассматривая квадратичный многочлен a + b ( x − x 0 ) + c ( xx 0 ) 2 . Еще лучшим может быть кубический многочлен a + b ( xx 0 ) + c ( xx 0 ) 2 + d ( xx 0 ) 3 , и эту идею можно распространить на многочлены произвольно высокой степени . Для каждого из этих полиномов должен быть наилучший возможный выбор коэффициентов a , b , c и d , который сделает приближение максимально хорошим.

В окрестности x 0 для a наилучшим возможным выбором всегда является f ( x 0 ) , а для b наилучшим возможным выбором всегда является f' ( x 0 ) . Для c , d и коэффициентов более высокой степени эти коэффициенты определяются высшими производными f . c всегда должно быть ж'' ( х 0 )/2 , и d всегда должно бытьж''' ( х 0 )/3! . Использование этих коэффициентов дает многочлен Тейлора для f . Многочлен Тейлора степени d — это многочлен степени d , который наилучшим образом приближает f , и его коэффициенты можно найти путем обобщения приведенных выше формул. Теорема Тейлора дает точную границу того, насколько хороша аппроксимация. Если f — многочлен степени, меньшей или равной d , то многочлен Тейлора степени d равен f .

Пределом полиномов Тейлора является бесконечный ряд, называемый рядом Тейлора . Ряд Тейлора часто является очень хорошим приближением к исходной функции. Функции, которые равны своему ряду Тейлора, называются аналитическими функциями . Функции с разрывами или острыми углами не могут быть аналитическими; более того, существуют гладкие функции , которые также не являются аналитическими.

Теорема о неявной функции

Некоторые естественные геометрические фигуры, такие как окружности , не могут быть нарисованы как график функции . Например, если f ( x , y ) = x 2 + y 2 − 1 , то окружность является множеством всех пар ( x , y ) таких, что f ( x , y ) = 0 . Это множество называется нулевым множеством функции f и не совпадает с графиком функции f , который является параболоидом . Теорема о неявной функции преобразует такие отношения, как f ( x , y ) = 0 , в функции. Она утверждает, что если f непрерывно дифференцируема , то вокруг большинства точек нулевое множество функции f выглядит как графики функций, склеенных вместе. Точки, где это неверно, определяются условием на производную функции f . Окружность, например, можно склеить из графиков двух функций ± 1 - x 2 . В окрестности каждой точки окружности, за исключением (−1, 0) и (1, 0) , одна из этих двух функций имеет график, похожий на окружность. (Эти две функции также пересекаются с (−1, 0) и (1, 0) , но это не гарантируется теоремой о неявной функции.)

Теорема о неявной функции тесно связана с теоремой об обратной функции , которая утверждает, что функция выглядит как графики обратимых функций, склеенных вместе.

Смотрите также

Примечания

  1. ^ Это не формальное определение того, что такое касательная линия. Определение производной как предела делает строгим это понятие касательной линии.
  2. ^ Хотя техническое определение функции несколько запутано, интуитивно легко понять, что такое функция. Функция принимает входные данные и выдает выходные данные. Например, функция принимает число и возводит его в квадрат. Число, над которым функция выполняет операцию, часто обозначается буквой , но нет никакой разницы между записью и записью . По этой причине часто описывается как «фиктивная переменная».
  3. ^ Термин «бесконечно малый» иногда может заставить людей ошибочно полагать, что существует «бесконечно малое число» — т. е. положительное действительное число, которое меньше любого другого действительного числа. На самом деле, термин «бесконечно малый» — это просто сокращение для предельного процесса. По этой причине — это не дробь, а, скорее, предел дроби.
  4. ^ Не каждая функция может быть дифференцирована, поэтому определение применимо только если «предел существует». Для получения дополнительной информации см. статью Википедии о дифференцируемости .
  5. ^ Ньютон начал свою работу в 1665 году, а Лейбниц — в 1676 году. Однако Лейбниц опубликовал свою первую работу в 1684 году, опередив публикацию Ньютона в 1693 году. Возможно, что Лейбниц видел черновики работы Ньютона в 1673 или 1676 году, или что Ньютон использовал работу Лейбница, чтобы усовершенствовать свою собственную. И Ньютон, и Лейбниц утверждали, что другой плагиатил их соответствующие работы. Это привело к ожесточенному спору между ними о том, кто первым изобрел исчисление, который потряс математическое сообщество в начале 18 века.
  6. ^ Это было монументальное достижение, даже несмотря на то, что ограниченная версия была ранее доказана Джеймсом Грегори (1638–1675), а некоторые ключевые примеры можно найти в работе Пьера де Ферма (1601–1665).

Ссылки

Цитаты

  1. ^ "Определение ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ". www.merriam-webster.com . Получено 2020-05-09 .
  2. ^ "Определение ИНТЕГРАЛЬНОГО ИСЧИСЛЕНИЯ". www.merriam-webster.com . Получено 2020-05-09 .
  3. ^ Alcock, Lara (2016). Как думать об анализе . Нью-Йорк: Oxford University Press. С. 155–157. ISBN 978-0-19-872353-0.
  4. ^ Weisstein, Eric W. "Производная". mathworld.wolfram.com . Получено 26.07.2020 .
  5. См . «Начала» Евклида , «Палимпсест Архимеда» и О'Коннор, Джон Дж.; Робертсон, Эдмунд Ф. , «Аполлоний Пергский», Архив истории математики Мактьютора , Университет Сент-Эндрюс
  6. ^ Ян Г. Пирс. Бхаскарачарья II. Архивировано 01.09.2016 в Wayback Machine
  7. ^ Broadbent, TAA; Kline, M. (октябрь 1968 г.). «Проверенные работы: История древнеиндийской математики К. Н. Шринивасиенгара». The Mathematical Gazette . 52 (381): 307–8. doi :10.2307/3614212. JSTOR  3614212. S2CID  176660647.
  8. ^ abc Берггрен 1990.
  9. ^ Сабра, А. И. (1981). Теории света: от Декарта до Ньютона . Cambridge University Press. стр. 144. ISBN 978-0521284363.
  10. ^ Ивс, Х. (1990).

Цитируемые работы

Другие источники