В исчислении интегрирование путем подстановки , также известное как u -подстановка , правило обратной цепочки или замена переменных , [1] является методом оценки интегралов и первообразных . Это аналог правила цепочки для дифференцирования , и его можно в общих чертах рассматривать как использование правила цепочки «назад».
Прежде чем строго сформулировать результат , рассмотрим простой случай с использованием неопределенных интегралов .
Вычислить [2]
Задайте Это означает или как дифференциальную форму , Теперь: где - произвольная постоянная интегрирования .
Эта процедура часто используется, но не все интегралы имеют форму, которая позволяет ее использовать. В любом случае результат должен быть проверен путем дифференцирования и сравнения с исходным подынтегральным выражением. Для определенных интегралов пределы интегрирования также должны быть скорректированы, но процедура в основном та же самая.
Пусть — дифференцируемая функция с непрерывной производной, где — интервал . Предположим, что — непрерывная функция . Тогда: [3]
В обозначениях Лейбница подстановка дает: Эвристическая работа с бесконечно малыми величинами дает уравнение , которое предполагает приведенную выше формулу подстановки. (Это уравнение можно строго обосновать, интерпретируя его как утверждение о дифференциальных формах .) Можно рассматривать метод интегрирования путем подстановки как частичное обоснование обозначений Лейбница для интегралов и производных.
Формула используется для преобразования одного интеграла в другой интеграл, который легче вычислить. Таким образом, формулу можно читать слева направо или справа налево, чтобы упростить заданный интеграл. При использовании в первом способе ее иногда называют u -подстановкой или w -подстановкой , в которой новая переменная определяется как функция исходной переменной, найденной внутри сложной функции, умноженной на производную внутренней функции. Последний способ обычно используется в тригонометрической подстановке , заменяя исходную переменную тригонометрической функцией новой переменной, а исходный дифференциал — дифференциалом тригонометрической функции.
Интеграция подстановкой может быть выведена из основной теоремы исчисления следующим образом. Пусть и — две функции, удовлетворяющие приведенной выше гипотезе, непрерывные на и интегрируемые на замкнутом интервале . Тогда функция также интегрируема на . Следовательно, интегралы и фактически существуют, и остается показать, что они равны.
Так как является непрерывным, то имеет первообразную . Затем определяется составная функция . Так как является дифференцируемой, объединение цепного правила и определения первообразной дает:
Применив основную теорему исчисления дважды, получаем: что является правилом подстановки.
Подстановка может быть использована для определения первообразных . Выбирается отношение между и определяется соответствующее отношение между и путем дифференцирования, и выполняются подстановки. Первообразная для подставленной функции, как можно надеяться, может быть определена; исходная подстановка между и затем отменяется.
Рассмотрим интеграл: Сделайте замену , чтобы получить значение Следовательно: где — произвольная постоянная интегрирования .
Функцию тангенса можно проинтегрировать с помощью подстановки, выразив ее через синус и косинус: .
Используя замену, получаем и
Функцию котангенса можно интегрировать аналогично, выразив ее как и используя подстановку :
При оценке определенных интегралов путем подстановки можно сначала полностью вычислить первообразную, а затем применить граничные условия. В этом случае нет необходимости преобразовывать граничные члены. В качестве альтернативы можно сначала полностью вычислить неопределенный интеграл (см. выше), а затем применить граничные условия. Это становится особенно удобным, когда используются множественные подстановки.
Рассмотрим интеграл: Сделайте замену, чтобы получить значение Следовательно: Поскольку нижний предел был заменен на , а верхний предел на , преобразование обратно в термины было ненужным.
Для интеграла требуется вариация вышеприведенной процедуры. Подстановка, подразумевающая , полезна, поскольку Таким образом, мы имеем:
Полученный интеграл можно вычислить с помощью интегрирования по частям или формулы двойного угла , за которой следует еще одна подстановка. Можно также отметить, что интегрируемая функция представляет собой верхнюю правую четверть круга с радиусом один, и, следовательно, интегрирование верхней правой четверти от нуля до единицы является геометрическим эквивалентом площади одной четверти единичного круга, или
При интегрировании функций нескольких переменных можно также использовать подстановку .
Здесь функция подстановки ( v 1 ,..., v n ) = φ ( u 1 , ..., u n ) должна быть инъективной и непрерывно дифференцируемой, а дифференциалы преобразуются как: где det( Dφ )( u 1 , ..., u n ) обозначает определитель матрицы Якоби частных производных φ в точке ( u 1 , ..., u n ) . Эта формула выражает тот факт, что абсолютное значение определителя матрицы равно объему параллелоэдра , натянутого на ее столбцы или строки.
Точнее, формула замены переменных сформулирована в следующей теореме:
Теорема — Пусть U — открытое множество в R n и φ : U → R n — инъективная дифференцируемая функция с непрерывными частными производными, якобиан которой отличен от нуля для каждого x из U. Тогда для любой действительной, компактной, непрерывной функции f с носителем, содержащимся в φ ( U ) :
Условия теоремы можно ослабить различными способами. Во-первых, требование, чтобы φ была непрерывно дифференцируемой, можно заменить более слабым предположением, что φ должна быть просто дифференцируемой и иметь непрерывную обратную функцию. [4] Это гарантированно выполняется, если φ непрерывно дифференцируема по теореме об обратной функции . В качестве альтернативы, требование, чтобы det( Dφ ) ≠ 0, можно устранить, применив теорему Сарда . [5]
Для измеримых по Лебегу функций теорему можно сформулировать в следующем виде: [6]
Теорема — Пусть U — измеримое подмножество R n и φ : U → R n — инъективная функция , и предположим, что для каждого x в U существует φ ′( x ) в R n , n такой, что φ ( y ) = φ ( x ) + φ′ ( x )( y − x ) + o (‖ y − x ‖) при y → x (здесь o — обозначение с небольшим о ). Тогда φ ( U ) измерима, и для любой действительной функции f, определенной на φ ( U ) : в том смысле, что если существует любой из интегралов (включая возможность быть собственно бесконечным), то существует и другой, и они имеют одинаковое значение.
Другая очень общая версия в теории меры такова: [7]
Теорема — Пусть X — локально компактное хаусдорфово пространство , снабженное конечной мерой Радона μ , и пусть Y — σ-компактное хаусдорфово пространство с σ-конечной мерой Радона ρ . Пусть φ : X → Y — абсолютно непрерывная функция (где последнее означает, что ρ ( φ ( E )) = 0 всякий раз, когда μ ( E ) = 0 ). Тогда существует вещественнозначная измеримая по Борелю функция w на X такая, что для любой интегрируемой по Лебегу функции f : Y → R функция ( f ∘ φ ) ⋅ w интегрируема по Лебегу на X , и Более того, можно записать для некоторой измеримой по Борелю функции g на Y .
В геометрической теории меры интегрирование путем подстановки используется с липшицевыми функциями . Билипшицева функция — это липшицева функция φ : U → R n , которая инъективна и обратная функция которой φ −1 : φ ( U ) → U также является липшицевой. По теореме Радемахера билипшицево отображение дифференцируемо почти всюду . В частности, определитель Якоби билипшицева отображения det Dφ корректно определен почти всюду. Тогда справедлив следующий результат:
Теорема — Пусть U — открытое подмножество R n и φ : U → R n — билипшицево отображение. Пусть f : φ ( U ) → R измеримо. Тогда в том смысле, что если один из интегралов существует (или собственно бесконечен), то существует и другой, и они имеют одинаковое значение.
Вышеуказанная теорема была впервые предложена Эйлером , когда он разработал понятие двойных интегралов в 1769 году. Хотя она была обобщена на тройные интегралы Лагранжем в 1773 году и использовалась Лежандром , Лапласом и Гауссом , а также впервые обобщена на n переменных Михаилом Остроградским в 1836 году, она удивительно долго сопротивлялась полностью строгому формальному доказательству и была впервые удовлетворительно решена 125 лет спустя Эли Картаном в серии статей, начавшихся в середине 1890-х годов. [8] [9]
Подстановку можно использовать для ответа на следующий важный вопрос теории вероятности: если дана случайная величина X с плотностью вероятности p X и другая случайная величина Y такая, что Y = ϕ ( X ) для инъективного (один к одному) ϕ , какова плотность вероятности для Y ?
Проще всего ответить на этот вопрос, сначала ответив на немного другой вопрос: какова вероятность того, что Y принимает значение в некотором конкретном подмножестве S ? Обозначим эту вероятность P ( Y ∈ S ). Конечно, если Y имеет плотность вероятности p Y , то ответ будет: но это не очень полезно, потому что мы не знаем p Y ; это то, что мы пытаемся найти. Мы можем продвинуться вперед, рассмотрев задачу в переменной X . Y принимает значение в S всякий раз, когда X принимает значение в , так что:
Переход от переменной x к y дает: Объединение этого с нашим первым уравнением дает: итак:
В случае, когда X и Y зависят от нескольких некоррелированных переменных (т.е. и ), можно найти путем подстановки в несколько переменных, обсуждавшихся выше. Результат: