В математике и ее приложениях задача Штурма–Лиувилля — это линейное обыкновенное дифференциальное уравнение второго порядка вида для заданных функций , и , вместе с некоторыми граничными условиями при экстремальных значениях . Целями данной задачи Штурма–Лиувилля являются:
Теория Штурма–Лиувилля — это общее исследование задач Штурма–Лиувилля. В частности, для «регулярной» задачи Штурма–Лиувилля можно показать, что существует бесконечное число собственных значений, каждое из которых имеет уникальную собственную функцию, и что эти собственные функции образуют ортонормированный базис определенного гильбертова пространства функций.
Эта теория важна в прикладной математике , где задачи Штурма–Лиувилля встречаются очень часто, особенно при работе с разделяемыми линейными уравнениями в частных производных . Например, в квантовой механике одномерное независимое от времени уравнение Шредингера является задачей Штурма–Лиувилля.
Теория Штурма–Лиувилля названа в честь Жака Шарля Франсуа Штурма (1803–1855) и Жозефа Лиувилля (1809–1882), которые разработали эту теорию.
Основные результаты теории Штурма–Лиувилля применимы к задаче Штурма–Лиувилля
на конечном интервале , который является «регулярным». Задача называется регулярной, если:
Функция , иногда обозначаемая , называется функцией веса или плотности .
Целями задачи Штурма–Лиувилля являются:
Для регулярной задачи Штурма–Лиувилля функция называется решением, если она непрерывно дифференцируема и удовлетворяет уравнению ( 1 ) при каждом . В случае более общего решения следует понимать в слабом смысле .
Термины собственное значение и собственный вектор используются, поскольку решения соответствуют собственным значениям и собственным функциям эрмитова дифференциального оператора в подходящем гильбертовом пространстве функций со скалярным произведением , определяемым с помощью весовой функции. Теория Штурма–Лиувилля изучает существование и асимптотическое поведение собственных значений, соответствующую качественную теорию собственных функций и их полноту в функциональном пространстве.
Основной результат теории Штурма–Лиувилля гласит, что для любой регулярной задачи Штурма–Лиувилля:
Говорят, что дифференциальное уравнение ( 1 ) находится в форме Штурма–Лиувилля или самосопряженной форме . Все линейные однородные обыкновенные дифференциальные уравнения второго порядка можно переписать в форме, представленной в левой части ( 1 ), умножив обе стороны уравнения на соответствующий интегрирующий множитель (хотя то же самое не относится к уравнениям в частных производных второго порядка или если y — вектор ). Ниже приведены некоторые примеры.
что можно записать в форме Штурма–Лиувилля (сначала разделив на x , а затем свернув первые два члена слева в один) как
который можно легко привести к форме Штурма–Лиувилля, поскольку г/дх (1 − x 2 ) = −2 x , поэтому уравнение Лежандра эквивалентно
Разделим все на x 3 :
Умножение на интегрирующий множитель дает , что можно легко привести к форме Штурма–Лиувилля, поскольку дифференциальное уравнение эквивалентно
Умножение на интегрирующий множитель и последующее суммирование дает форму Штурма–Лиувилля: или, в явном виде:
Отображение, определяемое: можно рассматривать как линейный оператор L, отображающий функцию u в другую функцию Lu , и его можно изучать в контексте функционального анализа . Фактически, уравнение ( 1 ) можно записать как
Это и есть задача собственных значений ; то есть ищутся собственные значения λ 1 , λ 2 , λ 3 ,... и соответствующие собственные векторы u 1 , u 2 , u 3 ,... оператора L. Правильным заданием для этой задачи является гильбертово пространство со скалярным произведением
В этом пространстве L определен на достаточно гладких функциях, удовлетворяющих указанным выше регулярным граничным условиям. Более того, L является самосопряженным оператором:
Это можно увидеть формально, используя интегрирование по частям дважды, где граничные члены исчезают в силу граничных условий. Тогда следует, что собственные значения оператора Штурма–Лиувилля являются действительными, а собственные функции L, соответствующие различным собственным значениям, ортогональны. Однако этот оператор неограничен , и, следовательно, существование ортонормированного базиса собственных функций неочевидно. Чтобы преодолеть эту проблему, нужно рассмотреть резольвенту, где z не является собственным значением. Затем вычисление резольвенты сводится к решению неоднородного уравнения, что можно сделать с помощью формулы вариации параметров . Это показывает, что резольвента является интегральным оператором с непрерывным симметричным ядром ( функцией Грина задачи). Как следствие теоремы Арцела–Асколи , этот интегральный оператор компактен, и существование последовательности собственных значений α n , которые сходятся к 0, и собственных функций, которые образуют ортонормированный базис, следует из спектральной теоремы для компактных операторов . Наконец, отметим, что эквивалентны, поэтому мы можем взять те же самые собственные функции.
Если интервал не ограничен или коэффициенты имеют сингулярности в граничных точках, то L называют сингулярным. В этом случае спектр больше не состоит из одних только собственных значений и может содержать непрерывную компоненту. Все еще существует связанное разложение собственных функций (похожее на ряд Фурье против преобразования Фурье). Это важно в квантовой механике , поскольку одномерное независимое от времени уравнение Шредингера является частным случаем уравнения Штурма–Лиувилля.
Рассмотрим общее неоднородное линейное дифференциальное уравнение второго порядка для заданных функций . Как и прежде, его можно свести к форме Штурма–Лиувилля : записав общий оператор Штурма–Лиувилля как: решается система:
Достаточно решить первые два уравнения, что равносильно решению ( Pw )′ = Qw , или
Решение:
Учитывая это преобразование, осталось решить:
В общем случае, если в некоторой точке заданы начальные условия, например, y ( a ) = 0 и y ′( a ) = 0 , дифференциальное уравнение второго порядка можно решить обычными методами, а теорема Пикара–Линделёфа гарантирует, что дифференциальное уравнение имеет единственное решение в окрестности точки, в которой заданы начальные условия.
Но если вместо указания начальных значений в одной точке , желательно указать значения в двух разных точках (так называемые граничные значения), например y ( a ) = 0 и y ( b ) = 1 , задача оказывается намного сложнее. Обратите внимание, что, добавляя подходящую известную дифференцируемую функцию к y , значения которой в a и b удовлетворяют желаемым граничным условиям, и вводя внутрь предлагаемого дифференциального уравнения, можно предположить без потери общности, что граничные условия имеют вид y ( a ) = 0 и y ( b ) = 0 .
Здесь в игру вступает теория Штурма–Лиувилля: действительно, большой класс функций f можно разложить в виде ряда ортонормированных собственных функций u i ассоциированного оператора Лиувилля с соответствующими собственными значениями λ i :
Тогда решение предложенного уравнения, очевидно, имеет вид:
Это решение будет справедливо только на открытом интервале a < x < b и может потерпеть неудачу на границах.
Рассмотрим задачу Штурма–Лиувилля:
для неизвестных λ и u ( x ) . Для граничных условий возьмем, например:
Заметим, что если k — любое целое число, то функция является решением с собственным значением λ = k 2 . Мы знаем, что решения задачи Штурма–Лиувилля образуют ортогональный базис , и из рядов Фурье мы знаем , что этот набор синусоидальных функций является ортогональным базисом. Поскольку ортогональные базисы всегда максимальны (по определению), мы заключаем, что задача Штурма–Лиувилля в этом случае не имеет других собственных векторов.
Учитывая вышесказанное, давайте теперь решим неоднородную задачу с теми же граничными условиями . В этом случае мы должны разложить f ( x ) = x в ряд Фурье. Читатель может проверить, либо проинтегрировав ∫ e ikx x dx , либо обратившись к таблице преобразований Фурье, что мы таким образом получаем
Этот конкретный ряд Фурье вызывает проблемы из-за своих плохих свойств сходимости. Априори неясно, сходится ли ряд поточечно. Из-за анализа Фурье, поскольку коэффициенты Фурье являются « квадратно-суммируемыми », ряд Фурье сходится в L 2 , что является всем, что нам нужно для функционирования этой конкретной теории. Для заинтересованного читателя отметим, что в этом случае мы можем положиться на результат, который гласит, что ряды Фурье сходятся в каждой точке дифференцируемости, а в точках скачка (функция x , рассматриваемая как периодическая функция, имеет скачок в π ) сходятся к среднему значению левого и правого пределов (см. сходимость рядов Фурье ).
Поэтому, используя формулу ( 4 ), получаем решение:
В этом случае мы могли бы найти ответ, используя антидифференциацию , но в большинстве случаев, когда дифференциальное уравнение имеет много переменных, это уже бесполезно.
Некоторые частные дифференциальные уравнения могут быть решены с помощью теории Штурма–Лиувилля. Предположим, что нас интересуют колебательные моды тонкой мембраны, удерживаемой в прямоугольной рамке, 0 ≤ x ≤ L 1 , 0 ≤ y ≤ L 2 . Уравнение движения для вертикального смещения мембраны, W ( x , y , t ) задается волновым уравнением :
Метод разделения переменных предполагает поиск сначала решений простого вида W = X ( x ) × Y ( y ) × T ( t ) . Для такой функции W уравнение в частных производных становится Х ″/Х + Y ″/И = 1/с 2 Т ″/Т . Поскольку три члена этого уравнения являются функциями x , y , t по отдельности, они должны быть константами. Например, первый член дает X ″ = λX для константы λ . Граничные условия («удерживаемые в прямоугольной рамке») равны W = 0 при x = 0 , L 1 или y = 0 , L 2 и определяют простейшие возможные задачи собственных значений Штурма–Лиувилля, как в примере, давая «решения в нормальном режиме» для W с гармонической зависимостью от времени, где m и n — ненулевые целые числа , A mn — произвольные константы, и
Функции W mn образуют основу гильбертова пространства (обобщенных) решений волнового уравнения; то есть произвольное решение W может быть разложено на сумму этих мод, которые колеблются на своих индивидуальных частотах ω mn . Это представление может потребовать сходящейся бесконечной суммы.
Рассмотрим линейное дифференциальное уравнение второго порядка в одном пространственном измерении и первого порядка по времени вида:
Разделяя переменные, мы предполагаем, что Тогда наше приведенное выше уравнение в частных производных можно записать как: где
Поскольку, по определению, L̂ и X ( x ) не зависят от времени t , а M̂ и T ( t ) не зависят от положения x , то обе стороны приведенного выше уравнения должны быть равны константе:
Первое из этих уравнений должно быть решено как задача Штурма–Лиувилля в терминах собственных функций X n ( x ) и собственных значений λ n . Второе из этих уравнений может быть решено аналитически, как только собственные значения известны.
где
Дифференциальное уравнение Штурма–Лиувилля ( 1 ) с граничными условиями может быть решено аналитически, что может быть точным или давать приближение, методом Рэлея–Ритца или матрично-вариационным методом Герка и др. [1] [2] [3]
Численно также доступны различные методы. В сложных случаях может потребоваться выполнить промежуточные вычисления с точностью до нескольких сотен знаков после запятой, чтобы получить собственные значения с точностью до нескольких знаков после запятой.
Методы стрельбы осуществляются путем угадывания значения λ , решения задачи начального значения, определенной граничными условиями в одной конечной точке, скажем, a , интервала [ a , b ] , сравнения значения, которое это решение принимает в другой конечной точке b, с другим желаемым граничным условием и, наконец, увеличения или уменьшения λ по мере необходимости для исправления исходного значения. Эта стратегия неприменима для поиска комплексных собственных значений. [ необходимо разъяснение ]
Метод спектральных степенных рядов параметров (SPPS) использует обобщение следующего факта об однородных линейных обыкновенных дифференциальных уравнениях второго порядка: если y является решением уравнения ( 1 ), которое не обращается в нуль ни в одной точке [ a , b ] , то функция
является решением того же уравнения и линейно независима от y . Кроме того, все решения являются линейными комбинациями этих двух решений. В алгоритме SPPS необходимо начать с произвольного значения λ∗
0(часто λ∗
0= 0 ; оно не обязательно должно быть собственным значением) и любое решение y 0 уравнения ( 1 ) с λ = λ∗
0который не обращается в нуль на [ a , b ] . (Ниже обсуждаются способы нахождения соответствующих y0 и λ∗
0.) Две последовательности функций X ( n ) ( t ) , X̃ ( n ) ( t ) на [ a , b ] , называемые повторными интегралами , определяются рекурсивно следующим образом. Сначала при n = 0 они принимаются тождественно равными 1 на [ a , b ] . Для получения следующих функций они поочередно умножаются на 1/py2
0 и wy2
0и интегрируем, в частности, для n > 0 :
Полученные повторные интегралы теперь применяются как коэффициенты в следующих двух степенных рядах по λ : Тогда для любого λ (действительного или комплексного) u 0 и u 1 являются линейно независимыми решениями соответствующего уравнения ( 1 ). (Функции p ( x ) и q ( x ) принимают участие в этой конструкции посредством своего влияния на выбор y 0 .)
Далее выбираются коэффициенты c 0 и c 1 так, чтобы комбинация y = c 0 u 0 + c 1 u 1 удовлетворяла первому граничному условию ( 2 ). Это просто сделать, поскольку X ( n ) ( a ) = 0 и X̃ ( n ) ( a ) = 0 для n > 0. Значения X ( n ) ( b ) и X̃ ( n ) ( b ) дают значения u 0 ( b ) и u 1 ( b ) и производные u ′ 0 ( b ) и u ′ 0 ( b ) , поэтому второе граничное условие ( 3 ) становится уравнением в степенном ряду по λ . Для численной работы можно усечь этот ряд до конечного числа членов, получив вычислимый полином по λ, корни которого являются приближениями искомых собственных значений.
При λ = λ 0 это сводится к исходной конструкции, описанной выше для решения, линейно независимого от заданного. Представления ( 5 ) и ( 6 ) также имеют теоретические приложения в теории Штурма–Лиувилля. [6]
Метод SPPS может быть использован для поиска начального решения y 0 . Рассмотрим уравнение ( py ′)′ = μqy ; т. е. q , w , и λ заменяются в ( 1 ) на 0, − q , и μ соответственно. Тогда постоянная функция 1 является неисчезающим решением, соответствующим собственному значению μ 0 = 0 . Хотя нет никакой гарантии, что u 0 или u 1 не исчезнут, комплексная функция y 0 = u 0 + iu 1 никогда не исчезнет, потому что два линейно-независимых решения регулярного уравнения Штурма–Лиувилля не могут исчезнуть одновременно в результате теоремы Штурма о разделении . Этот трюк дает решение y 0 уравнения ( 1 ) для значения λ 0 = 0 . На практике, если ( 1 ) имеет действительные коэффициенты, решения, основанные на y0 , будут иметь очень малые мнимые части, которые необходимо отбросить.