stringtranslate.com

Симметрия вторых производных

В математике симметрия вторых производных (также называемая равенством смешанных частных производных ) относится к возможности менять порядок взятия частных производных функции .

переменных без изменения результата при определенных условиях (см. ниже). Симметрия - это утверждение, что частные производные второго порядка удовлетворяют тождеству

так что они образуют симметричную матрицу , известную как матрица Гессе функции . Достаточные условия для выполнения указанной выше симметрии устанавливаются результатом, известным как теорема Шварца , теорема Клеро или теорема Юнга . [1] [2]

В контексте уравнений в частных производных это называется условием интегрируемости Шварца .

Формальные выражения симметрии

Символически симметрию можно выразить так:

Другое обозначение:

С точки зрения композиции дифференциального оператора D i , который принимает частную производную по x i :

.

Из этого соотношения следует, что кольцо дифференциальных операторов с постоянными коэффициентами , порожденное Di , коммутативно ; но это верно только для операторов над областью достаточно дифференцируемых функций. Легко проверить симметрию применительно к мономам , так что в качестве области определения можно взять многочлены от xi . Фактически, гладкие функции — еще одна допустимая область применения.

История

Результат о равенстве смешанных частных производных при определенных условиях имеет долгую историю. Список неудачных предложенных доказательств начался с доказательства Эйлера , опубликованного в 1740 году [3], хотя уже в 1721 году Бернулли неявно предположил этот результат без формального обоснования. [4] Клеро также опубликовал предложенное доказательство в 1740 году, без каких-либо других попыток до конца 18 века. Начиная с этого момента, в течение 70 лет, был предложен ряд неполных доказательств. Доказательство Лагранжа (1797) было усовершенствовано Коши (1823), но предполагалось существование и непрерывность частных производных и . [5] Другие попытки были предприняты П. Бланше (1841 г.), Дюамелем (1856 г.), Штурмом (1857 г.), Шлёмильхом (1862 г.) и Бертраном (1864 г.). Наконец, в 1867 году Линделёф систематически проанализировал все ранее ошибочные доказательства и смог продемонстрировать конкретный контрпример, в котором смешанные производные не были равны. [6] [7]

Шесть лет спустя Шварцу удалось дать первое строгое доказательство. [8] Позже Дини внес свой вклад, обнаружив более общие условия, чем у Шварца. В конце концов, в 1883 году Джордан нашел более чистую и более общую версию, которая до сих пор является доказательством, которое можно найти в большинстве учебников. Незначительные варианты более ранних доказательств были опубликованы Лораном (1885 г.), Пеано (1889 и 1893 гг.), Дж. Эдвардсом (1892 г.), П. Хаагом (1893 г.), Дж. К. Уиттемором (1898 г.), Виванти (1899 г.) и Пьерпонтом (1905 г.). Дальнейший прогресс был достигнут в 1907-1909 годах, когда Э. У. Хобсон и У. Янг нашли доказательства с более слабыми условиями, чем у Шварца и Дини. В 1918 году Каратеодори дал другое доказательство, основанное на интеграле Лебега . [7]

Теорема Шварца

В математическом анализе теорема Шварца (или теорема Клеро о равенстве смешанных частей ) [9] , названная в честь Алексиса Клеро и Германа Шварца , утверждает, что для функции , определенной на множестве , if является точкой такой, что некоторая окрестность содержится в и имеет непрерывные вторые частные производные в этой окрестности , то для всех i и j в

Частные производные этой функции коммутируют в этой точке.

Один простой способ установить эту теорему (в случае, когда , и , что легко влечет за собой общий результат) — применить теорему Грина к градиенту

Элементарное доказательство для функций на открытых подмножествах плоскости таково (простой редукцией общий случай теоремы Шварца легко сводится к плоскому случаю). [10] Пусть — дифференцируемая функция на открытом прямоугольнике , содержащем точку , и предположим, что она непрерывна с непрерывным и над Определить

Эти функции определены для , где и содержится в

По теореме о среднем значении для фиксированного h и k , отличного от нуля, можно найти в открытом интервале с

Поскольку первое равенство ниже можно разделить на :

Стремясь к нулю в последнем равенстве, из предположений о непрерывности и теперь следует, что

Это описание представляет собой простой классический метод, который можно найти во многих учебниках, например, у Беркилла, Апостола и Рудина. [10] [11] [12]

Хотя приведенный выше вывод является элементарным, этот подход также можно рассматривать с более концептуальной точки зрения, чтобы результат стал более очевидным. [13] [14] [15] [16] [17] Действительно, разностные операторы коммутируют и стремятся к 0, с аналогичным утверждением для операторов второго порядка. [a] Здесь для вектора на плоскости и вектора направления или разностный оператор определяется выражением

По основной теореме исчисления для функций на отрезке с

Следовательно

.

Это обобщенная версия теоремы о среднем значении . Напомним, что элементарное обсуждение максимумов и минимумов вещественнозначных функций подразумевает, что если функция непрерывна на и дифференцируема на , то существует точка в такой, что

Для вектор-функций с конечномерным нормированным пространством аналога приведенного выше равенства не существует, более того, оно неверно. Но поскольку , приведенное выше неравенство является полезной заменой. Более того, использование спаривания двойственного с его двойственной нормой приводит к следующему неравенству:

.

Эти версии теоремы о среднем обсуждаются у Рудина, Хёрмандера и других авторов. [19] [20]

Для функции на открытом множестве на плоскости определите и . Кроме того, для набора

.

Тогда для открытого множества обобщенную теорему о среднем значении можно применить дважды:

Таким образом , стремится к 0. Тот же аргумент показывает, что стремится к . Следовательно, поскольку разностные операторы коммутируют, то же самое делают и операторы в частных производных и , как утверждается. [21] [22] [23] [24] [25]

Замечание. По двум применениям классической теоремы о среднем значении:

для некоторых и в . Таким образом, первое элементарное доказательство можно переинтерпретировать с помощью разностных операторов. И наоборот, вместо использования обобщенной теоремы о среднем значении во втором доказательстве можно использовать классическую теорему о среднем значении.

Доказательство теоремы Клеро с помощью повторных интегралов.

Свойства повторных интегралов Римана непрерывной функции F на компактном прямоугольнике [ a , b ] × [ c , d ] легко устанавливаются. [26] Из равномерной непрерывности F немедленно следует, что функции и непрерывны. [27] Отсюда следует, что

;

более того, очевидно, что повторный интеграл положителен, если F положителен. [28] Приведенное выше равенство представляет собой простой случай теоремы Фубини , не включающий в себя теорию меры . Титчмарш (1939) доказывает это простым способом, используя аппроксимирующие суммы Римана , соответствующие подразделениям прямоугольника на меньшие прямоугольники.

Чтобы доказать теорему Клеро, предположим, что f — дифференцируемая функция на открытом множестве U , для которой смешанные вторые частные производные fyx и fxy существуют и непрерывны. Дважды используя фундаментальную теорему исчисления ,

Сходным образом

Таким образом, два повторных интеграла равны. С другой стороны, поскольку f xy ( x , y ) является непрерывным, второй повторный интеграл может быть выполнен путем сначала интегрирования по x , а затем по y . Но тогда повторный интеграл от f yxf xy на [ a , b ] × [ c , d ] должен обратиться в нуль. Однако если повторный интеграл непрерывной функции F обращается в нуль для всех прямоугольников, то F должен быть тождественно нулю; в противном случае F или F были бы строго положительными в некоторой точке и, следовательно, по непрерывности на прямоугольнике, что невозможно. Следовательно, f yxf xy должно быть тождественно равно нулю, так что f yx = f xy всюду. [29] [30] [31] [32] [33]

Достаточность дважды-дифференцируемости

Более слабое условие, чем непрерывность вторых частных производных (которое подразумевается последним), которого достаточно для обеспечения симметрии, состоит в том, что все частные производные сами по себе дифференцируемы . [34] Другое усиление теоремы, в котором утверждается существование перестановочного смешанного частичного, было предложено Пеано в короткой заметке 1890 года о Mathesis :

Если определено на открытом множестве ; и существуют повсюду на ; непрерывен в , и если существует в окрестности , то существует в и . [35]

Формулировка теории распределения

Теория распределений (обобщенных функций) устраняет аналитические проблемы с симметрией. Производную интегрируемой функции всегда можно определить как распределение, а симметрия смешанных частных производных всегда соблюдается как равенство распределений. Использование формального интегрирования по частям для определения дифференциации распределений возвращает вопрос симметрии к пробным функциям , которые являются гладкими и заведомо удовлетворяют этой симметрии. Более подробно (где f — распределение, записанное в виде оператора над пробными функциями, а φ — пробная функция),

Другой подход, определяющий преобразование Фурье функции, заключается в том, чтобы отметить, что при таких преобразованиях частные производные становятся операторами умножения, коммутация которых гораздо более очевидна. [а]

Требование непрерывности

Симметрия может быть нарушена, если функция не имеет дифференцируемых частных производных, что возможно, если не выполняется теорема Клеро (вторые частные производные не являются непрерывными ).

Функция f ( x ,  y ), как показано в уравнении ( 1 ), не имеет симметричных вторых производных в начале.

Примером несимметрии является функция (по Пеано ) [36] [37]

Это можно визуализировать с помощью полярной формы ; он всюду непрерывен, но его производные в точке (0, 0) не могут быть вычислены алгебраически. Скорее, предел разностных коэффициентов показывает, что , поэтому график имеет горизонтальную касательную плоскость в точке (0, 0) , а частные производные существуют и всюду непрерывны. Однако вторые частные производные не являются непрерывными в точке (0, 0) , и симметрия нарушается. Фактически, по оси x производная по y равна , и так:

Напротив, вдоль оси Y расположена производная x , и т.д. То есть в точке (0, 0) , хотя смешанные частные производные действительно существуют, и в любой другой точке симметрия сохраняется.

Вышеуказанную функцию, записанную в цилиндрической системе координат, можно выразить как

показывая, что функция колеблется четыре раза при одиночном обходе произвольно малого цикла, содержащего начало координат. Следовательно, интуитивно локальное поведение функции в точке (0, 0) не может быть описано как квадратичная форма, и, таким образом, матрица Гессе не может быть симметричной.

В общем, обмен ограничивающими операциями не требует коммутации . Учитывая две переменные вблизи (0, 0) и два предельных процесса на

соответствующее сначала сделать h → 0, а затем сначала сделать k → 0. Это может иметь значение, если учитывать члены первого порядка, которые применяются первыми. Это приводит к построению патологических примеров, в которых вторые производные несимметричны. Примеры такого рода относятся к теории реального анализа , где значение функции имеет значение поточечно. Если рассматривать его как распределение, значения второй частной производной можно изменить в произвольном наборе точек, если он имеет меру Лебега 0. Поскольку в примере гессиан симметричен везде, кроме (0, 0) , противоречия с тот факт, что гессиан, рассматриваемый как распределение Шварца , симметричен.

В теории лжи

Считайте, что дифференциальные операторы первого порядка D i являются инфинитезимальными операторами в евклидовом пространстве . То есть D i в некотором смысле генерирует однопараметрическую группу перемещений, параллельных оси x i . Эти группы коммутируют друг с другом, и, следовательно, бесконечно малые генераторы тоже коммутируют; скобка Лжи

[ D я , D j ] знак равно 0

является отражением этого свойства. Другими словами, производная Ли одной координаты по другой равна нулю.

Приложение к дифференциальным формам

Теорема Клеро-Шварца является ключевым фактом, необходимым для доказательства того, что для каждой (или по крайней мере дважды дифференцируемой) дифференциальной формы вторая внешняя производная равна нулю: . Это означает, что каждая дифференцируемая точная форма (т. е. такая, что для некоторой формы ) замкнута (т. е. ), поскольку . [38]

В середине 18 в. теория дифференциальных форм была впервые изучена в простейшем случае 1-форм на плоскости, т. е . где и – функции на плоскости. Изучение 1-форм и дифференциалов функций началось с работ Клеро в 1739 и 1740 годах. На этом этапе его исследования интерпретировались как способы решения обыкновенных дифференциальных уравнений . Формально Клеро показал, что 1-форма на открытом прямоугольнике замкнута, т . е. имеет форму для некоторой функции в круге. Решение для можно записать по интегральной формуле Коши

в то время как если закрытое свойство является тождественным . (В современном языке это один из вариантов леммы Пуанкаре .) [39]

Примечания

  1. ^ ab Их также можно перефразировать в терминах действия операторов на функции Шварца на плоскости. При преобразовании Фурье операторы разности и дифференциала являются просто операторами умножения. [18]
  1. ^ «Теорема Юнга» (PDF) . Калифорнийский университет в Беркли. Архивировано из оригинала (PDF) 18 мая 2006 г. Проверено 2 января 2015 г.
  2. ^ Аллен 1964, стр. 300–305.
  3. ^ Эйлер 1740.
  4. ^ Sandifer 2007, стр. 142–147, сноска: Comm. акад. наук. Имп. Петрополь. 7 (1734/1735) 1740 , 174–189, 180–183; Опера Омния , 1.22, 34-56..
  5. ^ Мингуцци 2015.
  6. ^ Линделеф 1867.
  7. ^ аб Хиггинс 1940.
  8. ^ Шварц 1873.
  9. ^ Джеймс 1966, с.  [ нужна страница ] .
  10. ^ аб Беркилл 1962, стр. 154–155.
  11. ^ Апостол 1965.
  12. ^ Рудин 1976.
  13. ^ Hörmander 2015, стр. 7, 11. Этот сокращенный отчет, возможно, самый короткий.
  14. ^ Дьедонне 1960, стр. 179–180.
  15. ^ Годемент 1998b, стр. 287–289.
  16. ^ Ланг 1969, стр. 108–111.
  17. ^ Картан 1971, стр. 64–67.
  18. ^ Хёрмандер 2015, Глава VII.
  19. ^ Хёрмандер 2015, с. 6.
  20. ^ Рудин 1976, с.  [ нужна страница ] .
  21. ^ Хёрмандер 2015, с. 11.
  22. ^ Дьедонне 1960.
  23. ^ Годемент 1998а.
  24. ^ Ланг 1969.
  25. ^ Картан 1971.
  26. ^ Титчмарш 1939, с.  [ нужна страница ] .
  27. ^ Титчмарш 1939, стр. 23–25.
  28. ^ Титчмарш 1939, стр. 49–50.
  29. ^ Спивак 1965, с. 61.
  30. ^ МакГрат 2014.
  31. ^ Аксой и Мартелли 2002.
  32. ^ Экслер 2020, стр. 142–143.
  33. ^ Маршалл, Дональд Э., Теоремы Фубини и Клеро (PDF) , Вашингтонский университет
  34. ^ Хаббард и Хаббард 2015, стр. 732–733.
  35. ^ Рудин 1976, стр. 235–236.
  36. ^ Хобсон 1921, стр. 403–404.
  37. ^ Апостол 1974, стр. 358–359.
  38. ^ Вт 2010.
  39. ^ Кац 1981.

Рекомендации

дальнейшее чтение