stringtranslate.com

Симметрия вторых производных

В математике симметрия вторых производных (также называемая равенством смешанных частных производных ) заключается в том, что при изменении порядка частных производных многомерной функции

не изменяет результат, если выполняются некоторые условия непрерывности (см. ниже); то есть частные производные второго порядка удовлетворяют тождествам

Другими словами, матрица частных производных второго порядка, известная как матрица Гессе , является симметричной матрицей .

Достаточные условия для соблюдения симметрии задаются теоремой Шварца , также называемой теоремой Клеро или теоремой Юнга . [1] [2]

В контексте уравнений в частных производных это называется условием интегрируемости Шварца .

Формальные выражения симметрии

В символах симметрию можно выразить так:

Другое обозначение:

В терминах композиции дифференциального оператора D i , который берет частную производную по x i :

.

Из этого соотношения следует, что кольцо дифференциальных операторов с постоянными коэффициентами , порожденное D i , коммутативно ; но это верно только для операторов над областью достаточно дифференцируемых функций. Легко проверить симметрию применительно к мономам , так что можно взять многочлены от x i как область. Фактически, гладкие функции являются другой допустимой областью.

История

Результат о равенстве смешанных частных производных при определенных условиях имеет долгую историю. Список неудачных предложенных доказательств начался с доказательства Эйлера , опубликованного в 1740 году, [3] хотя уже в 1721 году Бернулли неявно предположил результат без формального обоснования. [4] Клеро также опубликовал предложенное доказательство в 1740 году, и никаких других попыток не было до конца 18 века. Начиная с этого времени, в течение 70 лет был предложен ряд неполных доказательств. Доказательство Лагранжа (1797) было улучшено Коши (1823), но предполагало существование и непрерывность частных производных и . [5] Другие попытки были предприняты П. Бланше (1841), Дюамелем (1856), Штурмом (1857), Шлемильхом (1862) и Бертраном (1864). Наконец, в 1867 году Линделёф систематически проанализировал все предыдущие ошибочные доказательства и смог привести конкретный контрпример, в котором смешанные производные не были равны. [6] [7]

Шесть лет спустя Шварцу удалось дать первое строгое доказательство. [8] Дини позже внес свой вклад, найдя более общие условия, чем у Шварца. В конце концов, чистая и более общая версия была найдена Джорданом в 1883 году, которая до сих пор является доказательством, которое можно найти в большинстве учебников. Незначительные варианты более ранних доказательств были опубликованы Лораном (1885), Пеано (1889 и 1893), Дж. Эдвардсом (1892), П. Хаагом (1893), Дж. К. Уиттемором (1898), Виванти (1899) и Пьерпонтом (1905). Дальнейший прогресс был достигнут в 1907-1909 годах, когда Э. У. Хобсон и У. Х. Янг нашли доказательства с более слабыми условиями, чем у Шварца и Дини. В 1918 году Каратеодори дал другое доказательство, основанное на интеграле Лебега . [7]

Теорема Шварца

В математическом анализе теорема Шварца (или теорема Клеро о равенстве смешанных частных чисел ) [9], названная в честь Алексиса Клеро и Германа Шварца , утверждает, что для функции, определенной на множестве , если — точка такая, что некоторая окрестность содержится в и имеет непрерывные вторые частные производные в этой окрестности , то для всех i и j из

Частные производные этой функции коммутируют в этой точке.

Один из простых способов доказать эту теорему (в случае , когда , и , что легко влечет за собой общий результат) — применить теорему Грина к градиенту

Элементарное доказательство для функций на открытых подмножествах плоскости состоит в следующем (путем простого сведения общий случай теоремы Шварца легко сводится к плоскому случаю). [10] Пусть — дифференцируемая функция на открытом прямоугольнике , содержащем точку , и предположим, что она непрерывна при непрерывна и над Определим

Эти функции определены для , где и содержится в

По теореме о среднем значении для фиксированного h и k , не равного нулю, можно найти в открытом интервале с

Так как , то первое равенство ниже можно разделить на :

Устремляя к нулю в последнем равенстве, предположения о непрерывности относительно и теперь подразумевают, что

Этот отчет представляет собой простой классический метод, который можно найти во многих учебниках, например, в работах Беркилла, Апостола и Рудина. [10] [11] [12]

Хотя приведенный выше вывод является элементарным, этот подход можно также рассматривать с более концептуальной точки зрения, чтобы результат стал более очевидным. [13] [14] [15] [16] [17] Действительно, операторы разности коммутируют и стремятся к , когда стремится к 0, с аналогичным утверждением для операторов второго порядка. [a] Здесь для вектора на плоскости и направленного вектора или оператор разности определяется как

По основной теореме исчисления для функций на открытом интервале с

Следовательно

.

Это обобщенная версия теоремы о среднем значении . Напомним, что элементарное обсуждение максимумов или минимумов для вещественных функций подразумевает, что если непрерывна на и дифференцируема на , то существует точка в такая, что

Для векторнозначных функций с конечномерным нормированным пространством аналога равенства выше нет, более того, оно не выполняется. Но поскольку , неравенство выше является полезной заменой. Более того, использование сопряжения двойственного с его двойственной нормой дает следующее неравенство:

.

Эти версии теоремы о среднем значении обсуждаются в работах Рудина, Хермандера и других авторов. [19] [20]

Для функции на открытом множестве в плоскости определим и . Кроме того, для множества

.

Тогда для открытого множества обобщенную теорему о среднем значении можно применить дважды:

Таким образом, стремится к , поскольку стремится к 0. Тот же аргумент показывает, что стремится к . Следовательно, поскольку операторы разности коммутируют, то же самое делают и операторы частных дифференциалов и , как и утверждается. [21] [22] [23] [24] [25]

Замечание. Двумя применениями классической теоремы о среднем значении,

для некоторых и в . Таким образом, первое элементарное доказательство можно переосмыслить с использованием операторов разности. Наоборот, вместо использования обобщенной теоремы о среднем значении во втором доказательстве можно использовать классическую теорему о среднем значении.

Доказательство теоремы Клеро с использованием повторных интегралов

Свойства повторных интегралов Римана непрерывной функции F на компактном прямоугольнике [ a , b ] × [ c , d ] легко устанавливаются. [26] Из равномерной непрерывности F немедленно следует, что функции и непрерывны. [27] Из этого следует, что

;

более того, немедленно следует, что повторный интеграл положителен, если F положителен. [28] Равенство выше является простым случаем теоремы Фубини , не включающим теорию меры . Титчмарш (1939) доказывает это простым способом, используя аппроксимирующие суммы Римана, соответствующие подразделениям прямоугольника на меньшие прямоугольники.

Чтобы доказать теорему Клеро, предположим, что f — дифференцируемая функция на открытом множестве U , для которой существуют и непрерывны смешанные вторые частные производные f yx и f xy . Используя дважды основную теорему исчисления ,

Сходным образом

Два повторных интеграла, следовательно, равны. С другой стороны, поскольку f xy ( x , y ) непрерывна, второй повторный интеграл можно выполнить, сначала проинтегрировав по x , а затем по y . Но тогда повторный интеграл f yxf xy на [ a , b ] × [ c , d ] должен исчезнуть. Однако, если повторный интеграл непрерывной функции function F исчезает для всех прямоугольников, то F должен быть тождественно равен нулю; иначе F или F были бы строго положительными в некоторой точке и, следовательно, по непрерывности на прямоугольнике, что невозможно. Следовательно, f yxf xy должны исчезать тождественно, так что f yx = f xy всюду. [29] [30] [31] [32] [33]

Достаточность дважды дифференцируемости

Более слабое условие, чем непрерывность вторых частных производных (которая подразумевается последней), которого достаточно для обеспечения симметрии, состоит в том, что все частные производные сами по себе дифференцируемы . [34] Другое усиление теоремы, в котором утверждается существование переставленной смешанной частной производной, было представлено Пеано в короткой заметке 1890 года на Mathesis :

Если определено на открытом множестве ; и существует всюду на ; непрерывно в , и если существует в окрестности , то существует в и . [35]

Формулировка теории распределения

Теория распределений (обобщенных функций) устраняет аналитические проблемы с симметрией. Производная интегрируемой функции всегда может быть определена как распределение, а симметрия смешанных частных производных всегда выполняется как равенство распределений. Использование формального интегрирования по частям для определения дифференциации распределений возвращает вопрос симметрии к тестовым функциям , которые являются гладкими и, безусловно, удовлетворяют этой симметрии. Более подробно (где f — распределение, записанное как оператор на тестовых функциях, а φ — тестовая функция),

Другой подход, определяющий преобразование Фурье функции, состоит в том, чтобы заметить, что при таких преобразованиях частные производные становятся операторами умножения, которые коммутируют гораздо более очевидно. [a]

Требование непрерывности

Симметрия может быть нарушена, если функция не имеет дифференцируемых частных производных, что возможно, если не выполняется теорема Клеро (вторые частные производные не являются непрерывными ).

Функция f ( x ,  y ), как показано в уравнении ( 1 ), не имеет симметричных вторых производных в начале координат.

Примером несимметрии является функция (по Пеано ) [36] [37]

Это можно визуализировать с помощью полярной формы ; она всюду непрерывна, но ее производные в точке (0, 0) не могут быть вычислены алгебраически. Скорее, предел разностных отношений показывает, что , поэтому график имеет горизонтальную касательную плоскость в точке (0, 0) , и частные производные существуют и всюду непрерывны. Однако вторые частные производные не непрерывны в точке (0, 0) , и симметрия нарушается. Фактически, вдоль оси x производная по оси y равна , и поэтому:

Напротив, вдоль оси y производная x , и так далее . То есть, в точке (0, 0) , хотя смешанные частные производные существуют, и в любой другой точке симметрия сохраняется.

Вышеуказанная функция, записанная в полярных координатах, может быть выражена как

показывая, что функция совершает четыре колебания при обходе произвольно малого контура, содержащего начало координат. Поэтому интуитивно понятно, что локальное поведение функции в точке (0, 0) не может быть описано как квадратичная форма, и матрица Гессе, таким образом, не является симметричной.

В общем случае, обмен предельными операциями не обязательно коммутирует . При наличии двух переменных вблизи (0, 0) и двух предельных процессов на

что соответствует тому, что h → 0 сначала, и тому, что k → 0 сначала. Это может иметь значение, если смотреть на члены первого порядка, которые применяются первыми. Это приводит к построению патологических примеров, в которых вторые производные несимметричны. Этот вид примеров относится к теории действительного анализа , где поточечное значение функций имеет значение. При рассмотрении как распределения значения второй частной производной могут быть изменены в произвольном наборе точек, пока это имеет меру Лебега 0. Поскольку в примере гессиан симметричен везде, кроме (0, 0) , нет противоречия с тем фактом, что гессиан, рассматриваемый как распределение Шварца , симметричен.

В теории Лжи

Рассмотрим дифференциальные операторы первого порядка D i как бесконечно малые операторы в евклидовом пространстве . То есть, D i в некотором смысле порождает однопараметрическую группу трансляций, параллельных оси x i . Эти группы коммутируют друг с другом, и, следовательно, бесконечно малые генераторы делают то же самое; скобка Ли

[ Ди , Дj ] = 0

является отражением этого свойства. Другими словами, производная Ли одной координаты по другой равна нулю.

Применение к дифференциальным формам

Теорема Клеро-Шварца является ключевым фактом, необходимым для доказательства того, что для каждой (или по крайней мере дважды дифференцируемой) дифференциальной формы вторая внешняя производная равна нулю: . Это подразумевает, что каждая дифференцируемая точная форма (т. е. форма такая, что для некоторой формы ) замкнута (т. е. ), поскольку . [38]

В середине XVIII века теория дифференциальных форм впервые была изучена в простейшем случае 1-форм на плоскости, т. е. , где и — функции на плоскости. Изучение 1-форм и дифференциалов функций началось с работ Клеро 1739 и 1740 годов. На этом этапе его исследования трактовались как способы решения обыкновенных дифференциальных уравнений . Формально Клеро показал, что 1-форма на открытом прямоугольнике замкнута, т. е . , тогда и только тогда имеет вид для некоторой функции в круге. Решение для можно записать с помощью интегральной формулы Коши

в то время как если , то замкнутое свойство является тождеством . (На современном языке это одна из версий леммы Пуанкаре .) [39]

Примечания

  1. ^ ab Их также можно перефразировать в терминах действия операторов на функции Шварца на плоскости. При преобразовании Фурье операторы разности и дифференциации являются просто операторами умножения. [18]
  1. ^ "Теорема Юнга" (PDF) . Калифорнийский университет в Беркли. Архивировано из оригинала (PDF) 2006-05-18 . Получено 2015-01-02 .
  2. Аллен 1964, стр. 300–305.
  3. Эйлер 1740.
  4. ^ Sandifer 2007, стр. 142–147, сноска: Comm. акад. наук. Имп. Петрополь. 7 (1734/1735) 1740 , 174–189, 180–183; Опера Омния , 1.22, 34-56..
  5. ^ Мингуцци 2015.
  6. ^ Линделёф 1867.
  7. ^ ab Хиггинс 1940.
  8. Шварц 1873.
  9. ^ Джеймс 1966, стр.  [ нужна страница ] .
  10. ^ ab Burkill 1962, стр. 154–155
  11. Апостол 1965.
  12. ^ Рудин 1976.
  13. Hörmander 2015, стр. 7, 11. Это сжатое изложение, возможно, самое короткое.
  14. ^ Дьедонне 1960, стр. 179–180.
  15. Годеман 1998б, стр. 287–289.
  16. Ланг 1969, стр. 108–111.
  17. Картан 1971, стр. 64–67.
  18. ^ Хёрмандер 2015, Глава VII.
  19. ^ Хёрмандер 2015, стр. 6.
  20. ^ Рудин 1976, стр.  [ нужная страница ] .
  21. ^ Хёрмандер 2015, стр. 11.
  22. ^ Дьедонне 1960.
  23. ^ Годеман 1998а.
  24. ^ Ланг 1969.
  25. ^ Картан 1971.
  26. ^ Титчмарш 1939, стр.  [ нужна страница ] .
  27. Титчмарш 1939, стр. 23–25.
  28. Титчмарш 1939, стр. 49–50.
  29. Спивак 1965, стр. 61.
  30. ^ Макграт 2014.
  31. ^ Аксой и Мартелли 2002.
  32. ^ Акслер 2020, стр. 142–143.
  33. ^ Маршалл, Дональд Э., Теоремы Фубини и Клеро (PDF) , Вашингтонский университет
  34. Хаббард и Хаббард 2015, стр. 732–733.
  35. Рудин 1976, стр. 235–236.
  36. Хобсон 1921, стр. 403–404.
  37. Апостол 1974, стр. 358–359.
  38. ^ Вт 2010.
  39. ^ Кац 1981.

Ссылки

Дальнейшее чтение