Калибровочная ковариантная производная

В физике калибровочная ковариантная производная — это средство выражения того, как поля изменяются от места к месту, таким образом, чтобы учитывать, как системы координат, используемые для описания физического явления, сами могут меняться от места к месту. Калибровочная ковариантная производная используется во многих областях физики, включая квантовую теорию поля и гидродинамику, а также, в особом смысле, общую теорию относительности .

Если физическая теория не зависит от выбора локальных систем отсчета, то меняется группа локальных систем, калибровочные преобразования действуют на поля в теории, оставляя неизменным физическое содержание теории. Обычное дифференцирование компонент поля не инвариантно относительно таких калибровочных преобразований, поскольку они зависят от локальной системы отсчёта. Однако когда калибровочные преобразования действуют одновременно на поля и калибровочную ковариантную производную, они сохраняют свойства теорий, которые не зависят от выбора системы отсчета и, следовательно, являются действительными описаниями физики. Подобно ковариантной производной, используемой в общей теории относительности (что является частным случаем), калибровочная ковариантная производная представляет собой выражение связи в локальных координатах после выбора системы отсчета для задействованных полей, часто в форме индексной записи.

Обзор

Есть много способов понять калибровочную ковариантную производную. Подход, использованный в данной статье, основан на исторически традиционных обозначениях, используемых во многих учебниках физики. ^[1]^[2]^[3] Другой подход заключается в понимании калибровочной ковариантной производной как своего рода связи , а точнее, аффинной связи . ^[4]^[5]^[6] Аффинная связность интересна тем, что не требует определения какого-либо понятия метрического тензора ; кривизну аффинной связи можно понимать как напряженность поля калибровочного потенциала. Когда метрика доступна, можно пойти в другом направлении и определить соединение в пакете кадров . Этот путь ведет непосредственно к общей теории относительности; однако для этого требуется метрика, которой нет в калибровочных теориях физики элементарных частиц .

Аффинная и метрическая геометрия не являются обобщениями друг друга, а расходятся в разных направлениях: калибровочная группа ( псевдо ) римановой геометрии должна быть неопределенной ортогональной группой O(s,r) вообще или группой Лоренца O( 3,1) для пространства-времени . Это связано с тем, что слои расслоения фреймов должны обязательно, по определению, соединять касательное и кокасательное пространства пространства-времени. ^[7] Напротив, калибровочные группы, используемые в физике элементарных частиц, в принципе могут быть любой группой Ли вообще, хотя на практике Стандартная модель использует только U(1) , SU(2) и SU(3) . Обратите внимание, что группы Ли не имеют метрики.

Еще более сложный, но более точный и геометрически поучительный подход состоит в том, чтобы понять, что калибровочная ковариантная производная — это (точно) то же самое, что и внешняя ковариантная производная на участке ассоциированного расслоения для главного расслоения калибровочной теории; ^[8] и, в случае спиноров, ассоциированный расслоение будет спиновым расслоением спиновой структуры . ^[9] Хотя концептуально этот подход один и тот же, он использует совершенно другой набор обозначений и требует гораздо более продвинутых знаний во многих областях дифференциальной геометрии .

Последним шагом в геометризации калибровочной инвариантности является признание того, что в квантовой теории нужно только сравнивать соседние слои главного расслоения и что сами слои предоставляют избыточное дополнительное описание. Это приводит к идее модификации калибровочной группы, чтобы получить калибровочный группоид как наиболее близкое описание калибровочной связи в квантовой теории поля. ^[6]^[10]

Для обычных алгебр Ли калибровочная ковариантная производная пространственных симметрий (псевдориманова многообразия и общей теории относительности) не может быть переплетена с внутренними калибровочными симметриями; то есть метрическая геометрия и аффинная геометрия обязательно являются разными математическими предметами: это содержание теоремы Коулмана-Мандулы . Однако предпосылка этой теоремы нарушается супералгебрами Ли (которые не являются алгебрами Ли!), что дает надежду на то, что одна единая симметрия может описывать как пространственную, так и внутреннюю симметрию: это основа суперсимметрии .

Более математический подход использует обозначения без индексов, подчеркивая геометрическую и алгебраическую структуру калибровочной теории и ее связь с алгебрами Ли и римановыми многообразиями ; например, рассматривая калибровочную ковариацию как эквивалентность слоев расслоения. Индексное обозначение, используемое в физике, делает его гораздо более удобным для практических расчетов, хотя и делает общую геометрическую структуру теории более непрозрачной. ^[7] Физический подход также имеет педагогическое преимущество: общая структура калибровочной теории может быть раскрыта после минимального опыта в многомерном исчислении , тогда как геометрический подход требует больших затрат времени на изучение общей теории дифференциальной геометрии , римановых многообразий . , алгебры Ли , представления алгебр Ли и принципиальные расслоения, прежде чем можно будет развить общее понимание. В более сложных обсуждениях оба обозначения обычно смешиваются.

В этой статье делается попытка более внимательно следовать обозначениям и языку, обычно используемым в учебной программе по физике, лишь кратко затрагивая более абстрактные связи.

Мотивация ковариантной производной посредством требования калибровочной ковариации

Рассмотрим типичное (возможно, неабелевое) калибровочное преобразование, действующее на компонентное поле . Основные примеры в теории поля имеют компактную калибровочную группу, и мы пишем оператор симметрии как где - элемент алгебры Ли , связанный с группой Ли преобразований симметрии, и может быть выражен через эрмитовы генераторы алгебры Ли ( т. е. с точностью до множителя бесконечно малые образующие калибровочной группы), , as . $п$ $\phi =(\phi _{a})_{a=1..n}$ $U(x)=e^{i\alpha (x)}$ $\альфа (х)$ $я$ $\{t_{K}\}_{K\in {\mathcal {K}}}$ $\alpha (x)=\alpha ^{K} (x)t_ {K}$

Он действует на поле как $\фи (х)$

\phi (x)\rightarrow \phi '(x)=U(x)\phi (x)\equiv e^{i\alpha (x)}\phi (x),

\phi ^{\dagger }(x)\rightarrow \phi {'}^{\dagger }\equiv \phi ^{\dagger }(x)U^{\dagger }(x)=\phi ^ {\dagger }(x)e^{-i\alpha (x)},\qquad U^{\dagger }=U^{-1}.

Теперь частная производная преобразуется соответственно как $\partial _ {\mu }$

\partial _{\mu }\phi (x)\rightarrow \partial _ {\mu }\phi '(x)=U(x)\partial _{\mu }\phi (x)+(\ частичный _{\mu }U)\phi (x)\equiv e^{i\alpha (x)}\partial _{\mu }\phi (x)+i(\partial _{\mu }\alpha ) е^{я\альфа (х)}\фи (х)

Следовательно, кинетический член вида в лагранжиане не инвариантен относительно калибровочных преобразований. $\phi ^{\dagger }\partial _ {\mu }\phi$

Определение калибровочной ковариантной производной

Основная причина некалибровочной инвариантности заключается в том, что при записи поля в виде вектора-строки или в индексной записи мы неявно сделали выбор поля базисного кадра , то есть набора полей, так что каждое поле может быть однозначно выражено как для функций ( с использованием суммирования Эйнштейна ) и предполагали, что поля кадра постоянны . Локальную (т.е. зависимую) калибровочную инвариантность можно рассматривать как инвариантность относительно выбора системы отсчета. Однако, если одна базисная система так же хороша, как и любая калибровочная эквивалентная другая, мы не можем считать поля системы постоянными, не нарушая при этом локальную калибровочную симметрию. $\phi =(\phi _{1},\ldots \phi _{n})$ $\phi _{a}$ $\varphi ^{1}(x),\ldots,\varphi ^{n}(x)$ $\phi =\phi _{a}\varphi ^{a}$ $\phi _{a}(x)$ $\varphi ^{a}$ $х$

Мы можем ввести калибровочную ковариантную производную как обобщение частной производной , которая действует непосредственно на поле , а не на его компоненты, относительно выбора системы отсчета. Калибровочная ковариантная производная определяется как оператор, удовлетворяющий правилу произведения $D_{\mu }$ $\partial _ {\mu }$ $\фи$ $\phi _{a}$

D_{\mu }(f\phi)=(\partial _{\mu }f)\phi +f(D_{\mu }\phi)

для каждой гладкой функции (это определяющее свойство связности). $е$

Чтобы вернуться к индексной записи, мы используем правило произведения

D_{\mu }\phi =D_{\mu }(\phi _{a}\varphi ^{a}) = (\partial _{\mu }\phi _{a})\varphi ^{ a}+\phi _{a}(D_{\mu }\varphi ^{a}).

Для фиксированного значения — это поле, поэтому его можно расширить за счет поля кадра. Следовательно, калибровочно-ковариантная производная и поле репера определяют (возможно, неабелев) калибровочный потенциал. $а$ $D_{\mu }\varphi ^{a}$

D_{\mu }\varphi ^{a}=-igA_{\mu b}^{a}\varphi ^{b}

(фактор традиционен для компактных калибровочных групп и интерпретируется как константа связи). И наоборот, учитывая систему отсчета и калибровочный потенциал , это однозначно определяет калибровочную ковариантную производную. Затем мы получаем $-ig$ $\varphi ^{1},\ldots \varphi ^{n}$ $A_{\mu b}^{a}$

D_{\mu }\phi =(D_{\mu }\phi )_{a}\varphi ^{a} = (\partial _{\mu }\phi _{a}-igA_{\mu а}^{b}\phi _{b})\varphi ^{a}

и с подавленными полями кадра это дает индексную запись

(D_{\mu }\phi)_{a}=\partial _{\mu }\phi _{a}-igA_{\mu a}^{b}\phi _{b},

который из-за злоупотребления обозначениями часто записывается как

D_{\mu }\phi _{a}=\partial _{\mu }\phi _{a}-igA_{\mu a}^{b}\phi _{b}

Это определение калибровочной ковариантной производной, обычно представленное в физике. ^[11]

Часто предполагается, что калибровочная ковариантная производная удовлетворяет дополнительным условиям, делающим дополнительную структуру «постоянной» в том смысле, что ковариантная производная обращается в нуль. Например, если у нас есть эрмитово произведение полей (например, сопряженное по Дираку скалярное произведение для спиноров), сводящее калибровочную группу к унитарной группе, мы можем наложить дополнительное условие $ч$ ${\bar {\phi }}\psi$

\partial _{\mu }h(\phi ,\psi )=h(D_{\mu }\phi ,\psi )+h(\phi ,D_{\mu }\psi )

делая эрмитово произведение «постоянным». Запись этого относительно локального -ортонормированного поля кадра дает $h$

\partial _{\mu }(\phi _{a}^{*}\psi _{a})=\sum _{a}(D_{\mu }\phi )_{a}^{*}\psi _{a}+\phi _{a}^{*}(D_{\mu }\psi )_{a}

и, используя вышеизложенное, мы видим, что это должно быть эрмитово, т.е. (обусловливающее дополнительный фактор ). Эрмитовы матрицы являются (с точностью до множителя ) образующими унитарной группы. В более общем смысле, если калибровочная ковариантная производная сохраняет калибровочную группу, действующую с представлением , калибровочную ковариантную связь можно записать как $A_{\mu }$ $A_{\mu a}^{b}={A_{\mu b}^{a}}^{*}$ $i$ $i$ $G$ $\rho$

(D_{\mu }\phi )_{a}=\partial _{\mu }\phi _{a}-igA_{\mu }^{K}\rho '(t_{K})_{a}^{b}\phi _{b}

где – представление алгебры Ли, ассоциированное с представлением группы (см. цит.). $\rho '$ $\rho$

Обратите внимание, что включение калибровочной ковариантной производной (или ее калибровочного потенциала ) в качестве физического поля - «поля с нулевой калибровочной ковариантной производной вдоль касательной кривой » $\gamma$

D_{\dot {\gamma }}\phi =({\frac {d}{dt}}\gamma ^{\mu })D_{\mu }\phi =0

является физически значимым определением постоянной поля вдоль (гладкой) кривой. Следовательно, калибровочная ковариантная производная определяет (и определяется) параллельный транспорт . $\phi$

Напряженность поля датчика

В отличие от частных производных, калибровочные ковариантные производные не коммутируют. Однако почти так оно и есть в том смысле, что коммутатор является оператором не порядка 2, а порядка 0, т. е. линеен над функциями:

[D_{\mu },D_{\nu }](f\phi )=(\partial _{\mu }\partial _{\nu }f)\phi +\partial _{\nu }fD_{\mu }\phi +\partial _{\mu }fD_{\nu }\phi +fD_{\mu }D_{\nu }\phi -(\mu \leftrightarrow \nu )=f[D_{\mu },D_{\nu }]\phi

Линейная карта

F_{\mu \nu }=-1/(ig)[D_{\mu },D_{\nu }]

называется калибровочной напряженностью поля (см. ссылку). В индексных обозначениях, используя калибровочный потенциал

F_{\mu \nu \,b}^{\ a}=\partial _{\mu }A_{\nu b}^{a}-\partial _{\nu }A_{\mu b}^{a}-ig(A_{\mu c}^{a}A_{\nu b}^{c}-A_{\nu c}^{a}A_{\mu b}^{c})

Если является G-ковариантной производной, последний термин можно интерпретировать как коммутатор в алгебре Ли группы G и как оценочную алгебру Ли (см. цит.). $D_{\mu }$ $F_{\mu \nu }$

Инвариантность относительно калибровочных преобразований

Калибровочная ковариантная производная ковариантно преобразуется при калибровочных преобразованиях, т.е. для всех $\phi$

D_{\mu }\phi (x)\rightarrow D'_{\mu }\phi '(x)=D'_{\mu }U(x)\phi (x)=U(x)D_{\mu }\phi (x),

который в операторной форме принимает вид

D'_{\mu }U(x)=U(x)D_{\mu }

или

D'_{\mu }=U(x)D_{\mu }U^{-1}(x).

В частности (подавление зависимости от ) $x$

-igF'_{\mu \nu }=[D'_{\mu },D'_{\nu }]=[UD_{\mu }U^{-1},UD_{\nu }U^{-1}]=U[D_{\mu },D_{\nu }]U^{-1}=-igUF_{\mu \nu }U^{-1}

Далее (подавив индексы и заменив их умножением матриц), если имеет вид, указанный выше, имеет вид $D_{\mu }=\partial _{\mu }-igA_{\mu }$ $D'_{\mu }$

D'_{\mu }=\partial _{\mu }+(\partial _{\mu }U^{-1})U-igUA_{\mu }U^{-1}

или используя , $U(x)=e^{i\alpha (x)}$

D'_{\mu }=\partial _{\mu }-i\partial _{\mu }\alpha -igUA_{\mu }U^{-1}

который также имеет эту форму.

В эрмитовом случае с унитарной калибровочной группой мы нашли дифференциальный оператор первого порядка с членом первого порядка такой, что $U^{-1}=U^{\dagger }$ $D_{\mu }$ $\partial _{\mu }$

\phi ^{\dagger }D_{\mu }\phi \rightarrow \phi '^{\dagger }D'_{\mu }\phi '=\phi ^{\dagger }D_{\mu }\phi .

Калибровочная теория

В калибровочной теории , изучающей особый класс полей , имеющих важное значение для квантовой теории поля , в лагранжианах используются различные поля, инвариантные относительно локальных калибровочных преобразований. Кинетические члены включают производные полей, которые, согласно приведенным выше аргументам, должны включать калибровочно-ковариантные производные.

Абелева калибровочная теория

калибровочная ковариантная производная на комплексном скалярном поле (т. е. ) заряда является связностью. Калибровочный потенциал представляет собой матрицу (1 x 1), т.е. скаляр. $D_{\mu }$ $\phi =\phi _{1}\varphi ^{1}$ $n=1$ $q$ $U(1)$ $A_{\mu }$

(D_{\mu }\phi )_{1}=(\partial _{\mu }\phi _{1}-iqA_{\mu }\phi _{1})

Напряженность калибровочного поля равна

F_{\mu \nu }=\partial _{\mu }A_{\nu }-\partial _{\nu }A_{\mu }

Калибровочный потенциал можно интерпретировать как электромагнитный четырехпотенциал , а напряженность калибровочного поля — как тензор электромагнитного поля . Поскольку это включает в себя только заряд поля, а не более высокие мультиполи, такие как магнитный момент (и в свободном и неоднозначном виде, поскольку он заменяет [ ^12] ), это называется минимальной связью . $\partial _{\mu }$ $D_{\mu }$

Для спинорного поля заряда Дирака ковариантная производная также является связностью (поскольку она должна коммутировать с гамма-матрицами) и определяется как $\psi$ $q$ $U(1)$

(D_{\mu }\psi )_{\alpha }:=(\partial _{\mu }-iqA_{\mu })\psi _{\alpha }

где снова интерпретируется как электромагнитный четырехпотенциал и как тензор электромагнитного поля. (Знак минус — это соглашение, действительное для метрической сигнатуры Минковского (−, +, +, +) , которая распространена в общей теории относительности и используется ниже. Для соглашения физики элементарных частиц (+, −, −, −) это Заряд электрона определяется как отрицательный , а поле Дирака определяется как преобразующееся положительно как $A_{\mu }$ $F_{\mu \nu }$ $D_{\mu }:=\partial _{\mu }+iqA_{\mu }$ $q_{e}=-|e|$ $\psi (x)\rightarrow e^{iq\alpha (x)}\psi (x).$

Квантовая электродинамика

Если калибровочное преобразование задается формулой

\psi \mapsto e^{i\Lambda }\psi

а для калибровочного потенциала

A_{\mu }\mapsto A_{\mu }+{1 \over e}(\partial _{\mu }\Lambda )

затем преобразуется как $D_{\mu }$

D_{\mu }\mapsto \partial _{\mu }-ieA_{\mu }-i(\partial _{\mu }\Lambda )

и трансформируется как $D_{\mu }\psi$

D_{\mu }\psi \mapsto e^{i\Lambda }D_{\mu }\psi

и трансформируется как ${\bar {\psi }}:=\psi ^{\dagger }\gamma ^{0}$

{\bar {\psi }}\mapsto {\bar {\psi }}e^{-i\Lambda }

так что

{\bar {\psi }}D_{\mu }\psi \mapsto {\bar {\psi }}D_{\mu }\psi

и поэтому в КЭД лагранжиан является калибровочно-инвариантным, и поэтому калибровочно-ковариантная производная названа удачно. ^[^{нужна цитата}^] ${\bar {\psi }}D_{\mu }\psi$

С другой стороны, нековариантная производная не сохранит калибровочную симметрию лагранжиана, поскольку $\partial _{\mu }$

{\bar {\psi }}\partial _{\mu }\psi \mapsto {\bar {\psi }}\partial _{\mu }\psi +i{\bar {\psi }}(\partial _{\mu }\Lambda )\psi

Квантовая хромодинамика

В квантовой хромодинамике калибровочная ковариантная производная равна ^[13]

D_{\mu }:=\partial _{\mu }-ig_{s}\,G_{\mu }^{\alpha }\,\lambda _{\alpha }/2

где — константа связи сильного взаимодействия, — калибровочное поле глюонов для восьми различных глюонов , и где — одна из восьми матриц Гелл-Мана . Матрицы Гелла-Манна дают представление группы цветовой симметрии SU (3) . Для кварков представлением является фундаментальное представление , для глюонов — присоединенное представление . $g_{s}$ $G$ $\alpha =1\dots 8$ $\lambda _{\alpha }$

Стандартная модель

Ковариантная производная в Стандартной модели объединяет электромагнитное, слабое и сильное взаимодействия. Это можно выразить в следующем виде: ^[14]

D_{\mu }:=\partial _{\mu }-i{\frac {g'}{2}}Y\,B_{\mu }-i{\frac {g}{2}}\sigma _{j}\,W_{\mu }^{j}-i{\frac {g_{s}}{2}}\lambda _{\alpha }\,G_{\mu }^{\alpha }

Калибровочные поля здесь принадлежат фундаментальным представлениям электрослабой группы Ли , умноженной на группу Ли цветовой симметрии SU(3) . Константа связи обеспечивает связь гиперзаряда с бозоном и связь через три векторных бозона со слабым изоспином, компоненты которого здесь записаны как матрицы Паули . Посредством механизма Хиггса эти бозонные поля объединяются в безмассовое электромагнитное поле и поля трех массивных векторных бозонов и . $U(1)\times SU(2)$ $g'$ $Y$ $B$ $g$ $W^{j}$ $(j=1,2,3)$ $\sigma _{j}$ $A_{\mu }$ $W^{\pm }$ $Z$

Общая теория относительности

Ковариантная производная в общей теории относительности является частным примером калибровочной ковариантной производной. Оно соответствует связности Леви Чивиты (специальной римановой связности ) на касательном расслоении (или расслоении фреймов ), т. е. действует на касательные векторные поля или, в более общем смысле, на тензоры. Обычно пишется как вместо . В этом особом случае выбор (локальных) координат не только дает частные производные , но они удваиваются как система касательных векторов, в которой векторное поле может быть однозначно выражено как (при этом используется определение векторного поля как оператора над гладкие функции, удовлетворяющие правилу произведения, т.е. деривации ). Следовательно, в этом случае «внутренние индексы также являются индексами пространства-времени». С точностью до немного другой нормировки (и обозначений) калибровочный потенциал представляет собой символ Кристоффеля, определяемый формулой $\nabla$ $D$ $x^{1},\ldots ,x^{d}$ $\partial _{\mu }$ $\partial _{1},\ldots \partial _{d}$ $v$ $v=v^{\mu }\partial _{\mu }$ $A_{\mu \nu }^{\lambda }$

\nabla _{\mu }\partial _{\nu }=\Gamma _{\mu \nu }^{\lambda }\partial _{\lambda }

Это дает ковариантную производную

(\nabla _{\mu }v)^{\nu }=(\nabla _{\mu }(v^{\lambda }\partial _{\lambda }))^{\nu }=((\partial _{\mu }v^{\lambda })\partial _{\lambda }+v^{\lambda }(\nabla _{\mu }\partial _{\lambda }))^{\nu }=\partial _{\mu }v^{\nu }+\Gamma _{\mu \lambda }^{\nu }v^{\lambda }

Формальное сходство с калибровочной ковариантной производной становится более очевидным, когда выбор координат отделен от выбора системы отсчета векторных полей . Особенно когда кадр ортонормирован, такой кадр обычно называют d-Bein . Затем $e_{1}=e_{1}^{\mu }\partial _{\mu },\ldots ,e_{d}=e_{d}^{\mu }\partial _{\mu }$

(\nabla _{\mu }v)^{n}=(\nabla _{\mu }(v^{\ell }e_{\ell }))^{n}=((\partial _{\mu }v^{\ell })e_{\ell }+v^{\ell }(\nabla _{\mu }e_{\ell }))^{n}=\partial _{\mu }v^{n}+\Gamma _{\mu \ell }^{n}v^{\ell }

где . Прямым аналогом «калибровочной свободы» калибровочной ковариантной производной является произвольность выбора ортонормированного d-Бейна в каждой точке пространства -времени : локальная лоренц ^-^{инвариантность}^.Однако в этом случае более общая независимость выбора координат для определения связности Леви Чивита дает диффеоморфизм или общую координатную инвариантность. $\nabla _{\mu }e_{m}=\Gamma _{\mu m}^{\ell }e_{\ell }$

Динамика жидкостей

В гидродинамике калибровочно-ковариантная производная жидкости может быть определена как

\nabla _{t}\mathbf {v} :=\partial _{t}\mathbf {v} +(\mathbf {v} \cdot \nabla )\mathbf {v}

где – векторное поле скорости жидкости. ^[^{нужна цитата}^] $\mathbf {v}$