В физике калибровочная ковариантная производная — это средство выражения того, как поля изменяются от места к месту, таким образом, чтобы учитывать, как системы координат, используемые для описания физического явления, сами могут меняться от места к месту. Калибровочная ковариантная производная используется во многих областях физики, включая квантовую теорию поля и гидродинамику, а также, в особом смысле, общую теорию относительности .
Если физическая теория не зависит от выбора локальных систем отсчета, то меняется группа локальных систем, калибровочные преобразования действуют на поля в теории, оставляя неизменным физическое содержание теории. Обычное дифференцирование компонент поля не инвариантно относительно таких калибровочных преобразований, поскольку они зависят от локальной системы отсчёта. Однако когда калибровочные преобразования действуют одновременно на поля и калибровочную ковариантную производную, они сохраняют свойства теорий, которые не зависят от выбора системы отсчета и, следовательно, являются действительными описаниями физики. Подобно ковариантной производной, используемой в общей теории относительности (что является частным случаем), калибровочная ковариантная производная представляет собой выражение связи в локальных координатах после выбора системы отсчета для задействованных полей, часто в форме индексной записи.
Есть много способов понять калибровочную ковариантную производную. Подход, использованный в данной статье, основан на исторически традиционных обозначениях, используемых во многих учебниках физики. [1] [2] [3] Другой подход заключается в понимании калибровочной ковариантной производной как своего рода связи , а точнее, аффинной связи . [4] [5] [6] Аффинная связность интересна тем, что не требует определения какого-либо понятия метрического тензора ; кривизну аффинной связи можно понимать как напряженность поля калибровочного потенциала. Когда метрика доступна, можно пойти в другом направлении и определить соединение в пакете кадров . Этот путь ведет непосредственно к общей теории относительности; однако для этого требуется метрика, которой нет в калибровочных теориях физики элементарных частиц .
Аффинная и метрическая геометрия не являются обобщениями друг друга, а расходятся в разных направлениях: калибровочная группа ( псевдо ) римановой геометрии должна быть неопределенной ортогональной группой O(s,r) вообще или группой Лоренца O( 3,1) для пространства-времени . Это связано с тем, что слои расслоения фреймов должны обязательно, по определению, соединять касательное и кокасательное пространства пространства-времени. [7] Напротив, калибровочные группы, используемые в физике элементарных частиц, в принципе могут быть любой группой Ли вообще, хотя на практике Стандартная модель использует только U(1) , SU(2) и SU(3) . Обратите внимание, что группы Ли не имеют метрики.
Еще более сложный, но более точный и геометрически поучительный подход состоит в том, чтобы понять, что калибровочная ковариантная производная — это (точно) то же самое, что и внешняя ковариантная производная на участке ассоциированного расслоения для главного расслоения калибровочной теории; [8] и, в случае спиноров, ассоциированный расслоение будет спиновым расслоением спиновой структуры . [9] Хотя концептуально этот подход один и тот же, он использует совершенно другой набор обозначений и требует гораздо более продвинутых знаний во многих областях дифференциальной геометрии .
Последним шагом в геометризации калибровочной инвариантности является признание того, что в квантовой теории нужно только сравнивать соседние слои главного расслоения и что сами слои предоставляют избыточное дополнительное описание. Это приводит к идее модификации калибровочной группы, чтобы получить калибровочный группоид как наиболее близкое описание калибровочной связи в квантовой теории поля. [6] [10]
Для обычных алгебр Ли калибровочная ковариантная производная пространственных симметрий (псевдориманова многообразия и общей теории относительности) не может быть переплетена с внутренними калибровочными симметриями; то есть метрическая геометрия и аффинная геометрия обязательно являются разными математическими предметами: это содержание теоремы Коулмана-Мандулы . Однако предпосылка этой теоремы нарушается супералгебрами Ли (которые не являются алгебрами Ли!), что дает надежду на то, что одна единая симметрия может описывать как пространственную, так и внутреннюю симметрию: это основа суперсимметрии .
Более математический подход использует обозначения без индексов, подчеркивая геометрическую и алгебраическую структуру калибровочной теории и ее связь с алгебрами Ли и римановыми многообразиями ; например, рассматривая калибровочную ковариацию как эквивалентность слоев расслоения. Индексное обозначение, используемое в физике, делает его гораздо более удобным для практических расчетов, хотя и делает общую геометрическую структуру теории более непрозрачной. [7] Физический подход также имеет педагогическое преимущество: общая структура калибровочной теории может быть раскрыта после минимального опыта в многомерном исчислении , тогда как геометрический подход требует больших затрат времени на изучение общей теории дифференциальной геометрии , римановых многообразий . , алгебры Ли , представления алгебр Ли и принципиальные расслоения, прежде чем можно будет развить общее понимание. В более сложных обсуждениях оба обозначения обычно смешиваются.
В этой статье делается попытка более внимательно следовать обозначениям и языку, обычно используемым в учебной программе по физике, лишь кратко затрагивая более абстрактные связи.
Рассмотрим типичное (возможно, неабелевое) калибровочное преобразование, действующее на компонентное поле . Основные примеры в теории поля имеют компактную калибровочную группу, и мы пишем оператор симметрии как где - элемент алгебры Ли , связанный с группой Ли преобразований симметрии, и может быть выражен через эрмитовы генераторы алгебры Ли ( т. е. с точностью до множителя бесконечно малые образующие калибровочной группы), , as .
Он действует на поле как
Теперь частная производная преобразуется соответственно как
Следовательно, кинетический член вида в лагранжиане не инвариантен относительно калибровочных преобразований.
Основная причина некалибровочной инвариантности заключается в том, что при записи поля в виде вектора-строки или в индексной записи мы неявно сделали выбор поля базисного кадра , то есть набора полей, так что каждое поле может быть однозначно выражено как для функций ( с использованием суммирования Эйнштейна ) и предполагали, что поля кадра постоянны . Локальную (т.е. зависимую) калибровочную инвариантность можно рассматривать как инвариантность относительно выбора системы отсчета. Однако, если одна базисная система так же хороша, как и любая калибровочная эквивалентная другая, мы не можем считать поля системы постоянными, не нарушая при этом локальную калибровочную симметрию.
Мы можем ввести калибровочную ковариантную производную как обобщение частной производной , которая действует непосредственно на поле , а не на его компоненты, относительно выбора системы отсчета. Калибровочная ковариантная производная определяется как оператор, удовлетворяющий правилу произведения
для каждой гладкой функции (это определяющее свойство связности).
Чтобы вернуться к индексной записи, мы используем правило произведения
Для фиксированного значения — это поле, поэтому его можно расширить за счет поля кадра. Следовательно, калибровочно-ковариантная производная и поле репера определяют (возможно, неабелев) калибровочный потенциал.
(фактор традиционен для компактных калибровочных групп и интерпретируется как константа связи). И наоборот, учитывая систему отсчета и калибровочный потенциал , это однозначно определяет калибровочную ковариантную производную. Затем мы получаем
и с подавленными полями кадра это дает индексную запись
который из-за злоупотребления обозначениями часто записывается как
Это определение калибровочной ковариантной производной, обычно представленное в физике. [11]
Часто предполагается, что калибровочная ковариантная производная удовлетворяет дополнительным условиям, делающим дополнительную структуру «постоянной» в том смысле, что ковариантная производная обращается в нуль. Например, если у нас есть эрмитово произведение полей (например, сопряженное по Дираку скалярное произведение для спиноров), сводящее калибровочную группу к унитарной группе, мы можем наложить дополнительное условие
делая эрмитово произведение «постоянным». Запись этого относительно локального -ортонормированного поля кадра дает
и, используя вышеизложенное, мы видим, что это должно быть эрмитово, т.е. (обусловливающее дополнительный фактор ). Эрмитовы матрицы являются (с точностью до множителя ) образующими унитарной группы. В более общем смысле, если калибровочная ковариантная производная сохраняет калибровочную группу, действующую с представлением , калибровочную ковариантную связь можно записать как
где – представление алгебры Ли, ассоциированное с представлением группы (см. цит.).
Обратите внимание, что включение калибровочной ковариантной производной (или ее калибровочного потенциала ) в качестве физического поля - «поля с нулевой калибровочной ковариантной производной вдоль касательной кривой »
является физически значимым определением постоянной поля вдоль (гладкой) кривой. Следовательно, калибровочная ковариантная производная определяет (и определяется) параллельный транспорт .
В отличие от частных производных, калибровочные ковариантные производные не коммутируют. Однако почти так оно и есть в том смысле, что коммутатор является оператором не порядка 2, а порядка 0, т. е. линеен над функциями:
Линейная карта
называется калибровочной напряженностью поля (см. ссылку). В индексных обозначениях, используя калибровочный потенциал
Если является G-ковариантной производной, последний термин можно интерпретировать как коммутатор в алгебре Ли группы G и как оценочную алгебру Ли (см. цит.).
Калибровочная ковариантная производная ковариантно преобразуется при калибровочных преобразованиях, т.е. для всех
который в операторной форме принимает вид
или
В частности (подавление зависимости от )
Далее (подавив индексы и заменив их умножением матриц), если имеет вид, указанный выше, имеет вид
или используя ,
который также имеет эту форму.
В эрмитовом случае с унитарной калибровочной группой мы нашли дифференциальный оператор первого порядка с членом первого порядка такой, что
В калибровочной теории , изучающей особый класс полей , имеющих важное значение для квантовой теории поля , в лагранжианах используются различные поля, инвариантные относительно локальных калибровочных преобразований. Кинетические члены включают производные полей, которые, согласно приведенным выше аргументам, должны включать калибровочно-ковариантные производные.
калибровочная ковариантная производная на комплексном скалярном поле (т. е. ) заряда является связностью. Калибровочный потенциал представляет собой матрицу (1 x 1), т.е. скаляр.
Напряженность калибровочного поля равна
Калибровочный потенциал можно интерпретировать как электромагнитный четырехпотенциал , а напряженность калибровочного поля — как тензор электромагнитного поля . Поскольку это включает в себя только заряд поля, а не более высокие мультиполи, такие как магнитный момент (и в свободном и неоднозначном виде, поскольку он заменяет [ 12] ), это называется минимальной связью .
Для спинорного поля заряда Дирака ковариантная производная также является связностью (поскольку она должна коммутировать с гамма-матрицами) и определяется как
где снова интерпретируется как электромагнитный четырехпотенциал и как тензор электромагнитного поля. (Знак минус — это соглашение, действительное для метрической сигнатуры Минковского (−, +, +, +) , которая распространена в общей теории относительности и используется ниже. Для соглашения физики элементарных частиц (+, −, −, −) это Заряд электрона определяется как отрицательный , а поле Дирака определяется как преобразующееся положительно как
Если калибровочное преобразование задается формулой
а для калибровочного потенциала
затем преобразуется как
и трансформируется как
и трансформируется как
так что
и поэтому в КЭД лагранжиан является калибровочно-инвариантным, и поэтому калибровочно-ковариантная производная названа удачно. [ нужна цитата ]
С другой стороны, нековариантная производная не сохранит калибровочную симметрию лагранжиана, поскольку
В квантовой хромодинамике калибровочная ковариантная производная равна [13]
где — константа связи сильного взаимодействия, — калибровочное поле глюонов для восьми различных глюонов , и где — одна из восьми матриц Гелл-Мана . Матрицы Гелла-Манна дают представление группы цветовой симметрии SU (3) . Для кварков представлением является фундаментальное представление , для глюонов — присоединенное представление .
Ковариантная производная в Стандартной модели объединяет электромагнитное, слабое и сильное взаимодействия. Это можно выразить в следующем виде: [14]
Калибровочные поля здесь принадлежат фундаментальным представлениям электрослабой группы Ли , умноженной на группу Ли цветовой симметрии SU(3) . Константа связи обеспечивает связь гиперзаряда с бозоном и связь через три векторных бозона со слабым изоспином, компоненты которого здесь записаны как матрицы Паули . Посредством механизма Хиггса эти бозонные поля объединяются в безмассовое электромагнитное поле и поля трех массивных векторных бозонов и .
Ковариантная производная в общей теории относительности является частным примером калибровочной ковариантной производной. Оно соответствует связности Леви Чивиты (специальной римановой связности ) на касательном расслоении (или расслоении фреймов ), т. е. действует на касательные векторные поля или, в более общем смысле, на тензоры. Обычно пишется как вместо . В этом особом случае выбор (локальных) координат не только дает частные производные , но они удваиваются как система касательных векторов, в которой векторное поле может быть однозначно выражено как (при этом используется определение векторного поля как оператора над гладкие функции, удовлетворяющие правилу произведения, т.е. деривации ). Следовательно, в этом случае «внутренние индексы также являются индексами пространства-времени». С точностью до немного другой нормировки (и обозначений) калибровочный потенциал представляет собой символ Кристоффеля, определяемый формулой
Это дает ковариантную производную
Формальное сходство с калибровочной ковариантной производной становится более очевидным, когда выбор координат отделен от выбора системы отсчета векторных полей . Особенно когда кадр ортонормирован, такой кадр обычно называют d-Bein . Затем
где . Прямым аналогом «калибровочной свободы» калибровочной ковариантной производной является произвольность выбора ортонормированного d-Бейна в каждой точке пространства -времени : локальная лоренц - инвариантность . Однако в этом случае более общая независимость выбора координат для определения связности Леви Чивита дает диффеоморфизм или общую координатную инвариантность.
В гидродинамике калибровочно-ковариантная производная жидкости может быть определена как
где – векторное поле скорости жидкости. [ нужна цитата ]
{{cite book}}
: CS1 maint: multiple names: authors list (link)