В физике элементарных частиц уравнение Дирака — это релятивистское волновое уравнение, выведенное британским физиком Полем Дираком в 1928 году. В свободной форме или с учетом электромагнитных взаимодействий оно описывает все массивные частицы со спином 1/2 , называемые «частицами Дирака», такие как электроны и кварки , для которых четность является симметрией . Оно согласуется как с принципами квантовой механики , так и со специальной теорией относительности [1] и было первой теорией, полностью описывающей специальную теорию относительности в контексте квантовой механики. Оно было подтверждено путем учета тонкой структуры спектра водорода совершенно строгим образом. Оно стало жизненно важным в построении Стандартной модели [2] .
Уравнение также подразумевало существование новой формы материи, антиматерии , ранее не подозреваемой и не наблюдаемой, и которая была экспериментально подтверждена несколько лет спустя. Оно также дало теоретическое обоснование для введения нескольких компонентных волновых функций в феноменологическую теорию спина Паули . Волновые функции в теории Дирака являются векторами четырех комплексных чисел (известных как биспиноры ), два из которых напоминают волновую функцию Паули в нерелятивистском пределе, в отличие от уравнения Шредингера , которое описывало волновые функции только одного комплексного значения. Более того, в пределе нулевой массы уравнение Дирака сводится к уравнению Вейля .
В контексте квантовой теории поля уравнение Дирака интерпретируется заново для описания квантовых полей, соответствующих частицам со спином 1 ⁄ 2 .
Дирак не полностью оценил важность своих результатов; однако, вытекающее из этого объяснение спина как следствие объединения квантовой механики и теории относительности — и последующее открытие позитрона — представляет собой один из величайших триумфов теоретической физики . Это достижение было описано как полностью равное работам Ньютона , Максвелла и Эйнштейна до него. [3] Некоторые физики считали это уравнение «настоящим семенем современной физики». [4] Уравнение также было описано как «центральный элемент релятивистской квантовой механики», при этом также утверждалось, что «уравнение, возможно, является самым важным во всей квантовой механике». [5]
Уравнение Дирака написано на мемориальной доске на полу Вестминстерского аббатства . Открытая 13 ноября 1995 года, мемориальная доска увековечивает жизнь Дирака. [6]
Уравнение Дирака в форме, первоначально предложенной Дираком, выглядит следующим образом: [7] : 291 [8] где ψ ( x , t ) — волновая функция для электрона с массой покоя m с пространственно-временными координатами x , t . p 1 , p 2 , p 3 — компоненты импульса , понимаемые как оператор импульса в уравнении Шредингера . c — скорость света , а ħ — приведенная постоянная Планка ; эти фундаментальные физические константы отражают специальную теорию относительности и квантовую механику соответственно.
Целью Дирака при составлении этого уравнения было объяснить поведение релятивистски движущегося электрона, тем самым позволяя рассматривать атом в соответствии с теорией относительности. Он надеялся, что поправки, введенные таким образом, могут иметь отношение к проблеме атомных спектров .
До этого времени попытки сделать старую квантовую теорию атома совместимой с теорией относительности, основанной на дискретизации углового момента, хранящегося в возможно некруговой орбите электрона атомного ядра , терпели неудачу, а новая квантовая механика Гейзенберга , Паули , Иордана , Шредингера и самого Дирака не была достаточно развита, чтобы рассмотреть эту проблему. Хотя первоначальные намерения Дирака были удовлетворены, его уравнение имело гораздо более глубокие последствия для структуры материи и ввело новые математические классы объектов, которые теперь являются существенными элементами фундаментальной физики.
Новые элементы в этом уравнении — четыре матрицы 4 × 4 α 1 , α 2 , α 3 и β , а также четырехкомпонентная волновая функция ψ . В ψ четыре компонента , поскольку ее оценка в любой заданной точке конфигурационного пространства является биспинором . Она интерпретируется как суперпозиция электрона со спином вверх , электрона со спином вниз, позитрона со спином вверх и позитрона со спином вниз.
Матрицы α k и β размером 4 × 4 являются эрмитовыми и инволютивными : и все они взаимно антикоммутируют :
Эти матрицы и форма волновой функции имеют глубокое математическое значение. Алгебраическая структура, представленная гамма-матрицами, была создана примерно 50 годами ранее английским математиком У. К. Клиффордом . В свою очередь, идеи Клиффорда возникли из работы немецкого математика Германа Грассмана середины 19-го века в его Lineare Ausdehnungslehre ( Теория линейного расширения ). [ необходима цитата ]
Уравнение Дирака внешне похоже на уравнение Шредингера для массивной свободной частицы :
Левая сторона представляет собой квадрат оператора импульса, деленный на удвоенную массу, которая является нерелятивистской кинетической энергией. Поскольку относительность рассматривает пространство и время как единое целое, релятивистское обобщение этого уравнения требует, чтобы производные пространства и времени входили симметрично, как это происходит в уравнениях Максвелла , которые управляют поведением света — уравнения должны быть дифференциально одного и того же порядка в пространстве и времени. В относительности импульс и энергии являются пространственной и временной частями вектора пространства-времени, 4-импульса , и они связаны релятивистски инвариантным соотношением
которое гласит, что длина этого 4-вектора пропорциональна массе покоя m . Подстановка операторных эквивалентов энергии и импульса из теории Шредингера дает уравнение Клейна–Гордона , описывающее распространение волн, построенных из релятивистски инвариантных объектов, причем волновая функция является релятивистским скаляром: комплексным числом, имеющим одинаковое численное значение во всех системах отсчета. Производные по пространству и времени входят во второй порядок. Это имеет выразительное следствие для интерпретации уравнения. Поскольку уравнение имеет второй порядок по производной по времени, необходимо указать начальные значения как самой волновой функции, так и ее первой производной по времени, чтобы решить определенные задачи. Поскольку обе могут быть указаны более или менее произвольно, волновая функция не может сохранять свою прежнюю роль определения плотности вероятности нахождения электрона в заданном состоянии движения. В теории Шредингера плотность вероятности задается положительно определенным выражением , и эта плотность распространяется в соответствии с вектором тока вероятности с сохранением тока вероятности и плотности, вытекающим из уравнения непрерывности:
Тот факт, что плотность положительно определена и конвектируется согласно этому уравнению непрерывности, подразумевает, что можно интегрировать плотность по определенной области и установить сумму равной 1, и это условие будет поддерживаться законом сохранения . Правильная релятивистская теория с плотностью вероятности тока также должна разделять эту особенность. Чтобы сохранить понятие конвектируемой плотности, нужно обобщить выражение Шредингера плотности и тока так, чтобы пространственные и временные производные снова входили симметрично по отношению к скалярной волновой функции. Выражение Шредингера можно сохранить для тока, но плотность вероятности должна быть заменена симметрично сформированным выражением [ необходимо дальнейшее объяснение ] , которое теперь становится 4-м компонентом вектора пространства-времени, и вся плотность вероятности 4-тока имеет релятивистски ковариантное выражение
Уравнение непрерывности такое же, как и прежде. Теперь все совместимо с относительностью, но выражение для плотности больше не является положительно определенным; начальные значения как ψ, так и ∂ t ψ могут быть свободно выбраны, и плотность может стать отрицательной, что невозможно для законной плотности вероятности. Таким образом, нельзя получить простое обобщение уравнения Шредингера при наивном предположении, что волновая функция является релятивистским скаляром, а уравнение, которому она удовлетворяет, второго порядка по времени.
Хотя это не является успешным релятивистским обобщением уравнения Шредингера, это уравнение возрождается в контексте квантовой теории поля , где оно известно как уравнение Клейна–Гордона , и описывает поле бесспиновой частицы (например, пи-мезон или бозон Хиггса ). Исторически сам Шредингер пришел к этому уравнению раньше, чем к тому, которое носит его имя, но вскоре отказался от него. В контексте квантовой теории поля неопределенная плотность понимается как соответствующая плотности заряда , которая может быть положительной или отрицательной, а не плотности вероятности.
Дирак, таким образом, подумал попробовать уравнение, которое было бы первым порядком как в пространстве, так и во времени. Он постулировал уравнение вида , в котором операторы должны быть независимы от для линейности и независимы от для однородности пространства-времени. Эти ограничения подразумевали дополнительные динамические переменные, от которых будут зависеть операторы; из этого требования Дирак сделал вывод, что операторы будут зависеть от матриц 4x4, связанных с матрицами Паули. [9] : 205
Например, можно было бы формально (т. е. злоупотребляя обозначениями ) взять релятивистское выражение для энергии, заменить p его операторным эквивалентом, разложить квадратный корень в бесконечный ряд производных операторов, составить задачу на собственные значения, а затем решить уравнение формально итерациями. Большинство физиков мало верили в такой процесс, даже если бы он был технически возможен.
Как гласит история, Дирак сидел в Кембридже, размышляя над этой проблемой, и тут ему пришла в голову идея извлечь квадратный корень из волнового оператора (см. также полупроизводную ) следующим образом:
При умножении правой части становится очевидным, что для того, чтобы все перекрестные члены, такие как ∂ x ∂ y, обратились в нуль, нужно предположить , что
Дирак, который как раз тогда был интенсивно занят разработкой основ матричной механики Гейзенберга , сразу понял, что эти условия могут быть выполнены, если A , B , C и D являются матрицами , что подразумевает, что волновая функция имеет несколько компонент . Это сразу же объяснило появление двухкомпонентных волновых функций в феноменологической теории спина Паули , что до тех пор считалось загадочным даже для самого Паули. Однако для создания системы с требуемыми свойствами нужны как минимум матрицы 4 × 4 — поэтому волновая функция имела четыре компонента, а не два, как в теории Паули, или один, как в голой теории Шредингера. Четырехкомпонентная волновая функция представляет собой новый класс математических объектов в физических теориях, который впервые появляется здесь.
Учитывая факторизацию в терминах этих матриц, теперь можно немедленно записать уравнение с подлежащим определению. Применяя снова матричный оператор к обеим сторонам, получаем
Принимая показывает, что все компоненты волновой функции в отдельности удовлетворяют релятивистскому соотношению энергии-импульса. Таким образом, искомое уравнение первого порядка как по пространству, так и по времени имеет вид
Принимая во внимание , что , уравнение Дирака получается так, как написано выше.
Чтобы продемонстрировать релятивистскую инвариантность уравнения, выгодно привести его к форме, в которой пространственные и временные производные появляются на равных основаниях. Новые матрицы вводятся следующим образом: и уравнение принимает вид (помня определение ковариантных компонентов 4-градиента и особенно то, что ∂ 0 = 1/с ∂ т )
где подразумевается суммирование по значениям дважды повторенного индекса μ = 0, 1, 2, 3 , а ∂ μ — 4-градиент. На практике гамма-матрицы часто записывают в терминах подматриц 2 × 2, взятых из матриц Паули и единичной матрицы 2 × 2. Явно стандартное представление имеет вид
Полная система суммируется с использованием метрики Минковского на пространстве-времени в форме , где выражение в скобках обозначает антикоммутатор . Это определяющие соотношения алгебры Клиффорда над псевдоортогональным 4-мерным пространством с метрической сигнатурой (+ − − −) . Конкретная алгебра Клиффорда, используемая в уравнении Дирака, сегодня известна как алгебра Дирака . Хотя Дирак не признавал это таковым во время формулировки уравнения, оглядываясь назад, введение этой геометрической алгебры представляет собой огромный шаг вперед в развитии квантовой теории.
Уравнение Дирака теперь можно интерпретировать как уравнение собственных значений , где масса покоя пропорциональна собственному значению оператора 4-импульса , причем константа пропорциональности равна скорости света:
Используя ( произносится как «д-слэш»), [10] согласно нотации Фейнмана с косой чертой, уравнение Дирака принимает вид:
На практике физики часто используют единицы измерения, такие как ħ = c = 1 , известные как естественные единицы . Тогда уравнение принимает простую форму
Основная теорема [ которая? ] гласит, что если даны два различных набора матриц, которые оба удовлетворяют соотношениям Клиффорда , то они связаны друг с другом преобразованием подобия :
Если, кроме того, все матрицы унитарны , как и множество Дирака, то само S является унитарным ;
Преобразование U уникально с точностью до мультипликативного множителя с абсолютным значением 1. Теперь представим, что преобразование Лоренца было выполнено над пространственными и временными координатами и над производными операторами, которые образуют ковариантный вектор. Чтобы оператор γ μ ∂ μ оставался инвариантным, гаммы должны преобразовываться между собой как контравариантный вектор относительно их индекса пространства-времени. Эти новые гаммы сами будут удовлетворять соотношениям Клиффорда из-за ортогональности преобразования Лоренца. По ранее упомянутой основной теореме [ which? ] можно заменить новый набор старым набором, подвергнутым унитарному преобразованию. В новой системе отсчета, помня, что масса покоя является релятивистским скаляром, уравнение Дирака тогда примет вид
Если преобразованный спинор определить как, то преобразованное уравнение Дирака получается таким образом, что демонстрирует явную релятивистскую инвариантность :
Таким образом, выбор любого унитарного представления гамм является окончательным, если спинор преобразуется согласно унитарному преобразованию, которое соответствует данному преобразованию Лоренца.
Различные представления используемых матриц Дирака позволят сфокусировать внимание на конкретных аспектах физического содержания волновой функции Дирака. Представление, показанное здесь, известно как стандартное представление – в нем верхние два компонента волновой функции переходят в 2-спинорную волновую функцию Паули в пределе низких энергий и малых скоростей по сравнению со светом.
Приведенные выше соображения раскрывают происхождение гамм в геометрии , возвращаясь к изначальной мотивации Грассмана; они представляют собой фиксированный базис единичных векторов в пространстве-времени. Аналогично, произведения гамм, такие как γ μ γ ν, представляют собой ориентированные элементы поверхности и так далее. Имея это в виду, можно найти форму единичного элемента объема в пространстве-времени в терминах гамм следующим образом. По определению, это
Чтобы это было инвариантом, символ эпсилон должен быть тензором , и поэтому должен содержать множитель √ g , где g — определитель метрического тензора . Поскольку это отрицательно, этот множитель является мнимым . Таким образом
Эта матрица имеет специальный символ γ 5 , ввиду ее важности при рассмотрении несобственных преобразований пространства-времени, то есть тех, которые изменяют ориентацию базисных векторов. В стандартном представлении это
Также будет обнаружено, что эта матрица антикоммутирует с четырьмя другими матрицами Дирака:
Он играет ведущую роль, когда возникают вопросы четности , поскольку элемент объема как направленная величина меняет знак при пространственно-временном отражении. Таким образом, взятие положительного квадратного корня выше равнозначно выбору соглашения о хенде в пространстве-времени.
Необходимость введения полуцелого спина экспериментально восходит к результатам эксперимента Штерна–Герлаха . Пучок атомов пропускается через сильное неоднородное магнитное поле , которое затем разделяется на N частей в зависимости от собственного углового момента атомов. Было обнаружено, что для атомов серебра пучок разделяется на две части; поэтому основное состояние не может быть целым , поскольку даже если бы собственный угловой момент атомов был как можно меньше, 1, пучок разделился бы на три части, соответствующие атомам с L z = −1, 0, +1 . Вывод состоит в том, что атомы серебра имеют чистый собственный угловой момент 1/2 . Паули создал теорию, которая объяснила это расщепление, введя двухкомпонентную волновую функцию и соответствующий поправочный член в гамильтониан , представляющий полуклассическую связь этой волновой функции с приложенным магнитным полем, как в единицах СИ : (Обратите внимание, что жирные символы подразумевают евклидовы векторы в 3 измерениях , тогда как четырехмерный вектор Минковского A μ можно определить как )
Здесь A и представляют компоненты электромагнитного четырехпотенциала в их стандартных единицах СИ, а три сигмы являются матрицами Паули . При возведении в квадрат первого члена обнаруживается остаточное взаимодействие с магнитным полем, а также обычный классический гамильтониан заряженной частицы, взаимодействующей с приложенным полем в единицах СИ :
Этот гамильтониан теперь является матрицей 2 × 2 , поэтому уравнение Шредингера, основанное на нем, должно использовать двухкомпонентную волновую функцию. При введении внешнего электромагнитного 4-векторного потенциала в уравнение Дирака аналогичным образом, известным как минимальная связь , оно принимает вид:
Второе применение оператора Дирака теперь воспроизведет член Паули точно так же, как и раньше, поскольку пространственные матрицы Дирака, умноженные на i , имеют те же свойства возведения в квадрат и коммутации, что и матрицы Паули. Более того, значение гиромагнитного отношения электрона, стоящего перед новым членом Паули, объясняется из первых принципов. Это было главным достижением уравнения Дирака и вселило в физиков большую веру в его общую правильность. Однако это еще не все. Теорию Паули можно рассматривать как низкоэнергетический предел теории Дирака следующим образом. Сначала уравнение записывается в виде связанных уравнений для 2-спиноров с восстановленными единицами СИ: так
Если предположить, что поле слабое, а движение электрона нерелятивистское, то полная энергия электрона приблизительно равна его энергии покоя , а импульс переходит к классическому значению, поэтому второе уравнение можно записать так:
что имеет порядок Таким образом, при типичных энергиях и скоростях нижние компоненты спинора Дирака в стандартном представлении значительно подавлены по сравнению с верхними компонентами. Подстановка этого выражения в первое уравнение дает после некоторой перестановки
Оператор слева представляет собой полную энергию частицы, уменьшенную на ее энергию покоя, которая является просто ее классической кинетической энергией , поэтому можно восстановить теорию Паули, отождествив его 2-спинор с верхними компонентами спинора Дирака в нерелятивистском приближении. Дальнейшее приближение дает уравнение Шредингера как предел теории Паули. Таким образом, уравнение Шредингера можно рассматривать как далеко нерелятивистское приближение уравнения Дирака, когда можно пренебречь спином и работать только при низких энергиях и скоростях. Это также было большим триумфом для нового уравнения, поскольку оно проследило таинственное i , которое появляется в нем, и необходимость комплексной волновой функции обратно в геометрию пространства-времени через алгебру Дирака. Это также подчеркивает, почему уравнение Шредингера, хотя и кажущееся в форме уравнения диффузии , на самом деле представляет собой распространение волн.
Следует особо подчеркнуть, что весь спинор Дирака представляет собой неприводимое целое. Разделение спинора Дирака на большие и малые компоненты, выполненное здесь, зависит от справедливости низкоэнергетического приближения. Компоненты, которые были проигнорированы выше, чтобы показать, что теория Паули может быть восстановлена низкоскоростным приближением уравнения Дирака, необходимы для создания новых явлений, наблюдаемых в релятивистском режиме, среди которых антиматерия и рождение и уничтожение частиц.
В безмассовом случае уравнение Дирака сводится к уравнению Вейля , которое описывает релятивистские безмассовые частицы со спином 1 ⁄ 2. [11]
Теория приобретает вторую симметрию: см. ниже.
Критический физический вопрос в квантовой теории заключается в следующем: каковы физически наблюдаемые величины, определяемые теорией? Согласно постулатам квантовой механики, такие величины определяются эрмитовыми операторами , которые действуют на гильбертовом пространстве возможных состояний системы. Собственные значения этих операторов являются тогда возможными результатами измерения соответствующей физической величины. В теории Шредингера простейшим таким объектом является общий гамильтониан, который представляет собой полную энергию системы. Чтобы сохранить эту интерпретацию при переходе к теории Дирака, гамильтониан должен быть взят таким, где, как всегда, подразумевается суммирование по дважды повторенному индексу k = 1, 2, 3 . Это выглядит многообещающе, поскольку можно увидеть путем проверки энергию покоя частицы и, в случае A = 0 , энергию заряда, помещенного в электрический потенциал cqA 0 . А как насчет члена, включающего векторный потенциал? В классической электродинамике энергия заряда, движущегося в приложенном потенциале, равна
Таким образом, гамильтониан Дирака принципиально отличается от своего классического аналога, и нужно быть очень осторожным, чтобы правильно определить, что наблюдается в этой теории. Большая часть, по-видимому, парадоксального поведения, подразумеваемого уравнением Дирака, сводится к неправильной идентификации этих наблюдаемых. [ необходима цитата ]
Отрицательные решения уравнения E проблематичны, поскольку предполагалось, что частица имеет положительную энергию. Однако, с математической точки зрения, у нас, по-видимому, нет причин отвергать решения с отрицательной энергией. Поскольку они существуют, их нельзя просто игнорировать, поскольку, как только включается взаимодействие между электроном и электромагнитным полем, любой электрон, помещенный в собственное состояние с положительной энергией, распадется на собственные состояния с отрицательной энергией с последовательно более низкой энергией. Реальные электроны, очевидно, не ведут себя таким образом, или они исчезли бы, испуская энергию в форме фотонов .
Чтобы справиться с этой проблемой, Дирак ввел гипотезу, известную как теория дырок , о том, что вакуум является квантовым состоянием многих тел, в котором все собственные состояния электронов с отрицательной энергией заняты. Это описание вакуума как «моря» электронов называется морем Дирака . Поскольку принцип исключения Паули запрещает электронам занимать одно и то же состояние, любой дополнительный электрон будет вынужден занимать собственное состояние с положительной энергией, а электронам с положительной энергией будет запрещено распадаться на собственные состояния с отрицательной энергией.
Дирак далее рассуждал, что если собственные состояния с отрицательной энергией заполнены не полностью, каждое незанятое собственное состояние — называемое дыркой — будет вести себя как положительно заряженная частица. Дыра обладает положительной энергией, поскольку для создания пары частица-дырка из вакуума требуется энергия. Как отмечалось выше, Дирак изначально думал, что дырка может быть протоном, но Герман Вейль указал, что дырка должна вести себя так, как если бы она имела ту же массу, что и электрон, тогда как протон более чем в 1800 раз тяжелее. Дыра в конечном итоге была идентифицирована как позитрон , экспериментально обнаруженный Карлом Андерсоном в 1932 году. [12]
Не вполне удовлетворительно описывать «вакуум», используя бесконечное море электронов с отрицательной энергией. Бесконечно отрицательные вклады от моря электронов с отрицательной энергией должны быть отменены бесконечной положительной «голой» энергией, а вклад в плотность заряда и ток, исходящий от моря электронов с отрицательной энергией, в точности отменен бесконечным положительным фоном « желе », так что чистая плотность электрического заряда вакуума равна нулю. В квантовой теории поля преобразование Боголюбова на операторах рождения и уничтожения (превращающее занятое состояние электрона с отрицательной энергией в незанятое состояние позитрона с положительной энергией и незанятое состояние электрона с отрицательной энергией в занятое состояние позитрона с положительной энергией) позволяет нам обойти формализм моря Дирака, хотя формально он эквивалентен ему.
Однако в некоторых приложениях физики конденсированного состояния основные концепции «теории дырок» справедливы. Море электронов проводимости в электрическом проводнике , называемое морем Ферми , содержит электроны с энергией вплоть до химического потенциала системы. Незаполненное состояние в море Ферми ведет себя как положительно заряженный электрон, и хотя его тоже называют «электронной дыркой», оно отличается от позитрона. Отрицательный заряд моря Ферми уравновешивается положительно заряженной ионной решеткой материала.
В квантовых теориях поля, таких как квантовая электродинамика , поле Дирака подвергается процессу вторичного квантования , который разрешает некоторые парадоксальные особенности уравнения.
В своей современной формулировке для теории поля уравнение Дирака записано в терминах спинорного поля Дирака , принимающего значения в комплексном векторном пространстве, конкретно описываемом как , определенном на плоском пространстве-времени ( пространстве Минковского ) . Его выражение также содержит гамма-матрицы и параметр, интерпретируемый как масса, а также другие физические константы. Дирак впервые получил свое уравнение посредством факторизации соотношения эквивалентности энергии-импульса-массы Эйнштейна, предполагая скалярное произведение векторов импульса, определяемых метрическим тензором, и квантовал полученное соотношение, связывая импульсы с их соответствующими операторами.
В терминах поля уравнение Дирака тогда имеет вид
и в натуральных единицах , с обозначением Фейнмана ,
Гамма-матрицы представляют собой набор из четырех комплексных матриц (элементов ), которые удовлетворяют определяющим антикоммутационным соотношениям: где — элемент метрики Минковского, а индексы пробегают 0, 1, 2 и 3. Эти матрицы могут быть реализованы явно при выборе представления. Два распространенных выбора — это представление Дирака и киральное представление. Представление Дирака — это где — матрицы Паули .
Для хирального представления они одинаковы, но
Обозначение с косой чертой является компактной записью для , где — четырехвекторный (часто это четырехвекторный дифференциальный оператор ). Подразумевается суммирование по индексу .
В качестве альтернативы четыре связанных линейных уравнения в частных производных первого порядка для четырех величин, составляющих волновую функцию, можно записать в виде вектора. В единицах Планка это становится: [13] : 6 , что делает более ясным, что это набор из четырех уравнений в частных производных с четырьмя неизвестными функциями. (Обратите внимание, что перед членом не стоит i, поскольку σ y является мнимой.)
Дираковское сопряженное уравнение спинорного поля определяется как Используя свойство гамма-матриц (которое непосредственно следует из свойств эрмитовости ), можно вывести сопряженное уравнение Дирака, взяв эрмитово сопряженное уравнение Дирака и умножив справа на : где частная производная действует справа на : записанное обычным образом в терминах левого действия производной, мы имеем
Применяем к уравнению Дирака, получаем То есть каждая компонента спинорного поля Дирака удовлетворяет уравнению Клейна–Гордона .
Сохраняющийся ток теории - это
Сложение уравнений Дирака и сопряженных уравнений Дирака дает по правилу Лейбница:
Другой подход к выводу этого выражения — вариационные методы, применение теоремы Нётер для глобальной симметрии для вывода сохраняющегося тока.
Напомним, что лагранжиан имеет вид При симметрии, которая посылает нам , мы обнаруживаем, что лагранжиан инвариантен.
Теперь, считая параметр вариации бесконечно малым, мы работаем в первом порядке по и игнорируем члены. Из предыдущего обсуждения мы сразу видим явную вариацию в лагранжиане из-за того, что она исчезает, то есть под вариацией, где .
В рамках теоремы Нётер мы находим неявную вариацию в лагранжиане из-за вариации полей. Если уравнения движения для удовлетворяются, то
Это сразу упрощается, поскольку в лагранжиане нет частных производных . — бесконечно малая вариация. Мы оцениваем Уравнение ( * ) в конечном итоге имеет вид
Поскольку оператор Дирака действует на 4-кортежи квадратично-интегрируемых функций , его решения должны быть членами одного и того же гильбертова пространства . Тот факт, что энергии решений не имеют нижней границы, является неожиданным.
Решения с плоскими волнами возникают из анзаца , который моделирует частицу с определенным 4-импульсом , где
Для этого анзаца уравнение Дирака становится уравнением для : После выбора представления для гамма-матриц решение этого уравнения сводится к решению системы линейных уравнений. Это свойство гамма-матриц, не зависящее от представления, что пространство решений является двумерным (см. здесь ).
Например, в киральном представлении для пространство решений параметризуется вектором , где и — квадратный корень эрмитовой матрицы.
Эти решения с плоскими волнами служат отправной точкой для канонического квантования.
Как уравнение Дирака, так и сопряженное уравнение Дирака могут быть получены из (варьирования) действия с определенной плотностью Лагранжа, которая определяется как:
Если изменить это относительно, то получим сопряженное уравнение Дирака. Между тем, если изменить это относительно, то получим уравнение Дирака.
В натуральных единицах и с обозначением через косую черту действие тогда будет следующим:
Для этого действия сохраняющийся ток выше возникает как сохраняющийся ток, соответствующий глобальной симметрии через теорему Нётер для теории поля. Калибровка этой теории поля путем изменения симметрии на локальную, зависящую от точки пространства-времени, дает калибровочную симметрию (на самом деле, калибровочную избыточность). Результирующая теория — квантовая электродинамика или КЭД. См. ниже более подробное обсуждение.
Уравнение Дирака инвариантно относительно преобразований Лоренца, то есть под действием группы Лоренца или, строго говоря , компонента, связанного с тождеством.
Для спинора Дирака, рассматриваемого конкретно как принимающего значения в , преобразование при преобразовании Лоренца задается комплексной матрицей . Существуют некоторые тонкости в определении соответствующего , а также стандартное злоупотребление обозначениями.
Большинство обработок происходят на уровне алгебры Ли . Более подробную обработку см. здесь . Группа Лоренца действительных матриц, действующая на , генерируется набором из шести матриц с компонентами Когда оба индекса повышаются или понижаются, они просто являются «стандартным базисом» антисимметричных матриц.
Они удовлетворяют коммутационным соотношениям алгебры Лоренца. В статье об алгебре Дирака также обнаружено, что спиновые генераторы удовлетворяют коммутационным соотношениям алгебры Лоренца.
Преобразование Лоренца можно записать как, где компоненты антисимметричны относительно .
Соответствующее преобразование в пространстве спинов — Это злоупотребление обозначениями, но стандартное. Причина в том, что это не вполне определенная функция от , поскольку есть два разных набора компонентов (с точностью до эквивалентности), которые дают одно и то же, но разное . На практике мы неявно выбираем один из них , а затем хорошо определяется в терминах
При преобразовании Лоренца уравнение Дирака принимает вид
Умножение обеих сторон слева на и возвращение фиктивной переменной к дает Мы продемонстрируем инвариантность, если или эквивалентно Это проще всего показать на уровне алгебры. Предположим, что преобразования параметризованы бесконечно малыми компонентами , тогда в первом порядке по , в левой части мы получаем , а в правой части мы получаем Это стандартное упражнение для оценки коммутатора в левой части. Запись в терминах компонентов завершает доказательство.
С инвариантностью Лоренца связан сохраняющийся ток Нётер, или, скорее, тензор сохраняющихся токов Нётер . Аналогично, поскольку уравнение инвариантно относительно трансляций, существует тензор сохраняющихся токов Нётер , который можно определить как тензор энергии-импульса теории. Ток Лоренца можно записать в терминах тензора энергии-импульса в дополнение к тензору, представляющему внутренний угловой момент.
Уравнение Дирака является ковариантным по отношению к Лоренцу . Формулировка этого помогает прояснить не только уравнение Дирака, но и спинор Майораны и спинор Элко, которые, хотя и тесно связаны, имеют тонкие и важные различия.
Понимание лоренцевой ковариантности упрощается, если иметь в виду геометрический характер процесса. [14] Пусть будет одной фиксированной точкой в пространственно-временном многообразии . Ее местоположение может быть выражено в нескольких системах координат . В физической литературе они записываются как и , с пониманием того, что и и описывают одну и ту же точку , но в разных локальных системах отсчета ( система отсчета над небольшим протяженным участком пространства-времени). Можно представить себе, что над ней находится волокно различных систем координат. В геометрических терминах говорят, что пространство-время можно охарактеризовать как расслоение волокон , и, в частности, расслоение систем координат . Разница между двумя точками и в одном и том же волокне является комбинацией вращений и лоренцевских усилений . Выбор системы координат является (локальным) сечением через это расслоение.
Связанным с расслоением фрейма является второе расслоение, расслоение спинора . Сечение через расслоение спинора — это просто поле частиц (спинор Дирака, в данном случае). Различные точки в спинорном волокне соответствуют одному и тому же физическому объекту (фермиону), но выраженному в разных лоренцевых фреймах. Очевидно, что расслоение фрейма и расслоение спинора должны быть связаны друг с другом согласованным образом, чтобы получить согласованные результаты; формально говорят, что расслоение спинора является ассоциированным расслоением ; оно связано с главным расслоением , которое в данном случае является расслоением фрейма. Различия между точками на волокне соответствуют симметриям системы. Спинорное расслоение имеет два различных генератора своих симметрий: полный угловой момент и собственный угловой момент . Оба соответствуют преобразованиям Лоренца, но по-разному.
Представление здесь следует представлению Ицыксона и Зубера. [15] Оно почти идентично представлению Бьёркена и Дрелла. [16] Похожий вывод в общей теории относительности можно найти у Вайнберга. [17] Здесь мы фиксируем наше пространство-время плоским, то есть наше пространство-время является пространством Минковского.
При преобразовании Лоренца спинор Дирака преобразуется как Можно показать, что явное выражение для задается соотношением , где параметризует преобразование Лоренца, а — шесть матриц 4×4, удовлетворяющие следующему:
Эту матрицу можно интерпретировать как собственный угловой момент поля Дирака. То, что она заслуживает такой интерпретации, возникает из сопоставления ее с генератором преобразований Лоренца , имеющим форму Это можно интерпретировать как полный угловой момент . Он действует на спинорное поле как Обратите внимание, что вышеприведенное выражение не имеет штриха: вышеприведенное выражение получается путем преобразования, получая изменение на , а затем возвращаясь к исходной системе координат .
Геометрическая интерпретация вышесказанного заключается в том, что поле фрейма является аффинным , не имеющим предпочтительного начала. Генератор генерирует симметрии этого пространства: он обеспечивает перемаркировку фиксированной точки Генератор генерирует движение из одной точки в волокне в другую: движение из с обоими и все еще соответствующее той же точке пространства-времени Эти, возможно, тупые замечания можно прояснить с помощью явной алгебры.
Пусть будет преобразованием Лоренца. Уравнение Дирака имеет вид Если уравнение Дирака должно быть ковариантным, то оно должно иметь точно такую же форму во всех системах отсчета Лоренца: Оба спинора и должны описывать одно и то же физическое поле, и поэтому должны быть связаны преобразованием, которое не меняет никаких физических наблюдаемых (заряд, ток, массу и т. д. ). Преобразование должно кодировать только изменение системы координат. Можно показать, что такое преобразование представляет собой унитарную матрицу 4×4 . Таким образом, можно предположить, что соотношение между двумя системами можно записать как Подставляя это в преобразованное уравнение, получаем Координаты, связанные преобразованием Лоренца, удовлетворяют: Исходное уравнение Дирака затем восстанавливается, если Явное выражение для (равное выражению, приведенному выше) можно получить, рассматривая преобразование Лоренца бесконечно малого вращения вблизи тождественного преобразования: где — метрический тензор : и симметрично, тогда как антисимметрично. После включения и выключения получаем , что является (бесконечно малой) формой для вышеизложенного и дает отношение . Чтобы получить аффинную перемаркировку, запишите
После надлежащей антисимметризации получается генератор симметрий, данный ранее. Таким образом, оба и можно назвать «генераторами преобразований Лоренца», но с тонким различием: первый соответствует перемаркировке точек на аффинном расслоении репера , что вызывает трансляцию вдоль волокна спинора на расслоении спина , тогда как второй соответствует трансляциям вдоль волокна спинового расслоения (взятым как движение вдоль расслоения репера, а также движение вдоль волокна спинового расслоения). Вайнберг приводит дополнительные аргументы в пользу их физической интерпретации как полного и внутреннего углового момента. [18]
Уравнение Дирака можно сформулировать и другими способами.
В этой статье разработано уравнение Дирака в плоском пространстве-времени согласно специальной теории относительности. Можно сформулировать уравнение Дирака в искривленном пространстве-времени .
В этой статье разработано уравнение Дирака с использованием четырехвекторов и операторов Шредингера. Уравнение Дирака в алгебре физического пространства использует алгебру Клиффорда над действительными числами, тип геометрической алгебры.
Как упоминалось выше, безмассовое уравнение Дирака немедленно сводится к однородному уравнению Вейля . Используя киральное представление гамма-матриц , уравнение с ненулевой массой также можно разложить на пару связанных неоднородных уравнений Вейля, действующих на первую и последнюю пары индексов исходного четырехкомпонентного спинора, т.е. , где и являются двухкомпонентными спинорами Вейля . Это происходит потому, что форма косого блока киральных гамма-матриц означает, что они меняют местами и и применяют матрицы Паули два на два к каждой:
.
Итак, уравнение Дирака
становится
что в свою очередь эквивалентно паре неоднородных уравнений Вейля для безмассовых лево- и правоспиральных спиноров , где сила связи пропорциональна массе:
. [ требуется разъяснение ]
Это было предложено в качестве интуитивного объяснения Zitterbewegung , поскольку эти безмассовые компоненты будут распространяться со скоростью света и двигаться в противоположных направлениях, поскольку спиральность является проекцией спина на направление движения. [19] Здесь роль «массы» заключается не в том, чтобы сделать скорость меньше скорости света, а вместо этого контролировать среднюю скорость, с которой происходят эти инверсии; в частности, инверсии можно смоделировать как процесс Пуассона . [20]
В этом разделе используются естественные единицы. Константа связи по умолчанию обозначена как : этот параметр также можно рассматривать как моделирующий заряд электрона.
Уравнение Дирака и действие допускают симметрию, где поля преобразуются как Это глобальная симметрия, известная как векторная симметрия (в отличие от аксиальной симметрии: см. ниже). По теореме Нётер существует соответствующий сохраняющийся ток: это было упомянуто ранее как
Если мы «повысим» глобальную симметрию, параметризованную константой , до локальной симметрии, параметризованной функцией , или, что эквивалентно, уравнение Дирака больше не будет инвариантным: существует остаточная производная .
Исправление происходит так же, как в скалярной электродинамике : частная производная повышается до ковариантной производной . Ковариантная производная зависит от поля, на которое оказывается воздействие. Новое введенное — это 4-векторный потенциал из электродинамики, но его также можно рассматривать как калибровочное поле или связь .
Закон преобразования при калибровочных преобразованиях для тогда является обычным, но его также можно вывести, предположив, что ковариантные производные преобразуются при калибровочном преобразовании как Затем мы получаем калибровочно-инвариантное действие Дирака, преобразуя частную производную в ковариантную: Последний шаг, необходимый для записи калибровочно-инвариантного лагранжиана, — это добавление члена лагранжиана Максвелла. Объединение их вместе дает
Расширение ковариантной производной позволяет записать действие во второй полезной форме:
Безмассовые фермионы Дирака, то есть поля, удовлетворяющие уравнению Дирака с , допускают вторую, неэквивалентную симметрию.
Это легче всего увидеть, записав четырехкомпонентный фермион Дирака как пару двухкомпонентных векторных полей и приняв хиральное представление для гамма-матриц, так что можно записать, где имеет компоненты и имеет компоненты .
Тогда действие Дирака принимает форму То есть оно распадается на теорию двух спиноров Вейля или фермионов Вейля.
Прежняя векторная симметрия все еще присутствует, где и вращаются одинаково. Эта форма действия делает вторую неэквивалентную симметрию явной: Это также может быть выражено на уровне фермиона Дирака как где — экспоненциальное отображение для матриц.
Это не единственная возможная симметрия, но она условна. Любая «линейная комбинация» векторной и осевой симметрии также является симметрией.
Классически, аксиальная симметрия допускает хорошо сформулированную калибровочную теорию. Но на квантовом уровне существует аномалия , то есть препятствие для калибровки.
Мы можем расширить это обсуждение от абелевой симметрии до общей неабелевой симметрии относительно калибровочной группы , группы цветовых симметрий для теории.
Для конкретности зафиксируем , специальную унитарную группу матриц, действующую на .
До этого раздела можно было рассматривать как спинорное поле в пространстве Минковского, другими словами, функцию , а ее компоненты в обозначены спиновыми индексами, традиционно греческими индексами, взятыми из начала алфавита .
Переводя теорию в калибровочную теорию, неформально приобретает часть, преобразующуюся как , и они помечены цветовыми индексами, традиционно латинскими индексами . Всего имеет компоненты, заданные в индексах как . «Спинор» помечает только то, как поле преобразуется при пространственно-временных преобразованиях.
Формально оценивается в тензорном произведении, то есть является функцией
Калибровка происходит аналогично абелеву случаю, с некоторыми отличиями. При калибровочном преобразовании спинорные поля преобразуются как Матрично-значное калибровочное поле или связь преобразуется как и ковариантные производные, определенные как
Запись калибровочно-инвариантного действия происходит точно так же, как и в случае, заменяя лагранжиан Максвелла лагранжианом Янга–Миллса , где напряженность поля Янга–Миллса или кривизна определяются здесь как и является матричным коммутатором.
Действие тогда
Для физических приложений случай описывает кварковый сектор Стандартной модели , который моделирует сильные взаимодействия . Кварки моделируются как спиноры Дирака; калибровочное поле — это глюонное поле. Случай описывает часть электрослабого сектора Стандартной модели. Лептоны, такие как электроны и нейтрино, являются спинорами Дирака; калибровочное поле — это калибровочный бозон.
Это выражение можно обобщить на произвольную группу Ли со связностью и представлением , где цветовая часть имеет значение в . Формально поле Дирака является функцией
Тогда преобразуется под действием калибровочного преобразования как и ковариантная производная определяется как , где здесь мы рассматриваем как представление алгебры Ли алгебры Ли, связанной с .
Эту теорию можно обобщить на искривленное пространство-время, но есть тонкости, которые возникают в калибровочной теории на общем пространстве-времени (или, еще более обобщенно, на многообразии), которые на плоском пространстве-времени можно игнорировать. Это в конечном счете связано с сжимаемостью плоского пространства-времени, что позволяет нам рассматривать калибровочное поле и калибровочные преобразования как определенные глобально на .