В физике специальная теория относительности , или сокращенно специальная теория относительности , является научной теорией взаимосвязи пространства и времени . В статье Альберта Эйнштейна 1905 года « Об электродинамике движущихся тел » теория представлена как основанная всего на двух постулатах : [стр. 1] [1] [2]
Первый постулат впервые сформулировал Галилео Галилей (см. Галилеевская инвариантность ).
Специальная теория относительности была описана Альбертом Эйнштейном в статье, опубликованной 26 сентября 1905 года под названием «Об электродинамике движущихся тел». [стр. 1] Уравнения электромагнетизма Максвелла оказались несовместимыми с механикой Ньютона , и эксперимент Майкельсона-Морли не смог обнаружить движение Земли относительно гипотетического светоносного эфира . Это привело к разработке преобразований Лоренца Хендриком Лоренцом , которые корректируют расстояния и время для движущихся объектов. Специальная теория относительности исправляет существующие до сих пор законы механики, чтобы обрабатывать ситуации, включающие все движения, и особенно те, которые происходят со скоростью, близкой к скорости света (известной какрелятивистские скорости ). Сегодня доказано, что специальная теория относительности является наиболее точной моделью движения при любой скорости, когда гравитационные и квантовые эффекты пренебрежимо малы.[3][4]Тем не менее, ньютоновская модель по-прежнему верна как простое и точное приближение при низких скоростях (относительно скорости света), например, при повседневных движениях на Земле.
Специальная теория относительности имеет широкий спектр следствий, которые были экспериментально подтверждены. [5] Они включают в себя относительность одновременности , сокращение длины , замедление времени , релятивистскую формулу сложения скоростей, релятивистский эффект Доплера , релятивистскую массу , универсальный предел скорости , эквивалентность массы и энергии , скорость причинности и прецессию Томаса . [1] [2] Например, она заменила традиционное понятие абсолютного универсального времени на понятие времени, которое зависит от системы отсчета и пространственного положения. Вместо инвариантного временного интервала между двумя событиями существует инвариантный пространственно-временной интервал . В сочетании с другими законами физики два постулата специальной теории относительности предсказывают эквивалентность массы и энергии , как выражено в формуле эквивалентности массы и энергии , где - скорость света в вакууме. [6] [7] Она также объясняет, как связаны явления электричества и магнетизма. [1] [2]
Определяющей чертой специальной теории относительности является замена преобразований Галилея механики Ньютона на преобразования Лоренца . Время и пространство не могут быть определены отдельно друг от друга (как считалось ранее). Скорее, пространство и время переплетены в единый континуум, известный как «пространство-время» . События, которые происходят в одно и то же время для одного наблюдателя, могут происходить в разное время для другого.
До тех пор, пока несколько лет спустя Эйнштейн не разработал общую теорию относительности , которая ввела искривленное пространство-время для включения гравитации, фраза «специальная теория относительности» не использовалась. Иногда используется перевод «ограниченная относительность»; «специальная» на самом деле означает «особый случай». [стр. 2] [стр. 3] [стр. 4] [примечание 1] Некоторые работы Альберта Эйнштейна в области специальной теории относительности основаны на более ранних работах Хендрика Лоренца и Анри Пуанкаре . Теория стала по существу завершенной в 1907 году с работами Германа Минковского о пространстве-времени. [4]
Теория является «специальной» в том смысле, что она применима только в особом случае , когда пространство-время является «плоским», то есть, когда кривизна пространства-времени (следствие тензора энергии-импульса и представляющая гравитацию ) пренебрежимо мала. [8] [примечание 2] Чтобы правильно учесть гравитацию, Эйнштейн сформулировал общую теорию относительности в 1915 году. Специальная теория относительности, вопреки некоторым историческим описаниям, учитывает ускорения , а также ускоряющиеся системы отсчета . [9] [10]
Так же, как теория относительности Галилея теперь принимается как приближение специальной теории относительности, справедливое для низких скоростей, специальная теория относительности считается приближением общей теории относительности, справедливым для слабых гравитационных полей , то есть в достаточно малых масштабах (например, когда приливные силы пренебрежимо малы) и в условиях свободного падения . Но общая теория относительности включает неевклидову геометрию для представления гравитационных эффектов как геометрической кривизны пространства-времени. Специальная теория относительности ограничена плоским пространством-временем, известным как пространство Минковского . Пока Вселенную можно моделировать как псевдориманово многообразие , лоренц-инвариантная система отсчета, которая подчиняется специальной теории относительности, может быть определена для достаточно малой окрестности каждой точки в этом искривленном пространстве-времени .
Галилео Галилей уже постулировал, что не существует абсолютного и четко определенного состояния покоя (никаких привилегированных систем отсчета ), принцип, который теперь называется принципом относительности Галилея . Эйнштейн расширил этот принцип так, чтобы он учитывал постоянную скорость света, [11] явление, которое наблюдалось в эксперименте Майкельсона-Морли. Он также постулировал, что он справедлив для всех законов физики , включая как законы механики, так и электродинамики . [12]
«Размышления такого рода дали мне ясно понять еще вскоре после 1900 года, т. е. вскоре после новаторской работы Планка, что ни механика, ни электродинамика не могут (за исключением предельных случаев) претендовать на точную обоснованность. Постепенно я отчаялся в возможности открытия истинных законов посредством конструктивных усилий, основанных на известных фактах. Чем дольше и отчаяннее я пытался, тем больше приходил к убеждению, что только открытие универсального формального принципа может привести нас к гарантированным результатам... Как же тогда можно найти такой универсальный принцип?»
Альберт Эйнштейн: Автобиографические заметки [стр. 5]
Эйнштейн выделил два фундаментальных положения, которые казались наиболее достоверными, независимо от точной справедливости (тогда) известных законов механики или электродинамики. Эти положения заключались в постоянстве скорости света в вакууме и независимости физических законов (особенно постоянства скорости света) от выбора инерциальной системы. В своем первоначальном изложении специальной теории относительности в 1905 году он выразил эти постулаты следующим образом: [стр. 1]
Постоянство скорости света было мотивировано теорией электромагнетизма Максвелла [13] и отсутствием доказательств существования светоносного эфира . [14] Существуют противоречивые данные о степени влияния на Эйнштейна нулевого результата эксперимента Майкельсона-Морли. [15] [16] В любом случае, нулевой результат эксперимента Майкельсона-Морли помог представлению о постоянстве скорости света получить широкое и быстрое признание.
Вывод специальной теории относительности зависит не только от этих двух явных постулатов, но и от нескольких неявных предположений ( принимаемых почти во всех теориях физики ), включая изотропность и однородность пространства и независимость измерительных стержней и часов от их прошлой истории. [стр. 6]
После первоначального представления Эйнштейном специальной теории относительности в 1905 году было предложено много различных наборов постулатов в различных альтернативных выводах. [17] Но наиболее распространенным набором постулатов остаются те, которые использовались Эйнштейном в его оригинальной статье. Более математическое изложение принципа относительности, сделанное позже Эйнштейном, которое вводит концепцию простоты, не упомянутую выше, выглядит следующим образом:
Специальный принцип относительности : Если система координат K выбрана так, что по отношению к ней физические законы справедливы в их простейшей форме, то те же законы справедливы по отношению к любой другой системе координат K ′, движущейся равномерно и поступательно относительно K. [18 ]
Анри Пуанкаре предоставил математическую основу для теории относительности, доказав, что преобразования Лоренца являются подмножеством его группы преобразований симметрии Пуанкаре . Позднее Эйнштейн вывел эти преобразования из своих аксиом.
Во многих работах Эйнштейна представлены выводы преобразования Лоренца, основанные на этих двух принципах. [стр. 7]
Системы отсчета играют решающую роль в теории относительности. Термин «система отсчета», используемый здесь, представляет собой наблюдательную перспективу в пространстве, которое не претерпевает никаких изменений в движении (ускорении), из которой можно измерить положение по 3 пространственным осям (то есть в состоянии покоя или постоянной скорости). Кроме того, система отсчета имеет возможность определять измерения времени событий с помощью «часов» (любого устройства отсчета с равномерной периодичностью).
Событие — это явление, которому можно приписать единственный уникальный момент и местоположение в пространстве относительно системы отсчета: это «точка» в пространстве-времени . Поскольку скорость света постоянна в теории относительности независимо от системы отсчета, импульсы света можно использовать для однозначного измерения расстояний и отсылки к времени, когда события произошли, по часам, даже несмотря на то, что свету требуется время, чтобы достичь часов после того, как событие произошло.
Например, взрыв петарды можно считать «событием». Мы можем полностью определить событие по его четырем пространственно-временным координатам: время возникновения и его трехмерное пространственное положение определяют точку отсчета. Назовем эту систему отсчета S.
В теории относительности мы часто хотим вычислить координаты события из разных систем отсчета. Уравнения, связывающие измерения, сделанные в разных системах отсчета, называются уравнениями преобразования .
Чтобы получить представление о том, как пространственно-временные координаты, измеренные наблюдателями в разных системах отсчета, сравниваются друг с другом, полезно работать с упрощенной установкой с системами в стандартной конфигурации . [19] : 107 При осторожности это позволяет упростить математику без потери общности в полученных выводах. На рис. 2-1 две галилеевы системы отсчета (т. е. обычные трехмерные системы отсчета) отображаются в относительном движении. Система S принадлежит первому наблюдателю O , а система S ′ (произносится как «S штрих» или «S тире») принадлежит второму наблюдателю O ′ .
Поскольку в теории относительности нет абсолютной системы отсчета, понятие «движение» строго не существует, поскольку все может двигаться относительно какой-то другой системы отсчета. Вместо этого любые две системы, которые движутся с одинаковой скоростью в одном направлении, называются сопутствующими . Следовательно, S и S ′ не сопутствуют .
Принцип относительности , который гласит, что физические законы имеют одинаковую форму в каждой инерциальной системе отсчета , восходит к Галилею и был включен в ньютоновскую физику. Но в конце 19 века существование электромагнитных волн привело некоторых физиков к предположению, что вселенная заполнена веществом, которое они назвали « эфиром », которое, как они постулировали, будет действовать как среда, через которую распространяются эти волны или вибрации (во многих отношениях аналогично тому, как звук распространяется по воздуху). Считалось, что эфир является абсолютной системой отсчета , относительно которой можно измерить все скорости, и его можно считать фиксированным и неподвижным относительно Земли или какой-либо другой фиксированной точки отсчета. Предполагалось, что эфир достаточно упруг, чтобы поддерживать электромагнитные волны, в то время как эти волны могут взаимодействовать с материей, не оказывая при этом никакого сопротивления проходящим через него телам (его единственным свойством было то, что он позволял электромагнитным волнам распространяться). Результаты различных экспериментов, включая эксперимент Майкельсона-Морли в 1887 году (впоследствии подтвержденный более точными и новаторскими экспериментами), привели к появлению специальной теории относительности, показав, что эфира не существует. [20] Решение Эйнштейна состояло в том, чтобы отказаться от понятия эфира и абсолютного состояния покоя. В теории относительности любая система отсчета, движущаяся равномерно, будет соблюдать одни и те же законы физики. В частности, скорость света в вакууме всегда измеряется как c , даже если она измеряется несколькими системами, движущимися с разными (но постоянными) скоростями.
Из принципа относительности, без предположения о постоянстве скорости света (т. е. используя изотропию пространства и симметрию, подразумеваемую принципом специальной теории относительности), можно показать , что преобразования пространства-времени между инерциальными системами являются либо евклидовыми, либо галилеевыми, либо лоренцевскими. В лоренцевом случае можно получить сохранение релятивистского интервала и определенную конечную предельную скорость. Эксперименты показывают, что эта скорость является скоростью света в вакууме. [стр. 8] [21]
Эйнштейн последовательно основывал вывод инвариантности Лоренца (сущностного ядра специальной теории относительности) всего на двух основных принципах относительности и инвариантности скорости света. Он писал:
Фундаментальное понимание специальной теории относительности заключается в следующем: Допущения относительности и инвариантности скорости света совместимы, если постулировать соотношения нового типа («преобразования Лоренца») для преобразования координат и времени событий... Универсальный принцип специальной теории относительности содержится в постулате: Законы физики инвариантны относительно преобразований Лоренца (для перехода от одной инерциальной системы к любой другой произвольно выбранной инерциальной системе). Это ограничивающий принцип для законов природы... [стр. 5]
Таким образом, многие современные трактовки специальной теории относительности основывают ее на единственном постулате универсальной лоренц-ковариантности или, что эквивалентно, на единственном постулате пространства-времени Минковского . [стр. 9] [стр. 10]
Вместо того чтобы считать универсальную лоренц-ковариантность производным принципом, в этой статье она рассматривается как фундаментальный постулат специальной теории относительности. Традиционный двухпостулатный подход к специальной теории относительности представлен в бесчисленных учебниках для колледжей и популярных презентациях. [22] Учебники, начинающиеся с единственного постулата пространства-времени Минковского, включают учебники Тейлора и Уиллера [11] и Каллахана. [23] Этот подход также используется в статьях Википедии Пространство-время и Диаграмма Минковского .
Определим событие как имеющее пространственно-временные координаты ( t , x , y , z ) в системе S и ( t ′ , x ′ , y ′ , z ′ ) в системе отсчета, движущейся со скоростью v по оси x относительно этой системы S ′ . Тогда преобразование Лоренца указывает, что эти координаты связаны следующим образом: где — фактор Лоренца , а c — скорость света в вакууме, а скорость v системы S ′ относительно S параллельна оси x . Для простоты координаты y и z не затрагиваются; преобразуются только координаты x и t . Эти преобразования Лоренца образуют однопараметрическую группу линейных отображений , причем этот параметр называется быстротой .
Решение четырех уравнений преобразования выше для нештрихованных координат дает обратное преобразование Лоренца:
Это показывает, что нештрихованная система отсчета движется со скоростью − v , измеренной в штрихованной системе отсчета. [24]
Ничего особенного в оси x нет . Преобразование может применяться к оси y или z , или в любом направлении, параллельном движению (которое искривляется фактором γ ) и перпендикулярном; подробности см. в статье Преобразование Лоренца .
Величина, инвариантная относительно преобразований Лоренца, называется скаляром Лоренца .
Записывая преобразование Лоренца и его обратное в терминах разностей координат, где одно событие имеет координаты ( x 1 , t 1 ) и ( x ′ 1 , t ′ 1 ) , другое событие имеет координаты ( x 2 , t 2 ) и ( x ′ 2 , t ′ 2 ) , а разности определяются как
мы получаем
Если вместо разностей взять дифференциалы, то получим
Пространственно-временные диаграммы ( диаграммы Минковского ) являются чрезвычайно полезным средством визуализации того, как координаты преобразуются между различными системами отсчета. Хотя с их помощью не так просто выполнять точные вычисления, как напрямую используя преобразования Лоренца, их главная сила заключается в их способности обеспечивать интуитивное понимание результатов релятивистского сценария. [21]
Чтобы нарисовать пространственно-временную диаграмму, начнем с рассмотрения двух галилеевых систем отсчета, S и S', в стандартной конфигурации, как показано на рис. 2-1. [21] [25] : 155–199
Рис. 3-1a . Нарисуйте оси и кадра S. Ось горизонтальна, а (фактически ) ось вертикальна, что противоположно обычному соглашению в кинематике. Ось масштабируется с коэффициентом , так что обе оси имеют общие единицы длины. На показанной схеме линии сетки отстоят друг от друга на одну единицу расстояния. Диагональные линии под углом 45° представляют мировые линии двух фотонов, проходящих через начало координат в момент времени Наклон этих мировых линий равен 1, поскольку фотоны продвигаются на одну единицу в пространстве за единицу времени. Два события и были нанесены на этот график, так что их координаты можно сравнить в кадрах S и S'.
Рис. 3-1b . Нарисуйте оси и кадра S'. Ось представляет собой мировую линию начала системы координат S', измеренную в кадре S. На этом рисунке обе оси и наклонены относительно нештрихованных осей на угол , где Штрихованная и нештрихованная оси имеют общее начало, поскольку кадры S и S' были настроены в стандартной конфигурации, так что когда
Рис. 3-1c . Единицы в штрихованных осях имеют другой масштаб, чем единицы в нештрихованных осях. Из преобразований Лоренца мы видим, что координаты в штрихованной системе координат преобразуются в в нештрихованной системе координат. Аналогично, координаты в штрихованной системе координат преобразуются в в нештрихованной системе. Проведите линии сетки параллельно оси через точки , измеренные в нештрихованной системе отсчета, где — целое число. Аналогично, проведите линии сетки параллельно оси через , измеренные в нештрихованной системе отсчета. Используя теорему Пифагора, мы видим, что расстояние между единицами равно расстоянию между единицами, умноженному на расстояние между единицами, измеренное в системе отсчета S. Это отношение всегда больше 1 и в конечном итоге стремится к бесконечности, поскольку
Рис. 3-1d . Поскольку скорость света является инвариантом, мировые линии двух фотонов, проходящих через начало координат в момент времени, по-прежнему отображаются в виде диагональных линий под углом 45°. Штрихованные координаты и связаны с нештрихованными координатами посредством преобразований Лоренца и могут быть приблизительно измерены по графику (предполагая, что он был построен достаточно точно), но настоящее достоинство диаграммы Минковского заключается в том, что она предоставляет нам геометрическое представление сценария. Например, на этом рисунке мы видим, что два времениподобно разделенных события, которые имели разные x-координаты в нештрихованной системе отсчета, теперь находятся в одном и том же положении в пространстве.
В то время как нештрихованная рамка нарисована с пространственными и временными осями, которые встречаются под прямым углом, заштрихованная рамка нарисована с осями, которые встречаются под острым или тупым углом. Эта асимметрия вызвана неизбежными искажениями в том, как пространственно-временные координаты отображаются на декартовой плоскости , но рамки на самом деле эквивалентны.
Следствия специальной теории относительности можно вывести из уравнений преобразования Лоренца . [26] Эти преобразования, а следовательно, и специальная теория относительности, приводят к иным физическим предсказаниям, чем предсказания ньютоновской механики при всех относительных скоростях, и наиболее выражены, когда относительные скорости становятся сравнимыми со скоростью света. Скорость света настолько больше всего, с чем сталкивается большинство людей, что некоторые эффекты, предсказываемые теорией относительности, изначально противоречат здравому смыслу .
В теории относительности Галилея длина объекта ( ) [примечание 3] и временное разделение между двумя событиями ( ) являются независимыми инвариантами, значения которых не меняются при наблюдении из разных систем отсчета. [примечание 4] [примечание 5]
Однако в специальной теории относительности переплетение пространственных и временных координат порождает концепцию инвариантного интервала , обозначаемого как : [примечание 6]
Переплетение пространства и времени отменяет неявно предполагаемые концепции абсолютной одновременности и синхронизации в несопутствующих системах отсчета.
Форма, представляющая собой разницу квадрата промежутка времени и квадрата пространственного расстояния, демонстрирует фундаментальное расхождение между евклидовыми и пространственно-временными расстояниями. [примечание 7] Инвариантность этого интервала является свойством общего преобразования Лоренца (также называемого преобразованием Пуанкаре ), что делает его изометрией пространства-времени. Общее преобразование Лоренца расширяет стандартное преобразование Лоренца (которое имеет дело с переносами без вращения, то есть с прибавками Лоренца в направлении x) на все другие переносы , отражения и вращения между любой декартовой инерциальной системой отсчета. [30] : 33–34
При анализе упрощенных сценариев, таких как пространственно-временные диаграммы, часто используется форма инвариантного интервала с уменьшенной размерностью:
Демонстрация того, что интервал является инвариантным, проста для случая пониженной размерности и с рамками в стандартной конфигурации: [21]
Следовательно, значение не зависит от системы отсчета, в которой оно измеряется.
При рассмотрении физического значения следует отметить три случая: [21] [31] : 25–39
Рассмотрим два события, происходящие в двух разных местах, которые происходят одновременно в системе отсчета одного инерциального наблюдателя. Они могут происходить неодновременно в системе отсчета другого инерциального наблюдателя (отсутствие абсолютной одновременности ).
Из уравнения 3 (прямое преобразование Лоренца в терминах разностей координат)
Ясно, что два события, которые являются одновременными в системе S (удовлетворяющей Δ t = 0 ), не обязательно являются одновременными в другой инерциальной системе S ′ (удовлетворяющей Δ t ′ = 0 ). Только если эти события дополнительно колокальны в системе S (удовлетворяющей Δ x = 0 ), они будут одновременными в другой системе S ′ .
Эффект Саньяка можно считать проявлением относительности одновременности. [32] Поскольку относительность одновременности является эффектом первого порядка в , [21] приборы, работающие на основе эффекта Саньяка, такие как кольцевые лазерные гироскопы и волоконно-оптические гироскопы , способны достигать экстремальных уровней чувствительности. [стр. 14]
Промежуток времени между двумя событиями не является постоянным для разных наблюдателей, а зависит от относительных скоростей систем отсчета наблюдателей.
Предположим, что часы находятся в состоянии покоя в нештрихованной системе S. Положение часов в двух разных тиках тогда характеризуется Δ x = 0. Чтобы найти соотношение между временами между этими тиками, измеренными в обеих системах, можно использовать уравнение 3 для нахождения:
Это показывает, что время (Δ t ′ ) между двумя тиками, как видно в кадре, в котором движутся часы ( S ′ ), больше , чем время (Δ t ) между этими тиками, измеренное в неподвижной системе часов ( S ). Замедление времени объясняет ряд физических явлений; например, время жизни высокоскоростных мюонов, созданных столкновением космических лучей с частицами во внешней атмосфере Земли и движущихся к поверхности, больше, чем время жизни медленно движущихся мюонов, созданных и распадающихся в лаборатории. [33]
Всякий раз, когда слышишь утверждение о том, что «движущиеся часы идут медленно», следует представить себе инерциальную систему отсчета, густо заполненную идентичными, синхронизированными часами. Когда движущиеся часы проходят через этот массив, их показания в любой конкретной точке сравниваются с показаниями неподвижных часов в той же точке. [34] : 149–152
Измерения, которые мы получили бы, если бы мы действительно смотрели на движущиеся часы, в общем случае были бы совсем не тем же самым, потому что время, которое мы увидели бы, было бы задержано из-за конечной скорости света, т. е. время, которое мы видим, было бы искажено эффектом Доплера . Измерения релятивистских эффектов всегда следует понимать как сделанные после того, как эффекты конечной скорости света были вынесены за скобки. [34] : 149–152
Поль Ланжевен , один из первых сторонников теории относительности, сделал многое для популяризации теории, несмотря на сопротивление многих физиков революционным концепциям Эйнштейна. Среди его многочисленных вкладов в основы специальной теории относительности были независимые работы по соотношению массы и энергии, тщательное изучение парадокса близнецов и исследования вращающихся систем координат. Его имя часто связывают с гипотетической конструкцией, называемой «световыми часами» (первоначально разработанной Льюисом и Толменом в 1909 году [35] ), которую он использовал для выполнения нового вывода преобразования Лоренца. [36]
Световые часы представляются как ящик с идеально отражающими стенками, в котором световой сигнал отражается вперед и назад от противоположных сторон. Концепция замедления времени часто преподается с использованием световых часов, которые движутся равномерно инерционно перпендикулярно линии, соединяющей два зеркала. [37] [38] [39] [40] (Сам Ланжевен использовал световые часы, ориентированные параллельно своей линии движения. [36] )
Рассмотрим сценарий, показанный на рис. 4-3A. Наблюдатель A держит световые часы длины , а также электронный таймер, с помощью которого он измеряет, сколько времени требуется импульсу, чтобы совершить круговое путешествие вверх и вниз по световым часам. Хотя наблюдатель A быстро движется по поезду, с его точки зрения излучение и получение импульса происходят в одном и том же месте, и он измеряет интервал, используя одни часы, расположенные в точном месте этих двух событий. Для интервала между этими двумя событиями наблюдатель A находит Интервал времени, измеренный с помощью одних часов, которые неподвижны в определенной системе отсчета, называется собственным интервалом времени . [41]
Рис. 4-3B иллюстрирует эти же два события с точки зрения наблюдателя B, который стоит у путей, пока поезд проезжает со скоростью Вместо того, чтобы совершать прямые движения вверх-вниз, наблюдатель B видит, что импульсы движутся по зигзагообразной линии. Однако из-за постулата постоянства скорости света скорость импульсов вдоль этих диагональных линий та же самая, которую наблюдатель A видел для своих импульсов вверх-вниз. B измеряет скорость вертикальной составляющей этих импульсов как так что общее время прохождения импульсов туда и обратно составляет Обратите внимание, что для наблюдателя B излучение и получение светового импульса происходили в разных местах, и он измерял интервал, используя два неподвижных и синхронизированных часа, расположенных в двух разных положениях в его системе отсчета. Интервал, который измерял B, поэтому не был надлежащим временным интервалом, потому что он измерял его не с помощью одних покоящихся часов. [41]
В приведенном выше описании световых часов Ланжевена обозначение одного наблюдателя как неподвижного, а другого как движущегося было совершенно произвольным. Можно было бы с тем же успехом иметь наблюдателя B, несущего световые часы и движущегося со скоростью влево, в этом случае наблюдатель A воспринимал бы часы B как идущие медленнее, чем его локальные часы.
Здесь нет парадокса, потому что нет независимого наблюдателя C, который согласится и с A, и с B. Наблюдатель C обязательно производит свои измерения из своей собственной системы отсчета. Если эта система отсчета совпадает с системой отсчета A, то C согласится с измерением времени A. Если система отсчета C совпадает с системой отсчета B, то C согласится с измерением времени B. Если система отсчета C не совпадает ни с системой отсчета A, ни с системой отсчета B, то измерение времени C будет противоречить как измерению времени A , так и измерению времени B. [42]
Взаимность замедления времени между двумя наблюдателями в отдельных инерциальных системах отсчета приводит к так называемому парадоксу близнецов , сформулированному в его нынешней форме Ланжевеном в 1911 году. [43] Ланжевен представил себе авантюриста, желающего исследовать будущее Земли. Этот путешественник садится в снаряд, способный двигаться со скоростью 99,995% скорости света. Совершив путешествие туда и обратно к ближайшей звезде, длящееся всего два года его собственной жизни, он возвращается на Землю, которая на двести лет старше.
Этот результат кажется загадочным, поскольку и путешественник, и земной наблюдатель будут видеть друг друга движущимися, и поэтому, из-за взаимности замедления времени, можно было бы изначально ожидать, что каждый должен был бы обнаружить, что другой постарел меньше. На самом деле, нет никакого парадокса вообще, потому что для того, чтобы два наблюдателя могли сравнить свое собственное время, симметрия ситуации должна быть нарушена: по крайней мере один из двух наблюдателей должен изменить свое состояние движения, чтобы соответствовать состоянию другого. [44]
Однако знание общего решения парадокса не дает немедленной возможности вычислять правильные количественные результаты. Многие решения этой головоломки были предоставлены в литературе и рассмотрены в статье о парадоксе близнецов . Далее мы рассмотрим одно такое решение парадокса.
Наша основная цель — продемонстрировать, что после путешествия оба близнеца находятся в полном согласии относительно того, кто и на сколько постарел, независимо от их разного опыта. Рис. 4-4 иллюстрирует сценарий, в котором путешествующий близнец летит со скоростью 0,6 с к звезде, удаленной на 3 световых года , и обратно. Во время путешествия каждый близнец посылает друг другу ежегодные сигналы времени (измеренные в их собственном времени). После путешествия сравниваются накопленные подсчеты. На внешней фазе путешествия каждый близнец получает сигналы другого с пониженной частотой Первоначально ситуация совершенно симметрична: обратите внимание, что каждый близнец получает годовой сигнал другого через два года, измеренных по его собственным часам. Симметрия нарушается, когда путешествующий близнец оборачивается на четырехлетней отметке, измеренной по его часам. В течение оставшихся четырех лет своего путешествия она получает сигналы с повышенной частотой Ситуация совершенно иная с неподвижным близнецом. Из-за задержки, связанной со скоростью света, он не видит, как его сестра оборачивается, пока не пройдет восемь лет по его собственным часам. Таким образом, он получает сигналы повышенной частоты от своей сестры только в течение относительно короткого периода. Хотя близнецы расходятся в своих соответствующих измерениях общего времени, мы видим в следующей таблице, а также путем простого наблюдения за диаграммой Минковского, что каждый близнец находится в полном согласии с другим относительно общего числа сигналов, отправленных от одного к другому. Следовательно, нет никакого парадокса. [34] : 152–159
Размеры (например, длина) объекта, измеренные одним наблюдателем, могут быть меньше результатов измерений того же объекта, сделанных другим наблюдателем (например, парадокс лестницы подразумевает, что длинная лестница движется со скоростью, близкой к скорости света, и находится в меньшем гараже).
Аналогично, предположим, что измерительный стержень находится в состоянии покоя и выровнен вдоль оси x в нештрихованной системе S . В этой системе длина этого стержня записывается как Δ x . Чтобы измерить длину этого стержня в системе S ′ , в которой стержень движется, расстояния x ′ до конечных точек стержня должны быть измерены одновременно в этой системе S ′ . Другими словами, измерение характеризуется Δ t ′ = 0 , что можно объединить с уравнением 4, чтобы найти связь между длинами Δ x и Δ x ′ :
Это показывает, что длина (Δ x ′ ) стержня, измеренная в системе, в которой он движется ( S ′ ), короче его длины (Δ x ) в его собственной системе покоя ( S ).
Замедление времени и сокращение длины — это не просто видимости. Замедление времени явно связано с нашим способом измерения временных интервалов между событиями, которые происходят в одном и том же месте в данной системе координат (называемые «колокальными» событиями). Эти временные интервалы (которые могут быть и фактически измеряются экспериментально соответствующими наблюдателями) отличаются в другой системе координат, движущейся относительно первой, если только события, в дополнение к тому, что они колокальны, также не являются одновременными. Аналогично, сокращение длины связано с нашими измеренными расстояниями между разделенными, но одновременными событиями в данной выбранной системе координат. Если эти события не колокальны, а разделены расстоянием (пространством), они не будут происходить на одном и том же пространственном расстоянии друг от друга, если смотреть из другой движущейся системы координат.
Рассмотрим две системы отсчета S и S ′ в стандартной конфигурации. Частица в системе отсчета S движется в направлении x со скоростью вектора. Какова ее скорость в системе отсчета S ′ ?
Мы можем написать
Подстановка выражений для и из уравнения 5 в уравнение 8 , а затем простые математические преобразования и обратная подстановка из уравнения 7 дают преобразование Лоренца скорости :
Обратное отношение получается путем перестановки штрихованных и нештрихованных символов и замены на
Для невыровненных по оси x точек запишем: [12] : 47–49
Прямые и обратные преобразования для этого случая следующие:
Уравнение 10 и уравнение 14 можно интерпретировать как дающие результирующую двух скоростей и и они заменяют формулу , которая действительна в теории относительности Галилея. Интерпретируемые таким образом, они обычно называются формулами сложения (или композиции) релятивистских скоростей , действительными для трех осей S и S ′, выровненных друг с другом (хотя не обязательно в стандартной конфигурации). [12] : 47–49
Мы отмечаем следующие моменты:
В стандартной конфигурации нет ничего особенного в направлении x . Вышеуказанный формализм применим к любому направлению; и три ортогональных направления позволяют иметь дело со всеми направлениями в пространстве, разлагая векторы скорости на их компоненты в этих направлениях. Подробности см. в формуле сложения скоростей .
Композиция двух неколлинеарных усилений Лоренца (т. е. двух неколлинеарных преобразований Лоренца, ни одно из которых не включает в себя вращение) приводит к преобразованию Лоренца, которое не является чистым усилением, а представляет собой композицию усиления и вращения.
Вращение Томаса является результатом относительности одновременности. На рис. 4-5а стержень длиной в своей системе покоя (т.е. имеющий собственную длину ) поднимается вертикально вдоль оси y в наземной системе отсчета.
На рис. 4-5b тот же стержень наблюдается из рамы ракеты, движущейся со скоростью вправо. Если мы представим себе двое часов, расположенных на левом и правом концах стержня, которые синхронизированы в раме стержня , относительность одновременности заставляет наблюдателя в раме ракеты наблюдать (не видеть) часы на правом конце стержня как опережающие во времени на , а стержень соответственно наблюдается наклонным. [31] : 98–99
В отличие от релятивистских эффектов второго порядка, таких как сокращение длины или замедление времени, этот эффект становится весьма существенным даже при довольно низких скоростях. Например, это можно увидеть в спине движущихся частиц , где прецессия Томаса является релятивистской поправкой, которая применяется к спину элементарной частицы или вращению макроскопического гироскопа , связывая угловую скорость спина частицы, следующей по криволинейной орбите, с угловой скоростью орбитального движения. [31] : 169–174
Вращение Томаса дает решение известного «парадокса метровой палки и отверстия». [стр. 15] [31] : 98–99
На рис. 4-6 временной интервал между событиями A («причина») и B («следствие») является «временеподобным»; то есть существует система отсчета, в которой события A и B происходят в одном и том же месте пространства , разделенные только тем, что происходят в разное время. Если A предшествует B в этой системе, то A предшествует B во всех системах, доступных преобразованию Лоренца. Материя (или информация) может перемещаться (со скоростью ниже скорости света) из местоположения A, начиная с момента времени A, в местоположение B, прибывая во время B, поэтому может существовать причинно-следственная связь (где A является причиной, а B — следствием).
Интервал AC на диаграмме является «пространственно-подобным»; то есть, есть система отсчета, в которой события A и C происходят одновременно, разделенные только пространством. Есть также системы, в которых A предшествует C (как показано) и системы, в которых C предшествует A. Но ни одна система не доступна преобразованию Лоренца, в которой события A и C происходят в одном и том же месте. Если бы между событиями A и C могла существовать причинно-следственная связь, возникли бы парадоксы причинности.
Например, если бы сигналы можно было посылать быстрее света, то сигналы можно было бы посылать в прошлое отправителя (наблюдатель B на диаграммах). [45] [стр. 16] Тогда можно было бы сконструировать множество причинных парадоксов.
Рассмотрим пространственно-временные диаграммы на рис. 4-7. A и B стоят вдоль железнодорожных путей, когда мимо проезжает скоростной поезд, причем C едет в последнем вагоне поезда, а D едет в головном вагоне. Мировые линии A и B вертикальны ( ct ), что указывает на неподвижное положение этих наблюдателей на земле, в то время как мировые линии C и D наклонены вперед ( ct ′ ), отражая быстрое движение наблюдателей C и D, неподвижных в своем поезде, как это наблюдается с земли.
Сигналам не обязательно быть мгновенными, чтобы нарушить причинность. Даже если бы сигнал от D до C был немного мельче оси (а сигнал от A до B немного круче оси ), B все равно мог бы получить свое сообщение до того, как он его отправил. Увеличивая скорость поезда до скоростей, близких к скорости света, оси и можно сжать очень близко к пунктирной линии, представляющей скорость света. С помощью этой измененной установки можно продемонстрировать, что даже сигналы, лишь немного превышающие скорость света, приведут к нарушению причинности. [47]
Таким образом, если необходимо сохранить причинность , одним из следствий специальной теории относительности является то, что никакой информационный сигнал или материальный объект не может двигаться быстрее света в вакууме.
Это не означает, что все скорости, превышающие скорость света, невозможны. Можно описать различные тривиальные ситуации, в которых некоторые «вещи» (не материя и не энергия) движутся быстрее света. [48] Например, место, где луч прожектора попадает на дно облака, может двигаться быстрее света, если прожектор быстро поворачивается (хотя это не нарушает причинность или любое другое релятивистское явление). [49] [50]
В 1850 году Ипполит Физо и Леон Фуко независимо друг от друга установили, что свет распространяется в воде медленнее, чем в воздухе, тем самым подтвердив предсказание волновой теории света Френеля и опровергнув соответствующее предсказание корпускулярной теории Ньютона . [51] Скорость света была измерена в стоячей воде. Какова будет скорость света в текущей воде?
В 1851 году Физо провел эксперимент, чтобы ответить на этот вопрос, упрощенное представление которого показано на рис. 5-1. Луч света разделяется расщепителем луча, и разделенные лучи пропускаются в противоположных направлениях через трубку с текущей водой. Они рекомбинируются, образуя интерференционные полосы, указывающие на разницу в оптической длине пути, которую может видеть наблюдатель. Эксперимент продемонстрировал, что увлечение света текущей водой вызывает смещение полос, показывая, что движение воды повлияло на скорость света.
Согласно теориям, господствовавшим в то время, свет, проходящий через движущуюся среду, будет простой суммой его скорости через среду плюс скорость среды . Вопреки ожиданиям, Физо обнаружил, что хотя свет, казалось бы, увлекается водой, величина увлечения была намного ниже ожидаемой. Если — скорость света в стоячей воде, — скорость воды, — скорость света в воде в лабораторной системе отсчета, при этом поток воды добавляется или вычитается из скорости света, то
Результаты Физо, хотя и согласуются с более ранней гипотезой Френеля о частичном увлечении эфира , были крайне обескураживающими для физиков того времени. Среди прочего, наличие члена показателя преломления означало, что, поскольку зависит от длины волны, эфир должен быть способен поддерживать различные движения одновременно . [примечание 8] Было предложено множество теоретических объяснений для объяснения коэффициента увлечения Френеля , которые полностью противоречили друг другу. Еще до эксперимента Майкельсона-Морли экспериментальные результаты Физо были среди ряда наблюдений, которые создали критическую ситуацию в объяснении оптики движущихся тел. [52]
С точки зрения специальной теории относительности результат Физо есть не что иное, как приближение к уравнению 10 , релятивистской формуле для сложения скоростей. [30]
Из-за конечной скорости света, если относительные движения источника и приемника включают поперечную составляющую, то направление, из которого свет достигает приемника, будет смещено от геометрического положения в пространстве источника относительно приемника. Классический расчет смещения принимает две формы и делает разные предсказания в зависимости от того, приемник, источник или оба находятся в движении относительно среды. (1) Если приемник находится в движении, смещение будет следствием аберрации света . Угол падения луча относительно приемника можно вычислить из векторной суммы движений приемника и скорости падающего света. [53] (2) Если источник находится в движении, смещение будет следствием коррекции светового времени . Смещение видимого положения источника от его геометрического положения будет результатом движения источника в течение времени, которое требуется его свету, чтобы достичь приемника. [54]
Классическое объяснение не прошло экспериментальную проверку. Поскольку угол аберрации зависит от соотношения между скоростью приемника и скоростью падающего света, прохождение падающего света через преломляющую среду должно изменить угол аберрации. В 1810 году Араго использовал это ожидаемое явление в неудачной попытке измерить скорость света, [55] а в 1870 году Джордж Эйри проверил гипотезу, используя заполненный водой телескоп, обнаружив, что, вопреки ожиданиям, измеренная аберрация была идентична аберрации, измеренной с помощью заполненного воздухом телескопа. [56] «Громоздкая» попытка объяснить эти результаты использовала гипотезу частичного увлечения эфиром, [57], но была несовместима с результатами эксперимента Майкельсона–Морли, который, по-видимому, требовал полного увлечения эфиром. [58]
Предполагая инерциальные системы отсчета, релятивистское выражение для аберрации света применимо как к случаям перемещения приемника, так и к случаям перемещения источника. Было опубликовано множество тригонометрически эквивалентных формул. Выраженные через переменные на рис. 5-2, они включают [30] : 57–60
Классический эффект Доплера зависит от того, движутся ли источник, приемник или оба относительно среды. Релятивистский эффект Доплера не зависит от какой-либо среды. Тем не менее, релятивистский доплеровский сдвиг для продольного случая, когда источник и приемник движутся прямо друг к другу или друг от друга, может быть получен так, как если бы это было классическое явление, но модифицированное добавлением члена замедления времени , и это описанная здесь обработка. [59] [60]
Предположим, что приемник и источник удаляются друг от друга с относительной скоростью , измеренной наблюдателем на приемнике или источнике (здесь принято соглашение о знаках, что знак отрицательный , если приемник и источник движутся навстречу друг другу). Предположим, что источник неподвижен в среде. Тогда где скорость звука.
Для света, и с приемником, движущимся с релятивистской скоростью, часы на приемнике растянуты по времени относительно часов на источнике. Приемник будет измерять полученную частоту, чтобы быть там, где
Идентичное выражение для релятивистского доплеровского сдвига получается при выполнении анализа в системе отсчета приемника с движущимся источником. [61] [21]
Поперечный эффект Доплера — одно из главных новых предсказаний специальной теории относительности.
Классически можно было бы ожидать, что если источник и приемник движутся поперечно друг другу без продольной составляющей в их относительном движении, то не должно быть доплеровского сдвига в свете, достигающем приемника.
Специальная теория относительности предсказывает иное. Рис. 5-3 иллюстрирует два распространенных варианта этого сценария. Оба варианта можно проанализировать с использованием простых аргументов замедления времени. [21] На рис. 5-3a приемник наблюдает свет от источника как смещенный в синюю сторону на коэффициент . На рис. 5-3b свет смещен в красную сторону на тот же коэффициент.
Замедление времени и сокращение длины — это не оптические иллюзии, а реальные эффекты. Измерения этих эффектов не являются артефактом доплеровского сдвига и не являются результатом пренебрежения временем, которое требуется свету для прохождения от события до наблюдателя.
Ученые проводят фундаментальное различие между измерением или наблюдением , с одной стороны, и визуальным видом , или тем, что человек видит . Измеренная форма объекта — это гипотетический снимок всех точек объекта, которые существуют в один момент времени. Но визуальный вид объекта зависит от разной продолжительности времени, которое требуется свету, чтобы пройти от разных точек объекта до глаза.
В течение многих лет различие между ними не было общепризнанным, и обычно считалось, что объект с сокращенной длиной, проходящий мимо наблюдателя, на самом деле будет фактически виден как сокращенный по длине. В 1959 году Джеймс Террелл и Роджер Пенроуз независимо друг от друга указали, что дифференциальные эффекты задержки во времени в сигналах, достигающих наблюдателя от разных частей движущегося объекта, приводят к тому, что визуальный вид быстро движущегося объекта сильно отличается от его измеренной формы. Например, удаляющийся объект будет казаться сокращенным, приближающийся объект будет казаться удлиненным, а проходящий объект будет иметь перекошенный вид, который можно сравнить с вращением. [стр. 19] [стр. 20] [62] [63] Движущаяся сфера сохраняет круговой контур для всех скоростей, для любого расстояния и для всех углов обзора, хотя поверхность сферы и изображения на ней будут казаться искаженными. [64] [65]
На обоих рисунках, рис. 5-4 и рис. 5-5, изображены объекты, движущиеся поперек линии зрения. На рис. 5-4 куб рассматривается с расстояния, в четыре раза превышающего длину его сторон. На высоких скоростях стороны куба, перпендикулярные направлению движения, кажутся гиперболическими по форме. Куб на самом деле не вращается. Скорее, свету с задней стороны куба требуется больше времени, чтобы достичь глаз, по сравнению со светом с передней стороны, за это время куб перемещается вправо. На высоких скоростях сфера на рис. 5-5 приобретает вид сплющенного диска, наклоненного до 45° от линии зрения. Если движения объектов не строго поперечные, а вместо этого включают продольную составляющую, могут быть видны преувеличенные искажения в перспективе. [66] Эта иллюзия стала известна как вращение Террелла или эффект Террелла-Пенроуза . [примечание 9]
Другой пример, когда визуальный вид не соответствует измерению, можно найти в наблюдении кажущегося сверхсветового движения в различных радиогалактиках , объектах BL Lac , квазарах и других астрономических объектах, которые выбрасывают струи материи с релятивистской скоростью под узкими углами по отношению к наблюдателю. Возникает кажущаяся оптическая иллюзия, создающая видимость движения со скоростью, превышающей скорость света. [67] [68] [69] На рис. 5-6 галактика M87 выбрасывает высокоскоростную струю субатомных частиц почти прямо к нам, но вращение Пенроуза-Террелла заставляет струю казаться движущейся вбок таким же образом, как был вытянут вид куба на рис. 5-4. [70]
Раздел Следствия, полученные из преобразования Лоренца, посвящен исключительно кинематике , изучению движения точек, тел и систем тел без учета сил, вызвавших движение. В этом разделе обсуждаются массы, силы, энергия и т. д., и, как таковой, требуется рассмотрение физических эффектов, выходящих за рамки тех, которые охватываются самим преобразованием Лоренца.
По мере того, как скорость объекта приближается к скорости света с точки зрения наблюдателя, его релятивистская масса увеличивается, тем самым затрудняя его ускорение из системы отсчета наблюдателя.
Содержание энергии в покоящемся объекте с массой m равно mc 2 . Сохранение энергии подразумевает, что в любой реакции уменьшение суммы масс частиц должно сопровождаться увеличением кинетической энергии частиц после реакции. Аналогично, масса объекта может быть увеличена за счет поглощения кинетической энергии.
В дополнение к статьям, упомянутым выше, в которых приводятся выводы преобразований Лоренца и описываются основы специальной теории относительности, Эйнштейн также написал по крайней мере четыре статьи, в которых приводятся эвристические аргументы в пользу эквивалентности (и превращаемости) массы и энергии, поскольку E = mc2 .
Эквивалентность массы и энергии является следствием специальной теории относительности. Энергия и импульс, которые разделены в ньютоновской механике, образуют четырехвектор в теории относительности, и это связывает временную компоненту (энергию) с пространственными компонентами (импульсом) нетривиальным образом. Для покоящегося объекта четырехвектор энергии-импульса равен ( E / c , 0, 0, 0) : он имеет временную компоненту, которая является энергией, и три пространственных компонента, которые равны нулю. При смене систем отсчета с помощью преобразования Лоренца в направлении x с малым значением скорости v четырехвектор энергии-импульса становится равным ( E / c , Ev / c2 , 0, 0) . Импульс равен энергии, умноженной на скорость, деленную на c2 . Таким образом, ньютоновская масса объекта, которая является отношением импульса к скорости для медленных скоростей , равна E / c2 .
Энергия и импульс являются свойствами материи и излучения, и невозможно вывести, что они образуют четырехвектор, только из двух основных постулатов специальной теории относительности, потому что они не говорят о материи или излучении, они говорят только о пространстве и времени. Поэтому вывод требует некоторых дополнительных физических рассуждений. В своей статье 1905 года Эйнштейн использовал дополнительные принципы, которые ньютоновская механика должна соблюдать для медленных скоростей, так что существует один скаляр энергии и один трехвекторный импульс на медленных скоростях, и что закон сохранения энергии и импульса в точности верен в теории относительности. Более того, он предположил, что энергия света преобразуется тем же фактором доплеровского сдвига, что и его частота, что он ранее показал на основе уравнений Максвелла. [стр. 1] Первой из статей Эйнштейна на эту тему была «Зависит ли инерция тела от его энергетического содержания?» в 1905 году. [стр. 21] Хотя аргумент Эйнштейна в этой статье почти повсеместно принят физиками как правильный, даже самоочевидный, многие авторы на протяжении многих лет предполагали, что он неверен. [71] Другие авторы предполагают, что аргумент был просто неубедительным, поскольку он опирался на некоторые неявные предположения. [72]
Эйнштейн признал противоречия по поводу своего вывода в своей обзорной статье 1907 года по специальной теории относительности. Там он отмечает, что проблематично полагаться на уравнения Максвелла для эвристического аргумента массы-энергии. Аргумент в его статье 1905 года может быть реализован с излучением любых безмассовых частиц, но уравнения Максвелла неявно используются, чтобы сделать очевидным, что излучение света в частности может быть достигнуто только путем выполнения работы. Чтобы испустить электромагнитные волны, все, что вам нужно сделать, это встряхнуть заряженную частицу, и это, очевидно, выполнение работы, так что излучение является энергией. [стр. 22] [примечание 10]
В четвертой из своих статей Annus mirabilis 1905 года [ стр . 21] Эйнштейн представил эвристический аргумент в пользу эквивалентности массы и энергии. Хотя, как обсуждалось выше, последующая наука установила, что его аргументы не дотягивают до общеопределенного доказательства, выводы, к которым он пришел в этой статье, выдержали испытание временем.
В качестве исходных предположений Эйнштейн взял недавно открытую им формулу для релятивистского доплеровского сдвига , законы сохранения энергии и сохранения импульса , а также соотношение между частотой света и его энергией, вытекающее из уравнений Максвелла .
Рис. 6-1 (вверху). Рассмотрим систему плоских волн света с частотой , распространяющейся в направлении относительно оси x системы отсчета S. Частота (и, следовательно, энергия) волн, измеренная в системе S ′ , движущейся вдоль оси x со скоростью, определяется релятивистской формулой доплеровского сдвига, которую Эйнштейн вывел в своей статье 1905 года по специальной теории относительности: [стр. 1]
Рис. 6-1 (внизу). Рассмотрим произвольное тело, неподвижное в системе отсчета S. Пусть это тело испускает пару световых импульсов равной энергии в противоположных направлениях под углом к оси x. Каждый импульс имеет энергию . Из-за сохранения импульса тело остается неподвижным в S после испускания двух импульсов. Пусть будет энергией тела до испускания двух импульсов и после их испускания.
Далее рассмотрим ту же систему, наблюдаемую из системы S ′ , которая движется вдоль оси x со скоростью относительно системы S . В этой системе свет от прямого и обратного импульсов будет релятивистски смещен Доплером. Пусть будет энергией тела, измеренной в системе отсчета S ′ до испускания двух импульсов и после их испускания. Получаем следующие соотношения: [стр. 21]
Из приведенных выше уравнений получаем следующее:
Два различия формы, которые можно увидеть в приведенном выше уравнении, имеют простую физическую интерпретацию. Поскольку и являются энергиями произвольного тела в движущейся и неподвижной системах отсчета, а представляет собой кинетическую энергию тел до и после испускания света (за исключением аддитивной константы, которая фиксирует нулевую точку энергии и традиционно принимается равной нулю). Следовательно,
Используя разложение в ряд Тейлора и пренебрегая членами более высокого порядка, он получил
Сравнивая приведенное выше выражение с классическим выражением для кинетической энергии, KE = 1/2 mv 2 , Эйнштейн затем заметил: «Если тело выделяет энергию L в виде излучения, его масса уменьшается на L / c 2 ».
Риндлер заметил, что эвристический аргумент Эйнштейна предполагал лишь то, что энергия вносит вклад в массу. В 1905 году осторожное выражение Эйнштейном соотношения массы и энергии допускало возможность существования «спящей» массы, которая останется после того, как вся энергия тела будет удалена. Однако к 1907 году Эйнштейн был готов утверждать, что вся инертная масса представляет собой запас энергии. «Чтобы приравнять всю массу к энергии, требовался акт эстетической веры, очень характерный для Эйнштейна». [12] : 81–84 Смелая гипотеза Эйнштейна была полностью подтверждена в годы, последовавшие за его первоначальным предложением.
По разным причинам оригинальный вывод Эйнштейна в настоящее время редко преподается. Помимо бурных дебатов, которые продолжаются и по сей день относительно формальной правильности его оригинального вывода, признание специальной теории относительности тем, что Эйнштейн называл «принципиальной теорией», привело к переходу от опоры на электромагнитные явления к чисто динамическим методам доказательства. [73]
Поскольку ничто не может двигаться быстрее света, можно сделать вывод, что человек никогда не сможет путешествовать дальше от Земли, чем на ~100 световых лет. Вы могли бы легко подумать, что путешественник никогда не сможет достичь более нескольких солнечных систем, которые существуют в пределах 100 световых лет от Земли. Однако из-за замедления времени гипотетический космический корабль может пролететь тысячи световых лет за время жизни пассажира. Если бы можно было построить космический корабль, который ускоряется с постоянным ускорением 1 g , через год он будет двигаться почти со скоростью света, наблюдаемой с Земли. Это описывается следующим образом: где v ( t ) — скорость в момент времени t , a — ускорение космического корабля, а t — координатное время, измеренное людьми на Земле. [стр. 23] Таким образом, после одного года ускорения со скоростью 9,81 м/с 2 космический корабль будет двигаться со скоростью v = 0,712 c и 0,946 c через три года относительно Земли. После трех лет этого ускорения, когда космический корабль достигнет скорости 94,6% от скорости света относительно Земли, замедление времени приведет к тому, что каждая секунда, испытываемая на космическом корабле, будет соответствовать 3,1 секунды назад на Земле. Во время своего путешествия люди на Земле будут ощущать больше времени, чем они испытывают, поскольку их часы (все физические явления) будут действительно тикать в 3,1 раза быстрее, чем часы космического корабля. 5-летнее путешествие туда и обратно для путешественника займет 6,5 земных лет и покроет расстояние более 6 световых лет. 20-летнее путешествие туда и обратно для них (5 лет ускорения, 5 замедления, дважды каждое) вернет их на Землю, проделав путь в 335 земных лет и пройдя расстояние в 331 световой год. [74] Полное 40-летнее путешествие при 1 g покажется на Земле продолжительностью 58 000 лет и покроет расстояние в 55 000 световых лет. 40-летнее путешествие при 1,1 g займет 148 000 земных лет и охватит около 140 000 световых лет. Одностороннее 28-летнее (14 лет ускорения, 14 лет замедления, как измеряется по часам астронавта) путешествие при ускорении 1 g может достичь 2 000 000 световых лет до галактики Андромеды. [74] Это же самое замедление времени является причиной того, что мюон, движущийся близко к c , как наблюдается, движется намного дальше, чем c, умноженное на его период полураспада (в состоянии покоя). [75]
Изучение продуктов столкновений, генерируемых ускорителями частиц по всему миру, дает ученым доказательства структуры субатомного мира и естественных законов, управляющих им. Анализ продуктов столкновений, сумма масс которых может значительно превышать массы падающих частиц, требует специальной теории относительности. [76]
В ньютоновской механике анализ столкновений включает использование законов сохранения массы , импульса и энергии . В релятивистской механике масса не сохраняется независимо, поскольку она включена в общую релятивистскую энергию. Мы иллюстрируем различия, возникающие между ньютоновской и релятивистской трактовками столкновений частиц, рассматривая простой случай двух абсолютно упругих сталкивающихся частиц одинаковой массы. ( Неупругие столкновения обсуждаются в разделе Пространство-время#Законы сохранения . Радиоактивный распад можно рассматривать как своего рода неупругое столкновение, обращенное во времени. [76] )
Упругое рассеяние заряженных элементарных частиц отклоняется от идеальности из-за возникновения тормозного излучения. [77] [78]
Рис. 6-2 демонстрирует результат, знакомый игрокам в бильярд, что если неподвижный шар упруго ударяется другим шаром той же массы (предполагая отсутствие бокового вращения, или «английского»), то после столкновения расходящиеся траектории двух шаров будут стягивать прямой угол. (a) В неподвижной системе отсчета падающая сфера, движущаяся со скоростью 2 v, ударяется о неподвижную сферу. (b) В системе отсчета центра импульса две сферы сближаются симметрично со скоростью ± v . После упругого столкновения две сферы отскакивают друг от друга с равными и противоположными скоростями ± u . Закон сохранения энергии требует, чтобы | u | = | v |. (c) Возвращаясь к неподвижной системе отсчета, скорости отскока равны v ± u . Скалярное произведение ( v + u ) ⋅ ( v − u ) = v 2 − u 2 = 0 , что указывает на то, что векторы ортогональны. [12] : 26–27
Рассмотрим сценарий упругого столкновения на рис. 6-3 между движущейся частицей, сталкивающейся с неподвижной частицей равной массы. В отличие от ньютоновского случая, угол между двумя частицами после столкновения меньше 90°, зависит от угла рассеяния и становится все меньше и меньше по мере того, как скорость падающей частицы приближается к скорости света:
Релятивистский импульс и полная релятивистская энергия частицы определяются как
Закон сохранения импульса гласит, что сумма импульсов входящей частицы и неподвижной частицы (которая изначально имеет импульс = 0) равна сумме импульсов вылетевших частиц:
Аналогично, сумма полных релятивистских энергий входящей частицы и неподвижной частицы (которая изначально имеет полную энергию mc2 ) равна сумме полных энергий вылетевших частиц:
Разложение ( 6-5 ) на составляющие, замена на безразмерные и вынесение за скобки общих членов из ( 6-5 ) и ( 6-6 ) дает следующее: [стр. 24]
Из них мы получаем следующие соотношения: [стр. 24]
Для симметричного случая, в котором и ( 6-12 ) принимает более простую форму: [стр. 24]
Преобразования Лоренца связывают координаты событий в одной системе отсчета с координатами событий в другой системе отсчета. Релятивистское сложение скоростей используется для сложения двух скоростей. Формулы для выполнения последних вычислений нелинейны, что делает их более сложными, чем соответствующие формулы Галилея.
Эта нелинейность является артефактом нашего выбора параметров. [11] : 47–59 Ранее мы отмечали, что в пространственно-временной диаграмме x–ct точки на некотором постоянном пространственно-временном интервале от начала координат образуют инвариантную гиперболу. Мы также отмечали, что системы координат двух пространственно-временных систем отсчета в стандартной конфигурации гиперболически повернуты относительно друг друга.
The natural functions for expressing these relationships are the hyperbolic analogs of the trigonometric functions. Fig. 7-1a shows a unit circle with sin(a) and cos(a), the only difference between this diagram and the familiar unit circle of elementary trigonometry being that a is interpreted, not as the angle between the ray and the x-axis, but as twice the area of the sector swept out by the ray from the x-axis. Numerically, the angle and 2 × area measures for the unit circle are identical. Fig. 7-1b shows a unit hyperbola with sinh(a) and cosh(a), where a is likewise interpreted as twice the tinted area.[79] Fig. 7-2 presents plots of the sinh, cosh, and tanh functions.
For the unit circle, the slope of the ray is given by
In the Cartesian plane, rotation of point (x, y) into point (x', y') by angle θ is given by
In a spacetime diagram, the velocity parameter is the analog of slope. The rapidity, φ, is defined by[21]: 96–99
where
The rapidity defined above is very useful in special relativity because many expressions take on a considerably simpler form when expressed in terms of it. For example, rapidity is simply additive in the collinear velocity-addition formula;[11]: 47–59
or in other words,
The Lorentz transformations take a simple form when expressed in terms of rapidity. The γ factor can be written as
Transformations describing relative motion with uniform velocity and without rotation of the space coordinate axes are called boosts.
Substituting γ and γβ into the transformations as previously presented and rewriting in matrix form, the Lorentz boost in the x-direction may be written as
and the inverse Lorentz boost in the x-direction may be written as
In other words, Lorentz boosts represent hyperbolic rotations in Minkowski spacetime.[21]: 96–99
The advantages of using hyperbolic functions are such that some textbooks such as the classic ones by Taylor and Wheeler introduce their use at a very early stage.[11][note 11]
Four‑vectors have been mentioned above in context of the energy–momentum 4‑vector, but without any great emphasis. Indeed, none of the elementary derivations of special relativity require them. But once understood, 4‑vectors, and more generally tensors, greatly simplify the mathematics and conceptual understanding of special relativity. Working exclusively with such objects leads to formulas that are manifestly relativistically invariant, which is a considerable advantage in non-trivial contexts. For instance, demonstrating relativistic invariance of Maxwell's equations in their usual form is not trivial, while it is merely a routine calculation, really no more than an observation, using the field strength tensor formulation.[80]
On the other hand, general relativity, from the outset, relies heavily on 4‑vectors, and more generally tensors, representing physically relevant entities. Relating these via equations that do not rely on specific coordinates requires tensors, capable of connecting such 4‑vectors even within a curved spacetime, and not just within a flat one as in special relativity. The study of tensors is outside the scope of this article, which provides only a basic discussion of spacetime.
A 4-tuple, is a "4-vector" if its component Ai transform between frames according to the Lorentz transformation.
If using coordinates, A is a 4–vector if it transforms (in the x-direction) according to
which comes from simply replacing ct with A0 and x with A1 in the earlier presentation of the Lorentz transformation.
As usual, when we write x, t, etc. we generally mean Δx, Δt etc.
The last three components of a 4–vector must be a standard vector in three-dimensional space. Therefore, a 4–vector must transform like under Lorentz transformations as well as rotations.[81]: 36–59
As expected, the final components of the above 4-vectors are all standard 3-vectors corresponding to spatial 3-momentum, 3-force etc.[21]: 178–181 [81]: 36–59
The first postulate of special relativity declares the equivalency of all inertial frames. A physical law holding in one frame must apply in all frames, since otherwise it would be possible to differentiate between frames. Newtonian momenta fail to behave properly under Lorentzian transformation, and Einstein preferred to change the definition of momentum to one involving 4-vectors rather than give up on conservation of momentum.
Physical laws must be based on constructs that are frame independent. This means that physical laws may take the form of equations connecting scalars, which are always frame independent. However, equations involving 4-vectors require the use of tensors with appropriate rank, which themselves can be thought of as being built up from 4-vectors.[21]: 186
It is a common misconception that special relativity is applicable only to inertial frames, and that it is unable to handle accelerating objects or accelerating reference frames. Actually, accelerating objects can generally be analyzed without needing to deal with accelerating frames at all. It is only when gravitation is significant that general relativity is required.[82]
Properly handling accelerating frames does require some care, however. The difference between special and general relativity is that (1) In special relativity, all velocities are relative, but acceleration is absolute. (2) In general relativity, all motion is relative, whether inertial, accelerating, or rotating. To accommodate this difference, general relativity uses curved spacetime.[82]
In this section, we analyze several scenarios involving accelerated reference frames.
The Dewan–Beran–Bell spaceship paradox (Bell's spaceship paradox) is a good example of a problem where intuitive reasoning unassisted by the geometric insight of the spacetime approach can lead to issues.
In Fig. 7-4, two identical spaceships float in space and are at rest relative to each other. They are connected by a string which is capable of only a limited amount of stretching before breaking. At a given instant in our frame, the observer frame, both spaceships accelerate in the same direction along the line between them with the same constant proper acceleration.[note 12] Will the string break?
When the paradox was new and relatively unknown, even professional physicists had difficulty working out the solution. Two lines of reasoning lead to opposite conclusions. Both arguments, which are presented below, are flawed even though one of them yields the correct answer.[21]: 106, 120–122
The problem with the first argument is that there is no "frame of the spaceships." There cannot be, because the two spaceships measure a growing distance between the two. Because there is no common frame of the spaceships, the length of the string is ill-defined. Nevertheless, the conclusion is correct, and the argument is mostly right. The second argument, however, completely ignores the relativity of simultaneity.[21]: 106, 120–122
A spacetime diagram (Fig. 7-5) makes the correct solution to this paradox almost immediately evident. Two observers in Minkowski spacetime accelerate with constant magnitude acceleration for proper time (acceleration and elapsed time measured by the observers themselves, not some inertial observer). They are comoving and inertial before and after this phase. In Minkowski geometry, the length along the line of simultaneity turns out to be greater than the length along the line of simultaneity .
The length increase can be calculated with the help of the Lorentz transformation. If, as illustrated in Fig. 7-5, the acceleration is finished, the ships will remain at a constant offset in some frame If and are the ships' positions in the positions in frame are:[83]
The "paradox", as it were, comes from the way that Bell constructed his example. In the usual discussion of Lorentz contraction, the rest length is fixed and the moving length shortens as measured in frame . As shown in Fig. 7-5, Bell's example asserts the moving lengths and measured in frame to be fixed, thereby forcing the rest frame length in frame to increase.
Certain special relativity problem setups can lead to insight about phenomena normally associated with general relativity, such as event horizons. In the text accompanying Section "Invariant hyperbola" of the article Spacetime, the magenta hyperbolae represented actual paths that are tracked by a constantly accelerating traveler in spacetime. During periods of positive acceleration, the traveler's velocity just approaches the speed of light, while, measured in our frame, the traveler's acceleration constantly decreases.
Fig. 7-6 details various features of the traveler's motions with more specificity. At any given moment, her space axis is formed by a line passing through the origin and her current position on the hyperbola, while her time axis is the tangent to the hyperbola at her position. The velocity parameter approaches a limit of one as increases. Likewise, approaches infinity.
The shape of the invariant hyperbola corresponds to a path of constant proper acceleration. This is demonstrable as follows:
Fig. 7-6 illustrates a specific calculated scenario. Terence (A) and Stella (B) initially stand together 100 light hours from the origin. Stella lifts off at time 0, her spacecraft accelerating at 0.01 c per hour. Every twenty hours, Terence radios updates to Stella about the situation at home (solid green lines). Stella receives these regular transmissions, but the increasing distance (offset in part by time dilation) causes her to receive Terence's communications later and later as measured on her clock, and she never receives any communications from Terence after 100 hours on his clock (dashed green lines).[84]: 110–113
After 100 hours according to Terence's clock, Stella enters a dark region. She has traveled outside Terence's timelike future. On the other hand, Terence can continue to receive Stella's messages to him indefinitely. He just has to wait long enough. Spacetime has been divided into distinct regions separated by an apparent event horizon. So long as Stella continues to accelerate, she can never know what takes place behind this horizon.[84]: 110–113
Theoretical investigation in classical electromagnetism led to the discovery of wave propagation. Equations generalizing the electromagnetic effects found that finite propagation speed of the E and B fields required certain behaviors on charged particles. The general study of moving charges forms the Liénard–Wiechert potential, which is a step towards special relativity.
The Lorentz transformation of the electric field of a moving charge into a non-moving observer's reference frame results in the appearance of a mathematical term commonly called the magnetic field. Conversely, the magnetic field generated by a moving charge disappears and becomes a purely electrostatic field in a comoving frame of reference. Maxwell's equations are thus simply an empirical fit to special relativistic effects in a classical model of the Universe. As electric and magnetic fields are reference frame dependent and thus intertwined, one speaks of electromagnetic fields. Special relativity provides the transformation rules for how an electromagnetic field in one inertial frame appears in another inertial frame.
Maxwell's equations in the 3D form are already consistent with the physical content of special relativity, although they are easier to manipulate in a manifestly covariant form, that is, in the language of tensor calculus.[80]
Special relativity can be combined with quantum mechanics to form relativistic quantum mechanics and quantum electrodynamics. How general relativity and quantum mechanics can be unified is one of the unsolved problems in physics; quantum gravity and a "theory of everything", which require a unification including general relativity too, are active and ongoing areas in theoretical research.
The early Bohr–Sommerfeld atomic model explained the fine structure of alkali metal atoms using both special relativity and the preliminary knowledge on quantum mechanics of the time.[85]
In 1928, Paul Dirac constructed an influential relativistic wave equation, now known as the Dirac equation in his honour,[p 25] that is fully compatible both with special relativity and with the final version of quantum theory existing after 1926. This equation not only described the intrinsic angular momentum of the electrons called spin, it also led to the prediction of the antiparticle of the electron (the positron),[p 25][p 26] and fine structure could only be fully explained with special relativity. It was the first foundation of relativistic quantum mechanics.
On the other hand, the existence of antiparticles leads to the conclusion that relativistic quantum mechanics is not enough for a more accurate and complete theory of particle interactions. Instead, a theory of particles interpreted as quantized fields, called quantum field theory, becomes necessary; in which particles can be created and destroyed throughout space and time.
Special relativity in its Minkowski spacetime is accurate only when the absolute value of the gravitational potential is much less than c2 in the region of interest.[86] In a strong gravitational field, one must use general relativity. General relativity becomes special relativity at the limit of a weak field. At very small scales, such as at the Planck length and below, quantum effects must be taken into consideration resulting in quantum gravity. But at macroscopic scales and in the absence of strong gravitational fields, special relativity is experimentally tested to extremely high degree of accuracy (10−20)[87]and thus accepted by the physics community. Experimental results which appear to contradict it are not reproducible and are thus widely believed to be due to experimental errors.[88]
Special relativity is mathematically self-consistent, and it is an organic part of all modern physical theories, most notably quantum field theory, string theory, and general relativity (in the limiting case of negligible gravitational fields).
Newtonian mechanics mathematically follows from special relativity at small velocities (compared to the speed of light) – thus Newtonian mechanics can be considered as a special relativity of slow moving bodies. See classical mechanics for a more detailed discussion.
Several experiments predating Einstein's 1905 paper are now interpreted as evidence for relativity. Of these it is known Einstein was aware of the Fizeau experiment before 1905,[89] and historians have concluded that Einstein was at least aware of the Michelson–Morley experiment as early as 1899 despite claims he made in his later years that it played no role in his development of the theory.[16]
Particle accelerators accelerate and measure the properties of particles moving at near the speed of light, where their behavior is consistent with relativity theory and inconsistent with the earlier Newtonian mechanics. These machines would simply not work if they were not engineered according to relativistic principles. In addition, a considerable number of modern experiments have been conducted to test special relativity. Some examples:
Special relativity uses a "flat" 4-dimensional Minkowski space – an example of a spacetime. Minkowski spacetime appears to be very similar to the standard 3-dimensional Euclidean space, but there is a crucial difference with respect to time.
In 3D space, the differential of distance (line element) ds is defined bywhere dx = (dx1, dx2, dx3) are the differentials of the three spatial dimensions. In Minkowski geometry, there is an extra dimension with coordinate X0 derived from time, such that the distance differential fulfillswhere dX = (dX0, dX1, dX2, dX3) are the differentials of the four spacetime dimensions. This suggests a deep theoretical insight: special relativity is simply a rotational symmetry of our spacetime, analogous to the rotational symmetry of Euclidean space (see Fig. 10-1).[91] Just as Euclidean space uses a Euclidean metric, so spacetime uses a Minkowski metric. Basically, special relativity can be stated as the invariance of any spacetime interval (that is the 4D distance between any two events) when viewed from any inertial reference frame. All equations and effects of special relativity can be derived from this rotational symmetry (the Poincaré group) of Minkowski spacetime.
The actual form of ds above depends on the metric and on the choices for the X0 coordinate. To make the time coordinate look like the space coordinates, it can be treated as imaginary: X0 = ict (this is called a Wick rotation). According to Misner, Thorne and Wheeler (1971, §2.3), ultimately the deeper understanding of both special and general relativity will come from the study of the Minkowski metric (described below) and to take X0 = ct, rather than a "disguised" Euclidean metric using ict as the time coordinate.
Some authors use X0 = t, with factors of c elsewhere to compensate; for instance, spatial coordinates are divided by c or factors of c±2 are included in the metric tensor.[92]These numerous conventions can be superseded by using natural units where c = 1. Then space and time have equivalent units, and no factors of c appear anywhere.
If we reduce the spatial dimensions to 2, so that we can represent the physics in a 3D spacewe see that the null geodesics lie along a dual-cone (see Fig. 10-2) defined by the equation;or simplywhich is the equation of a circle of radius c dt.
If we extend this to three spatial dimensions, the null geodesics are the 4-dimensional cone:so
As illustrated in Fig. 10-3, the null geodesics can be visualized as a set of continuous concentric spheres with radii = c dt.
This null dual-cone represents the "line of sight" of a point in space. That is, when we look at the stars and say "The light from that star which I am receiving is X years old", we are looking down this line of sight: a null geodesic. We are looking at an event a distance away and a time d/c in the past. For this reason the null dual cone is also known as the "light cone". (The point in the lower left of the Fig. 10-2 represents the star, the origin represents the observer, and the line represents the null geodesic "line of sight".)
The cone in the −t region is the information that the point is "receiving", while the cone in the +t section is the information that the point is "sending".
The geometry of Minkowski space can be depicted using Minkowski diagrams, which are useful also in understanding many of the thought experiments in special relativity.
Above, the Lorentz transformation for the time coordinate and three space coordinates illustrates that they are intertwined. This is true more generally: certain pairs of "timelike" and "spacelike" quantities naturally combine on equal footing under the same Lorentz transformation.
The Lorentz transformation in standard configuration above, that is, for a boost in the x-direction, can be recast into matrix form as follows:
In Newtonian mechanics, quantities that have magnitude and direction are mathematically described as 3d vectors in Euclidean space, and in general they are parametrized by time. In special relativity, this notion is extended by adding the appropriate timelike quantity to a spacelike vector quantity, and we have 4d vectors, or "four-vectors", in Minkowski spacetime. The components of vectors are written using tensor index notation, as this has numerous advantages. The notation makes it clear the equations are manifestly covariant under the Poincaré group, thus bypassing the tedious calculations to check this fact. In constructing such equations, we often find that equations previously thought to be unrelated are, in fact, closely connected being part of the same tensor equation. Recognizing other physical quantities as tensors simplifies their transformation laws. Throughout, upper indices (superscripts) are contravariant indices rather than exponents except when they indicate a square (this should be clear from the context), and lower indices (subscripts) are covariant indices. For simplicity and consistency with the earlier equations, Cartesian coordinates will be used.
The simplest example of a four-vector is the position of an event in spacetime, which constitutes a timelike component ct and spacelike component x = (x, y, z), in a contravariant position four-vector with components:where we define X0 = ct so that the time coordinate has the same dimension of distance as the other spatial dimensions; so that space and time are treated equally.[93][94][95] Now the transformation of the contravariant components of the position 4-vector can be compactly written as:where there is an implied summation on from 0 to 3, and is a matrix.
More generally, all contravariant components of a four-vector transform from one frame to another frame by a Lorentz transformation:
Examples of other 4-vectors include the four-velocity defined as the derivative of the position 4-vector with respect to proper time:where the Lorentz factor is:
The relativistic energy and relativistic momentum of an object are respectively the timelike and spacelike components of a contravariant four-momentum vector:where m is the invariant mass.
The four-acceleration is the proper time derivative of 4-velocity:
The transformation rules for three-dimensional velocities and accelerations are very awkward; even above in standard configuration the velocity equations are quite complicated owing to their non-linearity. On the other hand, the transformation of four-velocity and four-acceleration are simpler by means of the Lorentz transformation matrix.
The four-gradient of a scalar field φ transforms covariantly rather than contravariantly:which is the transpose of:only in Cartesian coordinates. It is the covariant derivative which transforms in manifest covariance, in Cartesian coordinates this happens to reduce to the partial derivatives, but not in other coordinates.
More generally, the covariant components of a 4-vector transform according to the inverse Lorentz transformation:where is the reciprocal matrix of .
The postulates of special relativity constrain the exact form the Lorentz transformation matrices take.
More generally, most physical quantities are best described as (components of) tensors. So to transform from one frame to another, we use the well-known tensor transformation law[96]where is the reciprocal matrix of . All tensors transform by this rule.
An example of a four-dimensional second order antisymmetric tensor is the relativistic angular momentum, which has six components: three are the classical angular momentum, and the other three are related to the boost of the center of mass of the system. The derivative of the relativistic angular momentum with respect to proper time is the relativistic torque, also second order antisymmetric tensor.
The electromagnetic field tensor is another second order antisymmetric tensor field, with six components: three for the electric field and another three for the magnetic field. There is also the stress–energy tensor for the electromagnetic field, namely the electromagnetic stress–energy tensor.
The metric tensor allows one to define the inner product of two vectors, which in turn allows one to assign a magnitude to the vector. Given the four-dimensional nature of spacetime the Minkowski metric η has components (valid with suitably chosen coordinates) which can be arranged in a 4 × 4 matrix:which is equal to its reciprocal, , in those frames. Throughout we use the signs as above, different authors use different conventions – see Minkowski metric alternative signs.
The Poincaré group is the most general group of transformations which preserves the Minkowski metric:and this is the physical symmetry underlying special relativity.
The metric can be used for raising and lowering indices on vectors and tensors. Invariants can be constructed using the metric, the inner product of a 4-vector T with another 4-vector S is:
Invariant means that it takes the same value in all inertial frames, because it is a scalar (0 rank tensor), and so no Λ appears in its trivial transformation. The magnitude of the 4-vector T is the positive square root of the inner product with itself:
One can extend this idea to tensors of higher order, for a second order tensor we can form the invariants:similarly for higher order tensors. Invariant expressions, particularly inner products of 4-vectors with themselves, provide equations that are useful for calculations, because one does not need to perform Lorentz transformations to determine the invariants.
The coordinate differentials transform also contravariantly:so the squared length of the differential of the position four-vector dXμ constructed usingis an invariant. Notice that when the line element dX2 is negative that √−dX2 is the differential of proper time, while when dX2 is positive, √dX2 is differential of the proper distance.
The 4-velocity Uμ has an invariant form:which means all velocity four-vectors have a magnitude of c. This is an expression of the fact that there is no such thing as being at coordinate rest in relativity: at the least, you are always moving forward through time. Differentiating the above equation by τ produces:So in special relativity, the acceleration four-vector and the velocity four-vector are orthogonal.
The invariant magnitude of the momentum 4-vector generates the energy–momentum relation:
We can work out what this invariant is by first arguing that, since it is a scalar, it does not matter in which reference frame we calculate it, and then by transforming to a frame where the total momentum is zero.
We see that the rest energy is an independent invariant. A rest energy can be calculated even for particles and systems in motion, by translating to a frame in which momentum is zero.
The rest energy is related to the mass according to the celebrated equation discussed above:
The mass of systems measured in their center of momentum frame (where total momentum is zero) is given by the total energy of the system in this frame. It may not be equal to the sum of individual system masses measured in other frames.
To use Newton's third law of motion, both forces must be defined as the rate of change of momentum with respect to the same time coordinate. That is, it requires the 3D force defined above. Unfortunately, there is no tensor in 4D which contains the components of the 3D force vector among its components.
If a particle is not traveling at c, one can transform the 3D force from the particle's co-moving reference frame into the observer's reference frame. This yields a 4-vector called the four-force. It is the rate of change of the above energy momentum four-vector with respect to proper time. The covariant version of the four-force is:
In the rest frame of the object, the time component of the four-force is zero unless the "invariant mass" of the object is changing (this requires a non-closed system in which energy/mass is being directly added or removed from the object) in which case it is the negative of that rate of change of mass, times c. In general, though, the components of the four-force are not equal to the components of the three-force, because the three force is defined by the rate of change of momentum with respect to coordinate time, that is, dp/dt while the four-force is defined by the rate of change of momentum with respect to proper time, that is, dp/dτ.
In a continuous medium, the 3D density of force combines with the density of power to form a covariant 4-vector. The spatial part is the result of dividing the force on a small cell (in 3-space) by the volume of that cell. The time component is −1/c times the power transferred to that cell divided by the volume of the cell. This will be used below in the section on electromagnetism.
{{cite book}}
: CS1 maint: multiple names: authors list (link)