Специальная теория относительности

В физике специальная теория относительности , или сокращенно специальная теория относительности , является научной теорией взаимосвязи пространства и времени . В статье Альберта Эйнштейна 1905 года « Об электродинамике движущихся тел » теория представлена как основанная всего на двух постулатах : ^{[стр. 1]}^[1]^[2]

Законы физики инвариантны ( одинаковы ) во всех инерциальных системах отсчета (то есть системах отсчета без ускорения ). Это известно как принцип относительности .
Скорость света в вакууме одинакова для всех наблюдателей, независимо от движения источника света или наблюдателя. Это известно как принцип постоянства света или принцип инвариантности скорости света.

Первый постулат впервые сформулировал Галилео Галилей (см. Галилеевская инвариантность ).

Происхождение и значение

Специальная теория относительности была описана Альбертом Эйнштейном в статье, опубликованной 26 сентября 1905 года под названием «Об электродинамике движущихся тел». ^{[стр. 1]} Уравнения электромагнетизма Максвелла оказались несовместимыми с механикой Ньютона , и эксперимент Майкельсона-Морли не смог обнаружить движение Земли относительно гипотетического светоносного эфира . Это привело к разработке преобразований Лоренца Хендриком Лоренцом , которые корректируют расстояния и время для движущихся объектов. Специальная теория относительности исправляет существующие до сих пор законы механики, чтобы обрабатывать ситуации, включающие все движения, и особенно те, которые происходят со скоростью, близкой к скорости света (известной какрелятивистские скорости ). Сегодня доказано, что специальная теория относительности является наиболее точной моделью движения при любой скорости, когда гравитационные и квантовые эффекты пренебрежимо малы.^[3]^[4]Тем не менее, ньютоновская модель по-прежнему верна как простое и точное приближение при низких скоростях (относительно скорости света), например, при повседневных движениях на Земле.

Специальная теория относительности имеет широкий спектр следствий, которые были экспериментально подтверждены. ^[5] Они включают в себя относительность одновременности , сокращение длины , замедление времени , релятивистскую формулу сложения скоростей, релятивистский эффект Доплера , релятивистскую массу , универсальный предел скорости , эквивалентность массы и энергии , скорость причинности и прецессию Томаса . ^[1]^[2] Например, она заменила традиционное понятие абсолютного универсального времени на понятие времени, которое зависит от системы отсчета и пространственного положения. Вместо инвариантного временного интервала между двумя событиями существует инвариантный пространственно-временной интервал . В сочетании с другими законами физики два постулата специальной теории относительности предсказывают эквивалентность массы и энергии , как выражено в формуле эквивалентности массы и энергии , где - скорость света в вакууме. ^[6]^[7] Она также объясняет, как связаны явления электричества и магнетизма. ^[1]^[2] $E=mc^{2}$ $c$

Определяющей чертой специальной теории относительности является замена преобразований Галилея механики Ньютона на преобразования Лоренца . Время и пространство не могут быть определены отдельно друг от друга (как считалось ранее). Скорее, пространство и время переплетены в единый континуум, известный как «пространство-время» . События, которые происходят в одно и то же время для одного наблюдателя, могут происходить в разное время для другого.

До тех пор, пока несколько лет спустя Эйнштейн не разработал общую теорию относительности , которая ввела искривленное пространство-время для включения гравитации, фраза «специальная теория относительности» не использовалась. Иногда используется перевод «ограниченная относительность»; «специальная» на самом деле означает «особый случай». ^{[стр. 2]}^{[стр. 3]}^{[стр. 4]}^{[примечание 1]} Некоторые работы Альберта Эйнштейна в области специальной теории относительности основаны на более ранних работах Хендрика Лоренца и Анри Пуанкаре . Теория стала по существу завершенной в 1907 году с работами Германа Минковского о пространстве-времени. ^[4]

Теория является «специальной» в том смысле, что она применима только в особом случае , когда пространство-время является «плоским», то есть, когда кривизна пространства-времени (следствие тензора энергии-импульса и представляющая гравитацию ) пренебрежимо мала. ^[8]^{[примечание 2]} Чтобы правильно учесть гравитацию, Эйнштейн сформулировал общую теорию относительности в 1915 году. Специальная теория относительности, вопреки некоторым историческим описаниям, учитывает ускорения , а также ускоряющиеся системы отсчета . ^[9]^[10]

Так же, как теория относительности Галилея теперь принимается как приближение специальной теории относительности, справедливое для низких скоростей, специальная теория относительности считается приближением общей теории относительности, справедливым для слабых гравитационных полей , то есть в достаточно малых масштабах (например, когда приливные силы пренебрежимо малы) и в условиях свободного падения . Но общая теория относительности включает неевклидову геометрию для представления гравитационных эффектов как геометрической кривизны пространства-времени. Специальная теория относительности ограничена плоским пространством-временем, известным как пространство Минковского . Пока Вселенную можно моделировать как псевдориманово многообразие , лоренц-инвариантная система отсчета, которая подчиняется специальной теории относительности, может быть определена для достаточно малой окрестности каждой точки в этом искривленном пространстве-времени .

Галилео Галилей уже постулировал, что не существует абсолютного и четко определенного состояния покоя (никаких привилегированных систем отсчета ), принцип, который теперь называется принципом относительности Галилея . Эйнштейн расширил этот принцип так, чтобы он учитывал постоянную скорость света, ^[11] явление, которое наблюдалось в эксперименте Майкельсона-Морли. Он также постулировал, что он справедлив для всех законов физики , включая как законы механики, так и электродинамики . ^[12]

Традиционный подход к специальной теории относительности с использованием «двух постулатов»

«Размышления такого рода дали мне ясно понять еще вскоре после 1900 года, т. е. вскоре после новаторской работы Планка, что ни механика, ни электродинамика не могут (за исключением предельных случаев) претендовать на точную обоснованность. Постепенно я отчаялся в возможности открытия истинных законов посредством конструктивных усилий, основанных на известных фактах. Чем дольше и отчаяннее я пытался, тем больше приходил к убеждению, что только открытие универсального формального принципа может привести нас к гарантированным результатам... Как же тогда можно найти такой универсальный принцип?»

Альберт Эйнштейн: Автобиографические заметки ^{[стр. 5]}

Эйнштейн выделил два фундаментальных положения, которые казались наиболее достоверными, независимо от точной справедливости (тогда) известных законов механики или электродинамики. Эти положения заключались в постоянстве скорости света в вакууме и независимости физических законов (особенно постоянства скорости света) от выбора инерциальной системы. В своем первоначальном изложении специальной теории относительности в 1905 году он выразил эти постулаты следующим образом: ^{[стр. 1]}

Принцип относительности – законы, по которым состояния физических систем претерпевают изменения, не зависят от того, относятся ли эти изменения состояний к одной или другой из двух систем, находящихся в равномерном поступательном движении относительно друг друга. ^{[стр. 1]}
Принцип инвариантной скорости света – «... свет всегда распространяется в пустом пространстве с определенной скоростью [скоростью] c , которая не зависит от состояния движения излучающего тела» (из предисловия). ^{[стр. 1]} То есть свет в вакууме распространяется со скоростью c (фиксированная константа, не зависящая от направления) по крайней мере в одной системе инерциальных координат («неподвижная система»), независимо от состояния движения источника света.

Постоянство скорости света было мотивировано теорией электромагнетизма Максвелла ^[13] и отсутствием доказательств существования светоносного эфира . ^[14] Существуют противоречивые данные о степени влияния на Эйнштейна нулевого результата эксперимента Майкельсона-Морли. ^[15]^[16] В любом случае, нулевой результат эксперимента Майкельсона-Морли помог представлению о постоянстве скорости света получить широкое и быстрое признание.

Вывод специальной теории относительности зависит не только от этих двух явных постулатов, но и от нескольких неявных предположений ( принимаемых почти во всех теориях физики ), включая изотропность и однородность пространства и независимость измерительных стержней и часов от их прошлой истории. ^{[стр. 6]}

После первоначального представления Эйнштейном специальной теории относительности в 1905 году было предложено много различных наборов постулатов в различных альтернативных выводах. ^[17] Но наиболее распространенным набором постулатов остаются те, которые использовались Эйнштейном в его оригинальной статье. Более математическое изложение принципа относительности, сделанное позже Эйнштейном, которое вводит концепцию простоты, не упомянутую выше, выглядит следующим образом:

Специальный принцип относительности : Если система координат K выбрана так, что по отношению к ней физические законы справедливы в их простейшей форме, то те же законы справедливы по отношению к любой другой системе координат K ′, движущейся равномерно и поступательно относительно K. ^[18 ]

Анри Пуанкаре предоставил математическую основу для теории относительности, доказав, что преобразования Лоренца являются подмножеством его группы преобразований симметрии Пуанкаре . Позднее Эйнштейн вывел эти преобразования из своих аксиом.

Во многих работах Эйнштейна представлены выводы преобразования Лоренца, основанные на этих двух принципах. ^{[стр. 7]}

Принцип относительности

Системы отсчета и относительное движение

Системы отсчета играют решающую роль в теории относительности. Термин «система отсчета», используемый здесь, представляет собой наблюдательную перспективу в пространстве, которое не претерпевает никаких изменений в движении (ускорении), из которой можно измерить положение по 3 пространственным осям (то есть в состоянии покоя или постоянной скорости). Кроме того, система отсчета имеет возможность определять измерения времени событий с помощью «часов» (любого устройства отсчета с равномерной периодичностью).

Событие — это явление, которому можно приписать единственный уникальный момент и местоположение в пространстве относительно системы отсчета: это «точка» в пространстве-времени . Поскольку скорость света постоянна в теории относительности независимо от системы отсчета, импульсы света можно использовать для однозначного измерения расстояний и отсылки к времени, когда события произошли, по часам, даже несмотря на то, что свету требуется время, чтобы достичь часов после того, как событие произошло.

Например, взрыв петарды можно считать «событием». Мы можем полностью определить событие по его четырем пространственно-временным координатам: время возникновения и его трехмерное пространственное положение определяют точку отсчета. Назовем эту систему отсчета S.

В теории относительности мы часто хотим вычислить координаты события из разных систем отсчета. Уравнения, связывающие измерения, сделанные в разных системах отсчета, называются уравнениями преобразования .

Стандартная конфигурация

Чтобы получить представление о том, как пространственно-временные координаты, измеренные наблюдателями в разных системах отсчета, сравниваются друг с другом, полезно работать с упрощенной установкой с системами в стандартной конфигурации . ^[19]^{: 107} При осторожности это позволяет упростить математику без потери общности в полученных выводах. На рис. 2-1 две галилеевы системы отсчета (т. е. обычные трехмерные системы отсчета) отображаются в относительном движении. Система S принадлежит первому наблюдателю O , а система S ′ (произносится как «S штрих» или «S тире») принадлежит второму наблюдателю O ′ .

Оси x , y , z кадра S ориентированы параллельно соответствующим штрихованным осям кадра S ′ .
Для простоты система координат S ′ движется в одном направлении: направлении x системы координат S с постоянной скоростью v , измеренной в системе координат S.
Начало координат кадров S и S ′ совпадает, когда время t = 0 для кадра S и t ′ = 0 для кадра S ′ .

Поскольку в теории относительности нет абсолютной системы отсчета, понятие «движение» строго не существует, поскольку все может двигаться относительно какой-то другой системы отсчета. Вместо этого любые две системы, которые движутся с одинаковой скоростью в одном направлении, называются сопутствующими . Следовательно, S и S ′ не сопутствуют .

Отсутствие абсолютной системы отсчета

Принцип относительности , который гласит, что физические законы имеют одинаковую форму в каждой инерциальной системе отсчета , восходит к Галилею и был включен в ньютоновскую физику. Но в конце 19 века существование электромагнитных волн привело некоторых физиков к предположению, что вселенная заполнена веществом, которое они назвали « эфиром », которое, как они постулировали, будет действовать как среда, через которую распространяются эти волны или вибрации (во многих отношениях аналогично тому, как звук распространяется по воздуху). Считалось, что эфир является абсолютной системой отсчета , относительно которой можно измерить все скорости, и его можно считать фиксированным и неподвижным относительно Земли или какой-либо другой фиксированной точки отсчета. Предполагалось, что эфир достаточно упруг, чтобы поддерживать электромагнитные волны, в то время как эти волны могут взаимодействовать с материей, не оказывая при этом никакого сопротивления проходящим через него телам (его единственным свойством было то, что он позволял электромагнитным волнам распространяться). Результаты различных экспериментов, включая эксперимент Майкельсона-Морли в 1887 году (впоследствии подтвержденный более точными и новаторскими экспериментами), привели к появлению специальной теории относительности, показав, что эфира не существует. ^[20] Решение Эйнштейна состояло в том, чтобы отказаться от понятия эфира и абсолютного состояния покоя. В теории относительности любая система отсчета, движущаяся равномерно, будет соблюдать одни и те же законы физики. В частности, скорость света в вакууме всегда измеряется как c , даже если она измеряется несколькими системами, движущимися с разными (но постоянными) скоростями.

Относительность без второго постулата

Из принципа относительности, без предположения о постоянстве скорости света (т. е. используя изотропию пространства и симметрию, подразумеваемую принципом специальной теории относительности), можно показать , что преобразования пространства-времени между инерциальными системами являются либо евклидовыми, либо галилеевыми, либо лоренцевскими. В лоренцевом случае можно получить сохранение релятивистского интервала и определенную конечную предельную скорость. Эксперименты показывают, что эта скорость является скоростью света в вакууме. ^{[стр. 8]}^[21]

Лоренц-инвариантность как сущностное ядро специальной теории относительности

Альтернативные подходы к специальной теории относительности

Эйнштейн последовательно основывал вывод инвариантности Лоренца (сущностного ядра специальной теории относительности) всего на двух основных принципах относительности и инвариантности скорости света. Он писал:

Фундаментальное понимание специальной теории относительности заключается в следующем: Допущения относительности и инвариантности скорости света совместимы, если постулировать соотношения нового типа («преобразования Лоренца») для преобразования координат и времени событий... Универсальный принцип специальной теории относительности содержится в постулате: Законы физики инвариантны относительно преобразований Лоренца (для перехода от одной инерциальной системы к любой другой произвольно выбранной инерциальной системе). Это ограничивающий принцип для законов природы... ^{[стр. 5]}

Таким образом, многие современные трактовки специальной теории относительности основывают ее на единственном постулате универсальной лоренц-ковариантности или, что эквивалентно, на единственном постулате пространства-времени Минковского . ^{[стр. 9]}^{[стр. 10]}

Вместо того чтобы считать универсальную лоренц-ковариантность производным принципом, в этой статье она рассматривается как фундаментальный постулат специальной теории относительности. Традиционный двухпостулатный подход к специальной теории относительности представлен в бесчисленных учебниках для колледжей и популярных презентациях. ^[22] Учебники, начинающиеся с единственного постулата пространства-времени Минковского, включают учебники Тейлора и Уиллера ^[11] и Каллахана. ^[23] Этот подход также используется в статьях Википедии Пространство-время и Диаграмма Минковского .

Преобразование Лоренца и его обратные

Определим событие как имеющее пространственно-временные координаты ( t , x , y , z ) в системе S и ( t ′ , x ′ , y ′ , z ′ ) в системе отсчета, движущейся со скоростью v по оси x относительно этой системы S ′ . Тогда преобразование Лоренца указывает, что эти координаты связаны следующим образом: где — фактор Лоренца , а c — скорость света в вакууме, а скорость v системы S ′ относительно S параллельна оси x . Для простоты координаты y и z не затрагиваются; преобразуются только координаты x и t . Эти преобразования Лоренца образуют однопараметрическую группу линейных отображений , причем этот параметр называется быстротой . ${\begin{aligned}t'&=\gamma \ (t-vx/c^{2})\\x'&=\gamma \ (x-vt)\\y'&=y\\z'&=z,\end{aligned}}$ $\gamma ={\frac {1}{\sqrt {1-v^{2}/c^{2}}}}$

Решение четырех уравнений преобразования выше для нештрихованных координат дает обратное преобразование Лоренца: ${\begin{aligned}t&=\gamma (t'+vx'/c^{2})\\x&=\gamma (x'+vt')\\y&=y'\\z&=z'.\end{aligned}}$

Это показывает, что нештрихованная система отсчета движется со скоростью − v , измеренной в штрихованной системе отсчета. ^[24]

Ничего особенного в оси x нет . Преобразование может применяться к оси y или z , или в любом направлении, параллельном движению (которое искривляется фактором γ ) и перпендикулярном; подробности см. в статье Преобразование Лоренца .

Величина, инвариантная относительно преобразований Лоренца, называется скаляром Лоренца .

Записывая преобразование Лоренца и его обратное в терминах разностей координат, где одно событие имеет координаты ( x ₁ , t ₁ ) и ( x ′ ₁ , t ′ ₁ ) , другое событие имеет координаты ( x ₂ , t ₂ ) и ( x ′ ₂ , t ′ ₂ ) , а разности определяются как

Уравнение 1: $\Delta x'=x'_{2}-x'_{1}\ ,\ \Delta t'=t'_{2}-t'_{1}\ .$
Уравнение 2: $\Delta x=x_{2}-x_{1}\ ,\ \ \Delta t=t_{2}-t_{1}\ .$

мы получаем

Ур. 3: $\Delta x'=\gamma \ (\Delta x-v\,\Delta t)\ ,\ \$ $\Delta t'=\gamma \ \left(\Delta t-v\ \Delta x/c^{2}\right)\ .$
Ур. 4: $\Delta x=\gamma \ (\Delta x'+v\,\Delta t')\ ,\$ $\Delta t=\gamma \ \left(\Delta t'+v\ \Delta x'/c^{2}\right)\ .$

Если вместо разностей взять дифференциалы, то получим

Уравнение 5: $dx'=\gamma \ (dx-v\,dt)\ ,\ \$ $dt'=\gamma \ \left(dt-v\ dx/c^{2}\right)\ .$
Ур. 6: $dx=\gamma \ (dx'+v\,dt')\ ,\$ $dt=\gamma \ \left(dt'+v\ dx'/c^{2}\right)\ .$

Графическое представление преобразования Лоренца

Рисунок 3-1. Рисование пространственно-временной диаграммы Минковского для иллюстрации преобразования Лоренца.

Пространственно-временные диаграммы ( диаграммы Минковского ) являются чрезвычайно полезным средством визуализации того, как координаты преобразуются между различными системами отсчета. Хотя с их помощью не так просто выполнять точные вычисления, как напрямую используя преобразования Лоренца, их главная сила заключается в их способности обеспечивать интуитивное понимание результатов релятивистского сценария. ^[21]

Чтобы нарисовать пространственно-временную диаграмму, начнем с рассмотрения двух галилеевых систем отсчета, S и S', в стандартной конфигурации, как показано на рис. 2-1. ^[21]^[25]^{: 155–199}

Рис. 3-1a . Нарисуйте оси и кадра S. Ось горизонтальна, а (фактически ) ось вертикальна, что противоположно обычному соглашению в кинематике. Ось масштабируется с коэффициентом , так что обе оси имеют общие единицы длины. На показанной схеме линии сетки отстоят друг от друга на одну единицу расстояния. Диагональные линии под углом 45° представляют мировые линии двух фотонов, проходящих через начало координат в момент времени Наклон этих мировых линий равен 1, поскольку фотоны продвигаются на одну единицу в пространстве за единицу времени. Два события и были нанесены на этот график, так что их координаты можно сравнить в кадрах S и S'. $x$ $t$ $x$ $t$ $ct$ $ct$ $c$ $t=0.$ ${\text{A}}$ ${\text{B}},$

Рис. 3-1b . Нарисуйте оси и кадра S'. Ось представляет собой мировую линию начала системы координат S', измеренную в кадре S. На этом рисунке обе оси и наклонены относительно нештрихованных осей на угол , где Штрихованная и нештрихованная оси имеют общее начало, поскольку кадры S и S' были настроены в стандартной конфигурации, так что когда $x'$ $ct'$ $ct'$ $v=c/2.$ $ct'$ $x'$ $\alpha =\tan ^{-1}(\beta ),$ $\beta =v/c.$ $t=0$ $t'=0.$

Рис. 3-1c . Единицы в штрихованных осях имеют другой масштаб, чем единицы в нештрихованных осях. Из преобразований Лоренца мы видим, что координаты в штрихованной системе координат преобразуются в в нештрихованной системе координат. Аналогично, координаты в штрихованной системе координат преобразуются в в нештрихованной системе. Проведите линии сетки параллельно оси через точки , измеренные в нештрихованной системе отсчета, где — целое число. Аналогично, проведите линии сетки параллельно оси через , измеренные в нештрихованной системе отсчета. Используя теорему Пифагора, мы видим, что расстояние между единицами равно расстоянию между единицами, умноженному на расстояние между единицами, измеренное в системе отсчета S. Это отношение всегда больше 1 и в конечном итоге стремится к бесконечности, поскольку $(x',ct')$ $(0,1)$ $(\beta \gamma ,\gamma )$ $(x',ct')$ $(1,0)$ $(\gamma ,\beta \gamma )$ $ct'$ $(k\gamma ,k\beta \gamma )$ $k$ $x'$ $(k\beta \gamma ,k\gamma )$ $ct'$ ${\textstyle {\sqrt {(1+\beta ^{2})/(1-\beta ^{2})}}}$ $ct$ $\beta \to 1.$

Рис. 3-1d . Поскольку скорость света является инвариантом, мировые линии двух фотонов, проходящих через начало координат в момент времени, по-прежнему отображаются в виде диагональных линий под углом 45°. Штрихованные координаты и связаны с нештрихованными координатами посредством преобразований Лоренца и могут быть приблизительно измерены по графику (предполагая, что он был построен достаточно точно), но настоящее достоинство диаграммы Минковского заключается в том, что она предоставляет нам геометрическое представление сценария. Например, на этом рисунке мы видим, что два времениподобно разделенных события, которые имели разные x-координаты в нештрихованной системе отсчета, теперь находятся в одном и том же положении в пространстве. $t'=0$ ${\text{A}}$ ${\text{B}}$

В то время как нештрихованная рамка нарисована с пространственными и временными осями, которые встречаются под прямым углом, заштрихованная рамка нарисована с осями, которые встречаются под острым или тупым углом. Эта асимметрия вызвана неизбежными искажениями в том, как пространственно-временные координаты отображаются на декартовой плоскости , но рамки на самом деле эквивалентны.

Следствия, вытекающие из преобразования Лоренца

Следствия специальной теории относительности можно вывести из уравнений преобразования Лоренца . ^[26] Эти преобразования, а следовательно, и специальная теория относительности, приводят к иным физическим предсказаниям, чем предсказания ньютоновской механики при всех относительных скоростях, и наиболее выражены, когда относительные скорости становятся сравнимыми со скоростью света. Скорость света настолько больше всего, с чем сталкивается большинство людей, что некоторые эффекты, предсказываемые теорией относительности, изначально противоречат здравому смыслу .

Инвариантный интервал

В теории относительности Галилея длина объекта ( ) ^{[примечание 3]} и временное разделение между двумя событиями ( ) являются независимыми инвариантами, значения которых не меняются при наблюдении из разных систем отсчета. ^{[примечание 4]}^{[примечание 5]} $\Delta r$ $\Delta t$

Однако в специальной теории относительности переплетение пространственных и временных координат порождает концепцию инвариантного интервала , обозначаемого как : ^{[примечание 6]} $\Delta s^{2}$ $\Delta s^{2}\;{\overset {\text{def}}{=}}\;c^{2}\Delta t^{2}-(\Delta x^{2}+\Delta y^{2}+\Delta z^{2})$

Переплетение пространства и времени отменяет неявно предполагаемые концепции абсолютной одновременности и синхронизации в несопутствующих системах отсчета.

Форма, представляющая собой разницу квадрата промежутка времени и квадрата пространственного расстояния, демонстрирует фундаментальное расхождение между евклидовыми и пространственно-временными расстояниями. ^{[примечание 7]} Инвариантность этого интервала является свойством общего преобразования Лоренца (также называемого преобразованием Пуанкаре ), что делает его изометрией пространства-времени. Общее преобразование Лоренца расширяет стандартное преобразование Лоренца (которое имеет дело с переносами без вращения, то есть с прибавками Лоренца в направлении x) на все другие переносы , отражения и вращения между любой декартовой инерциальной системой отсчета. ^[30]^{: 33–34} $\Delta s^{2},$

При анализе упрощенных сценариев, таких как пространственно-временные диаграммы, часто используется форма инвариантного интервала с уменьшенной размерностью: $\Delta s^{2}\,=\,c^{2}\Delta t^{2}-\Delta x^{2}$

Демонстрация того, что интервал является инвариантным, проста для случая пониженной размерности и с рамками в стандартной конфигурации: ^[21] ${\begin{aligned}c^{2}\Delta t^{2}-\Delta x^{2}&=c^{2}\gamma ^{2}\left(\Delta t'+{\dfrac {v\Delta x'}{c^{2}}}\right)^{2}-\gamma ^{2}\ (\Delta x'+v\Delta t')^{2}\\&=\gamma ^{2}\left(c^{2}\Delta t'^{\,2}+2v\Delta x'\Delta t'+{\dfrac {v^{2}\Delta x'^{\,2}}{c^{2}}}\right)-\gamma ^{2}\ (\Delta x'^{\,2}+2v\Delta x'\Delta t'+v^{2}\Delta t'^{\,2})\\&=\gamma ^{2}c^{2}\Delta t'^{\,2}-\gamma ^{2}v^{2}\Delta t'^{\,2}-\gamma ^{2}\Delta x'^{\,2}+\gamma ^{2}{\dfrac {v^{2}\Delta x'^{\,2}}{c^{2}}}\\&=\gamma ^{2}c^{2}\Delta t'^{\,2}\left(1-{\dfrac {v^{2}}{c^{2}}}\right)-\gamma ^{2}\Delta x'^{\,2}\left(1-{\dfrac {v^{2}}{c^{2}}}\right)\\&=c^{2}\Delta t'^{\,2}-\Delta x'^{\,2}\end{aligned}}$

Следовательно, значение не зависит от системы отсчета, в которой оно измеряется. $\Delta s^{2}$

При рассмотрении физического значения следует отметить три случая: ^[21]^[31]^{: 25–39} $\Delta s^{2}$

Δs ² > 0: В этом случае два события разделены большим временем, чем пространством, и поэтому говорят, что они разделены подобно времени . Это подразумевает, что и учитывая преобразование Лоренца , очевидно, что существует меньшее, чем для которого (в частности, ). Другими словами, учитывая два события, разделенные подобно времени, можно найти систему отсчета, в которой два события происходят в одном и том же месте. В этой системе отсчета разделение во времени называется собственным временем . $|\Delta x/\Delta t|<c,$ $\Delta x'=\gamma \ (\Delta x-v\,\Delta t),$ $v$ $c$ $\Delta x'=0$ $v=\Delta x/\Delta t$ $\Delta s/c,$
Δs ² < 0: В этом случае два события разделены большим пространством, чем временем, и поэтому говорят, что они разделены подобно пространству . Это подразумевает, что и учитывая преобразование Лоренца существует меньше, чем для которого (в частности, ). Другими словами, учитывая два события, разделенных подобно пространству, можно найти систему отсчета, в которой два события происходят одновременно. В этой системе отсчета разделение в пространстве называется собственным расстоянием или собственной длиной . Для значений больше и меньше знака изменяется, что означает, что временной порядок разделенных подобно пространству событий изменяется в зависимости от системы отсчета, в которой рассматриваются события. Но временной порядок разделенных подобно времени событий является абсолютным, поскольку единственный способ, которым может быть больше, чем было бы, если бы $|\Delta x/\Delta t|>c,$ $\Delta t'=\gamma \ (\Delta t-v\Delta x/c^{2}),$ $v$ $c$ $\Delta t'=0$ $v=c^{2}\Delta t/\Delta x$ ${\textstyle {\sqrt {-\Delta s^{2}}},}$ $v$ $c^{2}\Delta t/\Delta x,$ $\Delta t'$ $v$ $c^{2}\Delta t/\Delta x$ $v>c.$
Δs ² = 0: В этом случае говорят, что два события разделены подобно свету . Это подразумевает, что и это отношение не зависит от системы отсчета из-за инвариантности Отсюда мы видим, что скорость света есть в каждой инерциальной системе отсчета. Другими словами, исходя из предположения об универсальной лоренц-ковариантности, постоянная скорость света является производным результатом, а не постулатом, как в двухпостулатной формулировке специальной теории. $|\Delta x/\Delta t|=c,$ $s^{2}.$ $c$

Относительность одновременности

Рассмотрим два события, происходящие в двух разных местах, которые происходят одновременно в системе отсчета одного инерциального наблюдателя. Они могут происходить неодновременно в системе отсчета другого инерциального наблюдателя (отсутствие абсолютной одновременности ).

Из уравнения 3 (прямое преобразование Лоренца в терминах разностей координат) $\Delta t'=\gamma \left(\Delta t-{\frac {v\,\Delta x}{c^{2}}}\right)$

Ясно, что два события, которые являются одновременными в системе S (удовлетворяющей Δ t = 0 ), не обязательно являются одновременными в другой инерциальной системе S ′ (удовлетворяющей Δ t ′ = 0 ). Только если эти события дополнительно колокальны в системе S (удовлетворяющей Δ x = 0 ), они будут одновременными в другой системе S ′ .

Эффект Саньяка можно считать проявлением относительности одновременности. ^[32] Поскольку относительность одновременности является эффектом первого порядка в , ^[21] приборы, работающие на основе эффекта Саньяка, такие как кольцевые лазерные гироскопы и волоконно-оптические гироскопы , способны достигать экстремальных уровней чувствительности. ^{[стр. 14]} $v$

Замедление времени

Промежуток времени между двумя событиями не является постоянным для разных наблюдателей, а зависит от относительных скоростей систем отсчета наблюдателей.

Предположим, что часы находятся в состоянии покоя в нештрихованной системе S. Положение часов в двух разных тиках тогда характеризуется Δ x = 0. Чтобы найти соотношение между временами между этими тиками, измеренными в обеих системах, можно использовать уравнение 3 для нахождения:

\Delta t'=\gamma \,\Delta t

для событий, удовлетворяющих

\Delta x=0\ .

Это показывает, что время (Δ t ′ ) между двумя тиками, как видно в кадре, в котором движутся часы ( S ′ ), больше , чем время (Δ t ) между этими тиками, измеренное в неподвижной системе часов ( S ). Замедление времени объясняет ряд физических явлений; например, время жизни высокоскоростных мюонов, созданных столкновением космических лучей с частицами во внешней атмосфере Земли и движущихся к поверхности, больше, чем время жизни медленно движущихся мюонов, созданных и распадающихся в лаборатории. ^[33]

Всякий раз, когда слышишь утверждение о том, что «движущиеся часы идут медленно», следует представить себе инерциальную систему отсчета, густо заполненную идентичными, синхронизированными часами. Когда движущиеся часы проходят через этот массив, их показания в любой конкретной точке сравниваются с показаниями неподвижных часов в той же точке. ^[34]^{: 149–152}

Измерения, которые мы получили бы, если бы мы действительно смотрели на движущиеся часы, в общем случае были бы совсем не тем же самым, потому что время, которое мы увидели бы, было бы задержано из-за конечной скорости света, т. е. время, которое мы видим, было бы искажено эффектом Доплера . Измерения релятивистских эффектов всегда следует понимать как сделанные после того, как эффекты конечной скорости света были вынесены за скобки. ^[34]^{: 149–152}

Световые часы Ланжевена

Поль Ланжевен , один из первых сторонников теории относительности, сделал многое для популяризации теории, несмотря на сопротивление многих физиков революционным концепциям Эйнштейна. Среди его многочисленных вкладов в основы специальной теории относительности были независимые работы по соотношению массы и энергии, тщательное изучение парадокса близнецов и исследования вращающихся систем координат. Его имя часто связывают с гипотетической конструкцией, называемой «световыми часами» (первоначально разработанной Льюисом и Толменом в 1909 году ^[35] ), которую он использовал для выполнения нового вывода преобразования Лоренца. ^[36]

Световые часы представляются как ящик с идеально отражающими стенками, в котором световой сигнал отражается вперед и назад от противоположных сторон. Концепция замедления времени часто преподается с использованием световых часов, которые движутся равномерно инерционно перпендикулярно линии, соединяющей два зеркала. ^[37]^[38]^[39]^[40] (Сам Ланжевен использовал световые часы, ориентированные параллельно своей линии движения. ^[36] )

Рассмотрим сценарий, показанный на рис. 4-3A. Наблюдатель A держит световые часы длины , а также электронный таймер, с помощью которого он измеряет, сколько времени требуется импульсу, чтобы совершить круговое путешествие вверх и вниз по световым часам. Хотя наблюдатель A быстро движется по поезду, с его точки зрения излучение и получение импульса происходят в одном и том же месте, и он измеряет интервал, используя одни часы, расположенные в точном месте этих двух событий. Для интервала между этими двумя событиями наблюдатель A находит Интервал времени, измеренный с помощью одних часов, которые неподвижны в определенной системе отсчета, называется собственным интервалом времени . ^[41] $L$ $t_{\text{A}}=2L/c.$

Рис. 4-3B иллюстрирует эти же два события с точки зрения наблюдателя B, который стоит у путей, пока поезд проезжает со скоростью Вместо того, чтобы совершать прямые движения вверх-вниз, наблюдатель B видит, что импульсы движутся по зигзагообразной линии. Однако из-за постулата постоянства скорости света скорость импульсов вдоль этих диагональных линий та же самая, которую наблюдатель A видел для своих импульсов вверх-вниз. B измеряет скорость вертикальной составляющей этих импульсов как так что общее время прохождения импульсов туда и обратно составляет Обратите внимание, что для наблюдателя B излучение и получение светового импульса происходили в разных местах, и он измерял интервал, используя два неподвижных и синхронизированных часа, расположенных в двух разных положениях в его системе отсчета. Интервал, который измерял B, поэтому не был надлежащим временным интервалом, потому что он измерял его не с помощью одних покоящихся часов. ^[41] $v.$ $c$ ${\textstyle \pm {\sqrt {c^{2}-v^{2}}},}$ ${\textstyle t_{B}=2L{\big /}{\sqrt {c^{2}-v^{2}}}={}}$ ${\textstyle t_{A}{\big /}{\sqrt {1-v^{2}/c^{2}}}.}$

Взаимное замедление времени

В приведенном выше описании световых часов Ланжевена обозначение одного наблюдателя как неподвижного, а другого как движущегося было совершенно произвольным. Можно было бы с тем же успехом иметь наблюдателя B, несущего световые часы и движущегося со скоростью влево, в этом случае наблюдатель A воспринимал бы часы B как идущие медленнее, чем его локальные часы. $v$

Здесь нет парадокса, потому что нет независимого наблюдателя C, который согласится и с A, и с B. Наблюдатель C обязательно производит свои измерения из своей собственной системы отсчета. Если эта система отсчета совпадает с системой отсчета A, то C согласится с измерением времени A. Если система отсчета C совпадает с системой отсчета B, то C согласится с измерением времени B. Если система отсчета C не совпадает ни с системой отсчета A, ни с системой отсчета B, то измерение времени C будет противоречить как измерению времени A , так и измерению времени B. ^[42]

Парадокс близнецов

Взаимность замедления времени между двумя наблюдателями в отдельных инерциальных системах отсчета приводит к так называемому парадоксу близнецов , сформулированному в его нынешней форме Ланжевеном в 1911 году. ^[43] Ланжевен представил себе авантюриста, желающего исследовать будущее Земли. Этот путешественник садится в снаряд, способный двигаться со скоростью 99,995% скорости света. Совершив путешествие туда и обратно к ближайшей звезде, длящееся всего два года его собственной жизни, он возвращается на Землю, которая на двести лет старше.

Этот результат кажется загадочным, поскольку и путешественник, и земной наблюдатель будут видеть друг друга движущимися, и поэтому, из-за взаимности замедления времени, можно было бы изначально ожидать, что каждый должен был бы обнаружить, что другой постарел меньше. На самом деле, нет никакого парадокса вообще, потому что для того, чтобы два наблюдателя могли сравнить свое собственное время, симметрия ситуации должна быть нарушена: по крайней мере один из двух наблюдателей должен изменить свое состояние движения, чтобы соответствовать состоянию другого. ^[44]

Однако знание общего решения парадокса не дает немедленной возможности вычислять правильные количественные результаты. Многие решения этой головоломки были предоставлены в литературе и рассмотрены в статье о парадоксе близнецов . Далее мы рассмотрим одно такое решение парадокса.

Наша основная цель — продемонстрировать, что после путешествия оба близнеца находятся в полном согласии относительно того, кто и на сколько постарел, независимо от их разного опыта. Рис. 4-4 иллюстрирует сценарий, в котором путешествующий близнец летит со скоростью 0,6 с к звезде, удаленной на 3 световых года , и обратно. Во время путешествия каждый близнец посылает друг другу ежегодные сигналы времени (измеренные в их собственном времени). После путешествия сравниваются накопленные подсчеты. На внешней фазе путешествия каждый близнец получает сигналы другого с пониженной частотой Первоначально ситуация совершенно симметрична: обратите внимание, что каждый близнец получает годовой сигнал другого через два года, измеренных по его собственным часам. Симметрия нарушается, когда путешествующий близнец оборачивается на четырехлетней отметке, измеренной по его часам. В течение оставшихся четырех лет своего путешествия она получает сигналы с повышенной частотой Ситуация совершенно иная с неподвижным близнецом. Из-за задержки, связанной со скоростью света, он не видит, как его сестра оборачивается, пока не пройдет восемь лет по его собственным часам. Таким образом, он получает сигналы повышенной частоты от своей сестры только в течение относительно короткого периода. Хотя близнецы расходятся в своих соответствующих измерениях общего времени, мы видим в следующей таблице, а также путем простого наблюдения за диаграммой Минковского, что каждый близнец находится в полном согласии с другим относительно общего числа сигналов, отправленных от одного к другому. Следовательно, нет никакого парадокса. ^[34]^{: 152–159} ${\textstyle f'=f{\sqrt {(1-\beta )/(1+\beta )}}.}$ ${\textstyle f''=f{\sqrt {(1+\beta )/(1-\beta )}}.}$

Сокращение длины

Размеры (например, длина) объекта, измеренные одним наблюдателем, могут быть меньше результатов измерений того же объекта, сделанных другим наблюдателем (например, парадокс лестницы подразумевает, что длинная лестница движется со скоростью, близкой к скорости света, и находится в меньшем гараже).

Аналогично, предположим, что измерительный стержень находится в состоянии покоя и выровнен вдоль оси x в нештрихованной системе S . В этой системе длина этого стержня записывается как Δ x . Чтобы измерить длину этого стержня в системе S ′ , в которой стержень движется, расстояния x ′ до конечных точек стержня должны быть измерены одновременно в этой системе S ′ . Другими словами, измерение характеризуется Δ t ′ = 0 , что можно объединить с уравнением 4, чтобы найти связь между длинами Δ x и Δ x ′ :

\Delta x'={\frac {\Delta x}{\gamma }}

для событий, удовлетворяющих

\Delta t'=0\ .

Это показывает, что длина (Δ x ′ ) стержня, измеренная в системе, в которой он движется ( S ′ ), короче его длины (Δ x ) в его собственной системе покоя ( S ).

Замедление времени и сокращение длины — это не просто видимости. Замедление времени явно связано с нашим способом измерения временных интервалов между событиями, которые происходят в одном и том же месте в данной системе координат (называемые «колокальными» событиями). Эти временные интервалы (которые могут быть и фактически измеряются экспериментально соответствующими наблюдателями) отличаются в другой системе координат, движущейся относительно первой, если только события, в дополнение к тому, что они колокальны, также не являются одновременными. Аналогично, сокращение длины связано с нашими измеренными расстояниями между разделенными, но одновременными событиями в данной выбранной системе координат. Если эти события не колокальны, а разделены расстоянием (пространством), они не будут происходить на одном и том же пространственном расстоянии друг от друга, если смотреть из другой движущейся системы координат.

Преобразование Лоренца скоростей

Рассмотрим две системы отсчета S и S ′ в стандартной конфигурации. Частица в системе отсчета S движется в направлении x со скоростью вектора. Какова ее скорость в системе отсчета S ′ ? $\mathbf {u} .$ $\mathbf {u'}$

Мы можем написать

Подстановка выражений для и из уравнения 5 в уравнение 8 , а затем простые математические преобразования и обратная подстановка из уравнения 7 дают преобразование Лоренца скорости : $dx'$ $dt'$ $u$ $u'$

Обратное отношение получается путем перестановки штрихованных и нештрихованных символов и замены на $v$ $-v\ .$

Для невыровненных по оси x точек запишем: ^[12]^{: 47–49} $\mathbf {u}$

Прямые и обратные преобразования для этого случая следующие:

Уравнение 10 и уравнение 14 можно интерпретировать как дающие результирующую двух скоростей и и они заменяют формулу , которая действительна в теории относительности Галилея. Интерпретируемые таким образом, они обычно называются формулами сложения (или композиции) релятивистских скоростей , действительными для трех осей S и S ′, выровненных друг с другом (хотя не обязательно в стандартной конфигурации). ^[12]^{: 47–49} $\mathbf {u}$ $\mathbf {v}$ $\mathbf {u'} ,$ $\mathbf {u=u'+v}$

Мы отмечаем следующие моменты:

Если бы объект (например, фотон ) двигался со скоростью света в одной системе отсчета (т. е. u = ± c или u ′ = ± c ) , то он также двигался бы со скоростью света в любой другой системе отсчета, двигаясь со скоростью | v | < c .
Результирующая скорость двух скоростей с величиной, меньшей c, всегда представляет собой скорость с величиной, меньшей c .
Если и | u |, и | v | (а затем также | u ′ | и | v ′ |) малы по сравнению со скоростью света (то есть, например, | ⁠ты/с⁠ | ≪ $1$ ), то интуитивные преобразования Галилея восстанавливаются из уравнений преобразования для специальной теории относительности
Присоединение рамки к фотону ( перемещение по световому лучу, как полагает Эйнштейн) требует особого подхода к преобразованиям.

В стандартной конфигурации нет ничего особенного в направлении x . Вышеуказанный формализм применим к любому направлению; и три ортогональных направления позволяют иметь дело со всеми направлениями в пространстве, разлагая векторы скорости на их компоненты в этих направлениях. Подробности см. в формуле сложения скоростей .

вращение Томаса

Рисунок 4-5. Вращение Томаса-Вигнера.

Композиция двух неколлинеарных усилений Лоренца (т. е. двух неколлинеарных преобразований Лоренца, ни одно из которых не включает в себя вращение) приводит к преобразованию Лоренца, которое не является чистым усилением, а представляет собой композицию усиления и вращения.

Вращение Томаса является результатом относительности одновременности. На рис. 4-5а стержень длиной в своей системе покоя (т.е. имеющий собственную длину ) поднимается вертикально вдоль оси y в наземной системе отсчета. $L$ $L$

На рис. 4-5b тот же стержень наблюдается из рамы ракеты, движущейся со скоростью вправо. Если мы представим себе двое часов, расположенных на левом и правом концах стержня, которые синхронизированы в раме стержня , относительность одновременности заставляет наблюдателя в раме ракеты наблюдать (не видеть) часы на правом конце стержня как опережающие во времени на , а стержень соответственно наблюдается наклонным. ^[31]^{: 98–99} $v$ $Lv/c^{2},$

В отличие от релятивистских эффектов второго порядка, таких как сокращение длины или замедление времени, этот эффект становится весьма существенным даже при довольно низких скоростях. Например, это можно увидеть в спине движущихся частиц , где прецессия Томаса является релятивистской поправкой, которая применяется к спину элементарной частицы или вращению макроскопического гироскопа , связывая угловую скорость спина частицы, следующей по криволинейной орбите, с угловой скоростью орбитального движения. ^[31]^{: 169–174}

Вращение Томаса дает решение известного «парадокса метровой палки и отверстия». ^{[стр. 15]}^[31]^{: 98–99}

Причинность и запрет движения со скоростью, превышающей скорость света

На рис. 4-6 временной интервал между событиями A («причина») и B («следствие») является «временеподобным»; то есть существует система отсчета, в которой события A и B происходят в одном и том же месте пространства , разделенные только тем, что происходят в разное время. Если A предшествует B в этой системе, то A предшествует B во всех системах, доступных преобразованию Лоренца. Материя (или информация) может перемещаться (со скоростью ниже скорости света) из местоположения A, начиная с момента времени A, в местоположение B, прибывая во время B, поэтому может существовать причинно-следственная связь (где A является причиной, а B — следствием).

Интервал AC на диаграмме является «пространственно-подобным»; то есть, есть система отсчета, в которой события A и C происходят одновременно, разделенные только пространством. Есть также системы, в которых A предшествует C (как показано) и системы, в которых C предшествует A. Но ни одна система не доступна преобразованию Лоренца, в которой события A и C происходят в одном и том же месте. Если бы между событиями A и C могла существовать причинно-следственная связь, возникли бы парадоксы причинности.

Например, если бы сигналы можно было посылать быстрее света, то сигналы можно было бы посылать в прошлое отправителя (наблюдатель B на диаграммах). ^[45]^{[стр. 16]} Тогда можно было бы сконструировать множество причинных парадоксов.

Рисунок 4-7. Нарушение причинности при использовании фиктивных
«мгновенных коммуникаторов»

Рассмотрим пространственно-временные диаграммы на рис. 4-7. A и B стоят вдоль железнодорожных путей, когда мимо проезжает скоростной поезд, причем C едет в последнем вагоне поезда, а D едет в головном вагоне. Мировые линии A и B вертикальны ( ct ), что указывает на неподвижное положение этих наблюдателей на земле, в то время как мировые линии C и D наклонены вперед ( ct ′ ), отражая быстрое движение наблюдателей C и D, неподвижных в своем поезде, как это наблюдается с земли.

Рис. 4-7а. Событие "B передает сообщение D", когда головной вагон проезжает мимо, находится в начале кадра D. D отправляет сообщение по поезду C в заднем вагоне, используя фиктивный "мгновенный коммуникатор". Мировая линия этого сообщения - жирная красная стрелка вдоль оси , которая является линией одновременности в штрихованных кадрах C и D. В (нештрихованном) основном кадре сигнал приходит раньше, чем был отправлен. $-x'$
Рис. 4-7b. Событие "C передает сообщение A", который стоит у железнодорожных путей, находится в начале их кадров. Теперь A отправляет сообщение по путям B через "мгновенный коммуникатор". Мировая линия этого сообщения - синяя жирная стрелка вдоль оси , которая является линией одновременности для кадров A и B. Как видно из диаграммы пространства-времени, B получит сообщение до того, как отправит его, что является нарушением причинности. ^[46] $+x$

Сигналам не обязательно быть мгновенными, чтобы нарушить причинность. Даже если бы сигнал от D до C был немного мельче оси (а сигнал от A до B немного круче оси ), B все равно мог бы получить свое сообщение до того, как он его отправил. Увеличивая скорость поезда до скоростей, близких к скорости света, оси и можно сжать очень близко к пунктирной линии, представляющей скорость света. С помощью этой измененной установки можно продемонстрировать, что даже сигналы, лишь немного превышающие скорость света, приведут к нарушению причинности. ^[47] $x'$ $x$ $ct'$ $x'$

Таким образом, если необходимо сохранить причинность , одним из следствий специальной теории относительности является то, что никакой информационный сигнал или материальный объект не может двигаться быстрее света в вакууме.

Это не означает, что все скорости, превышающие скорость света, невозможны. Можно описать различные тривиальные ситуации, в которых некоторые «вещи» (не материя и не энергия) движутся быстрее света. ^[48] Например, место, где луч прожектора попадает на дно облака, может двигаться быстрее света, если прожектор быстро поворачивается (хотя это не нарушает причинность или любое другое релятивистское явление). ^[49]^[50]

Оптические эффекты

Эффекты перетаскивания

В 1850 году Ипполит Физо и Леон Фуко независимо друг от друга установили, что свет распространяется в воде медленнее, чем в воздухе, тем самым подтвердив предсказание волновой теории света Френеля и опровергнув соответствующее предсказание корпускулярной теории Ньютона . ^[51] Скорость света была измерена в стоячей воде. Какова будет скорость света в текущей воде?

В 1851 году Физо провел эксперимент, чтобы ответить на этот вопрос, упрощенное представление которого показано на рис. 5-1. Луч света разделяется расщепителем луча, и разделенные лучи пропускаются в противоположных направлениях через трубку с текущей водой. Они рекомбинируются, образуя интерференционные полосы, указывающие на разницу в оптической длине пути, которую может видеть наблюдатель. Эксперимент продемонстрировал, что увлечение света текущей водой вызывает смещение полос, показывая, что движение воды повлияло на скорость света.

Согласно теориям, господствовавшим в то время, свет, проходящий через движущуюся среду, будет простой суммой его скорости через среду плюс скорость среды . Вопреки ожиданиям, Физо обнаружил, что хотя свет, казалось бы, увлекается водой, величина увлечения была намного ниже ожидаемой. Если — скорость света в стоячей воде, — скорость воды, — скорость света в воде в лабораторной системе отсчета, при этом поток воды добавляется или вычитается из скорости света, то $u'=c/n$ $v$ $u_{\pm }$ $u_{\pm }={\frac {c}{n}}\pm v\left(1-{\frac {1}{n^{2}}}\right)\ .$

Результаты Физо, хотя и согласуются с более ранней гипотезой Френеля о частичном увлечении эфира , были крайне обескураживающими для физиков того времени. Среди прочего, наличие члена показателя преломления означало, что, поскольку зависит от длины волны, эфир должен быть способен поддерживать различные движения одновременно . ^{[примечание 8]} Было предложено множество теоретических объяснений для объяснения коэффициента увлечения Френеля , которые полностью противоречили друг другу. Еще до эксперимента Майкельсона-Морли экспериментальные результаты Физо были среди ряда наблюдений, которые создали критическую ситуацию в объяснении оптики движущихся тел. ^[52] $n$

С точки зрения специальной теории относительности результат Физо есть не что иное, как приближение к уравнению 10 , релятивистской формуле для сложения скоростей. ^[30]

u_{\pm }={\frac {u'\pm v}{1\pm u'v/c^{2}}}=

{\frac {c/n\pm v}{1\pm v/cn}}\approx

c\left({\frac {1}{n}}\pm {\frac {v}{c}}\right)\left(1\mp {\frac {v}{cn}}\right)\approx

{\frac {c}{n}}\pm v\left(1-{\frac {1}{n^{2}}}\right)

Релятивистская аберрация света

Из-за конечной скорости света, если относительные движения источника и приемника включают поперечную составляющую, то направление, из которого свет достигает приемника, будет смещено от геометрического положения в пространстве источника относительно приемника. Классический расчет смещения принимает две формы и делает разные предсказания в зависимости от того, приемник, источник или оба находятся в движении относительно среды. (1) Если приемник находится в движении, смещение будет следствием аберрации света . Угол падения луча относительно приемника можно вычислить из векторной суммы движений приемника и скорости падающего света. ^[53] (2) Если источник находится в движении, смещение будет следствием коррекции светового времени . Смещение видимого положения источника от его геометрического положения будет результатом движения источника в течение времени, которое требуется его свету, чтобы достичь приемника. ^[54]

Классическое объяснение не прошло экспериментальную проверку. Поскольку угол аберрации зависит от соотношения между скоростью приемника и скоростью падающего света, прохождение падающего света через преломляющую среду должно изменить угол аберрации. В 1810 году Араго использовал это ожидаемое явление в неудачной попытке измерить скорость света, ^[55] а в 1870 году Джордж Эйри проверил гипотезу, используя заполненный водой телескоп, обнаружив, что, вопреки ожиданиям, измеренная аберрация была идентична аберрации, измеренной с помощью заполненного воздухом телескопа. ^[56] «Громоздкая» попытка объяснить эти результаты использовала гипотезу частичного увлечения эфиром, ^[57], но была несовместима с результатами эксперимента Майкельсона–Морли, который, по-видимому, требовал полного увлечения эфиром. ^[58]

Предполагая инерциальные системы отсчета, релятивистское выражение для аберрации света применимо как к случаям перемещения приемника, так и к случаям перемещения источника. Было опубликовано множество тригонометрически эквивалентных формул. Выраженные через переменные на рис. 5-2, они включают ^[30]^{: 57–60}

\cos \theta '={\frac {\cos \theta +v/c}{1+(v/c)\cos \theta }}

ИЛИ ИЛИ

\sin \theta '={\frac {\sin \theta }{\gamma [1+(v/c)\cos \theta ]}}

\tan {\frac {\theta '}{2}}=\left({\frac {c-v}{c+v}}\right)^{1/2}\tan {\frac {\theta }{2}}

Релятивистский эффект Доплера

Релятивистский продольный эффект Доплера

Классический эффект Доплера зависит от того, движутся ли источник, приемник или оба относительно среды. Релятивистский эффект Доплера не зависит от какой-либо среды. Тем не менее, релятивистский доплеровский сдвиг для продольного случая, когда источник и приемник движутся прямо друг к другу или друг от друга, может быть получен так, как если бы это было классическое явление, но модифицированное добавлением члена замедления времени , и это описанная здесь обработка. ^[59]^[60]

Предположим, что приемник и источник удаляются друг от друга с относительной скоростью , измеренной наблюдателем на приемнике или источнике (здесь принято соглашение о знаках, что знак отрицательный , если приемник и источник движутся навстречу друг другу). Предположим, что источник неподвижен в среде. Тогда где скорость звука. $v\,$ $v$ $f_{r}=\left(1-{\frac {v}{c_{s}}}\right)f_{s}$ $c_{s}$

Для света, и с приемником, движущимся с релятивистской скоростью, часы на приемнике растянуты по времени относительно часов на источнике. Приемник будет измерять полученную частоту, чтобы быть там, где $f_{r}=\gamma \left(1-\beta \right)f_{s}={\sqrt {\frac {1-\beta }{1+\beta }}}\,f_{s}.$

$\beta =v/c$ и
$\gamma ={\frac {1}{\sqrt {1-\beta ^{2}}}}$ это фактор Лоренца .

Идентичное выражение для релятивистского доплеровского сдвига получается при выполнении анализа в системе отсчета приемника с движущимся источником. ^[61]^[21]

Поперечный эффект Доплера

Поперечный эффект Доплера — одно из главных новых предсказаний специальной теории относительности.

Классически можно было бы ожидать, что если источник и приемник движутся поперечно друг другу без продольной составляющей в их относительном движении, то не должно быть доплеровского сдвига в свете, достигающем приемника.

Специальная теория относительности предсказывает иное. Рис. 5-3 иллюстрирует два распространенных варианта этого сценария. Оба варианта можно проанализировать с использованием простых аргументов замедления времени. ^[21] На рис. 5-3a приемник наблюдает свет от источника как смещенный в синюю сторону на коэффициент . На рис. 5-3b свет смещен в красную сторону на тот же коэффициент. $\gamma$

Измерение против визуального восприятия

Замедление времени и сокращение длины — это не оптические иллюзии, а реальные эффекты. Измерения этих эффектов не являются артефактом доплеровского сдвига и не являются результатом пренебрежения временем, которое требуется свету для прохождения от события до наблюдателя.

Ученые проводят фундаментальное различие между измерением или наблюдением , с одной стороны, и визуальным видом , или тем, что человек видит . Измеренная форма объекта — это гипотетический снимок всех точек объекта, которые существуют в один момент времени. Но визуальный вид объекта зависит от разной продолжительности времени, которое требуется свету, чтобы пройти от разных точек объекта до глаза.

В течение многих лет различие между ними не было общепризнанным, и обычно считалось, что объект с сокращенной длиной, проходящий мимо наблюдателя, на самом деле будет фактически виден как сокращенный по длине. В 1959 году Джеймс Террелл и Роджер Пенроуз независимо друг от друга указали, что дифференциальные эффекты задержки во времени в сигналах, достигающих наблюдателя от разных частей движущегося объекта, приводят к тому, что визуальный вид быстро движущегося объекта сильно отличается от его измеренной формы. Например, удаляющийся объект будет казаться сокращенным, приближающийся объект будет казаться удлиненным, а проходящий объект будет иметь перекошенный вид, который можно сравнить с вращением. ^{[стр. 19]}^{[стр. 20]}^[62]^[63] Движущаяся сфера сохраняет круговой контур для всех скоростей, для любого расстояния и для всех углов обзора, хотя поверхность сферы и изображения на ней будут казаться искаженными. ^[64]^[65]

На обоих рисунках, рис. 5-4 и рис. 5-5, изображены объекты, движущиеся поперек линии зрения. На рис. 5-4 куб рассматривается с расстояния, в четыре раза превышающего длину его сторон. На высоких скоростях стороны куба, перпендикулярные направлению движения, кажутся гиперболическими по форме. Куб на самом деле не вращается. Скорее, свету с задней стороны куба требуется больше времени, чтобы достичь глаз, по сравнению со светом с передней стороны, за это время куб перемещается вправо. На высоких скоростях сфера на рис. 5-5 приобретает вид сплющенного диска, наклоненного до 45° от линии зрения. Если движения объектов не строго поперечные, а вместо этого включают продольную составляющую, могут быть видны преувеличенные искажения в перспективе. ^[66] Эта иллюзия стала известна как вращение Террелла или эффект Террелла-Пенроуза . ^{[примечание 9]}

Другой пример, когда визуальный вид не соответствует измерению, можно найти в наблюдении кажущегося сверхсветового движения в различных радиогалактиках , объектах BL Lac , квазарах и других астрономических объектах, которые выбрасывают струи материи с релятивистской скоростью под узкими углами по отношению к наблюдателю. Возникает кажущаяся оптическая иллюзия, создающая видимость движения со скоростью, превышающей скорость света. ^[67]^[68]^[69] На рис. 5-6 галактика M87 выбрасывает высокоскоростную струю субатомных частиц почти прямо к нам, но вращение Пенроуза-Террелла заставляет струю казаться движущейся вбок таким же образом, как был вытянут вид куба на рис. 5-4. ^[70]

Динамика

Раздел Следствия, полученные из преобразования Лоренца, посвящен исключительно кинематике , изучению движения точек, тел и систем тел без учета сил, вызвавших движение. В этом разделе обсуждаются массы, силы, энергия и т. д., и, как таковой, требуется рассмотрение физических эффектов, выходящих за рамки тех, которые охватываются самим преобразованием Лоренца.

Эквивалентность массы и энергии

По мере того, как скорость объекта приближается к скорости света с точки зрения наблюдателя, его релятивистская масса увеличивается, тем самым затрудняя его ускорение из системы отсчета наблюдателя.

Содержание энергии в покоящемся объекте с массой m равно mc ² . Сохранение энергии подразумевает, что в любой реакции уменьшение суммы масс частиц должно сопровождаться увеличением кинетической энергии частиц после реакции. Аналогично, масса объекта может быть увеличена за счет поглощения кинетической энергии.

В дополнение к статьям, упомянутым выше, в которых приводятся выводы преобразований Лоренца и описываются основы специальной теории относительности, Эйнштейн также написал по крайней мере четыре статьи, в которых приводятся ^{эвристические} аргументы в пользу эквивалентности (и превращаемости) массы и энергии, поскольку E = mc2 .

Эквивалентность массы и энергии является следствием специальной теории относительности. Энергия и импульс, которые разделены в ньютоновской механике, образуют четырехвектор в теории относительности, и это связывает временную компоненту (энергию) с пространственными компонентами (импульсом) нетривиальным образом. Для покоящегося объекта четырехвектор энергии-импульса равен ( E / c , 0, 0, 0) : он имеет временную компоненту, которая является энергией, и три пространственных компонента, которые равны нулю. При смене систем отсчета с помощью преобразования Лоренца в направлении x с малым значением скорости v четырехвектор энергии-импульса становится равным ( E / c , Ev / c2 , 0, 0) . Импульс равен энергии, умноженной на скорость, деленную на c2 . Таким образом, ^{ньютоновская}^{масса объекта, которая является отношением импульса к скорости для медленных скоростей} , равна E / c2 ^.

Энергия и импульс являются свойствами материи и излучения, и невозможно вывести, что они образуют четырехвектор, только из двух основных постулатов специальной теории относительности, потому что они не говорят о материи или излучении, они говорят только о пространстве и времени. Поэтому вывод требует некоторых дополнительных физических рассуждений. В своей статье 1905 года Эйнштейн использовал дополнительные принципы, которые ньютоновская механика должна соблюдать для медленных скоростей, так что существует один скаляр энергии и один трехвекторный импульс на медленных скоростях, и что закон сохранения энергии и импульса в точности верен в теории относительности. Более того, он предположил, что энергия света преобразуется тем же фактором доплеровского сдвига, что и его частота, что он ранее показал на основе уравнений Максвелла. ^{[стр. 1]} Первой из статей Эйнштейна на эту тему была «Зависит ли инерция тела от его энергетического содержания?» в 1905 году. ^{[стр. 21]} Хотя аргумент Эйнштейна в этой статье почти повсеместно принят физиками как правильный, даже самоочевидный, многие авторы на протяжении многих лет предполагали, что он неверен. ^[71] Другие авторы предполагают, что аргумент был просто неубедительным, поскольку он опирался на некоторые неявные предположения. ^[72]

Эйнштейн признал противоречия по поводу своего вывода в своей обзорной статье 1907 года по специальной теории относительности. Там он отмечает, что проблематично полагаться на уравнения Максвелла для эвристического аргумента массы-энергии. Аргумент в его статье 1905 года может быть реализован с излучением любых безмассовых частиц, но уравнения Максвелла неявно используются, чтобы сделать очевидным, что излучение света в частности может быть достигнуто только путем выполнения работы. Чтобы испустить электромагнитные волны, все, что вам нужно сделать, это встряхнуть заряженную частицу, и это, очевидно, выполнение работы, так что излучение является энергией. ^{[стр. 22]}^{[примечание 10]}

Демонстрация Эйнштейна в 1905 годуЭ=мс2

В четвертой из своих статей Annus mirabilis 1905 года [ стр ^{. 21]} Эйнштейн представил эвристический аргумент в пользу эквивалентности массы и энергии. Хотя, как обсуждалось выше, последующая наука установила, что его аргументы не дотягивают до общеопределенного доказательства, выводы, к которым он пришел в этой статье, выдержали испытание временем.

В качестве исходных предположений Эйнштейн взял недавно открытую им формулу для релятивистского доплеровского сдвига , законы сохранения энергии и сохранения импульса , а также соотношение между частотой света и его энергией, вытекающее из уравнений Максвелла .

Рис. 6-1 (вверху). Рассмотрим систему плоских волн света с частотой , распространяющейся в направлении относительно оси x системы отсчета S. Частота (и, следовательно, энергия) волн, измеренная в системе S ′ , движущейся вдоль оси x со скоростью, определяется релятивистской формулой доплеровского сдвига, которую Эйнштейн вывел в своей статье 1905 года по специальной теории относительности: ^{[стр. 1]} $f$ $\phi$ $v$

{\frac {f'}{f}}={\frac {1-(v/c)\cos {\phi }}{\sqrt {1-v^{2}/c^{2}}}}

Рис. 6-1 (внизу). Рассмотрим произвольное тело, неподвижное в системе отсчета S. Пусть это тело испускает пару световых импульсов равной энергии в противоположных направлениях под углом к оси x. Каждый импульс имеет энергию . Из-за сохранения импульса тело остается неподвижным в S после испускания двух импульсов. Пусть будет энергией тела до испускания двух импульсов и после их испускания. $\phi$ $L/2$ $E_{0}$ $E_{1}$

Далее рассмотрим ту же систему, наблюдаемую из системы S ′ , которая движется вдоль оси x со скоростью относительно системы S . В этой системе свет от прямого и обратного импульсов будет релятивистски смещен Доплером. Пусть будет энергией тела, измеренной в системе отсчета S ′ до испускания двух импульсов и после их испускания. Получаем следующие соотношения: ^{[стр. 21]} $v$ $H_{0}$ $H_{1}$

{\begin{aligned}E_{0}&=E_{1}+{\tfrac {1}{2}}L+{\tfrac {1}{2}}L=E_{1}+L\\[5mu]H_{0}&=H_{1}+{\tfrac {1}{2}}L{\frac {1-(v/c)\cos {\phi }}{\sqrt {1-v^{2}/c^{2}}}}+{\tfrac {1}{2}}L{\frac {1+(v/c)\cos {\phi }}{\sqrt {1-v^{2}/c^{2}}}}=H_{1}+{\frac {L}{\sqrt {1-v^{2}/c^{2}}}}\end{aligned}}

Из приведенных выше уравнений получаем следующее:

Два различия формы, которые можно увидеть в приведенном выше уравнении, имеют простую физическую интерпретацию. Поскольку и являются энергиями произвольного тела в движущейся и неподвижной системах отсчета, а представляет собой кинетическую энергию тел до и после испускания света (за исключением аддитивной константы, которая фиксирует нулевую точку энергии и традиционно принимается равной нулю). Следовательно, $H-E$ $H$ $E$ $H_{0}-E_{0}$ $H_{1}-E_{1}$

Используя разложение в ряд Тейлора и пренебрегая членами более высокого порядка, он получил

Сравнивая приведенное выше выражение с классическим выражением для кинетической энергии, KE = ⁠1/2⁠ mv ² , Эйнштейн затем заметил: «Если тело выделяет энергию L в виде излучения, его масса уменьшается на L / c ² ».

Риндлер заметил, что эвристический аргумент Эйнштейна предполагал лишь то, что энергия вносит вклад в массу. В 1905 году осторожное выражение Эйнштейном соотношения массы и энергии допускало возможность существования «спящей» массы, которая останется после того, как вся энергия тела будет удалена. Однако к 1907 году Эйнштейн был готов утверждать, что вся инертная масса представляет собой запас энергии. «Чтобы приравнять всю массу к энергии, требовался акт эстетической веры, очень характерный для Эйнштейна». ^[12]^{: 81–84} Смелая гипотеза Эйнштейна была полностью подтверждена в годы, последовавшие за его первоначальным предложением.

По разным причинам оригинальный вывод Эйнштейна в настоящее время редко преподается. Помимо бурных дебатов, которые продолжаются и по сей день относительно формальной правильности его оригинального вывода, признание специальной теории относительности тем, что Эйнштейн называл «принципиальной теорией», привело к переходу от опоры на электромагнитные явления к чисто динамическим методам доказательства. ^[73]

Как далеко от Земли можно улететь?

Поскольку ничто не может двигаться быстрее света, можно сделать вывод, что человек никогда не сможет путешествовать дальше от Земли, чем на ~100 световых лет. Вы могли бы легко подумать, что путешественник никогда не сможет достичь более нескольких солнечных систем, которые существуют в пределах 100 световых лет от Земли. Однако из-за замедления времени гипотетический космический корабль может пролететь тысячи световых лет за время жизни пассажира. Если бы можно было построить космический корабль, который ускоряется с постоянным ускорением 1 g , через год он будет двигаться почти со скоростью света, наблюдаемой с Земли. Это описывается следующим образом: где v ( t ) — скорость в момент времени t , a — ускорение космического корабля, а t — координатное время, измеренное людьми на Земле. ^{[стр. 23]} Таким образом, после одного года ускорения со скоростью 9,81 м/с ² космический корабль будет двигаться со скоростью v = 0,712 c и 0,946 c через три года относительно Земли. После трех лет этого ускорения, когда космический корабль достигнет скорости 94,6% от скорости света относительно Земли, замедление времени приведет к тому, что каждая секунда, испытываемая на космическом корабле, будет соответствовать 3,1 секунды назад на Земле. Во время своего путешествия люди на Земле будут ощущать больше времени, чем они испытывают, поскольку их часы (все физические явления) будут действительно тикать в 3,1 раза быстрее, чем часы космического корабля. 5-летнее путешествие туда и обратно для путешественника займет 6,5 земных лет и покроет расстояние более 6 световых лет. 20-летнее путешествие туда и обратно для них (5 лет ускорения, 5 замедления, дважды каждое) вернет их на Землю, проделав путь в 335 земных лет и пройдя расстояние в 331 световой год. ^[74] Полное 40-летнее путешествие при 1 g покажется на Земле продолжительностью 58 000 лет и покроет расстояние в 55 000 световых лет. 40-летнее путешествие при 1,1 g займет 148 000 земных лет и охватит около 140 000 световых лет. Одностороннее 28-летнее (14 лет ускорения, 14 лет замедления, как измеряется по часам астронавта) путешествие при ускорении 1 g может достичь 2 000 000 световых лет до галактики Андромеды. ^[74] Это же самое замедление времени является причиной того, что мюон, движущийся близко к c , как наблюдается, движется намного дальше, чем c, умноженное на его период полураспада (в состоянии покоя). ^[75] $v(t)={\frac {at}{\sqrt {1+a^{2}t^{2}/c^{2}}}}$

Упругие столкновения

Изучение продуктов столкновений, генерируемых ускорителями частиц по всему миру, дает ученым доказательства структуры субатомного мира и естественных законов, управляющих им. Анализ продуктов столкновений, сумма масс которых может значительно превышать массы падающих частиц, требует специальной теории относительности. ^[76]

В ньютоновской механике анализ столкновений включает использование законов сохранения массы , импульса и энергии . В релятивистской механике масса не сохраняется независимо, поскольку она включена в общую релятивистскую энергию. Мы иллюстрируем различия, возникающие между ньютоновской и релятивистской трактовками столкновений частиц, рассматривая простой случай двух абсолютно упругих сталкивающихся частиц одинаковой массы. ( Неупругие столкновения обсуждаются в разделе Пространство-время#Законы сохранения . Радиоактивный распад можно рассматривать как своего рода неупругое столкновение, обращенное во времени. ^[76] )

Упругое рассеяние заряженных элементарных частиц отклоняется от идеальности из-за возникновения тормозного излучения. ^[77]^[78]

Ньютоновский анализ

Рис. 6-2 демонстрирует результат, знакомый игрокам в бильярд, что если неподвижный шар упруго ударяется другим шаром той же массы (предполагая отсутствие бокового вращения, или «английского»), то после столкновения расходящиеся траектории двух шаров будут стягивать прямой угол. (a) В неподвижной системе отсчета падающая сфера, движущаяся со скоростью 2 v, ударяется о неподвижную сферу. (b) В системе отсчета центра импульса две сферы сближаются симметрично со скоростью ± v . После упругого столкновения две сферы отскакивают друг от друга с равными и противоположными скоростями ± u . Закон сохранения энергии требует, чтобы | u | = | v |. (c) Возвращаясь к неподвижной системе отсчета, скорости отскока равны v ± u . Скалярное произведение ( v + u ) ⋅ ( v − u ) = v ² − u ² = 0 , что указывает на то, что векторы ортогональны. ^[12]^{: 26–27}

Релятивистский анализ

Рассмотрим сценарий упругого столкновения на рис. 6-3 между движущейся частицей, сталкивающейся с неподвижной частицей равной массы. В отличие от ньютоновского случая, угол между двумя частицами после столкновения меньше 90°, зависит от угла рассеяния и становится все меньше и меньше по мере того, как скорость падающей частицы приближается к скорости света:

Релятивистский импульс и полная релятивистская энергия частицы определяются как

Закон сохранения импульса гласит, что сумма импульсов входящей частицы и неподвижной частицы (которая изначально имеет импульс = 0) равна сумме импульсов вылетевших частиц:

Аналогично, сумма полных релятивистских энергий входящей частицы и неподвижной частицы (которая изначально имеет полную энергию mc2 ⁾ равна сумме полных энергий вылетевших частиц:

Разложение ( 6-5 ) на составляющие, замена на безразмерные и вынесение за скобки общих членов из ( 6-5 ) и ( 6-6 ) дает следующее: ^{[стр. 24]} $v$ $\beta$

Из них мы получаем следующие соотношения: ^{[стр. 24]}

Для симметричного случая, в котором и ( 6-12 ) принимает более простую форму: ^{[стр. 24]} $\phi =\theta$ $\beta _{2}=\beta _{3},$

Помимо основ

Быстрота

Рисунок 7–2. График трех основных гиперболических функций : гиперболического синуса ( sinh ), гиперболического косинуса ( cosh ) и гиперболического тангенса ( tanh ). Sinh — красный, cosh — синий, а tanh — зеленый.

Преобразования Лоренца связывают координаты событий в одной системе отсчета с координатами событий в другой системе отсчета. Релятивистское сложение скоростей используется для сложения двух скоростей. Формулы для выполнения последних вычислений нелинейны, что делает их более сложными, чем соответствующие формулы Галилея.

Эта нелинейность является артефактом нашего выбора параметров. ^[11]^{: 47–59} Ранее мы отмечали, что в пространственно-временной диаграмме x–ct точки на некотором постоянном пространственно-временном интервале от начала координат образуют инвариантную гиперболу. Мы также отмечали, что системы координат двух пространственно-временных систем отсчета в стандартной конфигурации гиперболически повернуты относительно друг друга.

The natural functions for expressing these relationships are the hyperbolic analogs of the trigonometric functions. Fig. 7-1a shows a unit circle with sin(a) and cos(a), the only difference between this diagram and the familiar unit circle of elementary trigonometry being that a is interpreted, not as the angle between the ray and the x-axis, but as twice the area of the sector swept out by the ray from the x-axis. Numerically, the angle and 2 × area measures for the unit circle are identical. Fig. 7-1b shows a unit hyperbola with sinh(a) and cosh(a), where a is likewise interpreted as twice the tinted area.^[79] Fig. 7-2 presents plots of the sinh, cosh, and tanh functions.

For the unit circle, the slope of the ray is given by

{\text{slope}}=\tan a={\frac {\sin a}{\cos a}}.

In the Cartesian plane, rotation of point (x, y) into point (x', y') by angle θ is given by

{\begin{pmatrix}x'\\y'\\\end{pmatrix}}={\begin{pmatrix}\cos \theta &-\sin \theta \\\sin \theta &\cos \theta \\\end{pmatrix}}{\begin{pmatrix}x\\y\\\end{pmatrix}}.

In a spacetime diagram, the velocity parameter $\beta$ is the analog of slope. The rapidity, φ, is defined by^[21]^: 96–99

\beta \equiv \tanh \phi \equiv {\frac {v}{c}},

where

\tanh \phi ={\frac {\sinh \phi }{\cosh \phi }}={\frac {e^{\phi }-e^{-\phi }}{e^{\phi }+e^{-\phi }}}.

The rapidity defined above is very useful in special relativity because many expressions take on a considerably simpler form when expressed in terms of it. For example, rapidity is simply additive in the collinear velocity-addition formula;^[11]^: 47–59

\beta ={\frac {\beta _{1}+\beta _{2}}{1+\beta _{1}\beta _{2}}}=

{\frac {\tanh \phi _{1}+\tanh \phi _{2}}{1+\tanh \phi _{1}\tanh \phi _{2}}}=

\tanh(\phi _{1}+\phi _{2}),

or in other words, $\phi =\phi _{1}+\phi _{2}.$

The Lorentz transformations take a simple form when expressed in terms of rapidity. The γ factor can be written as

\gamma ={\frac {1}{\sqrt {1-\beta ^{2}}}}={\frac {1}{\sqrt {1-\tanh ^{2}\phi }}}

=\cosh \phi ,

\gamma \beta ={\frac {\beta }{\sqrt {1-\beta ^{2}}}}={\frac {\tanh \phi }{\sqrt {1-\tanh ^{2}\phi }}}

=\sinh \phi .

Transformations describing relative motion with uniform velocity and without rotation of the space coordinate axes are called boosts.

Substituting γ and γβ into the transformations as previously presented and rewriting in matrix form, the Lorentz boost in the x-direction may be written as

{\begin{pmatrix}ct'\\x'\end{pmatrix}}={\begin{pmatrix}\cosh \phi &-\sinh \phi \\-\sinh \phi &\cosh \phi \end{pmatrix}}{\begin{pmatrix}ct\\x\end{pmatrix}},

and the inverse Lorentz boost in the x-direction may be written as

{\begin{pmatrix}ct\\x\end{pmatrix}}={\begin{pmatrix}\cosh \phi &\sinh \phi \\\sinh \phi &\cosh \phi \end{pmatrix}}{\begin{pmatrix}ct'\\x'\end{pmatrix}}.

In other words, Lorentz boosts represent hyperbolic rotations in Minkowski spacetime.^[21]^: 96–99

The advantages of using hyperbolic functions are such that some textbooks such as the classic ones by Taylor and Wheeler introduce their use at a very early stage.^[11]^{[note 11]}

4‑vectors

Four‑vectors have been mentioned above in context of the energy–momentum 4‑vector, but without any great emphasis. Indeed, none of the elementary derivations of special relativity require them. But once understood, 4‑vectors, and more generally tensors, greatly simplify the mathematics and conceptual understanding of special relativity. Working exclusively with such objects leads to formulas that are manifestly relativistically invariant, which is a considerable advantage in non-trivial contexts. For instance, demonstrating relativistic invariance of Maxwell's equations in their usual form is not trivial, while it is merely a routine calculation, really no more than an observation, using the field strength tensor formulation.^[80]

On the other hand, general relativity, from the outset, relies heavily on 4‑vectors, and more generally tensors, representing physically relevant entities. Relating these via equations that do not rely on specific coordinates requires tensors, capable of connecting such 4‑vectors even within a curved spacetime, and not just within a flat one as in special relativity. The study of tensors is outside the scope of this article, which provides only a basic discussion of spacetime.

Definition of 4-vectors

A 4-tuple, ⁠ $A=\left(A_{0},A_{1},A_{2},A_{3}\right)$ ⁠ is a "4-vector" if its component A_i transform between frames according to the Lorentz transformation.

If using ⁠ $(ct,x,y,z)$ ⁠ coordinates, A is a 4–vector if it transforms (in the x-direction) according to

{\begin{aligned}A_{0}'&=\gamma \left(A_{0}-(v/c)A_{1}\right)\\A_{1}'&=\gamma \left(A_{1}-(v/c)A_{0}\right)\\A_{2}'&=A_{2}\\A_{3}'&=A_{3}\end{aligned}}

which comes from simply replacing ct with A₀ and x with A₁ in the earlier presentation of the Lorentz transformation.

As usual, when we write x, t, etc. we generally mean Δx, Δt etc.

The last three components of a 4–vector must be a standard vector in three-dimensional space. Therefore, a 4–vector must transform like ⁠ $(c\Delta t,\Delta x,\Delta y,\Delta z)$ ⁠ under Lorentz transformations as well as rotations.^[81]^: 36–59

Properties of 4-vectors

Closure under linear combination: If A and B are 4-vectors, then ⁠ $C=aA+aB$ ⁠ is also a 4-vector.
Inner-product invariance: If A and B are 4-vectors, then their inner product (scalar product) is invariant, i.e. their inner product is independent of the frame in which it is calculated. Note how the calculation of inner product differs from the calculation of the inner product of a 3-vector. In the following, ${\vec {A}}$ and ${\vec {B}}$ are 3-vectors:
$A\cdot B\equiv$ $A_{0}B_{0}-A_{1}B_{1}-A_{2}B_{2}-A_{3}B_{3}\equiv$ $A_{0}B_{0}-{\vec {A}}\cdot {\vec {B}}$

In addition to being invariant under Lorentz transformation, the above inner product is also invariant under rotation in 3-space.

Two vectors are said to be orthogonal if

A\cdot B=0.

Unlike the case with 3-vectors, orthogonal 4-vectors are not necessarily at right angles with each other. The rule is that two 4-vectors are orthogonal if they are offset by equal and opposite angles from the 45° line which is the world line of a light ray. This implies that a lightlike 4-vector is orthogonal with itself.

Invariance of the magnitude of a vector: The magnitude of a vector is the inner product of a 4-vector with itself, and is a frame-independent property. As with intervals, the magnitude may be positive, negative or zero, so that the vectors are referred to as timelike, spacelike or null (lightlike). Note that a null vector is not the same as a zero vector. A null vector is one for which $A\cdot A=0,$ while a zero vector is one whose components are all zero. Special cases illustrating the invariance of the norm include the invariant interval $c^{2}t^{2}-x^{2}$ and the invariant length of the relativistic momentum vector $E^{2}-p^{2}c^{2}.$ ^[21]^{: 178–181}^[81]^: 36–59

Examples of 4-vectors

Displacement 4-vector: Otherwise known as the spacetime separation, this is (Δt, Δx, Δy, Δz), or for infinitesimal separations, (dt, dx, dy, dz).
$dS\equiv (dt,dx,dy,dz)$
Velocity 4-vector: This results when the displacement 4-vector is divided by $d\tau$ , where $d\tau$ is the proper time between the two events that yield dt, dx, dy, and dz.
$V\equiv {\frac {dS}{d\tau }}={\frac {(dt,dx,dy,dz)}{dt/\gamma }}=$ $\gamma \left(1,{\frac {dx}{dt}},{\frac {dy}{dt}},{\frac {dz}{dt}}\right)=$ $(\gamma ,\gamma {\vec {v}})$

The 4-velocity is tangent to the world line of a particle, and has a length equal to one unit of time in the frame of the particle.

An accelerated particle does not have an inertial frame in which it is always at rest. However, an inertial frame can always be found which is momentarily comoving with the particle. This frame, the momentarily comoving reference frame (MCRF), enables application of special relativity to the analysis of accelerated particles.

Since photons move on null lines,

d\tau =0

for a photon, and a 4-velocity cannot be defined. There is no frame in which a photon is at rest, and no MCRF can be established along a photon's path.

Energy–momentum 4-vector:
$P\equiv (E/c,{\vec {p}})=(E/c,p_{x},p_{y},p_{z})$

As indicated before, there are varying treatments for the energy-momentum 4-vector so that one may also see it expressed as

(E,{\vec {p}})

(E,{\vec {p}}c).

The first component is the total energy (including mass) of the particle (or system of particles) in a given frame, while the remaining components are its spatial momentum. The energy-momentum 4-vector is a conserved quantity.

Acceleration 4-vector: This results from taking the derivative of the velocity 4-vector with respect to $\tau .$
$A\equiv {\frac {dV}{d\tau }}=$ ${\frac {d}{d\tau }}(\gamma ,\gamma {\vec {v}})=$ $\gamma \left({\frac {d\gamma }{dt}},{\frac {d(\gamma {\vec {v}})}{dt}}\right)$
Force 4-vector: This is the derivative of the momentum 4-vector with respect to $\tau .$
$F\equiv {\frac {dP}{d\tau }}=$ $\gamma \left({\frac {dE}{dt}},{\frac {d{\vec {p}}}{dt}}\right)=$ $\gamma \left({\frac {dE}{dt}},{\vec {f}}\right)$

As expected, the final components of the above 4-vectors are all standard 3-vectors corresponding to spatial 3-momentum, 3-force etc.^[21]^{: 178–181}^[81]^: 36–59

4-vectors and physical law

The first postulate of special relativity declares the equivalency of all inertial frames. A physical law holding in one frame must apply in all frames, since otherwise it would be possible to differentiate between frames. Newtonian momenta fail to behave properly under Lorentzian transformation, and Einstein preferred to change the definition of momentum to one involving 4-vectors rather than give up on conservation of momentum.

Physical laws must be based on constructs that are frame independent. This means that physical laws may take the form of equations connecting scalars, which are always frame independent. However, equations involving 4-vectors require the use of tensors with appropriate rank, which themselves can be thought of as being built up from 4-vectors.^[21]^: 186

Acceleration

It is a common misconception that special relativity is applicable only to inertial frames, and that it is unable to handle accelerating objects or accelerating reference frames. Actually, accelerating objects can generally be analyzed without needing to deal with accelerating frames at all. It is only when gravitation is significant that general relativity is required.^[82]

Properly handling accelerating frames does require some care, however. The difference between special and general relativity is that (1) In special relativity, all velocities are relative, but acceleration is absolute. (2) In general relativity, all motion is relative, whether inertial, accelerating, or rotating. To accommodate this difference, general relativity uses curved spacetime.^[82]

In this section, we analyze several scenarios involving accelerated reference frames.

Dewan–Beran–Bell spaceship paradox

The Dewan–Beran–Bell spaceship paradox (Bell's spaceship paradox) is a good example of a problem where intuitive reasoning unassisted by the geometric insight of the spacetime approach can lead to issues.

In Fig. 7-4, two identical spaceships float in space and are at rest relative to each other. They are connected by a string which is capable of only a limited amount of stretching before breaking. At a given instant in our frame, the observer frame, both spaceships accelerate in the same direction along the line between them with the same constant proper acceleration.^{[note 12]} Will the string break?

When the paradox was new and relatively unknown, even professional physicists had difficulty working out the solution. Two lines of reasoning lead to opposite conclusions. Both arguments, which are presented below, are flawed even though one of them yields the correct answer.^[21]^{: 106, 120–122}

To observers in the rest frame, the spaceships start a distance L apart and remain the same distance apart during acceleration. During acceleration, L is a length contracted distance of the distance L' = γL in the frame of the accelerating spaceships. After a sufficiently long time, γ will increase to a sufficiently large factor that the string must break.
Let A and B be the rear and front spaceships. In the frame of the spaceships, each spaceship sees the other spaceship doing the same thing that it is doing. A says that B has the same acceleration that he has, and B sees that A matches her every move. So the spaceships stay the same distance apart, and the string does not break.^[21]^{: 106, 120–122}

The problem with the first argument is that there is no "frame of the spaceships." There cannot be, because the two spaceships measure a growing distance between the two. Because there is no common frame of the spaceships, the length of the string is ill-defined. Nevertheless, the conclusion is correct, and the argument is mostly right. The second argument, however, completely ignores the relativity of simultaneity.^[21]^{: 106, 120–122}

A spacetime diagram (Fig. 7-5) makes the correct solution to this paradox almost immediately evident. Two observers in Minkowski spacetime accelerate with constant magnitude $k$ acceleration for proper time $\sigma$ (acceleration and elapsed time measured by the observers themselves, not some inertial observer). They are comoving and inertial before and after this phase. In Minkowski geometry, the length along the line of simultaneity $A'B''$ turns out to be greater than the length along the line of simultaneity $AB$ .

The length increase can be calculated with the help of the Lorentz transformation. If, as illustrated in Fig. 7-5, the acceleration is finished, the ships will remain at a constant offset in some frame $S'.$ If $x_{A}$ and $x_{B}=x_{A}+L$ are the ships' positions in $S,$ the positions in frame $S'$ are:^[83]

{\begin{aligned}x'_{A}&=\gamma \left(x_{A}-vt\right)\\x'_{B}&=\gamma \left(x_{A}+L-vt\right)\\L'&=x'_{B}-x'_{A}=\gamma L\end{aligned}}

The "paradox", as it were, comes from the way that Bell constructed his example. In the usual discussion of Lorentz contraction, the rest length is fixed and the moving length shortens as measured in frame $S$ . As shown in Fig. 7-5, Bell's example asserts the moving lengths $AB$ and $A'B'$ measured in frame $S$ to be fixed, thereby forcing the rest frame length $A'B''$ in frame $S'$ to increase.

Accelerated observer with horizon

Certain special relativity problem setups can lead to insight about phenomena normally associated with general relativity, such as event horizons. In the text accompanying Section "Invariant hyperbola" of the article Spacetime, the magenta hyperbolae represented actual paths that are tracked by a constantly accelerating traveler in spacetime. During periods of positive acceleration, the traveler's velocity just approaches the speed of light, while, measured in our frame, the traveler's acceleration constantly decreases.

Fig. 7-6 details various features of the traveler's motions with more specificity. At any given moment, her space axis is formed by a line passing through the origin and her current position on the hyperbola, while her time axis is the tangent to the hyperbola at her position. The velocity parameter $\beta$ approaches a limit of one as $ct$ increases. Likewise, $\gamma$ approaches infinity.

The shape of the invariant hyperbola corresponds to a path of constant proper acceleration. This is demonstrable as follows:

We remember that $\beta =ct/x.$
Since $c^{2}t^{2}-x^{2}=s^{2},$ we conclude that $\beta (ct)=ct/{\sqrt {c^{2}t^{2}-s^{2}}}.$
$\gamma =1/{\sqrt {1-\beta ^{2}}}=$ ${\sqrt {c^{2}t^{2}-s^{2}}}/s$
From the relativistic force law, $F=dp/dt=$ $dpc/d(ct)=d(\beta \gamma mc^{2})/d(ct).$
Substituting $\beta (ct)$ from step 2 and the expression for $\gamma$ from step 3 yields $F=mc^{2}/s,$ which is a constant expression.^[84]^{: 110–113}

Fig. 7-6 illustrates a specific calculated scenario. Terence (A) and Stella (B) initially stand together 100 light hours from the origin. Stella lifts off at time 0, her spacecraft accelerating at 0.01 c per hour. Every twenty hours, Terence radios updates to Stella about the situation at home (solid green lines). Stella receives these regular transmissions, but the increasing distance (offset in part by time dilation) causes her to receive Terence's communications later and later as measured on her clock, and she never receives any communications from Terence after 100 hours on his clock (dashed green lines).^[84]^{: 110–113}

After 100 hours according to Terence's clock, Stella enters a dark region. She has traveled outside Terence's timelike future. On the other hand, Terence can continue to receive Stella's messages to him indefinitely. He just has to wait long enough. Spacetime has been divided into distinct regions separated by an apparent event horizon. So long as Stella continues to accelerate, she can never know what takes place behind this horizon.^[84]^{: 110–113}

Relativity and unifying electromagnetism

Theoretical investigation in classical electromagnetism led to the discovery of wave propagation. Equations generalizing the electromagnetic effects found that finite propagation speed of the E and B fields required certain behaviors on charged particles. The general study of moving charges forms the Liénard–Wiechert potential, which is a step towards special relativity.

The Lorentz transformation of the electric field of a moving charge into a non-moving observer's reference frame results in the appearance of a mathematical term commonly called the magnetic field. Conversely, the magnetic field generated by a moving charge disappears and becomes a purely electrostatic field in a comoving frame of reference. Maxwell's equations are thus simply an empirical fit to special relativistic effects in a classical model of the Universe. As electric and magnetic fields are reference frame dependent and thus intertwined, one speaks of electromagnetic fields. Special relativity provides the transformation rules for how an electromagnetic field in one inertial frame appears in another inertial frame.

Maxwell's equations in the 3D form are already consistent with the physical content of special relativity, although they are easier to manipulate in a manifestly covariant form, that is, in the language of tensor calculus.^[80]

Theories of relativity and quantum mechanics

Special relativity can be combined with quantum mechanics to form relativistic quantum mechanics and quantum electrodynamics. How general relativity and quantum mechanics can be unified is one of the unsolved problems in physics; quantum gravity and a "theory of everything", which require a unification including general relativity too, are active and ongoing areas in theoretical research.

The early Bohr–Sommerfeld atomic model explained the fine structure of alkali metal atoms using both special relativity and the preliminary knowledge on quantum mechanics of the time.^[85]

In 1928, Paul Dirac constructed an influential relativistic wave equation, now known as the Dirac equation in his honour,^{[p 25]} that is fully compatible both with special relativity and with the final version of quantum theory existing after 1926. This equation not only described the intrinsic angular momentum of the electrons called spin, it also led to the prediction of the antiparticle of the electron (the positron),^{[p 25]}^{[p 26]} and fine structure could only be fully explained with special relativity. It was the first foundation of relativistic quantum mechanics.

On the other hand, the existence of antiparticles leads to the conclusion that relativistic quantum mechanics is not enough for a more accurate and complete theory of particle interactions. Instead, a theory of particles interpreted as quantized fields, called quantum field theory, becomes necessary; in which particles can be created and destroyed throughout space and time.

Status

Special relativity in its Minkowski spacetime is accurate only when the absolute value of the gravitational potential is much less than c² in the region of interest.^[86] In a strong gravitational field, one must use general relativity. General relativity becomes special relativity at the limit of a weak field. At very small scales, such as at the Planck length and below, quantum effects must be taken into consideration resulting in quantum gravity. But at macroscopic scales and in the absence of strong gravitational fields, special relativity is experimentally tested to extremely high degree of accuracy (10⁻²⁰)^[87]and thus accepted by the physics community. Experimental results which appear to contradict it are not reproducible and are thus widely believed to be due to experimental errors.^[88]

Special relativity is mathematically self-consistent, and it is an organic part of all modern physical theories, most notably quantum field theory, string theory, and general relativity (in the limiting case of negligible gravitational fields).

Newtonian mechanics mathematically follows from special relativity at small velocities (compared to the speed of light) – thus Newtonian mechanics can be considered as a special relativity of slow moving bodies. See classical mechanics for a more detailed discussion.

Several experiments predating Einstein's 1905 paper are now interpreted as evidence for relativity. Of these it is known Einstein was aware of the Fizeau experiment before 1905,^[89] and historians have concluded that Einstein was at least aware of the Michelson–Morley experiment as early as 1899 despite claims he made in his later years that it played no role in his development of the theory.^[16]

The Fizeau experiment (1851, repeated by Michelson and Morley in 1886) measured the speed of light in moving media, with results that are consistent with relativistic addition of colinear velocities.
The famous Michelson–Morley experiment (1881, 1887) gave further support to the postulate that detecting an absolute reference velocity was not achievable. It should be stated here that, contrary to many alternative claims, it said little about the invariance of the speed of light with respect to the source and observer's velocity, as both source and observer were travelling together at the same velocity at all times.
The Trouton–Noble experiment (1903) showed that the torque on a capacitor is independent of position and inertial reference frame.
The Experiments of Rayleigh and Brace (1902, 1904) showed that length contraction does not lead to birefringence for a co-moving observer, in accordance with the relativity principle.

Particle accelerators accelerate and measure the properties of particles moving at near the speed of light, where their behavior is consistent with relativity theory and inconsistent with the earlier Newtonian mechanics. These machines would simply not work if they were not engineered according to relativistic principles. In addition, a considerable number of modern experiments have been conducted to test special relativity. Some examples:

Tests of relativistic energy and momentum – testing the limiting speed of particles
Ives–Stilwell experiment – testing relativistic Doppler effect and time dilation
Experimental testing of time dilation – relativistic effects on a fast-moving particle's half-life
Kennedy–Thorndike experiment – time dilation in accordance with Lorentz transformations
Hughes–Drever experiment – testing isotropy of space and mass
Modern searches for Lorentz violation – various modern tests
Experiments to test emission theory demonstrated that the speed of light is independent of the speed of the emitter.
Experiments to test the aether drag hypothesis – no "aether flow obstruction".

Technical discussion of spacetime

Geometry of spacetime

Comparison between flat Euclidean space and Minkowski space

Special relativity uses a "flat" 4-dimensional Minkowski space – an example of a spacetime. Minkowski spacetime appears to be very similar to the standard 3-dimensional Euclidean space, but there is a crucial difference with respect to time.

In 3D space, the differential of distance (line element) ds is defined by $ds^{2}=d\mathbf {x} \cdot d\mathbf {x} =dx_{1}^{2}+dx_{2}^{2}+dx_{3}^{2},$ where dx = (dx₁, dx₂, dx₃) are the differentials of the three spatial dimensions. In Minkowski geometry, there is an extra dimension with coordinate X⁰ derived from time, such that the distance differential fulfills $ds^{2}=-dX_{0}^{2}+dX_{1}^{2}+dX_{2}^{2}+dX_{3}^{2},$ where dX = (dX₀, dX₁, dX₂, dX₃) are the differentials of the four spacetime dimensions. This suggests a deep theoretical insight: special relativity is simply a rotational symmetry of our spacetime, analogous to the rotational symmetry of Euclidean space (see Fig. 10-1).^[91] Just as Euclidean space uses a Euclidean metric, so spacetime uses a Minkowski metric. Basically, special relativity can be stated as the invariance of any spacetime interval (that is the 4D distance between any two events) when viewed from any inertial reference frame. All equations and effects of special relativity can be derived from this rotational symmetry (the Poincaré group) of Minkowski spacetime.

The actual form of ds above depends on the metric and on the choices for the X⁰ coordinate. To make the time coordinate look like the space coordinates, it can be treated as imaginary: X₀ = ict (this is called a Wick rotation). According to Misner, Thorne and Wheeler (1971, §2.3), ultimately the deeper understanding of both special and general relativity will come from the study of the Minkowski metric (described below) and to take X⁰ = ct, rather than a "disguised" Euclidean metric using ict as the time coordinate.

Some authors use X⁰ = t, with factors of c elsewhere to compensate; for instance, spatial coordinates are divided by c or factors of c^±2 are included in the metric tensor.^[92]These numerous conventions can be superseded by using natural units where c = 1. Then space and time have equivalent units, and no factors of c appear anywhere.

3D spacetime

If we reduce the spatial dimensions to 2, so that we can represent the physics in a 3D space $ds^{2}=dx_{1}^{2}+dx_{2}^{2}-c^{2}dt^{2},$ we see that the null geodesics lie along a dual-cone (see Fig. 10-2) defined by the equation; $ds^{2}=0=dx_{1}^{2}+dx_{2}^{2}-c^{2}dt^{2}$ or simply $dx_{1}^{2}+dx_{2}^{2}=c^{2}dt^{2},$ which is the equation of a circle of radius c dt.

4D spacetime

If we extend this to three spatial dimensions, the null geodesics are the 4-dimensional cone: $ds^{2}=0=dx_{1}^{2}+dx_{2}^{2}+dx_{3}^{2}-c^{2}dt^{2}$ so $dx_{1}^{2}+dx_{2}^{2}+dx_{3}^{2}=c^{2}dt^{2}.$

As illustrated in Fig. 10-3, the null geodesics can be visualized as a set of continuous concentric spheres with radii = c dt.

This null dual-cone represents the "line of sight" of a point in space. That is, when we look at the stars and say "The light from that star which I am receiving is X years old", we are looking down this line of sight: a null geodesic. We are looking at an event a distance ${\textstyle d={\sqrt {x_{1}^{2}+x_{2}^{2}+x_{3}^{2}}}}$ away and a time d/c in the past. For this reason the null dual cone is also known as the "light cone". (The point in the lower left of the Fig. 10-2 represents the star, the origin represents the observer, and the line represents the null geodesic "line of sight".)

The cone in the −t region is the information that the point is "receiving", while the cone in the +t section is the information that the point is "sending".

The geometry of Minkowski space can be depicted using Minkowski diagrams, which are useful also in understanding many of the thought experiments in special relativity.

Physics in spacetime

Transformations of physical quantities between reference frames

Above, the Lorentz transformation for the time coordinate and three space coordinates illustrates that they are intertwined. This is true more generally: certain pairs of "timelike" and "spacelike" quantities naturally combine on equal footing under the same Lorentz transformation.

The Lorentz transformation in standard configuration above, that is, for a boost in the x-direction, can be recast into matrix form as follows:

${\begin{pmatrix}ct'\\x'\\y'\\z'\end{pmatrix}}={\begin{pmatrix}\gamma &-\beta \gamma &0&0\\-\beta \gamma &\gamma &0&0\\0&0&1&0\\0&0&0&1\end{pmatrix}}{\begin{pmatrix}ct\\x\\y\\z\end{pmatrix}}={\begin{pmatrix}\gamma ct-\gamma \beta x\\\gamma x-\beta \gamma ct\\y\\z\end{pmatrix}}.$

In Newtonian mechanics, quantities that have magnitude and direction are mathematically described as 3d vectors in Euclidean space, and in general they are parametrized by time. In special relativity, this notion is extended by adding the appropriate timelike quantity to a spacelike vector quantity, and we have 4d vectors, or "four-vectors", in Minkowski spacetime. The components of vectors are written using tensor index notation, as this has numerous advantages. The notation makes it clear the equations are manifestly covariant under the Poincaré group, thus bypassing the tedious calculations to check this fact. In constructing such equations, we often find that equations previously thought to be unrelated are, in fact, closely connected being part of the same tensor equation. Recognizing other physical quantities as tensors simplifies their transformation laws. Throughout, upper indices (superscripts) are contravariant indices rather than exponents except when they indicate a square (this should be clear from the context), and lower indices (subscripts) are covariant indices. For simplicity and consistency with the earlier equations, Cartesian coordinates will be used.

The simplest example of a four-vector is the position of an event in spacetime, which constitutes a timelike component ct and spacelike component x = (x, y, z), in a contravariant position four-vector with components: $X^{\nu }=(X^{0},X^{1},X^{2},X^{3})=(ct,x,y,z)=(ct,\mathbf {x} ).$ where we define X⁰ = ct so that the time coordinate has the same dimension of distance as the other spatial dimensions; so that space and time are treated equally.^[93]^[94]^[95] Now the transformation of the contravariant components of the position 4-vector can be compactly written as: $X^{\mu '}=\Lambda ^{\mu '}{}_{\nu }X^{\nu }$ where there is an implied summation on $\nu$ from 0 to 3, and $\Lambda ^{\mu '}{}_{\nu }$ is a matrix.

More generally, all contravariant components of a four-vector $T^{\nu }$ transform from one frame to another frame by a Lorentz transformation: $T^{\mu '}=\Lambda ^{\mu '}{}_{\nu }T^{\nu }$

Examples of other 4-vectors include the four-velocity $U^{\mu },$ defined as the derivative of the position 4-vector with respect to proper time: $U^{\mu }={\frac {dX^{\mu }}{d\tau }}=\gamma (v)(c,v_{x},v_{y},v_{z})=\gamma (v)(c,\mathbf {v} ).$ where the Lorentz factor is: $\gamma (v)={\frac {1}{\sqrt {1-v^{2}/c^{2}}}}\qquad v^{2}=v_{x}^{2}+v_{y}^{2}+v_{z}^{2}.$

The relativistic energy $E=\gamma (v)mc^{2}$ and relativistic momentum $\mathbf {p} =\gamma (v)m\mathbf {v}$ of an object are respectively the timelike and spacelike components of a contravariant four-momentum vector: $P^{\mu }=mU^{\mu }=m\gamma (v)(c,v_{x},v_{y},v_{z})=\left({\frac {E}{c}},p_{x},p_{y},p_{z}\right)=\left({\frac {E}{c}},\mathbf {p} \right).$ where m is the invariant mass.

The four-acceleration is the proper time derivative of 4-velocity: $A^{\mu }={\frac {dU^{\mu }}{d\tau }}.$

The transformation rules for three-dimensional velocities and accelerations are very awkward; even above in standard configuration the velocity equations are quite complicated owing to their non-linearity. On the other hand, the transformation of four-velocity and four-acceleration are simpler by means of the Lorentz transformation matrix.

The four-gradient of a scalar field φ transforms covariantly rather than contravariantly: ${\begin{pmatrix}{\dfrac {1}{c}}{\dfrac {\partial \phi }{\partial t'}}&{\dfrac {\partial \phi }{\partial x'}}&{\dfrac {\partial \phi }{\partial y'}}&{\dfrac {\partial \phi }{\partial z'}}\end{pmatrix}}={\begin{pmatrix}{\dfrac {1}{c}}{\dfrac {\partial \phi }{\partial t}}&{\dfrac {\partial \phi }{\partial x}}&{\dfrac {\partial \phi }{\partial y}}&{\dfrac {\partial \phi }{\partial z}}\end{pmatrix}}{\begin{pmatrix}\gamma &+\beta \gamma &0&0\\+\beta \gamma &\gamma &0&0\\0&0&1&0\\0&0&0&1\end{pmatrix}}.$ which is the transpose of: $(\partial _{\mu '}\phi )=\Lambda _{\mu '}{}^{\nu }(\partial _{\nu }\phi )\qquad \partial _{\mu }\equiv {\frac {\partial }{\partial x^{\mu }}}.$ only in Cartesian coordinates. It is the covariant derivative which transforms in manifest covariance, in Cartesian coordinates this happens to reduce to the partial derivatives, but not in other coordinates.

More generally, the covariant components of a 4-vector transform according to the inverse Lorentz transformation: $T_{\mu '}=\Lambda _{\mu '}{}^{\nu }T_{\nu },$ where $\Lambda _{\mu '}{}^{\nu }$ is the reciprocal matrix of $\Lambda ^{\mu '}{}_{\nu }$ .

The postulates of special relativity constrain the exact form the Lorentz transformation matrices take.

More generally, most physical quantities are best described as (components of) tensors. So to transform from one frame to another, we use the well-known tensor transformation law^[96] $T_{\theta '\iota '\cdots \kappa '}^{\alpha '\beta '\cdots \zeta '}=\Lambda ^{\alpha '}{}_{\mu }\Lambda ^{\beta '}{}_{\nu }\cdots \Lambda ^{\zeta '}{}_{\rho }\Lambda _{\theta '}{}^{\sigma }\Lambda _{\iota '}{}^{\upsilon }\cdots \Lambda _{\kappa '}{}^{\phi }T_{\sigma \upsilon \cdots \phi }^{\mu \nu \cdots \rho }$ where $\Lambda _{\chi '}{}^{\psi }$ is the reciprocal matrix of $\Lambda ^{\chi '}{}_{\psi }$ . All tensors transform by this rule.

An example of a four-dimensional second order antisymmetric tensor is the relativistic angular momentum, which has six components: three are the classical angular momentum, and the other three are related to the boost of the center of mass of the system. The derivative of the relativistic angular momentum with respect to proper time is the relativistic torque, also second order antisymmetric tensor.

The electromagnetic field tensor is another second order antisymmetric tensor field, with six components: three for the electric field and another three for the magnetic field. There is also the stress–energy tensor for the electromagnetic field, namely the electromagnetic stress–energy tensor.

Metric

The metric tensor allows one to define the inner product of two vectors, which in turn allows one to assign a magnitude to the vector. Given the four-dimensional nature of spacetime the Minkowski metric η has components (valid with suitably chosen coordinates) which can be arranged in a 4 × 4 matrix: $\eta _{\alpha \beta }={\begin{pmatrix}-1&0&0&0\\0&1&0&0\\0&0&1&0\\0&0&0&1\end{pmatrix}}$ which is equal to its reciprocal, $\eta ^{\alpha \beta }$ , in those frames. Throughout we use the signs as above, different authors use different conventions – see Minkowski metric alternative signs.

The Poincaré group is the most general group of transformations which preserves the Minkowski metric: $\eta _{\alpha \beta }=\eta _{\mu '\nu '}\Lambda ^{\mu '}{}_{\alpha }\Lambda ^{\nu '}{}_{\beta }$ and this is the physical symmetry underlying special relativity.

The metric can be used for raising and lowering indices on vectors and tensors. Invariants can be constructed using the metric, the inner product of a 4-vector T with another 4-vector S is: $T^{\alpha }S_{\alpha }=T^{\alpha }\eta _{\alpha \beta }S^{\beta }=T_{\alpha }\eta ^{\alpha \beta }S_{\beta }={\text{invariant scalar}}$

Invariant means that it takes the same value in all inertial frames, because it is a scalar (0 rank tensor), and so no $Λ$ appears in its trivial transformation. The magnitude of the 4-vector T is the positive square root of the inner product with itself: $|\mathbf {T} |={\sqrt {T^{\alpha }T_{\alpha }}}$

One can extend this idea to tensors of higher order, for a second order tensor we can form the invariants: $T^{\alpha }{}_{\alpha },T^{\alpha }{}_{\beta }T^{\beta }{}_{\alpha },T^{\alpha }{}_{\beta }T^{\beta }{}_{\gamma }T^{\gamma }{}_{\alpha }={\text{invariant scalars}},$ similarly for higher order tensors. Invariant expressions, particularly inner products of 4-vectors with themselves, provide equations that are useful for calculations, because one does not need to perform Lorentz transformations to determine the invariants.

Relativistic kinematics and invariance

The coordinate differentials transform also contravariantly: $dX^{\mu '}=\Lambda ^{\mu '}{}_{\nu }dX^{\nu }$ so the squared length of the differential of the position four-vector dX^μ constructed using $d\mathbf {X} ^{2}=dX^{\mu }\,dX_{\mu }=\eta _{\mu \nu }\,dX^{\mu }\,dX^{\nu }=-(c\,dt)^{2}+(dx)^{2}+(dy)^{2}+(dz)^{2}$ is an invariant. Notice that when the line element dX² is negative that $\sqrt - d X 2$ is the differential of proper time, while when dX² is positive, $\sqrt d X 2$ is differential of the proper distance.

The 4-velocity U^μ has an invariant form: $\mathbf {U} ^{2}=\eta _{\nu \mu }U^{\nu }U^{\mu }=-c^{2}\,,$ which means all velocity four-vectors have a magnitude of c. This is an expression of the fact that there is no such thing as being at coordinate rest in relativity: at the least, you are always moving forward through time. Differentiating the above equation by τ produces: $2\eta _{\mu \nu }A^{\mu }U^{\nu }=0.$ So in special relativity, the acceleration four-vector and the velocity four-vector are orthogonal.

Relativistic dynamics and invariance

The invariant magnitude of the momentum 4-vector generates the energy–momentum relation: $\mathbf {P} ^{2}=\eta ^{\mu \nu }P_{\mu }P_{\nu }=-\left({\frac {E}{c}}\right)^{2}+p^{2}.$

We can work out what this invariant is by first arguing that, since it is a scalar, it does not matter in which reference frame we calculate it, and then by transforming to a frame where the total momentum is zero. $\mathbf {P} ^{2}=-\left({\frac {E_{\text{rest}}}{c}}\right)^{2}=-(mc)^{2}.$

We see that the rest energy is an independent invariant. A rest energy can be calculated even for particles and systems in motion, by translating to a frame in which momentum is zero.

The rest energy is related to the mass according to the celebrated equation discussed above: $E_{\text{rest}}=mc^{2}.$

The mass of systems measured in their center of momentum frame (where total momentum is zero) is given by the total energy of the system in this frame. It may not be equal to the sum of individual system masses measured in other frames.

To use Newton's third law of motion, both forces must be defined as the rate of change of momentum with respect to the same time coordinate. That is, it requires the 3D force defined above. Unfortunately, there is no tensor in 4D which contains the components of the 3D force vector among its components.

If a particle is not traveling at c, one can transform the 3D force from the particle's co-moving reference frame into the observer's reference frame. This yields a 4-vector called the four-force. It is the rate of change of the above energy momentum four-vector with respect to proper time. The covariant version of the four-force is: $F_{\nu }={\frac {dP_{\nu }}{d\tau }}=mA_{\nu }$

In the rest frame of the object, the time component of the four-force is zero unless the "invariant mass" of the object is changing (this requires a non-closed system in which energy/mass is being directly added or removed from the object) in which case it is the negative of that rate of change of mass, times c. In general, though, the components of the four-force are not equal to the components of the three-force, because the three force is defined by the rate of change of momentum with respect to coordinate time, that is, dp/dt while the four-force is defined by the rate of change of momentum with respect to proper time, that is, dp/dτ.

In a continuous medium, the 3D density of force combines with the density of power to form a covariant 4-vector. The spatial part is the result of dividing the force on a small cell (in 3-space) by the volume of that cell. The time component is −1/c times the power transferred to that cell divided by the volume of the cell. This will be used below in the section on electromagnetism.

Notes

^ Einstein himself, in The Foundations of the General Theory of Relativity, Ann. Phys. 49 (1916), writes "The word 'special' is meant to intimate that the principle is restricted to the case ...". See p. 111 of The Principle of Relativity, A. Einstein, H. A. Lorentz, H. Weyl, H. Minkowski, Dover reprint of 1923 translation by Methuen and Company.]
^ Wald, General Relativity, p. 60: "... the special theory of relativity asserts that spacetime is the manifold $\mathbb {R} ^{4}$ with a flat metric of Lorentz signature defined on it. Conversely, the entire content of special relativity ... is contained in this statement ..."
^ In a spacetime setting, the length of a moving rigid object is the spatial distance between the ends of the object measured at the same time. In the rest frame of the object the simultaneity is not required.
^ The results of the Michelson–Morley experiment led George Francis FitzGerald and Hendrik Lorentz independently to propose the phenomenon of length contraction. Lorentz believed that length contraction represented a physical contraction of the atoms making up an object. He envisioned no fundamental change in the nature of space and time.^[27]^: 62–68
Lorentz expected that length contraction would result in compressive strains in an object that should result in measurable effects. Such effects would include optical effects in transparent media, such as optical rotation^{[p 11]} and induction of double refraction,^{[p 12]} and the induction of torques on charged condensers moving at an angle with respect to the aether.^{[p 12]} Lorentz was perplexed by experiments such as the Trouton–Noble experiment and the experiments of Rayleigh and Brace which failed to validate his theoretical expectations.^[27]
^ For mathematical consistency, Lorentz proposed a new time variable, the "local time", called that because it depended on the position of a moving body, following the relation t′ = t − vx/c².^{[p 13]} Lorentz considered local time not to be "real"; rather, it represented an ad hoc change of variable.^[28]^: 51, 80
Impressed by Lorentz's "most ingenious idea", Poincaré saw more in local time than a mere mathematical trick. It represented the actual time that would be shown on a moving observer's clocks. On the other hand, Poincaré did not consider this measured time to be the "true time" that would be exhibited by clocks at rest in the aether. Poincaré made no attempt to redefine the concepts of space and time. To Poincaré, Lorentz transformation described the apparent states of the field for a moving observer. True states remained those defined with respect to the ether.^[29]
^ This concept is counterintuitive at least for the fact that, in contrast to usual concepts of distance, it may assume negative values (is not positive definite for non-coinciding events), and that the square-denotation is misleading. This negative square lead to, now not broadly used, concepts of imaginary time. It is immediate that the negative of Δs² is also an invariant, generated by a variant of the metric signature of spacetime.
^ The invariance of Δs² under standard Lorentz transformation in analogous to the invariance of squared distances Δr² under rotations in Euclidean space. Although space and time have an equal footing in relativity, the minus sign in front of the spatial terms marks space and time as being of essentially different character. They are not the same. Because it treats time differently than it treats the 3 spatial dimensions, Minkowski space differs from four-dimensional Euclidean space.
^ The refractive index dependence of the presumed partial aether-drag was eventually confirmed by Pieter Zeeman in 1914–1915, long after special relativity had been accepted by the mainstream. Using a scaled-up version of Michelson's apparatus connected directly to Amsterdam's main water conduit, Zeeman was able to perform extended measurements using monochromatic light ranging from violet (4358 Å) through red (6870 Å).^{[p 17]}^{[p 18]}
^ Even though it has been many decades since Terrell and Penrose published their observations, popular writings continue to conflate measurement versus appearance. For example, Michio Kaku wrote in Einstein's Cosmos (W. W. Norton & Company, 2004. p. 65): "... imagine that the speed of light is only 20 miles per hour. If a car were to go down the street, it might look compressed in the direction of motion, being squeezed like an accordion down to perhaps 1 inch in length."
^ In a letter to Carl Seelig in 1955, Einstein wrote "I had already previously found that Maxwell's theory did not account for the micro-structure of radiation and could therefore have no general validity.", Einstein letter to Carl Seelig, 1955.
^ Rapidity arises naturally as a coordinates on the pure boost generators inside the Lie algebra algebra of the Lorentz group. Likewise, rotation angles arise naturally as coordinates (modulo 2 $π$ ) on the pure rotation generators in the Lie algebra. (Together they coordinatize the whole Lie algebra.) A notable difference is that the resulting rotations are periodic in the rotation angle, while the resulting boosts are not periodic in rapidity (but rather one-to-one). The similarity between boosts and rotations is formal resemblance.
^ In relativity theory, proper acceleration is the physical acceleration (i.e., measurable acceleration as by an accelerometer) experienced by an object. It is thus acceleration relative to a free-fall, or inertial, observer who is momentarily at rest relative to the object being measured.

Primary sources

^ a b c d e f g Albert Einstein (1905) "Zur Elektrodynamik bewegter Körper", Annalen der Physik 17: 891; English translation On the Electrodynamics of Moving Bodies by George Barker Jeffery and Wilfrid Perrett (1923); Another English translation On the Electrodynamics of Moving Bodies by Megh Nad Saha (1920).
^ "Science and Common Sense", P. W. Bridgman, The Scientific Monthly, Vol. 79, No. 1 (Jul. 1954), pp. 32–39.
^ The Electromagnetic Mass and Momentum of a Spinning Electron, G. Breit, Proceedings of the National Academy of Sciences, Vol. 12, p.451, 1926
^ Kinematics of an electron with an axis. Phil. Mag. 3:1-22. L. H. Thomas.]
^ a b Einstein, Autobiographical Notes, 1949.
^ Einstein, "Fundamental Ideas and Methods of the Theory of Relativity", 1920
^ Einstein, On the Relativity Principle and the Conclusions Drawn from It, 1907; "The Principle of Relativity and Its Consequences in Modern Physics", 1910; "The Theory of Relativity", 1911; Manuscript on the Special Theory of Relativity, 1912; Theory of Relativity, 1913; Einstein, Relativity, the Special and General Theory, 1916; The Principal Ideas of the Theory of Relativity, 1916; What Is The Theory of Relativity?, 1919; The Principle of Relativity (Princeton Lectures), 1921; Physics and Reality, 1936; The Theory of Relativity, 1949.
^ Yaakov Friedman (2004). Physical Applications of Homogeneous Balls. Progress in Mathematical Physics. Vol. 40. pp. 1–21. ISBN 978-0-8176-3339-4.
^ Das, A. (1993) The Special Theory of Relativity, A Mathematical Exposition, Springer, ISBN 0-387-94042-1.
^ Schutz, J. (1997) Independent Axioms for Minkowski Spacetime, Addison Wesley Longman Limited, ISBN 0-582-31760-6.
^ Lorentz, H.A. (1902). "The rotation of the plane of polarization in moving media" (PDF). Huygens Institute - Royal Netherlands Academy of Arts and Sciences (KNAW). 4: 669–678. Bibcode:1901KNAB....4..669L. Retrieved 15 November 2018.
^ a b Lorentz, H. A. (1904). "Electromagnetic phenomena in a system moving with any velocity smaller than that of light" (PDF). Huygens Institute - Royal Netherlands Academy of Arts and Sciences (KNAW). 6: 809–831. Bibcode:1903KNAB....6..809L. Retrieved 15 November 2018.
^ Lorentz, Hendrik (1895). "Investigation of oscillations excited by oscillating ions". Attempt at a Theory of Electrical and Optical Phenomena in Moving Bodies (Versuch einer Theorie der electrischen und optischen Erscheinungen in bewegten Körpern). Leiden: E. J. Brill. (subsection § 31).
^ Lin, Shih-Chun; Giallorenzi, Thomas G. (1979). "Sensitivity analysis of the Sagnac-effect optical-fiber ring interferometer". Applied Optics. 18 (6): 915–931. Bibcode:1979ApOpt..18..915L. doi:10.1364/AO.18.000915. PMID 20208844. S2CID 5343180.
^ Shaw, R. (1962). "Length Contraction Paradox". American Journal of Physics. 30 (1): 72. Bibcode:1962AmJPh..30...72S. doi:10.1119/1.1941907. S2CID 119855914.
^ G. A. Benford; D. L. Book & W. A. Newcomb (1970). "The Tachyonic Antitelephone". Physical Review D. 2 (2): 263–265. Bibcode:1970PhRvD...2..263B. doi:10.1103/PhysRevD.2.263. S2CID 121124132.
^ Zeeman, Pieter (1914). "Fresnel's coefficient for light of different colours. (First part)". Proc. Kon. Acad. Van Weten. 17: 445–451. Bibcode:1914KNAB...17..445Z.
^ Zeeman, Pieter (1915). "Fresnel's coefficient for light of different colours. (Second part)". Proc. Kon. Acad. Van Weten. 18: 398–408. Bibcode:1915KNAB...18..398Z.
^ Terrell, James (15 November 1959). "Invisibility of the Lorentz Contraction". Physical Review. 116 (4): 1041–1045. Bibcode:1959PhRv..116.1041T. doi:10.1103/PhysRev.116.1041.
^ Penrose, Roger (24 October 2008). "The Apparent Shape of a Relativistically Moving Sphere". Mathematical Proceedings of the Cambridge Philosophical Society. 55 (1): 137–139. Bibcode:1959PCPS...55..137P. doi:10.1017/S0305004100033776. S2CID 123023118.
^ a b c Does the inertia of a body depend upon its energy content? A. Einstein, Annalen der Physik. 18:639, 1905 (English translation by W. Perrett and G.B. Jeffery)
^ On the Inertia of Energy Required by the Relativity Principle, A. Einstein, Annalen der Physik 23 (1907): 371–384
^ Baglio, Julien (26 May 2007). "Acceleration in special relativity: What is the meaning of "uniformly accelerated movement" ?" (PDF). Physics Department, ENS Cachan. Retrieved 22 January 2016.
^ a b c Champion, Frank Clive (1932). "On some close collisions of fast β-particles with electrons, photographed by the expansion method". Proceedings of the Royal Society of London. Series A, Containing Papers of a Mathematical and Physical Character. 136 (830). The Royal Society Publishing: 630–637. Bibcode:1932RSPSA.136..630C. doi:10.1098/rspa.1932.0108. S2CID 123018629.
^ a b P.A.M. Dirac (1930). "A Theory of Electrons and Protons". Proceedings of the Royal Society. A126 (801): 360–365. Bibcode:1930RSPSA.126..360D. doi:10.1098/rspa.1930.0013. JSTOR 95359.
^ C.D. Anderson (1933). "The Positive Electron". Phys. Rev. 43 (6): 491–494. Bibcode:1933PhRv...43..491A. doi:10.1103/PhysRev.43.491.

References

^ a b c Griffiths, David J. (2013). "Electrodynamics and Relativity". Introduction to Electrodynamics (4th ed.). Pearson. Chapter 12. ISBN 978-0-321-85656-2.
^ a b c Jackson, John D. (1999). "Special Theory of Relativity". Classical Electrodynamics (3rd ed.). John Wiley & Sons. Chapter 11. ISBN 0-471-30932-X.
^ Goldstein, Herbert (1980). "Chapter 7: Special Relativity in Classical Mechanics". Classical Mechanics (2nd ed.). Addison-Wesley Publishing Company. ISBN 0-201-02918-9.
^ a b Lanczos, Cornelius (1970). "Chapter IX: Relativistic Mechanics". The Variational Principles of Mechanics (4th ed.). Dover Publications. ISBN 978-0-486-65067-8.
^ Tom Roberts & Siegmar Schleif (October 2007). "What is the experimental basis of Special Relativity?". Usenet Physics FAQ. Retrieved 2008-09-17.
^ Albert Einstein (2001). Relativity: The Special and the General Theory (Reprint of 1920 translation by Robert W. Lawson ed.). Routledge. p. 48. ISBN 978-0-415-25384-0.
^ The Feynman Lectures on Physics Vol. I Ch. 15-9: Equivalence of mass and energy
^ Sean Carroll, Lecture Notes on General Relativity, ch. 1, "Special relativity and flat spacetime", http://ned.ipac.caltech.edu/level5/March01/Carroll3/Carroll1.html
^ Koks, Don (2006). Explorations in Mathematical Physics: The Concepts Behind an Elegant Language (illustrated ed.). Springer Science & Business Media. p. 234. ISBN 978-0-387-32793-8. Extract of page 234
^ Steane, Andrew M. (2012). Relativity Made Relatively Easy (illustrated ed.). OUP Oxford. p. 226. ISBN 978-0-19-966286-9. Extract of page 226
^ a b c d e Taylor, Edwin F.; Wheeler, John Archibald (1992). Spacetime Physics (2nd ed.). W. H. Freeman. ISBN 0-7167-2327-1.
^ a b c d e Rindler, Wolfgang (1977). Essential Relativity: Special, General, and Cosmological (illustrated ed.). Springer Science & Business Media. p. §1,11 p. 7. ISBN 978-3-540-07970-5.
^ "James Clerk Maxwell: a force for physics". Physics World. 2006-12-01. Retrieved 2024-03-22.
^ "November 1887: Michelson and Morley report their failure to detect the luminiferous ether". www.aps.org. Retrieved 2024-03-22.
^ Michael Polanyi (1974) Personal Knowledge: Towards a Post-Critical Philosophy, ISBN 0-226-67288-3, footnote page 10–11: Einstein reports, via Dr N Balzas in response to Polanyi's query, that "The Michelson–Morley experiment had no role in the foundation of the theory." and "... the theory of relativity was not founded to explain its outcome at all". [1]
^ a b Jeroen van Dongen (2009). "On the role of the Michelson–Morley experiment: Einstein in Chicago". Archive for History of Exact Sciences. 63 (6): 655–663. arXiv:0908.1545. Bibcode:2009arXiv0908.1545V. doi:10.1007/s00407-009-0050-5. S2CID 119220040.
^ For a survey of such derivations, see Lucas and Hodgson, Spacetime and Electromagnetism, 1990
^ Einstein, A., Lorentz, H. A., Minkowski, H., & Weyl, H. (1952). The Principle of Relativity: a collection of original memoirs on the special and general theory of relativity. Courier Dover Publications. p. 111. ISBN 978-0-486-60081-9.{{cite book}}: CS1 maint: multiple names: authors list (link)
^ Collier, Peter (2017). A Most Incomprehensible Thing: Notes Towards a Very Gentle Introduction to the Mathematics of Relativity (3rd ed.). Incomprehensible Books. ISBN 9780957389465.
^ Staley, Richard (2009), "Albert Michelson, the Velocity of Light, and the Ether Drift", Einstein's generation. The origins of the relativity revolution, Chicago: University of Chicago Press, ISBN 0-226-77057-5
^ a b c d e f g h i j k l m n o p David Morin (2007) Introduction to Classical Mechanics, Cambridge University Press, Cambridge, chapter 11, Appendix I, ISBN 1-139-46837-5.
^ Miller, D. J. (2010). "A constructive approach to the special theory of relativity". American Journal of Physics. 78 (6): 633–638. arXiv:0907.0902. Bibcode:2010AmJPh..78..633M. doi:10.1119/1.3298908. S2CID 20444859.
^ Callahan, James J. (2011). The Geometry of Spacetime: An Introduction to Special and General Relativity. New York: Springer. ISBN 9781441931429.
^ P. G. Bergmann (1976) Introduction to the Theory of Relativity, Dover edition, Chapter IV, page 36 ISBN 0-486-63282-2.
^ Mermin, N. David (1968). Space and Time in Special Relativity. McGraw-Hill. ISBN 978-0881334203.
^ Robert Resnick (1968). Introduction to special relativity. Wiley. pp. 62–63. ISBN 9780471717249.
^ a b Miller, Arthur I. (1998). Albert Einstein's Special Theory of Relativity: Emergence (1905) and Early Interpretation (1905–1911). Mew York: Springer-Verlag. ISBN 978-0-387-94870-6.
^ Bernstein, Jeremy (2006). Secrets of the Old One: Einstein, 1905. Copernicus Books (imprint of Springer Science + Business Media). ISBN 978-0387-26005-1.
^ Darrigol, Olivier (2005). "The Genesis of the Theory of Relativity" (PDF). Séminaire Poincaré. 1: 1–22. Bibcode:2006eins.book....1D. Retrieved 15 November 2018.
^ a b c Rindler, Wolfgang (1977). Essential Relativity (2nd ed.). New York: Springer-Verlag. ISBN 978-0-387-10090-6.
^ a b c d Taylor, Edwin F.; Wheeler, John Archibald (1966). Spacetime Physics (1st ed.). San Francisco: W. H. Freeman and Company.
^ Ashby, Neil (2003). "Relativity in the Global Positioning System". Living Reviews in Relativity. 6 (1): 1. Bibcode:2003LRR.....6....1A. doi:10.12942/lrr-2003-1. PMC 5253894. PMID 28163638.
^ Daniel Kleppner & David Kolenkow (1973). An Introduction to Mechanics. McGraw-Hill. pp. 468–70. ISBN 978-0-07-035048-9.
^ a b c French, A. P. (1968). Special Relativity. New York: W. W. Norton & Company. ISBN 0-393-09793-5.
^ Lewis, Gilbert Newton; Tolman, Richard Chase (1909). "The Principle of Relativity, and Non-Newtonian Mechanics". Proceedings of the American Academy of Arts and Sciences. 44 (25): 709–726. doi:10.2307/20022495. JSTOR 20022495. Retrieved 22 August 2023.
^ a b Cuvaj, Camillo (1971). "Paul Langeyin and the Theory of Relativity" (PDF). Japanese Studies in the History of Science. 10: 113–142. Retrieved 12 June 2023.
^ Cassidy, David C.; Holton, Gerald James; Rutherford, Floyd James (2002). Understanding Physics. Springer-Verlag. p. 422. ISBN 978-0-387-98756-9.
^ Cutner, Mark Leslie (2003). Astronomy, A Physical Perspective. Cambridge University Press. p. 128. ISBN 978-0-521-82196-4.
^ Ellis, George F. R.; Williams, Ruth M. (2000). Flat and Curved Space-times (2n ed.). Oxford University Press. pp. 28–29. ISBN 978-0-19-850657-7.
^ Feynman, Richard P.; Leighton, Robert B.; Sands, Matthew (2011). The feynman lectures on physics; vol I: The new millennium edition. Basic Books. p. 15-5. ISBN 978-0-465-02414-8. Retrieved 12 June 2023.
^ a b Halliday, David; Resnick, Robert (1988). Fundamental Physics: Extended Third Edition. New York: John Wiley & sons. pp. 958–959. ISBN 0-471-81995-6.
^ Adams, Steve (1997). Relativity: An introduction to space-time physics. CRC Press. p. 54. ISBN 978-0-7484-0621-0.
^ Langevin, Paul (1911). "L'Évolution de l'espace et du temps". Scientia. 10: 31–54. Retrieved 20 June 2023.
^ Debs, Talal A.; Redhead, Michael L.G. (1996). "The twin "paradox" and the conventionality of simultaneity". American Journal of Physics. 64 (4): 384–392. Bibcode:1996AmJPh..64..384D. doi:10.1119/1.18252.
^ Tolman, Richard C. (1917). The Theory of the Relativity of Motion. Berkeley: University of California Press. p. 54.
^ Takeuchi, Tatsu. "Special Relativity Lecture Notes – Section 10". Virginia Tech. Retrieved 31 October 2018.
^ Morin, David (2017). Special Relativity for the Enthusiastic Beginner. CreateSpace Independent Publishing Platform. pp. 90–92. ISBN 9781542323512.
^ Gibbs, Philip. "Is Faster-Than-Light Travel or Communication Possible?". Physics FAQ. Department of Mathematics, University of California, Riverside. Retrieved 31 October 2018.
^ Ginsburg, David (1989). Applications of Electrodynamics in Theoretical Physics and Astrophysics (illustrated ed.). CRC Press. p. 206. Bibcode:1989aetp.book.....G. ISBN 978-2-88124-719-4. Extract of page 206
^ Wesley C. Salmon (2006). Four Decades of Scientific Explanation. University of Pittsburgh. p. 107. ISBN 978-0-8229-5926-7., Section 3.7 page 107
^ Lauginie, P. (2004). "Measuring Speed of Light: Why? Speed of what?" (PDF). Proceedings of the Fifth International Conference for History of Science in Science Education. Archived from the original (PDF) on 4 July 2015. Retrieved 3 July 2015.
^ Stachel, J. (2005). "Fresnel's (dragging) coefficient as a challenge to 19th century optics of moving bodies". In Kox, A.J.; Eisenstaedt, J (eds.). The universe of general relativity. Boston: Birkhäuser. pp. 1–13. ISBN 978-0-8176-4380-5. Retrieved 17 April 2012.
^ Richard A. Mould (2001). Basic Relativity (2nd ed.). Springer. p. 8. ISBN 978-0-387-95210-9.
^ Seidelmann, P. Kenneth, ed. (1992). Explanatory Supplement to the Astronomical Almanac. ill Valley, Calif.: University Science Books. p. 393. ISBN 978-0-935702-68-2.
^ Ferraro, Rafael; Sforza, Daniel M. (2005). "European Physical Society logo Arago (1810): the first experimental result against the ether". European Journal of Physics. 26 (1): 195–204. arXiv:physics/0412055. Bibcode:2005EJPh...26..195F. doi:10.1088/0143-0807/26/1/020. S2CID 119528074.
^ Dolan, Graham. "Airy's Water Telescope (1870)". The Royal Observatory Greenwich. Retrieved 20 November 2018.
^ Hollis, H. P. (1937). "Airy's water telescope". The Observatory. 60: 103–107. Bibcode:1937Obs....60..103H. Retrieved 20 November 2018.
^ Janssen, Michel; Stachel, John (2004). "The Optics and Electrodynamics of Moving Bodies" (PDF). In Stachel, John (ed.). Going Critical. Springer. ISBN 978-1-4020-1308-9.
^ Sher, D. (1968). "The Relativistic Doppler Effect". Journal of the Royal Astronomical Society of Canada. 62: 105–111. Bibcode:1968JRASC..62..105S. Retrieved 11 October 2018.
^ Gill, T. P. (1965). The Doppler Effect. London: Logos Press Limited. pp. 6–9. OL 5947329M.
^ Feynman, Richard P.; Leighton, Robert B.; Sands, Matthew (February 1977). "Relativistic Effects in Radiation". The Feynman Lectures on Physics: Volume 1. Reading, Massachusetts: Addison-Wesley. pp. 34–7 f. ISBN 9780201021165. LCCN 2010938208.
^ Cook, Helen. "Relativistic Distortion". Mathematics Department, University of British Columbia. Retrieved 12 April 2017.
^ Signell, Peter. "Appearances at Relativistic Speeds" (PDF). Project PHYSNET. Michigan State University, East Lansing, MI. Archived from the original (PDF) on 13 April 2017. Retrieved 12 April 2017.
^ Kraus, Ute. "The Ball is Round". Space Time Travel: Relativity visualized. Institut für Physik Universität Hildesheim. Archived from the original on 12 May 2017. Retrieved 16 April 2017.
^ Boas, Mary L. (1961). "Apparent Shape of Large Objects at Relativistic Speeds". American Journal of Physics. 29 (5): 283. Bibcode:1961AmJPh..29..283B. doi:10.1119/1.1937751.
^ Müller, Thomas; Boblest, Sebastian (2014). "Visual appearance of wireframe objects in special relativity". European Journal of Physics. 35 (6): 065025. arXiv:1410.4583. Bibcode:2014EJPh...35f5025M. doi:10.1088/0143-0807/35/6/065025. S2CID 118498333.
^ Zensus, J. Anton; Pearson, Timothy J. (1987). Superluminal Radio Sources (1st ed.). Cambridge, New York: Cambridge University Press. p. 3. ISBN 9780521345606.
^ Chase, Scott I. "Apparent Superluminal Velocity of Galaxies". The Original Usenet Physics FAQ. Department of Mathematics, University of California, Riverside. Retrieved 12 April 2017.
^ Richmond, Michael. ""Superluminal" motions in astronomical sources". Physics 200 Lecture Notes. School of Physics and Astronomy, Rochester Institute of Technology. Archived from the original on 16 February 2017. Retrieved 20 April 2017.
^ Keel, Bill. "Jets, Superluminal Motion, and Gamma-Ray Bursts". Galaxies and the Universe - WWW Course Notes. Department of Physics and Astronomy, University of Alabama. Archived from the original on 1 March 2017. Retrieved 29 April 2017.
^ Max Jammer (1997). Concepts of Mass in Classical and Modern Physics. Courier Dover Publications. pp. 177–178. ISBN 978-0-486-29998-3.
^ John J. Stachel (2002). Einstein from B to Z. Springer. p. 221. ISBN 978-0-8176-4143-6.
^ Fernflores, Francisco (2018). Einstein's Mass-Energy Equation, Volume I: Early History and Philosophical Foundations. New York: Momentum Pres. ISBN 978-1-60650-857-2.
^ a b Philip Gibbs & Don Koks. "The Relativistic Rocket". Retrieved 30 August 2012.
^ The special theory of relativity shows that time and space are affected by motion Archived 2012-10-21 at the Wayback Machine. Library.thinkquest.org. Retrieved on 2013-04-24.
^ a b Idema, Timon (17 April 2019). "Mechanics and Relativity. Chapter 14: Relativistic Collisions". LibreTexts Physics. California State University Affordable Learning Solutions Program. Retrieved 2 January 2023.
^ Nakel, Werner (1994). "The elementary process of bremsstrahlung". Physics Reports. 243 (6): 317–353. Bibcode:1994PhR...243..317N. doi:10.1016/0370-1573(94)00068-9.
^ Halbert, M.L. (1972). "Review of Experiments on Nucleon-Nucleon Bremsstrahlung". In Austin, S.M.; Crawley, G.M. (eds.). The Two-Body Force in Nuclei. Boston, MA.: Springer.
^ Thomas, George B.; Weir, Maurice D.; Hass, Joel; Giordano, Frank R. (2008). Thomas' Calculus: Early Transcendentals (Eleventh ed.). Boston: Pearson Education, Inc. p. 533. ISBN 978-0-321-49575-4.
^ a b E. J. Post (1962). Formal Structure of Electromagnetics: General Covariance and Electromagnetics. Dover Publications Inc. ISBN 978-0-486-65427-0.
^ a b c Schutz, Bernard F. (1985). A first course in general relativity. Cambridge, UK: Cambridge University Press. p. 26. ISBN 0521277035.
^ a b Gibbs, Philip. "Can Special Relativity Handle Acceleration?". The Physics and Relativity FAQ. math.ucr.edu. Archived from the original on 7 June 2017. Retrieved 28 May 2017.
^ Franklin, Jerrold (2010). "Lorentz contraction, Bell's spaceships, and rigid body motion in special relativity". European Journal of Physics. 31 (2): 291–298. arXiv:0906.1919. Bibcode:2010EJPh...31..291F. doi:10.1088/0143-0807/31/2/006. S2CID 18059490.
^ a b c Bais, Sander (2007). Very Special Relativity: An Illustrated Guide. Cambridge, Massachusetts: Harvard University Press. ISBN 978-0-674-02611-7.
^ R. Resnick; R. Eisberg (1985). Quantum Physics of Atoms, Molecules, Solids, Nuclei and Particles (2nd ed.). John Wiley & Sons. pp. 114–116. ISBN 978-0-471-87373-0.
^ Øyvind Grøn & Sigbjørn Hervik (2007). Einstein's general theory of relativity: with modern applications in cosmology. Springer. p. 195. ISBN 978-0-387-69199-2. Extract of page 195 (with units where c = 1)
^ The number of works is vast, see as example:
Sidney Coleman; Sheldon L. Glashow (1997). "Cosmic Ray and Neutrino Tests of Special Relativity". Physics Letters B. 405 (3–4): 249–252. arXiv:hep-ph/9703240. Bibcode:1997PhLB..405..249C. doi:10.1016/S0370-2693(97)00638-2. S2CID 17286330.
An overview can be found on this page
^ Roberts, Tom; Schleif, Siegmar. "Experiments that Apparently are NOT Consistent with SR/GR". What is the experimental basis of Special Relativity?. University of California at Riverside. Retrieved 10 July 2024.
^ John D. Norton, John D. (2004). "Einstein's Investigations of Galilean Covariant Electrodynamics prior to 1905". Archive for History of Exact Sciences. 59 (1): 45–105. Bibcode:2004AHES...59...45N. doi:10.1007/s00407-004-0085-6. S2CID 17459755.
^ J.A. Wheeler; C. Misner; K.S. Thorne (1973). Gravitation. W.H. Freeman & Co. p. 58. ISBN 978-0-7167-0344-0.
^ J.R. Forshaw; A.G. Smith (2009). Dynamics and Relativity. Wiley. p. 247. ISBN 978-0-470-01460-8.
^ R. Penrose (2007). The Road to Reality. Vintage books. ISBN 978-0-679-77631-4.
^ Jean-Bernard Zuber & Claude Itzykson, Quantum Field Theory, pg 5, ISBN 0-07-032071-3
^ Charles W. Misner, Kip S. Thorne & John A. Wheeler, Gravitation, pg 51, ISBN 0-7167-0344-0
^ George Sterman, An Introduction to Quantum Field Theory, pg 4, ISBN 0-521-31132-2
^ Sean M. Carroll (2004). Spacetime and Geometry: An Introduction to General Relativity. Addison Wesley. p. 22. ISBN 978-0-8053-8732-2.

External links

Wikisource has original text related to this article:

Relativity: The Special and General Theory

Wikisource has original works on the topic: Relativity

Wikibooks has a book on the topic of: Special Relativity

Wikiversity has learning resources about Special Relativity

Look up special relativity in Wiktionary, the free dictionary.

Original works

Zur Elektrodynamik bewegter Körper Einstein's original work in German, Annalen der Physik, Bern 1905
On the Electrodynamics of Moving Bodies English Translation as published in the 1923 book The Principle of Relativity.

Special relativity for a general audience (no mathematical knowledge required)

Einstein Light An award-winning, non-technical introduction (film clips and demonstrations) supported by dozens of pages of further explanations and animations, at levels with or without mathematics.
Einstein Online Archived 2010-02-01 at the Wayback Machine Introduction to relativity theory, from the Max Planck Institute for Gravitational Physics.
Audio: Cain/Gay (2006) – Astronomy Cast. Einstein's Theory of Special Relativity

Special relativity explained (using simple or more advanced mathematics)

Bondi K-Calculus – A simple introduction to the special theory of relativity.
Greg Egan's Foundations Archived 2013-04-25 at the Wayback Machine.
The Hogg Notes on Special Relativity A good introduction to special relativity at the undergraduate level, using calculus.
Relativity Calculator: Special Relativity Archived 2013-03-21 at the Wayback Machine – An algebraic and integral calculus derivation for E = mc².
MathPages – Reflections on Relativity A complete online book on relativity with an extensive bibliography.
Special Relativity An introduction to special relativity at the undergraduate level.
Relativity: the Special and General Theory at Project Gutenberg, by Albert Einstein
Special Relativity Lecture Notes is a standard introduction to special relativity containing illustrative explanations based on drawings and spacetime diagrams from Virginia Polytechnic Institute and State University.
Understanding Special Relativity The theory of special relativity in an easily understandable way.
An Introduction to the Special Theory of Relativity (1964) by Robert Katz, "an introduction ... that is accessible to any student who has had an introduction to general physics and some slight acquaintance with the calculus" (130 pp; pdf format).
Lecture Notes on Special Relativity by J D Cresser Department of Physics Macquarie University.
SpecialRelativity.net – An overview with visualizations and minimal mathematics.
Relativity 4-ever? The problem of superluminal motion is discussed in an entertaining manner.

Visualization

Raytracing Special Relativity Software visualizing several scenarios under the influence of special relativity.
Real Time Relativity Archived 2013-05-08 at the Wayback Machine The Australian National University. Relativistic visual effects experienced through an interactive program.
Spacetime travel A variety of visualizations of relativistic effects, from relativistic motion to black holes.
Through Einstein's Eyes Archived 2013-05-14 at the Wayback Machine The Australian National University. Relativistic visual effects explained with movies and images.
Warp Special Relativity Simulator A computer program to show the effects of traveling close to the speed of light.
Animation clip on YouTube visualizing the Lorentz transformation.
Original interactive FLASH Animations from John de Pillis illustrating Lorentz and Galilean frames, Train and Tunnel Paradox, the Twin Paradox, Wave Propagation, Clock Synchronization, etc.
lightspeed An OpenGL-based program developed to illustrate the effects of special relativity on the appearance of moving objects.
Animation showing the stars near Earth, as seen from a spacecraft accelerating rapidly to light speed.