Альберт Эйнштейн вывел теорию специальной теории относительности в 1905 году [1] из принципов, которые сейчас называются постулатами специальной теории относительности . Формулировка Эйнштейна, как утверждается [ кем? ] , требует только двух постулатов , хотя его вывод подразумевает еще несколько предположений.
Идея о том, что специальная теория относительности зависит только от двух постулатов, оба из которых, казалось, следовали из теории и эксперимента того времени, была одним из самых убедительных аргументов в пользу правильности теории (Эйнштейн 1912: « Эта теория верна в той степени, в которой верны два принципа, на которых она основана. Поскольку они кажутся верными в значительной степени, ... ») [2]
1. Первый постулат ( принцип относительности )
2. Второй постулат (инвариантность c )
Двухпостулатная основа специальной теории относительности — та, которую исторически использовал Эйнштейн, и иногда она является отправной точкой сегодня. Как позже признал сам Эйнштейн, вывод преобразования Лоренца неявно использует некоторые дополнительные предположения, включая пространственную однородность, изотропию и отсутствие памяти . [3] Герман Минковский также неявно использовал оба постулата, когда он ввел формулировку пространства Минковского , хотя он показал, что c можно рассматривать как постоянную пространства-времени, а отождествление со скоростью света вытекает из оптики. [4]
Исторически Хендрик Лоренц и Анри Пуанкаре (1892–1905) вывели преобразование Лоренца из уравнений Максвелла , что послужило объяснением отрицательного результата всех измерений эфирного дрейфа. Благодаря этому светоносный эфир становится необнаружимым в соответствии с тем, что Пуанкаре называл принципом относительности (см. История преобразований Лоренца и Теория эфира Лоренца ). Более современный пример вывода преобразования Лоренца из электродинамики (без использования исторической концепции эфира вообще) был дан Ричардом Фейнманом . [5]
Джордж Фрэнсис Фицджеральд уже выдвинул аргумент, похожий на аргумент Эйнштейна, в 1889 году в ответ на эксперимент Майкельсона-Морли, который, казалось бы, показал истинность обоих постулатов. Он писал, что сокращение длины — «почти единственная гипотеза, которая может примирить» кажущиеся противоречия. Лоренц независимо пришел к похожим выводам и позже написал: «главное отличие в том, что Эйнштейн просто постулирует то, что мы вывели».
После этих выводов было предложено много альтернативных выводов, основанных на различных наборах предположений. Часто утверждалось (например, Владимиром Игнатовским в 1910 году, [6] [7] [8] или Филиппом Франком и Германом Роте в 1911 году, [9] [10] и многими другими в последующие годы [11] ), что формула, эквивалентная преобразованию Лоренца, с точностью до неотрицательного свободного параметра, следует только из самого постулата относительности, без предварительного постулирования универсальной скорости света. [12] Эти формулировки опираются на вышеупомянутые различные предположения, такие как изотропия. Численное значение параметра в этих преобразованиях затем может быть определено экспериментально, так же как численные значения пары параметров c и диэлектрической проницаемости вакуума остаются для определения экспериментально даже при использовании исходных постулатов Эйнштейна. Эксперимент исключает справедливость преобразований Галилея. Когда числовые значения в подходах Эйнштейна и других подходах найдены, то эти разные подходы приводят к одной и той же теории. [ необходима цитата ]
Вывод Эйнштейна 1905 года не является полным. Разрыв в логике Эйнштейна происходит там, где, установив « закон постоянства скорости света » для пустого пространства, он применяет этот закон в ситуациях, когда пространство больше не пусто. [1] Для того, чтобы вывод был применим к физическим объектам, требуется дополнительный постулат или «соединительная гипотеза», что геометрия, полученная для пустого пространства, также применима, когда пространство заполнено. Это было бы эквивалентно утверждению, что мы знаем, что введение материи в область и ее относительное движение не оказывают никакого влияния на геометрию светового луча.
Такое утверждение было бы проблематичным, поскольку Эйнштейн отвергал идею о том, что такой процесс, как распространение света, может быть невосприимчив к другим факторам (1914: « Не может быть никаких сомнений в том, что этот принцип имеет далеко идущее значение; и все же я не могу поверить в его точную справедливость. Мне кажется невероятным, что ход любого процесса (например, распространения света в вакууме) можно представить как независимый от всех других событий в мире ».) [13]
Включение этого "моста" в качестве явного третьего постулата также могло бы подорвать доверие к теории, поскольку показатель преломления и эффект Физо предполагали бы, что присутствие и поведение материи, по -видимому, влияют на распространение света, вопреки теории. Если бы эта гипотеза моста была сформулирована как третий постулат, можно было бы утверждать, что третий постулат (и, следовательно, теория) были фальсифицированы экспериментальными доказательствами.
Без «связующей гипотезы» в качестве третьего постулата вывод 1905 года открыт для критики, поскольку выведенные из него соотношения могут применяться только in vacuo , то есть при отсутствии материи.
Спорное предположение о том, что теория 1905 года, выведенная из предположения о пустом пространстве, может применяться только к пустому пространству, появляется в книге Эдвина Ф. Тейлора и Джона Арчибальда Уиллера « Физика пространства-времени » (Вставка 3-1: « Принцип относительности основывается на пустоте »). [14]
Аналогичное предположение о том, что редукция геометрии ОТО к плоскому пространству-времени СТО в малых областях может быть «нефизической» (потому что плоские точечные области не могут содержать материю, способную действовать как физические наблюдатели), было признано, но отвергнуто Эйнштейном в 1914 году (« Уравнения новой теории относительности сводятся к уравнениям исходной теории в особом случае, когда g μν можно считать постоянным... единственное возражение, которое можно выдвинуть против теории, состоит в том, что уравнения, которые мы составили, возможно, могут быть лишены какого-либо физического содержания. Но никто вряд ли будет всерьез думать, что это возражение оправдано в данном случае »). [13]
Эйнштейн вернулся к этой проблеме в 1919 году (« Ни в коем случае не установлено a priori, что предельный переход такого рода имеет какое-либо возможное значение. Ибо если гравитационные поля действительно играют существенную роль в структуре частиц материи, то переход к предельному случаю постоянного g μν для них потерял бы свое обоснование, поскольку, действительно, при постоянном g μν не могло бы быть никаких частиц материи. ») [15]
Еще один аргумент в пользу нефизичности можно почерпнуть из решения Эйнштейна «проблемы дырки» в рамках общей теории относительности, в котором Эйнштейн отвергает физичность отношений системы координат в действительно пустом пространстве. [16]
Специальная теория Эйнштейна — не единственная теория, которая объединяет форму постоянства скорости света с принципом относительности. Теория, подобная той, что была предложена Генрихом Герцем (в 1890 году) [17], допускает полное увлечение света всеми объектами, давая локальное постоянство c для всех физических наблюдателей. Логическая возможность теории Герца показывает, что два стандартных постулата Эйнштейна ( без гипотезы моста) недостаточны для того, чтобы позволить нам прийти к единственному решению специальной теории относительности (хотя специальную теорию относительности можно считать самым минималистским решением).
Эйнштейн согласился, что теория Герца логически последовательна (« Именно на основе этой гипотезы Герц разработал электродинамику движущихся тел, свободную от противоречий »), [18], но отклонил ее по причине плохого согласия с результатом Физо , оставив специальную теорию относительности как единственный оставшийся вариант. Учитывая, что СТО также не смогла воспроизвести результат Физо без введения дополнительных вспомогательных правил (для рассмотрения различного поведения света в среде с частицами), это, возможно, было не совсем справедливым сравнением.
В строгой математической формулировке специальной теории относительности мы предполагаем, что Вселенная существует в четырехмерном пространстве-времени M. Отдельные точки в пространстве-времени известны как события ; физические объекты в пространстве-времени описываются мировыми линиями (если объект является точечной частицей) или мировыми листами (если объект больше точки). Мировая линия или мировой лист описывают только движение объекта; объект может также иметь несколько других физических характеристик, таких как энергия-импульс , масса , заряд и т. д.
В дополнение к событиям и физическим объектам существует класс инерциальных систем отсчета . Каждая инерциальная система отсчета предоставляет систему координат для событий в пространстве-времени M. Кроме того, эта система отсчета также дает координаты для всех других физических характеристик объектов в пространстве-времени; например, она предоставит координаты для импульса и энергии объекта, координаты для электромагнитного поля и так далее.
Мы предполагаем, что для любых двух инерциальных систем отсчета существует преобразование координат , которое преобразует координаты из одной системы отсчета в координаты в другой системе отсчета. Это преобразование не только обеспечивает преобразование для пространственно-временных координат , но также обеспечит преобразование для всех других физических координат, таких как закон преобразования для импульса и энергии и т. д. (На практике эти законы преобразования могут быть эффективно обработаны с использованием математики тензоров .)
Мы также предполагаем, что Вселенная подчиняется ряду физических законов. Математически каждый физический закон может быть выражен относительно координат, заданных инерциальной системой отсчета, математическим уравнением (например, дифференциальным уравнением ), которое связывает различные координаты различных объектов в пространстве-времени. Типичным примером являются уравнения Максвелла . Другим примером является первый закон Ньютона .
1. Первый постулат ( Принцип относительности )
2. Второй постулат (Инвариантность c )
Неформально, Второй постулат утверждает, что объекты, движущиеся со скоростью c в одной системе отсчета, обязательно будут двигаться со скоростью c во всех системах отсчета. Этот постулат является подмножеством постулатов, лежащих в основе уравнений Максвелла в интерпретации, данной им в контексте специальной теории относительности. Однако уравнения Максвелла опираются на несколько других постулатов, некоторые из которых, как теперь известно, ложны (например, уравнения Максвелла не могут учитывать квантовые атрибуты электромагнитного излучения).
Второй постулат может быть использован для того, чтобы подразумевать более сильную версию самого себя, а именно, что интервал пространства-времени инвариантен относительно изменений инерциальной системы отсчета. В приведенных выше обозначениях это означает, что
для любых двух событий A , B. Это, в свою очередь, можно использовать для вывода законов преобразования между системами отсчета; см. преобразование Лоренца .
Постулаты специальной теории относительности можно выразить очень лаконично, используя математический язык псевдоримановых многообразий . Второй постулат представляет собой утверждение, что четырехмерное пространство-время M является псевдоримановым многообразием, снабженным метрикой g сигнатуры (1,3), которая задается метрикой Минковского при измерении в каждой инерциальной системе отсчета. Эта метрика рассматривается как одна из физических величин теории; таким образом, она преобразуется определенным образом при изменении системы отсчета, и ее можно законно использовать при описании законов физики. Первый постулат представляет собой утверждение, что законы физики инвариантны при представлении в любой системе отсчета, для которой g задается метрикой Минковского. Одним из преимуществ этой формулировки является то, что теперь легко сравнивать специальную теорию относительности с общей теорией относительности , в которой выполняются те же два постулата, но предположение о том, что метрика должна быть Минковского, отбрасывается.
Теория относительности Галилея является предельным случаем специальной теории относительности в пределе (который иногда называют нерелятивистским пределом ). В этой теории первый постулат остается неизменным, но второй постулат изменяется следующим образом:
Физическая теория, заданная классической механикой и ньютоновской гравитацией, согласуется с галилеевской относительностью, но не со специальной теорией относительности. Наоборот, уравнения Максвелла не согласуются с галилеевской относительностью, если только не постулировать существование физического эфира. В ряде случаев законы физики в специальной теории относительности (такие как уравнение ) можно вывести, объединив постулаты специальной теории относительности с гипотезой о том, что законы специальной теории относительности приближаются к законам классической механики в нерелятивистском пределе.