stringtranslate.com

Теорема Кэли–Гамильтона

Артур Кэли , член Королевского общества (1821–1895), широко известен как ведущий британский чистый математик XIX века. Кэли в 1848 году поехал в Дублин, чтобы прослушать лекции по кватернионам Гамильтона, их первооткрывателя. Позже Кэли произвел на него впечатление, став вторым, опубликовавшим о них работу. [1] Кэли сформулировал теорему для матриц размерности 3 или меньше и опубликовал доказательство для двумерного случая.
Уильям Роуэн Гамильтон (1805–1865), ирландский физик, астроном и математик, первый иностранный член Американской национальной академии наук . Придерживаясь противоположной позиции относительно того, как следует изучать геометрию , Гамильтон всегда оставался в лучших отношениях с Кэли. [1]

Гамильтон доказал, что для линейной функции кватернионов существует некоторое уравнение, зависящее от линейной функции, которому удовлетворяет сама линейная функция. [2] [3] [4]

В линейной алгебре теорема Кэли -Гамильтона (названная в честь математиков Артура Кэли и Уильяма Роуэна Гамильтона ) утверждает, что каждая квадратная матрица над коммутативным кольцом (например, действительные или комплексные числа или целые числа ) удовлетворяет своему собственному характеристическому уравнению .

Если A — заданная матрица размера n  ×  n , а I nединичная матрица размера n  ×  n , то характеристический полином A определяется как [5] , где detопределительная операция, а λпеременная для скалярного элемента матрицы. базовое кольцо . Поскольку элементы матрицы являются (линейными или постоянными) полиномами от λ , определитель также является моническим полиномом степени n от λ . Можно создать аналогичный полином в матрице A вместо скалярной переменной λ , определяемой как Кэли Теорема Гамильтона утверждает, что это полиномиальное выражение равно нулевой матрице , то есть полином является аннулирующим многочленом для . Теорема позволяет выразить An как линейную комбинацию младших степеней матрицы A . Когда кольцо является полем , теорема Кэли-Гамильтона эквивалентна утверждению, что минимальный многочлен квадратной матрицы делит ее характеристический многочлен.

Частный случай теоремы был впервые доказан Гамильтоном в 1853 году [6] в терминах обратных линейных функций кватернионов . [2] [3] [4] Это соответствует частному случаю некоторых вещественных матриц 4 × 4 или комплексных матриц 2 × 2 . Кэли в 1858 году сформулировал результат для матриц 3 × 3 и меньших, но опубликовал доказательство только для случая 2 × 2 . [7] [8] Что касается матриц размера n  ×  n , Кэли заявил: «... я не считал необходимым предпринимать труд по формальному доказательству теоремы в общем случае матрицы любой степени». Общий случай был впервые доказан Фердинандом Фробениусом в 1878 году. [9]

Примеры

матрицы 1 × 1

Для матрицы A = ( a ) размера 1 × 1 характеристический многочлен задается выражением p ( λ ) = λ - a , и поэтому p ( A ) = ( a ) - a (1) = 0 тривиально.

матрицы 2 × 2

В качестве конкретного примера позвольте

Теорема Кэли-Гамильтона утверждает, что если мы определим

Для общей матрицы 2 × 2

характеристический полином задается формулой p ( λ ) = λ 2 − ( a + d ) λ + ( adbc ) , поэтому теорема Кэли – Гамильтона утверждает, что

A 2
Доказательство

Приложения

Определитель и обратная матрица

Таким образом, для общей обратимой матрицы A размера n  ×  n , т. е. матрицы с ненулевым определителем, A −1 можно записать как полиномиальное выражение ( n − 1) -го порядка от A : Как указано, теорема Кэли – Гамильтона сводится к личность

Коэффициенты c i задаются элементарными симметричными полиномами собственных значений A . Используя тождества Ньютона , элементарные симметричные полиномы, в свою очередь, могут быть выражены через симметричные полиномы суммы степеней собственных значений:

trAk )следAk . _ c iA

В общем случае формула для коэффициентов c i задается в терминах полных экспоненциальных полиномов Белла как [nb 1]

В частности, определитель A равен (−1) n c 0 . Таким образом, определитель можно записать как тождество следа :

Аналогично характеристический полином можно записать как

A−1−(−1)n = (−1)n−1inverseA

Another method for obtaining these coefficients ck for a general n × n matrix, provided no root be zero, relies on the following alternative expression for the determinant,

Mercator series
onlyλnp(λ)nλrational numbersDifferentiationλnm × m[nb 2]
Examples

For instance, the first few Bell polynomials are B0 = 1, B1(x1) = x1, B2(x1, x2) = x2
1
+ x2
, and B3(x1, x2, x3) = x3
1
+ 3 x1x2 + x3
.

Using these to specify the coefficients ci of the characteristic polynomial of a 2 × 2 matrix yields

The coefficient c0 gives the determinant of the 2 × 2 matrix, c1 minus its trace, while its inverse is given by

It is apparent from the general formula for cnk, expressed in terms of Bell polynomials, that the expressions

всегда задавайте коэффициенты c n −1 для λ n −1 и c n −2 для λ n −2 в характеристическом многочлене любой матрицы размера n  ×  n соответственно. Итак, для матрицы A 3 × 3 утверждение теоремы Кэли–Гамильтона также можно записать в виде

3 × 3n = 3
c n -3λ n -3

Аналогично можно написать для матрицы A 4 × 4 :

где теперь определитель равен c n −4 ,

и так далее для больших матриц. Все более сложные выражения для коэффициентов c k выводятся из тождеств Ньютона или алгоритма Фаддеева – Леверье .

n -я степень матрицы

Теорема Кэли-Гамильтона всегда обеспечивает связь между степенями A (хотя и не всегда самую простую), что позволяет упростить выражения, включающие такие степени, и вычислять их без необходимости вычисления степени An или каких-либо более высоких степеней A. .

В качестве примера теорема приводит

Затем, чтобы вычислить A 4 , обратите внимание

Обратите внимание, что мы смогли записать степень матрицы как сумму двух слагаемых. Фактически, степень матрицы любого порядка k можно записать в виде матричного полинома степени не выше n - 1 , где n - размер квадратной матрицы. Это тот случай, когда теорему Кэли-Гамильтона можно использовать для выражения матричной функции, которую мы систематически обсудим ниже.

Матричные функции

Учитывая аналитическую функцию

p ( x )nAn  ×  n
q ( x )r ( x )0 ≤ deg r ( x ) < n

По теореме Кэли-Гамильтона замена x на матрицу A дает p ( A ) = 0 , поэтому имеем

Таким образом, аналитическую функцию матрицы A можно выразить в виде матричного многочлена степени меньше n .

Пусть полином остатка равен

p ( λ ) = 0f ( x )nдает
n линейных уравненийc i

Когда собственные значения повторяются, то есть λ i = λ j для некоторого i ≠ j , два или более уравнений идентичны; и, следовательно, линейные уравнения не могут быть решены однозначно. В таких случаях для собственного значения λ с кратностью m первые m – 1 производные p ( x ) обращаются в нуль в собственном значении. Это приводит к дополнительным m – 1 линейно независимым решениям.

nc i

Поиск полинома, проходящего через точки ( λ i ,   f  ( λ i )) по сути является проблемой интерполяции и может быть решен с использованием методов интерполяции Лагранжа или Ньютона , что приводит к формуле Сильвестра .

Например, предположим, что задача состоит в том, чтобы найти полиномиальное представление

Характеристический полином равен p ( x ) = ( x - 1)( x - 3) = x 2 - 4 x + 3 , а собственные значения равны λ = 1, 3 . Пусть р ( Икс ) знак равно c 0 + c 1 Икс . Оценивая f ( λ ) = r ( λ ) по собственным значениям, получаем два линейных уравнения: e t = c 0 + c 1 и e 3 t = c 0 + 3 c 1 .

Решение уравнений дает c 0 знак равно (3 е т - е 3 т )/2 и c 1 знак равно ( е 3 т - е т )/2 . Таким образом, следует, что

Если бы вместо этого функция была f ( A ) = sin At , то коэффициенты были бы c 0 = (3 sin t - sin 3 t )/2 и c 1 = (sin 3 t - sin t )/2 ; следовательно

В качестве еще одного примера, при рассмотрении

p ( x ) = x 2  + 1λ = ± i

Как и раньше, вычисление функции по собственным значениям дает нам линейные уравнения e it = c 0 + ic 1 и e it = c 0ic 1 ; решение которого дает, c 0 = ( e it + e - it )/2 = cos  t и c 1 = ( e it - e - it )/2 i = sin  t . Таким образом, для этого случая

матрицей вращения

Стандартными примерами такого использования являются экспоненциальное отображение алгебры Ли матричной группы Ли в группу. Оно задается матричной экспонентой ,

SU(2)
σматрицы ПаулиSO(3)
формулой вращения РодригесаГруппа трехмерных вращений № Заметка об алгебрах Ли

Совсем недавно появились выражения для других групп, таких как группа Лоренца SO(3, 1) , [10] O(4, 2) [11] и SU(2, 2) , [12] а также GL( n , Р ) . [13] Группа O(4, 2)конформная группа пространства -времени , SU(2, 2) — её односвязное покрытие (точнее, односвязное покрытие связной компоненты SO + (4, 2) пространства O (4, 2) ). Полученные выражения относятся к стандартному представлению этих групп. Для возведения в степень они требуют знания (некоторых) собственных значений матрицы. Для SU(2) (и, следовательно, для SO(3) ) получены замкнутые выражения для всех неприводимых представлений, т. е. любого спина. [14]

Фердинанд Георг Фробениус (1849–1917), немецкий математик. Его основными интересами были эллиптические функции , дифференциальные уравнения , а затем теория групп .
В 1878 году он дал первое полное доказательство теоремы Кэли-Гамильтона. [9]

Алгебраическая теория чисел

Теорема Кэли-Гамильтона — эффективный инструмент для вычисления минимального многочлена целых алгебраических чисел . Например, учитывая конечное расширение и целое алгебраическое число , которое является ненулевой линейной комбинацией, мы можем вычислить минимальный полином, найдя матрицу, представляющую линейное преобразование.

[15]

Доказательства

Теорема Кэли–Гамильтона является непосредственным следствием существования жордановой нормальной формы для матриц над алгебраически замкнутыми полями , см. Жордановую нормальную форму § Теорема Кэли–Гамильтона . В этом разделе представлены прямые доказательства.

Как показывают приведенные выше примеры, получение утверждения теоремы Кэли–Гамильтона для матрицы размера n  ×  n

c it

а затем эти коэффициенты используются в линейной комбинации степеней A , которая приравнивается к нулевой матрице размера n  ×  n :

Левую часть можно преобразовать в матрицу размера n  ×  n , элементы которой представляют собой (огромные) полиномиальные выражения в наборе элементов a i , j из A , поэтому теорема Кэли-Гамильтона утверждает, что каждое из этих n 2 выражений равно 0 . Для любого фиксированного значения n эти тождества можно получить с помощью утомительных, но простых алгебраических манипуляций. Однако ни одно из этих вычислений не может показать, почему теорема Кэли-Гамильтона должна быть справедливой для матриц всех возможных размеров n , поэтому необходимо единообразное доказательство для всех n .

Предварительные сведения

Если вектор v размера n является собственным вектором A с собственным значением λ , другими словами, если Av = λv , то

p ( λ ) = 0Aкорнями( t )λAбазисA диагонализуема ,A

Рассмотрим теперь функцию , которая отображает матрицы размера n  ×  n в матрицы размера n  ×  n , заданные формулой , т. е. которая берет матрицу и подставляет ее в свой собственный характеристический полином. Не все матрицы диагонализуемы, но для матриц с комплексными коэффициентами многие из них таковы: множество диагонализируемых комплексных квадратных матриц заданного размера плотно во множестве всех таких квадратных матриц [16] (чтобы матрица была диагонализуемой, достаточно например, что его характеристический полином не имеет кратных корней ). Теперь, если рассматривать ее как функцию (поскольку в матрицах есть элементы), мы видим, что эта функция непрерывна . Это верно, поскольку элементы изображения матрицы задаются полиномами в элементах матрицы. С

и поскольку набор плотен, по непрерывности эта функция должна отображать весь набор матриц размера n  ×  n в нулевую матрицу. Следовательно, теорема Кэли-Гамильтона верна для комплексных чисел и, следовательно, должна быть справедлива и для - или -значных матриц.

Хотя это и дает валидное доказательство, аргумент не очень удовлетворительный, поскольку тождества, представляемые теоремой, никоим образом не зависят ни от природы матрицы (диагонализуемой или нет), ни от типа разрешенных элементов (для матриц с реальные элементы (диагонализуемые) не образуют плотного множества, и кажется странным, что пришлось бы рассматривать комплексные матрицы, чтобы увидеть, что для них справедлива теорема Кэли–Гамильтона). Поэтому мы теперь будем рассматривать только те рассуждения, которые доказывают теорему непосредственно для любой матрицы, используя только алгебраические манипуляции; они также имеют то преимущество, что работают с матрицами с элементами в любом коммутативном кольце .

Существует множество таких доказательств теоремы Кэли–Гамильтона, некоторые из которых будут приведены здесь. Они различаются по количеству абстрактных алгебраических понятий, необходимых для понимания доказательства. Простейшие доказательства используют только те понятия, которые необходимы для формулировки теоремы (матрицы, многочлены с числовыми элементами, определители), но включают в себя технические вычисления, которые делают несколько загадочным тот факт, что они приводят именно к правильному выводу. Таких подробностей можно избежать, но ценой привлечения более тонких алгебраических понятий: многочленов с коэффициентами в некоммутативном кольце или матриц с необычными типами элементов.

Сопряженные матрицы

Во всех приведенных ниже доказательствах используется понятие сопряженной матрицы adj( M ) матрицы M размера n  ×  n , транспонированной ее матрицы-сомножителя . Это матрица, коэффициенты которой задаются полиномиальными выражениями в коэффициентах M (фактически, определенными ( n - 1) × ( n - 1) определителями), таким образом, что выполняются следующие фундаментальные соотношения:

( i , j )jMijdet( M )i = j

Являясь следствием простого манипулирования алгебраическими выражениями, эти соотношения действительны для матриц с элементами в любом коммутативном кольце (для определения определителей необходимо предположить коммутативность). Здесь важно отметить это, поскольку эти отношения будут применяться ниже к матрицам с нечисловыми элементами, такими как полиномы.

Прямое алгебраическое доказательство

В этом доказательстве используются именно те объекты, которые необходимы для формулировки теоремы Кэли–Гамильтона: матрицы с полиномами в качестве элементов. Матрица t I nA , определителем которой является характеристический многочлен матрицы A , является такой матрицей, и, поскольку многочлены образуют коммутативное кольцо, она имеет сопряженное

Поскольку B также является матрицей с полиномами от t в качестве элементов, можно для каждого i собрать коэффициенты при t i в каждой записи, чтобы сформировать матрицу чисел B i , такую, что

Bt n −1выглядитnt i

Теперь можно разложить матричное произведение в нашем уравнении по билинейности:

Письмо

t

Такое равенство может выполняться только в том случае, если в любой позиции матрицы элемент, умножаемый на заданную степень t i , одинаков с обеих сторон; следует, что постоянные матрицы с коэффициентом t i в обоих выражениях должны быть равны. Записав эти уравнения затем для i от n до 0, можно найти

Наконец, умножьте уравнение коэффициентов t i слева на A i и просуммируйте:

Левые части образуют телескопическую сумму и полностью сокращаются; правые части в сумме дают :

Доказательство с использованием полиномов с матричными коэффициентами.

Это доказательство похоже на первое, но пытается придать смысл понятию многочлена с матричными коэффициентами, которое было предложено выражениями, встречающимися в этом доказательстве. Это требует значительной осторожности, поскольку несколько необычно рассматривать многочлены с коэффициентами в некоммутативном кольце, и не все рассуждения, справедливые для коммутативных многочленов, могут быть применены в этом случае.

Примечательно, что хотя арифметика полиномов над коммутативным кольцом моделирует арифметику полиномиальных функций , это не относится к некоммутативному кольцу (фактически в этом случае не существует очевидного понятия полиномиальной функции, замкнутой при умножении). Поэтому при рассмотрении полиномов от t с матричными коэффициентами переменную t следует рассматривать не как «неизвестную», а как формальный символ, которым нужно манипулировать в соответствии с заданными правилами; в частности, нельзя просто установить t на определенное значение.

Пусть — кольцо матриц размера n  ×  n с элементами в некотором кольце R (например, вещественных или комплексных чисел), элементом которого является A. Матрицы с полиномами коэффициентов от t , такие как или его сопряженный B в первом доказательстве, являются элементами .

Собирая одинаковые степени t , такие матрицы можно записать как «полиномы» от t с постоянными матрицами в качестве коэффициентов; напишите для множества таких многочленов. Поскольку это множество находится в взаимно однозначном соответствии с , над ним соответственно определяются арифметические операции, в частности, умножение задается формулой

Таким образом, тождество

На этом этапе возникает соблазн просто установить t равным матрице A , что делает первый множитель слева равным нулевой матрице, а правую часть — p ( A ) ; однако это недопустимая операция, если коэффициенты не коммутируют. Можно определить «карту с правой оценкой» ev A  : M [ t  ] → M , которая заменяет каждое ti матричной степенью A i A , где оговаривается , что степень всегда должна умножаться справа. соответствующему коэффициенту. Но это отображение не является кольцевым гомоморфизмом : правая оценка произведения, вообще говоря, отличается от произведения правых оценок. Это так, потому что умножение полиномов на матричные коэффициенты не моделирует умножение выражений, содержащих неизвестные: произведение определяется в предположении, что t коммутирует с N , но это может потерпеть неудачу, если t заменить матрицей A.

Эту трудность можно обойти в конкретной ситуации, поскольку указанное выше отображение с правым вычислением действительно становится кольцевым гомоморфизмом, если матрица A находится в центре кольца коэффициентов, так что она коммутирует со всеми коэффициентами многочленов. (аргумент, доказывающий это, прост, именно потому, что коммутация t с коэффициентами теперь оправдана после вычисления).

Теперь A не всегда находится в центре M , но мы можем заменить M кольцом меньшего размера при условии, что оно содержит все коэффициенты рассматриваемых многочленов: , A и коэффициенты многочлена B . Очевидным выбором для такого подкольца является централизатор Z кольца A , подкольцо всех матриц, коммутирующих с A ; по определению A находится в центре Z.

Этот централизатор, очевидно , содержит и А , но нужно показать, что он содержит матрицы . Для этого объединяем два фундаментальных соотношения для адъюгатов, записывая адъюгат B в виде многочлена:

Приравнивание коэффициентов показывает, что для каждого i имеем AB i = B i A , как и хотелось. Найдя подходящую ситуацию, в которой ev A действительно является гомоморфизмом колец, можно завершить доказательство, как предложено выше:

Синтез первых двух доказательств

В первом доказательстве удалось определить коэффициенты B i функции B на основе правого фундаментального соотношения только для сопряженного. Фактически первые n полученных уравнений можно интерпретировать как определение фактора B евклидова деления многочлена p ( t ) I n слева по моническому многочлену I n tA , в то время как последнее уравнение выражает тот факт, что остаток равен нулю. Это деление осуществляется в кольце многочленов с матричными коэффициентами. Действительно, даже над некоммутативным кольцом евклидово деление на монический многочлен P определено и всегда дает уникальное частное и остаток с тем же условием степени , что и в коммутативном случае, при условии, что указано, на какой стороне нужно, чтобы P быть фактором (здесь это слева).

Чтобы увидеть, что частное и остаток уникальны (что является важной частью утверждения здесь), достаточно написать as и заметить, что, поскольку P является унитарным, P ( QQ ′) не может иметь степень меньше, чем степень P , если только Q знак равно Q .

Но использованные здесь делимое p ( t ) I n и делитель I n tA лежат в подкольце ( R [ A ])[ t ] , где R [ A ] — подкольцо кольца матриц M ( n , R ) , порожденный A : R -линейная совокупность всех степеней A. Следовательно, евклидово деление фактически может быть выполнено внутри этого коммутативного кольца полиномов, и, конечно, тогда оно дает то же частное B и остаток 0, что и в большем кольце; в частности, это показывает, что B на самом деле лежит в ( R [ A ])[ t ] .

Но в этой коммутативной ситуации допустимо установить t равным A в уравнении

другими словами, применить оценочную карту

который является кольцевым гомоморфизмом, дающим

как и во втором доказательстве, по желанию.

В дополнение к доказательству теоремы приведенный выше аргумент говорит нам, что коэффициенты B i группы B являются полиномами от A , тогда как из второго доказательства мы знали только, что они лежат в централизаторе Z группы A ; вообще Z — большее подкольцо, чем R [ A ] и не обязательно коммутативное. В частности, постоянный член B 0 = adj(− A ) лежит в R [ A ] . Поскольку A — произвольная квадратная матрица, это доказывает, что adj( A ) всегда можно выразить как полином от A (с коэффициентами, зависящими от A ) .

Фактически, уравнения, найденные в первом доказательстве, позволяют последовательно выразиться в виде полиномов от A , что приводит к тождеству

справедливо для всех матриц размера n  ×  n , где

A

Заметим, что из этого тождества также следует утверждение теоремы Кэли–Гамильтона: можно переместить adj(− A ) в правую часть, умножить полученное уравнение (слева или справа) на A и воспользоваться тем, что

Доказательство с использованием матриц эндоморфизмов

Как упоминалось выше, матрица p ( A ) в формулировке теоремы получается сначала вычислением определителя, а затем заменой t на матрицу A ; выполнение этой замены в матрице перед вычислением определителя не имеет смысла. Тем не менее, можно дать интерпретацию, где p ( A ) получается непосредственно как значение некоторого определителя, но это требует более сложной настройки, одной из матриц над кольцом, в которой можно интерпретировать оба элемента A , и весь сам А. Для этого можно было бы взять кольцо M ( n , R ) матриц размера n  ×  n над R , где элемент реализуется как , а A как он сам. Но рассмотрение матриц с матрицами в качестве элементов может привести к путанице с блочными матрицами , что не предусмотрено, поскольку это дает неверное представление об определителе (напомним, что определитель матрицы определяется как сумма произведений ее элементов, и в случае блочной матрицы это, как правило, не то же самое, что соответствующая сумма произведений ее блоков!). Гораздо яснее отличить A от эндоморфизма φ n - мерного векторного пространства V (или свободного R -модуля, если R не является полем), определенного им в базисе , и взять матрицы над кольцом End( V ) все такие эндоморфизмы. Тогда φ ∈ End( V ) является возможным элементом матрицы, а A обозначает элемент M ( n , End( V )) , элемент i ,  j которого является эндоморфизмом скалярного умножения на ; аналогично будет интерпретироваться как элемент M ( n , End( V )) . Однако, поскольку End( V ) не является коммутативным кольцом, на M ( n , End( V )) не определен определитель ; это можно сделать только для матриц над коммутативным подкольцом End( V ) . Теперь все элементы матрицы лежат в подкольце R [ φ ] порожден тождеством и φ , который является коммутативным. Затем определяетсядетерминантное отображение M ( n , R [ φ ]) → R [ φ ] и вычисляет значение p ( φ ) характеристического многочлена A в точке φ (это справедливо независимо от отношения между A и φ ) ; теорема Кэли-Гамильтона утверждает, что p ( φ ) является нулевым эндоморфизмом.

В этой форме можно получить следующее доказательство из доказательства Атьи и Макдональда (1969, предложение 2.4) (которое на самом деле является более общим утверждением, связанным с леммой Накаямы ; в этом предложении в качестве идеала принимается все кольцо R ). Тот факт, что A является матрицей φ в базисе e 1 , ..., en , означает, что

nV nM ( n , End( V )) × V nV nψ ∈ End( V )vV
ieie 1 , ..., en V , записанный
транспонированиеM ( n , R [ φ ]))pφp ( φ ) = 0 ∈ End( V )матрицуM ( n , R [ φ ])
операцийip ( φ )( e i ) = 0 ∈ Vp ( φ )eiV ,p ( φ ) = 0 ∈ End( V )

Еще один факт, который следует из этого доказательства, состоит в том, что матрица A , характеристический полином которой взят, не обязательно должна быть идентична значению φ , подставленному в этот многочлен; достаточно, чтобы φ был эндоморфизмом V , удовлетворяющим исходным уравнениям

некоторойe 1 , ..., en ,VnRсвободным модулем ).

Фальшивое «доказательство»: p ( A ) = det( AI n - A ) = det( A - A ) = 0

Один настойчивый элементарный, но неверный аргумент [17] в пользу теоремы состоит в том, чтобы «просто» взять определение

Aλ

Есть много способов понять, почему этот аргумент неверен. Во-первых, в теореме Кэли-Гамильтона p ( A ) является матрицей размера n × n . Однако правая часть приведенного выше уравнения представляет собой значение определителя, который является скаляром . Поэтому их нельзя приравнять, если n = 1 (т. е. A — просто скаляр). Во-вторых, в выражении переменная λ фактически встречается в диагональных элементах матрицы . Для иллюстрации снова рассмотрим характеристический полином из предыдущего примера:

Если заменить всю матрицу A на λ в этих позициях, получим

в котором «матричное» выражение просто недопустимо. Однако обратите внимание, что если в вышеприведенном вычитаются скалярные кратные единичных матриц вместо скаляров, т.е. если замена выполняется как

тогда определитель действительно равен нулю, но рассматриваемая расширенная матрица не имеет значения ; и его определитель (скаляр) нельзя сравнивать с p ( A ) (матрицей). Так что аргумент, который до сих пор не применим.

На самом деле, если такой аргумент верен, он должен быть верен и тогда, когда вместо определителя используются другие полилинейные формы . Например, если мы рассмотрим постоянную функцию и определим , то с помощью того же аргумента мы сможем «доказать», что q ( A ) = 0 . Но это утверждение явно неверно: например, в двумерном случае перманент матрицы определяется выражением

Итак, для матрицы A в предыдущем примере:

И все же можно убедиться в том, что

Одно из приведенных выше доказательств теоремы Кэли-Гамильтона имеет некоторое сходство с аргументом о том, что . Вводя матрицу с нечисловыми коэффициентами, можно фактически позволить A жить внутри элемента матрицы, но тогда он не равен A , и вывод достигается по-другому.

Доказательства методами абстрактной алгебры.

Основные свойства дифференцирований Хассе–Шмидта на внешней алгебре некоторого B - модуля M (предполагаемого свободным и конечного ранга) были использованы Гатто и Салехианом (2016, §4) для доказательства теоремы Кэли–Гамильтона. См. также Гатто и Щербак (2015).

Абстракция и обобщения

Приведенные выше доказательства показывают, что теорема Кэли–Гамильтона справедлива для матриц с элементами в любом коммутативном кольце R и что p ( φ ) = 0 будет выполняться всякий раз, когда φ является эндоморфизмом R -модуля, порожденного элементами e 1 ,... , en что удовлетворяет

Эта более общая версия теоремы является источником знаменитой леммы Накаямы в коммутативной алгебре и алгебраической геометрии .

Теорема Кэли-Гамильтона также справедлива для матриц над кватернионами , некоммутативным кольцом . [18] [номер 3]

Смотрите также

Примечания

  1. ^ См. раздел. 2 Криворученко (2016). Явное выражение для коэффициентов c i предоставлено Кондратюком и Криворученко (1992):
    где сумма берется по множествам всех целочисленных разбиений k l ≥ 0 , удовлетворяющих уравнению
  2. ^ См., например, с. 54 Брауна 1994 года, в котором решается формула Якоби .
    где B — сопряженная матрица следующего раздела. Также существует эквивалентный родственный рекурсивный алгоритм, предложенный Урбеном Леверье и Дмитрием Константиновичем Фаддеевым , — алгоритм Фаддеева–Леверье , который читается
    (см., например, Gantmacher 1960, стр. 88.) Наблюдаем A −1 = − M n / c 0 , когда рекурсия завершается. См. алгебраическое доказательство в следующем разделе, которое основано на модах сопряжения B kM nk . В частности, и приведенная выше производная от p , если ее проследить, дает
    (Hou 1998) и вышеупомянутые рекурсии, в свою очередь.
  3. ^ Из-за некоммутативного характера операции умножения для кватернионов и связанных с ней конструкций необходимо проявлять осторожность при определениях, особенно в этом контексте, для определителя. Теорема справедлива и для немного менее «хороших» расщепленных кватернионов , см. Alagös, Oral & Yüce (2012). Кольца кватернионов и разделенные кватернионы могут быть представлены определенными комплексными матрицами размера 2 × 2 . (Если ограничиться единичной нормой, это группы SU(2) и SU(1,1) соответственно.) Поэтому неудивительно, что теорема верна. Для октонионов
    такого матричного представления не существует , поскольку операция умножения в данном случае не ассоциативна . Однако модифицированная теорема Кэли-Гамильтона по-прежнему справедлива для октонионов, см. Tian (2000).

Примечания

  1. ^ аб Крилли 1998
  2. ^ аб Гамильтон 1864a
  3. ^ аб Гамильтон 1864b
  4. ^ аб Гамильтон 1862 г.
  5. ^ Атья и Макдональд 1969
  6. ^ Гамильтон 1853, с. 562
  7. ^ Кэли 1858, стр. 17–37.
  8. ^ Кэли 1889, стр. 475–496.
  9. ^ аб Фробениус 1878 г.
  10. ^ Зени и Родригес 1992
  11. ^ Барут, Зени и Лауфер 1994a
  12. ^ Барут, Зени и Лауфер, 1994b.
  13. ^ Лауфер 1997
  14. ^ Куртрайт, Фэрли и Захос, 2014 г.
  15. ^ Штейн, Уильям. Алгебраическая теория чисел, вычислительный подход (PDF) . п. 29.
  16. ^ Бхатия 1997, с. 7
  17. ^ Гарретт 2007, с. 381
  18. ^ Чжан 1997

Рекомендации

Внешние ссылки