Основная теорема алгебры , также называемая теоремой Даламбера [1] или теоремой Даламбера–Гаусса [2] , утверждает, что каждый непостоянный одномерный многочлен с комплексными коэффициентами имеет по крайней мере один комплексный корень . Это включает в себя многочлены с действительными коэффициентами, поскольку каждое действительное число является комплексным числом с мнимой частью , равной нулю.
Эквивалентно (по определению) теорема утверждает, что поле комплексных чисел алгебраически замкнуто .
Теорема также формулируется следующим образом: каждый ненулевой, однопараметрический, степени n многочлен с комплексными коэффициентами имеет, с учетом кратности , ровно n комплексных корней. Эквивалентность двух утверждений может быть доказана с помощью последовательного деления многочленов .
Несмотря на свое название, он не является основополагающим для современной алгебры ; он был назван так, когда алгебра была синонимом теории уравнений .
Питер Рот Альбер Жирар в своей книге L'invention nouvelle en l'Algèbre (опубликованной в 1629 году) утверждал, что полиномиальное уравнение степени n имеет n решений, но он не утверждал, что они должны быть действительными числами. Кроме того, он добавил, что его утверждение справедливо «если только уравнение не является неполным», под чем он подразумевал, что ни один коэффициент не равен 0. Однако, когда он подробно объясняет, что он имеет в виду, становится ясно, что он на самом деле верит, что его утверждение всегда верно; например, он показывает, что уравнение, хотя и неполное, имеет четыре решения (с учетом кратностей): 1 (дважды) и
в своей книге Arithmetica Philosophica (опубликованной в 1608 году в Нюрнберге Иоганном Ланценбергером) [3] писал, что полиномиальное уравнение степени n (с действительными коэффициентами) может иметь n решений.Как будет снова упомянуто ниже, из основной теоремы алгебры следует, что любой непостоянный многочлен с действительными коэффициентами может быть записан в виде произведения многочленов с действительными коэффициентами, степени которых равны либо 1, либо 2. Однако в 1702 году Лейбниц ошибочно сказал, что никакой многочлен типа x 4 + a 4 (с действительным и отличным от 0) не может быть записан таким образом. Позднее Николай Бернулли сделал то же самое утверждение относительно многочлена x 4 − 4 x 3 + 2 x 2 + 4 x + 4 , но он получил письмо от Эйлера в 1742 году [4], в котором было показано, что этот многочлен равен
Также Эйлер указал, что
Первая попытка доказать теорему была сделана Даламбером в 1746 году, но его доказательство было неполным. Среди прочих проблем, оно неявно предполагало теорему (теперь известную как теорема Пюизё ), которая была доказана только более чем столетие спустя и с использованием фундаментальной теоремы алгебры. Другие попытки были предприняты Эйлером (1749), де Фонсенексом (1759), Лагранжем (1772) и Лапласом (1795). Эти последние четыре попытки неявно предполагали утверждение Жирара; если быть более точным, предполагалось существование решений, и оставалось доказать только то, что их форма была a + bi для некоторых действительных чисел a и b . Говоря современным языком, Эйлер, де Фонсенекс, Лагранж и Лаплас предполагали существование поля расщепления многочлена p ( z ).
В конце 18 века были опубликованы два новых доказательства, которые не предполагали существования корней, но ни одно из них не было полным. Одно из них, принадлежащее Джеймсу Вуду и в основном алгебраическое, было опубликовано в 1798 году и было полностью проигнорировано. Доказательство Вуда имело алгебраический пробел. [5] Другое было опубликовано Гауссом в 1799 году и было в основном геометрическим, но имело топологический пробел, заполненный только Александром Островским в 1920 году, как обсуждалось в Smale (1981). [6]
Первое строгое доказательство было опубликовано Арганом , математиком-любителем , в 1806 году (и пересмотрено в 1813 году); [7] именно здесь впервые была сформулирована фундаментальная теорема алгебры для многочленов с комплексными коэффициентами, а не только с действительными коэффициентами. Гаусс представил два других доказательства в 1816 году и еще одну неполную версию своего первоначального доказательства в 1849 году.
Первым учебником, содержащим доказательство теоремы, был « Cours d'analyse de l'École Royale Polytechnique» Коши (1821). Он содержал доказательство Аргана, хотя Аргану оно не приписывается.
Ни одно из упомянутых до сих пор доказательств не является конструктивным . Именно Вейерштрасс впервые поднял в середине XIX века проблему нахождения конструктивного доказательства основной теоремы алгебры. Он представил свое решение, которое в современных терминах представляет собой комбинацию метода Дюрана–Кернера с принципом продолжения гомотопии , в 1891 году. Другое доказательство такого рода было получено Хельмутом Кнезером в 1940 году и упрощено его сыном Мартином Кнезером в 1981 году.
Без использования счетного выбора невозможно конструктивно доказать основную теорему алгебры для комплексных чисел, основанную на действительных числах Дедекинда (которые конструктивно не эквивалентны действительным числам Коши без счетного выбора). [8] Однако Фред Ричман доказал переформулированную версию теоремы, которая работает. [9]
Существует несколько эквивалентных формулировок теоремы:
Следующие два утверждения эквивалентны предыдущим, хотя они не содержат никаких недействительных комплексных чисел. Эти утверждения можно доказать из предыдущих факторизаций, заметив, что если r — недействительный корень многочлена с действительными коэффициентами, его комплексно сопряженный корень также является корнем и является многочленом второй степени с действительными коэффициентами (это теорема о комплексно сопряженных корнях ). И наоборот, если есть множитель второй степени, квадратичная формула дает корень.
Все доказательства ниже включают в себя некоторый математический анализ или, по крайней мере, топологическое понятие непрерывности действительных или комплексных функций. Некоторые также используют дифференцируемые или даже аналитические функции. Это требование привело к замечанию, что Основная теорема алгебры не является ни основной, ни теоремой алгебры. [10]
Некоторые доказательства теоремы доказывают только то, что любой непостоянный многочлен с действительными коэффициентами имеет некоторый комплексный корень. Эта лемма достаточна для установления общего случая, поскольку для непостоянного многочлена p с комплексными коэффициентами многочлен
имеет только действительные коэффициенты, и, если z является корнем q , то либо z , либо его сопряженный элемент является корнем p . Здесь — многочлен, полученный заменой каждого коэффициента p его комплексно сопряженным элементом ; корни являются в точности комплексно сопряженными корнями p
Многие неалгебраические доказательства теоремы используют тот факт (иногда называемый «леммой роста»), что полиномиальная функция p ( z ) степени n , доминирующий коэффициент которой равен 1, ведет себя как z n , когда | z | достаточно велико. Точнее, существует некоторое положительное действительное число R такое, что
когда | z | > R .
Даже не используя комплексные числа, можно показать, что действительный многочлен p ( x ): p (0) ≠ 0 степени n > 2 всегда можно разделить на некоторый квадратичный многочлен с действительными коэффициентами. [11] Другими словами, для некоторых действительных a и b коэффициенты линейного остатка от деления p ( x ) на x 2 − ax − b одновременно обращаются в нуль.
где q ( x ) — многочлен степени n − 2. Коэффициенты R p ( x ) ( a , b ) и S p ( x ) ( a , b ) не зависят от x и полностью определяются коэффициентами p ( x ). С точки зрения представления, R p ( x ) ( a , b ) и S p ( x ) ( a , b ) являются двумерными многочленами от a и b . В духе первого (неполного) доказательства Гаусса этой теоремы от 1799 года ключ заключается в том, чтобы показать, что для любого достаточно большого отрицательного значения b все корни как R p ( x ) ( a , b ), так и S p ( x ) ( a , b ) в переменной a являются действительными и чередуются друг с другом (свойство чередования). Используя цепочку типа Штурма , содержащую R p ( x ) ( a , b ) и S p ( x ) ( a , b ) в качестве последовательных членов, можно показать переплетение в переменной a для всех последовательных пар в цепочке, когда b имеет достаточно большое отрицательное значение. Поскольку S p ( a , b = 0) = p (0) не имеет корней, переплетение R p ( x ) ( a , b ) и S p ( x ) ( a , b ) в переменной a не выполняется при b = 0. Топологические аргументы можно применить к свойству переплетения, чтобы показать, что геометрическое место корней R p ( x ) ( a , b ) и S p (x ) ( a , b ) должны пересекаться для некоторых действительных значений a и b < 0.
Найдите замкнутый диск D радиуса r с центром в начале координат, такой что | p ( z )| > | p (0)| всякий раз, когда | z | ≥ r . Минимум | p ( z )| на D , который должен существовать, поскольку D компактен , поэтому достигается в некоторой точке z 0 внутри D , но не в любой точке его границы. Принцип максимального модуля, примененный к 1/ p ( z ), подразумевает, что p ( z 0 ) = 0. Другими словами, z 0 является нулем p ( z ).
Разновидность этого доказательства не требует принципа максимума модуля (на самом деле, аналогичное рассуждение также дает доказательство принципа максимума модуля для голоморфных функций). Продолжая с того момента, как принцип был вызван, если a := p ( z 0 ) ≠ 0, то, разлагая p ( z ) по степеням z − z 0 , мы можем записать
Здесь c j — это просто коэффициенты полинома z → p ( z + z 0 ) после разложения, а k — индекс первого ненулевого коэффициента, следующего за постоянным членом. Для z, достаточно близкого к z 0 , эта функция ведет себя асимптотически аналогично более простому полиному . Точнее, функция
для некоторой положительной константы M в некоторой окрестности z 0 . Поэтому, если мы определим и позволим провести окружность радиуса r > 0 вокруг z , то для любого достаточно малого r (так, чтобы граница M сохранялась), мы увидим, что
Когда r достаточно близко к 0, эта верхняя граница для | p ( z )| строго меньше, чем | a |, что противоречит определению z 0 . Геометрически мы нашли явное направление θ 0 такое, что если приближаться к z 0 с этого направления, то можно получить значения p ( z ) меньшие по абсолютной величине, чем | p ( z 0 )|.
Другое аналитическое доказательство может быть получено в этом направлении мысли, наблюдая, что, поскольку | p ( z )| > | p (0)| вне D , минимум | p ( z )| на всей комплексной плоскости достигается в точке z 0 . Если | p ( z 0 )| > 0, то 1/ p является ограниченной голоморфной функцией на всей комплексной плоскости, поскольку для каждого комплексного числа z , |1/ p ( z )| ≤ |1/ p ( z 0 )|. Применяя теорему Лиувилля , которая утверждает, что ограниченная целая функция должна быть постоянной, это означало бы, что 1/ p является постоянной и, следовательно, что p является постоянной. Это дает противоречие, и, следовательно, p ( z 0 ) = 0. [12]
Еще одно аналитическое доказательство использует принцип аргумента . Пусть R будет положительным действительным числом, достаточно большим, чтобы каждый корень p ( z ) имел абсолютное значение, меньшее, чем R ; такое число должно существовать, поскольку каждая непостоянная полиномиальная функция степени n имеет не более n нулей. Для каждого r > R рассмотрим число
где c ( r ) — круг с центром в точке 0 и радиусом r , ориентированный против часовой стрелки; тогда принцип аргумента гласит, что это число — число N нулей p ( z ) в открытом шаре с центром в точке 0 и радиусом r , которое, поскольку r > R , является общим числом нулей p ( z ). С другой стороны, интеграл n / z вдоль c ( r ), деленный на 2π i , равен n . Но разность между двумя числами равна
Числитель интегрируемого рационального выражения имеет степень не выше n − 1, а степень знаменателя равна n + 1. Следовательно, число выше стремится к 0 при r → +∞. Но число также равно N − n и поэтому N = n .
Другое комплексно-аналитическое доказательство может быть дано путем объединения линейной алгебры с теоремой Коши . Чтобы установить, что каждый комплексный многочлен степени n > 0 имеет ноль, достаточно показать, что каждая комплексная квадратная матрица размера n > 0 имеет (комплексное) собственное значение . [13] Доказательство последнего утверждения — от противного .
Пусть A — комплексная квадратная матрица размера n > 0, а I n — единичная матрица того же размера. Предположим, что A не имеет собственных значений. Рассмотрим резольвентную функцию
которая является мероморфной функцией на комплексной плоскости со значениями в векторном пространстве матриц. Собственные значения A являются в точности полюсами R ( z ). Поскольку, по предположению, A не имеет собственных значений, функция R ( z ) является целой функцией , и теорема Коши подразумевает, что
С другой стороны, R ( z ), разложенный в геометрическую прогрессию, дает:
Эта формула верна вне замкнутого круга радиуса ( норма оператора A ) . Пусть Тогда
(в котором только слагаемое k = 0 имеет ненулевой интеграл). Это противоречие, и поэтому A имеет собственное значение.
Наконец, теорема Руше дает, возможно, самое короткое доказательство теоремы.
Предположим, что минимум | p ( z )| на всей комплексной плоскости достигается в точке z 0 ; при доказательстве, использующем теорему Лиувилля, было видно, что такое число должно существовать. Мы можем записать p ( z ) как многочлен от z − z 0 : существует некоторое натуральное число k и существуют некоторые комплексные числа c k , c k + 1 , ..., c n такие, что c k ≠ 0 и:
Если p ( z 0 ) ненулевое, то отсюда следует, что если a является корнем степени k из − p ( z 0 )/ c k и если t положительно и достаточно мало, то | p ( z 0 + ta )| < | p ( z 0 )|, что невозможно, поскольку | p ( z 0 )| является минимумом | p | на D .
Для другого топологического доказательства от противного предположим, что многочлен p ( z ) не имеет корней и, следовательно, никогда не равен 0. Подумайте о многочлене как о отображении из комплексной плоскости в комплексную плоскость. Он отображает любую окружность | z | = R в замкнутый контур, кривую P ( R ). Мы рассмотрим, что происходит с числом оборотов P ( R ) в крайних случаях, когда R очень велико и когда R = 0. Когда R является достаточно большим числом, то ведущий член z n из p ( z ) доминирует над всеми другими членами вместе взятыми; другими словами,
Когда z пересекает окружность один раз против часовой стрелки , то оборачивается n раз против часовой стрелки вокруг начала координат (0,0), и P ( R ) делает то же самое. В другом крайнем случае, при | z | = 0, кривая P (0) — это просто единственная точка p (0), которая должна быть ненулевой, потому что p ( z ) никогда не равно нулю. Таким образом, p (0) должно отличаться от начала координат (0,0), что обозначает 0 в комплексной плоскости. Число оборотов P (0) вокруг начала координат (0,0) таким образом равно 0. Теперь непрерывное изменение R будет непрерывно деформировать петлю . При некотором R число оборотов должно измениться. Но это может произойти только в том случае, если кривая P ( R ) включает начало координат (0,0) для некоторого R . Но тогда для некоторого z на этой окружности | z | = R мы имеем p ( z ) = 0, что противоречит нашему первоначальному предположению. Следовательно, p ( z ) имеет по крайней мере один ноль.
Эти доказательства основной теоремы алгебры должны использовать следующие два факта о действительных числах, которые не являются алгебраическими, но требуют лишь небольшого анализа (точнее, теорему о промежуточном значении в обоих случаях):
Второй факт, вместе с квадратичной формулой , влечет теорему для действительных квадратичных многочленов. Другими словами, алгебраические доказательства фундаментальной теоремы фактически показывают, что если R — любое действительно замкнутое поле , то его расширение C = R ( √ −1 ) алгебраически замкнуто.
Как упоминалось выше, достаточно проверить утверждение "каждый непостоянный многочлен p ( z ) с действительными коэффициентами имеет комплексный корень". Это утверждение можно доказать индукцией по наибольшему неотрицательному целому числу k такому, что 2 k делит степень n полинома p ( z ). Пусть a будет коэффициентом z n в p ( z ), а F будет полем разложения p ( z ) над C ; другими словами, поле F содержит C и существуют элементы z 1 , z 2 , ..., z n в F такие , что
Если k = 0, то n нечетно, и поэтому p ( z ) имеет действительный корень. Теперь предположим, что n = 2 k m (при нечетном m и k > 0) и что теорема уже доказана, когда степень многочлена имеет вид 2 k − 1 m ′ при нечетном m ′. Для действительного числа t определим:
Тогда коэффициенты q t ( z ) являются симметричными многочленами от z i с действительными коэффициентами. Следовательно, их можно выразить как многочлены с действительными коэффициентами от элементарных симметричных многочленов , то есть от − a 1 , a 2 , ..., (−1) n a n . Так что q t ( z ) на самом деле имеет действительные коэффициенты. Кроме того, степень q t ( z ) равна n ( n − 1)/2 = 2 k −1 m ( n − 1), а m ( n − 1) — нечетное число. Таким образом, используя предположение индукции, q t имеет по крайней мере один комплексный корень; другими словами, z i + z j + tz i z j является комплексным для двух различных элементов i и j из {1, ..., n }. Так как действительных чисел больше, чем пар ( i , j ), можно найти различные действительные числа t и s такие, что z i + z j + tz i z j и z i + z j + sz i z j являются комплексными (для тех же i и j ). Таким образом, и z i + z j , и z i z j являются комплексными числами. Легко проверить, что каждое комплексное число имеет комплексный квадратный корень, таким образом, каждый комплексный многочлен степени 2 имеет комплексный корень по квадратной формуле. Отсюда следует, что z i и z j являются комплексными числами, так как они являются корнями квадратного многочлена z 2 − ( z i + z j ) z + z i z j .
Джозеф Шипман показал в 2007 году, что предположение о том, что многочлены нечетной степени имеют корни, сильнее, чем необходимо; любое поле, в котором многочлены простой степени имеют корни, алгебраически замкнуто (поэтому «нечетное» можно заменить на «нечетное простое», и это справедливо для полей всех характеристик). [14] Для аксиоматизации алгебраически замкнутых полей это наилучшее возможное, поскольку существуют контрпримеры, если исключить одно простое число. Однако эти контрпримеры полагаются на −1, имеющий квадратный корень. Если мы возьмем поле, где −1 не имеет квадратного корня, и каждый многочлен степени n ∈ I имеет корень, где I — любой фиксированный бесконечный набор нечетных чисел, то каждый многочлен f ( x ) нечетной степени имеет корень (поскольку ( x 2 + 1) k f ( x ) имеет корень, где k выбрано так, что deg( f ) + 2 k ∈ I ).
Другое алгебраическое доказательство фундаментальной теоремы можно дать с использованием теории Галуа . Достаточно показать, что C не имеет собственного конечного расширения поля . [15] Пусть K / C — конечное расширение. Поскольку нормальное замыкание K над R все еще имеет конечную степень над C (или R ), мы можем предположить без потери общности , что K — нормальное расширение R (следовательно, это расширение Галуа , поскольку каждое алгебраическое расширение поля характеристики 0 является сепарабельным ). Пусть G — группа Галуа этого расширения, и пусть H — силовская 2-подгруппа G , так что порядок H является степенью 2, а индекс H в G нечетен . По фундаментальной теореме теории Галуа существует подрасширение L из K / R такое, что Gal( K / L ) = H . Так как [ L : R ] = [ G : H ] нечетно, и не существует нелинейных неприводимых вещественных многочленов нечетной степени, мы должны иметь L = R , таким образом, [ K : R ] и [ K : C ] являются степенями 2. Предполагая от противного, что [ K : C ] > 1, мы заключаем, что 2-группа Gal( K / C ) содержит подгруппу индекса 2, поэтому существует подрасширение M группы C степени 2. Однако C не имеет расширения степени 2, потому что каждый квадратичный комплексный многочлен имеет комплексный корень, как упоминалось выше. Это показывает, что [ K : C ] = 1, и, следовательно, K = C , что завершает доказательство.
Существует еще один способ приблизиться к фундаментальной теореме алгебры, предложенный Дж. М. Альмирой и А. Ромеро: с помощью римановых геометрических аргументов. Основная идея здесь заключается в доказательстве того, что существование непостоянного многочлена p ( z ) без нулей подразумевает существование плоской римановой метрики над сферой S 2 . Это приводит к противоречию, поскольку сфера не является плоской.
Риманова поверхность ( M , g ) называется плоской, если ее гауссова кривизна, которую мы обозначаем как K g , тождественно равна нулю. Теперь теорема Гаусса–Бонне , примененная к сфере S 2 , утверждает, что
что доказывает, что сфера не плоская.
Предположим теперь, что n > 0 и
для каждого комплексного числа z . Определим
Очевидно, p* ( z ) ≠ 0 для всех z в C . Рассмотрим многочлен f ( z ) = p ( z ) p* ( z ). Тогда f ( z ) ≠ 0 для каждого z в C . Более того,
Мы можем использовать это функциональное уравнение, чтобы доказать, что g , заданное как
для w в C и
для w ∈ S 2 \{0}, является хорошо определенной римановой метрикой над сферой S 2 (которую мы отождествляем с расширенной комплексной плоскостью C ∪ {∞}).
Теперь простой расчет показывает, что
поскольку действительная часть аналитической функции является гармонической. Это доказывает, что K g = 0.
Поскольку фундаментальную теорему алгебры можно рассматривать как утверждение, что поле комплексных чисел алгебраически замкнуто , отсюда следует, что любая теорема, касающаяся алгебраически замкнутых полей, применима к полю комплексных чисел. Вот еще несколько следствий теоремы, которые либо касаются поля действительных чисел, либо отношения между полем действительных чисел и полем комплексных чисел:
В то время как основная теорема алгебры устанавливает общий результат существования, представляет определенный интерес, как с теоретической, так и с практической точки зрения, иметь информацию о расположении нулей данного многочлена. Более простой результат в этом направлении — это ограничение на модуль: все нули ζ монического многочлена удовлетворяют неравенству |ζ| ≤ R ∞ , где
Как уже говорилось, это еще не результат существования, а скорее пример того, что называется априорной границей: она гласит, что если есть решения , то они лежат внутри замкнутого круга с центром, началом координат и радиусом R∞ . Однако, будучи объединенной с фундаментальной теоремой алгебры, она гласит, что круг фактически содержит по крайней мере одно решение. В более общем смысле, границу можно задать непосредственно в терминах любой p-нормы n - вектора коэффициентов, которая равна |ζ| ≤ Rp , где Rp — это в точности q -норма 2-вектора q, являющегося сопряженным показателем p , для любого 1 ≤ p ≤ ∞. Таким образом, модуль любого решения также ограничен
для 1 < p < ∞, и в частности
(где мы определяем n как 1, что разумно, поскольку 1 действительно является n -м коэффициентом нашего многочлена). Случай общего многочлена степени n ,
конечно, сводится к случаю монического уравнения, деля все коэффициенты на a n ≠ 0. Кроме того, в случае, когда 0 не является корнем, т. е. a 0 ≠ 0, оценки снизу для корней ζ немедленно следуют как оценки сверху для , то есть корни
Наконец, расстояние от корней ζ до любой точки можно оценить снизу и сверху, рассматривая как нули многочлена , коэффициенты которого являются разложением Тейлора P ( z ) при
Пусть ζ — корень многочлена
Чтобы доказать неравенство |ζ| ≤ R p , можно, конечно, предположить, что |ζ| > 1. Записывая уравнение в виде
и используя неравенство Гельдера находим
Теперь, если p = 1, это
таким образом
В случае 1 < p ≤ ∞, учитывая формулу суммирования геометрической прогрессии , имеем
таким образом
и упрощение,
Поэтому
справедливо для всех 1 ≤ p ≤ ∞.