В математике одномерный многочлен степени n с действительными или комплексными коэффициентами имеет n комплексных корней , если посчитать их кратности . Они образуют мультимножество из n точек в комплексной плоскости . В этой статье рассматривается геометрия этих точек, то есть информация об их локализации в комплексной плоскости, которая может быть выведена из степени и коэффициентов многочлена.
Некоторые из этих геометрических свойств связаны с одним полиномом, например, верхние границы абсолютных значений корней, которые определяют диск, содержащий все корни, или нижние границы расстояния между двумя корнями. Такие границы широко используются для алгоритмов поиска корней для полиномов, либо для их настройки, либо для вычисления их вычислительной сложности .
Некоторые другие свойства являются вероятностными, например, ожидаемое число действительных корней случайного многочлена степени n с действительными коэффициентами, которое меньше, чем при достаточно большом n .
В этой статье рассматриваемый многочлен всегда обозначается
где — действительные или комплексные числа , а ; таким образом, — степень многочлена.
Корни n многочлена степени n непрерывно зависят от коэффициентов. Для простых корней это следует непосредственно из теоремы о неявной функции . Это справедливо и для кратных корней, но для доказательства требуется некоторая осторожность.
Небольшое изменение коэффициентов может вызвать резкое изменение корней, включая изменение действительного корня на комплексный корень с довольно большой мнимой частью (см. полином Уилкинсона ). Следствием этого является то, что для классических числовых алгоритмов поиска корней проблема аппроксимации корней с учетом коэффициентов может быть плохо обусловлена для многих входных данных.
Теорема о комплексно сопряженных корнях утверждает, что если коэффициенты многочлена действительны, то недействительные корни появляются парами вида ( a + ib , a – ib ) .
Отсюда следует, что корни многочлена с действительными коэффициентами зеркально симметричны относительно действительной оси.
Это можно распространить на алгебраическое сопряжение : корни многочлена с рациональными коэффициентами сопряжены (то есть инвариантны) под действием группы Галуа многочлена. Однако эту симметрию редко можно интерпретировать геометрически.
Верхние границы абсолютных значений корней полиномов широко используются в алгоритмах поиска корней , либо для ограничения областей, в которых следует искать корни, либо для вычисления вычислительной сложности этих алгоритмов.
Было дано много таких границ, и более точная граница обычно зависит от конкретной последовательности рассматриваемых коэффициентов. Большинство границ больше или равны единице, и, таким образом, не являются точными для полинома, имеющего только корни с абсолютными значениями ниже единицы. Однако такие полиномы встречаются очень редко, как показано ниже.
Любая верхняя граница абсолютных значений корней обеспечивает соответствующую нижнюю границу. Фактически, если и U является верхней границей абсолютных значений корней
тогда 1/ U — нижняя граница абсолютных значений корней
поскольку корни любого полинома являются мультипликативными обратными корням другого. Поэтому в оставшейся части статьи нижние оценки не будут даны явно .
Лагранж и Коши были первыми, кто дал верхние границы для всех комплексных корней. [1] Граница Лагранжа равна [2]
и оценка Коши равна [3]
Граница Лагранжа тоньше (меньше), чем граница Коши, только когда 1 больше суммы всех , кроме наибольшего. Это встречается на практике относительно редко и объясняет, почему граница Коши используется шире, чем граница Лагранжа.
Обе оценки вытекают из теоремы Гершгорина о круге, примененной к сопутствующей матрице многочлена и ее транспонированной матрице . Их также можно доказать элементарными методами.
Эти границы не инвариантны относительно масштабирования. То есть корни полинома p ( sx ) являются частным по s корня p , а границы, заданные для корней p ( sx ) , не являются частным по s границ p . Таким образом, можно получить более точные границы, минимизируя возможные масштабирования. Это дает
и
для границ Лагранжа и Коши соответственно.
Другая граница, первоначально данная Лагранжем, но приписанная Цассенхаузу Дональдом Кнутом , [4]
Эта граница инвариантна при масштабировании.
Лагранж улучшил эту последнюю оценку до суммы двух наибольших значений (возможно, равных) в последовательности [4]
Лагранж также дал оценку [ необходима ссылка ]
где обозначает i-й ненулевой коэффициент при сортировке членов многочленов по возрастанию степеней.
Неравенство Гельдера допускает распространение границ Лагранжа и Коши на любую h -норму . H -норма последовательности
является
для любого действительного числа h ≥ 1 , и
Если при 1 ≤ h , k ≤ ∞ и 1 / ∞ = 0 , верхняя граница абсолютных значений корней p равна
При k = 1 и k = ∞ получаются соответственно границы Коши и Лагранжа.
При h = k = 2 имеет место ограничение
Это не только граница абсолютных значений корней, но и граница произведения их абсолютных значений, больших 1; см. § Неравенство Ландау ниже.
Было дано много других верхних границ для величин всех корней. [5]
Связанный Фудзиварой [6]
немного улучшает оценку, данную выше, путем деления последнего аргумента максимума на два.
Предел Кодзимы — [7] [ требуется проверка ]
где обозначает i -й ненулевой коэффициент, когда члены многочленов отсортированы по возрастанию степеней. Если все коэффициенты ненулевые, граница Фудзивары точнее, поскольку каждый элемент в границе Фудзивары является геометрическим средним первых элементов в границе Кодзимы.
Сан и Хсие получили еще одно улучшение границы Коши. [8] Предположим, что многочлен является моническим с общим членом a i x i . Сан и Хсие показали, что верхние границы 1 + d 1 и 1 + d 2 могут быть получены из следующих уравнений.
d 2 — положительный корень кубического уравнения
Они также отметили, что d 2 ≤ d 1 .
Предыдущие оценки являются верхними оценками для каждого корня в отдельности. Неравенство Ландау дает верхнюю оценку для абсолютных значений произведения корней, имеющих абсолютное значение больше единицы. Это неравенство, открытое в 1905 году Эдмундом Ландау [9] , было забыто и открыто заново по крайней мере три раза в течение 20-го века. [10] [11] [12]
Эта граница произведения корней не намного больше, чем наилучшие предыдущие границы каждого корня в отдельности. [13] Пусть — n корней многочлена p . Если
является мерой Малера p , тогда
Удивительно, но эта граница произведения абсолютных значений корней, больших 1, не намного больше, чем лучшие границы одного корня, которые были даны выше для одного корня. Эта граница даже в точности равна одной из границ, полученных с использованием неравенства Гёльдера.
Эта граница также полезна для ограничения коэффициентов делителя многочлена с целыми коэффициентами: [14] если
является делителем p , тогда
и, по формулам Виета ,
для i = 0, ..., m , где - биномиальный коэффициент . Таким образом
и
Теорема Руше позволяет определить диски с центром в нуле, содержащие заданное число корней. Точнее, если есть положительное действительное число R и целое число 0 ≤ k ≤ n, такие, что
тогда имеется ровно k корней, подсчитанных с учетом кратности , имеющих абсолютное значение меньше R.
Приведенный выше результат можно применить, если многочлен
принимает отрицательное значение для некоторого положительного действительного значения x .
В оставшейся части раздела предположим, что a 0 ≠ 0. Если это не так, то ноль является корнем, а локализацию других корней можно изучить, разделив многочлен на степень неопределенности, получив многочлен с ненулевым постоянным членом.
Для k = 0 и k = n правило знаков Декарта показывает, что многочлен имеет ровно один положительный действительный корень. Если и являются этими корнями, то приведенный выше результат показывает , что все корни удовлетворяют
Поскольку эти неравенства применимы также к и эти границы оптимальны для полиномов с заданной последовательностью абсолютных значений их коэффициентов. Таким образом, они точнее всех границ, приведенных в предыдущих разделах.
Для 0 < k < n правило знаков Декарта подразумевает, что либо имеет два положительных действительных корня, которые не являются кратными, либо является неотрицательным для каждого положительного значения x . Таким образом, приведенный выше результат может быть применен только в первом случае. Если — эти два корня, приведенный выше результат подразумевает, что
для k корней p , и что
для n – k других корней.
Вместо явного вычисления и обычно достаточно вычислить значение, такое что (обязательно ). Они обладают свойством разделения корней с точки зрения их абсолютных значений: если для h < k существуют и , то существует ровно k – h корней z таких, что
Для вычисления можно использовать тот факт, что является выпуклой функцией (ее вторая производная положительна). Таким образом, существует тогда и только тогда, когда является отрицательной в своем единственном минимуме. Для вычисления этого минимума можно использовать любой метод оптимизации или, в качестве альтернативы, метод Ньютона для вычисления единственного положительного нуля производной (он быстро сходится, так как производная является монотонной функцией ).
Можно увеличить количество существующих ', применив операцию квадратного корня итерации Данделина–Граеффе . Если корни имеют различные абсолютные значения, можно в конечном итоге полностью разделить корни с точки зрения их абсолютных значений, то есть вычислить n + 1 положительных чисел так, чтобы в открытом интервале для k = 1, ..., n был ровно один корень с абсолютным значением .
Теорема Гершгорина о круге применяет сопутствующую матрицу многочлена на основе, связанной с интерполяцией Лагранжа, для определения дисков с центрами в точках интерполяции, каждый из которых содержит корень многочлена; подробности см. в Методе Дюрана–Кернера § Включение корней через круги Гершгорина .
Если точки интерполяции близки к корням корней многочлена, радиусы дисков малы, и это является ключевым компонентом метода Дюрана–Кернера для вычисления корней многочлена.
Для полиномов с действительными коэффициентами часто бывает полезно ограничить только действительные корни. Достаточно ограничить положительные корни, поскольку отрицательные корни p ( x ) являются положительными корнями p (– x ) .
Очевидно, что каждая граница всех корней применима также и к действительным корням. Но в некоторых контекстах более строгие границы действительных корней полезны. Например, эффективность метода непрерывных дробей для изоляции действительных корней сильно зависит от строгости границы положительных корней. Это привело к установлению новых границ, которые являются более строгими, чем общие границы всех корней. Эти границы обычно выражаются не только в терминах абсолютных значений коэффициентов, но и в терминах их знаков.
Другие границы применимы только к полиномам, все корни которых являются действительными числами (см. ниже).
Чтобы дать оценку положительным корням, можно без потери общности предположить, что изменение знаков всех коэффициентов не приводит к изменению корней.
Каждая верхняя граница положительных корней
также является границей действительных нулей
Фактически, если B является такой границей, то для всех x > B имеем p ( x ) ≥ q ( x ) > 0 .
Применительно к границе Коши это дает верхнюю границу
для действительных корней многочлена с действительными коэффициентами. Если эта граница не больше, чем1 , это означает, что все ненулевые коэффициенты имеют одинаковый знак и что положительного корня нет.
Аналогично, другая верхняя граница положительных корней равна
Если все ненулевые коэффициенты имеют одинаковый знак, то положительного корня нет, и максимум должен быть равен нулю.
Недавно были разработаны другие границы, в основном для метода непрерывных дробей для изоляции действительных корней . [15] [16]
Если все корни многочлена действительны, Лагерр доказал следующие нижние и верхние границы корней, используя то, что сейчас называется неравенством Самуэльсона . [17]
Пусть — многочлен со всеми действительными корнями. Тогда его корни расположены в интервале с концами
Например, корни многочлена удовлетворяют
Разделение корней многочлена — это минимальное расстояние между двумя корнями, то есть минимум абсолютных значений разности двух корней:
Разделение корней является фундаментальным параметром вычислительной сложности алгоритмов поиска корней для полиномов. Фактически, разделение корней определяет точность представления чисел, которая необходима для уверенности в различении различных корней. Кроме того, для изоляции действительных корней оно позволяет ограничить количество делений интервала, которые необходимы для изоляции всех корней.
Для полиномов с действительными или комплексными коэффициентами невозможно выразить нижнюю границу корневого разделения только через степень и абсолютные значения коэффициентов, поскольку небольшое изменение одного коэффициента преобразует полином с несколькими корнями в бесквадратный полином с малым корневым разделением и по сути теми же абсолютными значениями коэффициента. Однако включение дискриминанта полинома позволяет получить нижнюю границу.
Для бесквадратных многочленов с целыми коэффициентами дискриминант является целым числом и, таким образом, имеет абсолютное значение, не меньшее, чем1. Это позволяет получить нижние границы разделения корней, не зависящие от дискриминанта.
Граница разделения Миньотта равна [18] [19] [20]
где дискриминант, и
Для свободного от квадратов многочлена с целыми коэффициентами это означает
где s — это разрядность p , то есть сумма разрядностей его коэффициентов.
Теорема Гаусса–Лукаса утверждает, что выпуклая оболочка корней многочлена содержит корни производной многочлена .
Иногда полезным следствием является то, что если все корни многочлена имеют положительную действительную часть, то же самое происходит и с корнями всех производных этого многочлена.
Связанный результат — неравенство Бернштейна . Оно утверждает, что для полинома P степени n с производной P′ имеем
Если коэффициенты a i случайного полинома распределены независимо и одинаково со средним значением , равным нулю, большинство комплексных корней находятся на единичной окружности или близко к ней. В частности, действительные корни в основном расположены вблизи ±1 , и, более того, их ожидаемое число для большой степени меньше натурального логарифма степени.
Если коэффициенты распределены по Гауссу со средним значением, равным нулю, и дисперсией σ , то средняя плотность действительных корней определяется формулой Каца [21] [22]
где
Когда коэффициенты распределены по Гауссу с ненулевым средним значением и дисперсией σ , известна похожая, но более сложная формула. [ необходима ссылка ]
При больших n средняя плотность действительных корней вблизи x асимптотически равна
если и
Отсюда следует, что ожидаемое число действительных корней, используя обозначение О большое, равно
где C — константа, приблизительно равная0,625 735 8072 . [23]
Другими словами, ожидаемое число действительных корней случайного многочлена высокой степени меньше натурального логарифма степени .
Кац, Эрдёш и другие показали, что эти результаты нечувствительны к распределению коэффициентов, если они независимы и имеют одинаковое распределение со средним значением 0. Однако, если дисперсия i -го коэффициента равна ожидаемому числу действительных корней [23]
Многочлен можно записать в виде
с различными корнями и соответствующими кратностями . Корень является простым корнем, если или кратным корнем, если . Простые корни непрерывны по Липшицу относительно коэффициентов, но кратные корни — нет. Другими словами, простые корни имеют ограниченную чувствительность, но кратные корни бесконечно чувствительны, если коэффициенты произвольно возмущены. В результате большинство алгоритмов поиска корней испытывают существенную потерю точности на кратных корнях в численных вычислениях.
В 1972 году Уильям Кахан доказал, что существует внутренняя устойчивость кратных корней. [24] Кахан обнаружил, что многочлены с определенным набором кратностей образуют то, что он назвал уничижительным многообразием , и доказал, что кратный корень является непрерывным по Липшицу, если возмущение сохраняет его кратность.
Это геометрическое свойство кратных корней имеет решающее значение при численном вычислении кратных корней .