В линейной алгебре собственный вектор ( / ˈ aɪ ɡ ən -/ EYE -gən- ) или характеристический вектор — это вектор , направление которого не изменяется при заданном линейном преобразовании . Точнее, собственный вектор , линейного преобразования , масштабируется постоянным множителем , , когда к нему применяется линейное преобразование: . Часто важно знать эти векторы в линейной алгебре. Соответствующее собственное значение , характеристическое значение или характеристический корень — это множитель .
Геометрически векторы — это многомерные величины с величиной и направлением, часто изображаемые в виде стрелок. Линейное преобразование вращает , растягивает или сдвигает векторы, на которые оно действует. Его собственные векторы — это те векторы, которые только растягиваются, без вращения или сдвига. Соответствующее собственное значение — это коэффициент, на который собственный вектор растягивается или сжимается. Если собственное значение отрицательно, направление собственного вектора меняется на противоположное. [1]
Собственные векторы и собственные значения линейного преобразования служат для его характеристики, и поэтому они играют важную роль во всех областях, где применяется линейная алгебра, от геологии до квантовой механики . В частности, часто бывает так, что система представлена линейным преобразованием, выходные данные которого подаются в качестве входных данных для того же преобразования ( обратная связь ). В таком приложении наибольшее собственное значение имеет особое значение, поскольку оно управляет долгосрочным поведением системы после многих применений линейного преобразования, а связанный с ним собственный вектор является устойчивым состоянием системы.
Рассмотрим матрицу A и ненулевой вектор длины Если умножение A на (обозначается как ) просто масштабируется на коэффициент λ , где λ — скаляр , то называется собственным вектором A , а λ — соответствующим собственным значением. Это соотношение можно выразить как: . [2]
Существует прямое соответствие между квадратными матрицами n -на- n и линейными преобразованиями из n -мерного векторного пространства в себя, учитывая любой базис векторного пространства. Следовательно, в конечномерном векторном пространстве эквивалентно определять собственные значения и собственные векторы, используя либо язык матриц , либо язык линейных преобразований. [3] [4]
В следующем разделе представлена более общая точка зрения, которая охватывает также бесконечномерные векторные пространства .
Собственные значения и собственные векторы играют важную роль в анализе линейных преобразований. Префикс eigen- заимствован из немецкого слова eigen ( родственного английскому слову own ) для «собственный», «характеристический», «собственный». [5] [6] Первоначально используемые для изучения главных осей вращательного движения твердых тел , собственные значения и собственные векторы имеют широкий спектр приложений, например, в анализе устойчивости , анализе вибрации , атомных орбиталях , распознавании лиц и диагонализации матриц .
По сути, собственный вектор v линейного преобразования T — это ненулевой вектор, который при применении к нему T не меняет направления. Применение T к собственному вектору только масштабирует собственный вектор на скалярное значение λ , называемое собственным значением. Это условие можно записать в виде уравнения, называемого уравнением собственного значения или собственным уравнением . В общем случае λ может быть любым скаляром . Например, λ может быть отрицательным, и в этом случае собственный вектор меняет направление как часть масштабирования, или он может быть нулевым или комплексным .
Пример здесь, основанный на Моне Лизе , дает простую иллюстрацию. Каждая точка на картине может быть представлена как вектор, указывающий из центра картины в эту точку. Линейное преобразование в этом примере называется сдвиговым отображением . Точки в верхней половине перемещаются вправо, а точки в нижней половине перемещаются влево, пропорционально тому, насколько далеко они находятся от горизонтальной оси, проходящей через середину картины. Векторы, указывающие на каждую точку на исходном изображении, поэтому наклоняются вправо или влево и становятся длиннее или короче в результате преобразования. Точки вдоль горизонтальной оси вообще не перемещаются, когда применяется это преобразование. Следовательно, любой вектор, который указывает прямо вправо или влево без вертикальной компоненты, является собственным вектором этого преобразования, потому что отображение не меняет его направления. Более того, все эти собственные векторы имеют собственное значение, равное единице, потому что отображение также не меняет их длину.
Линейные преобразования могут принимать множество различных форм, отображая векторы в различных векторных пространствах, поэтому собственные векторы также могут принимать множество форм. Например, линейное преобразование может быть дифференциальным оператором , например , в этом случае собственные векторы являются функциями, называемыми собственными функциями , которые масштабируются этим дифференциальным оператором, например Альтернативно, линейное преобразование может принимать форму матрицы n на n , в этом случае собственные векторы являются матрицами n на 1. Если линейное преобразование выражено в виде матрицы n на n A , то уравнение собственных значений для линейного преобразования выше можно переписать как умножение матриц , где собственный вектор v является матрицей n на 1. Для матрицы собственные значения и собственные векторы можно использовать для разложения матрицы — например, путем ее диагонализации .
Собственные значения и собственные векторы порождают множество тесно связанных математических понятий, и при их наименовании обычно используется префикс «собственный» :
Собственные значения часто вводятся в контексте линейной алгебры или теории матриц . Однако исторически они возникли при изучении квадратичных форм и дифференциальных уравнений .
В XVIII веке Леонард Эйлер изучал вращательное движение твердого тела и открыл важность главных осей . [a] Жозеф-Луи Лагранж понял, что главные оси являются собственными векторами матрицы инерции. [10]
В начале 19 века Огюстен-Луи Коши увидел, как их работа может быть использована для классификации квадратных поверхностей , и обобщил ее на произвольные измерения. [11] Коши также ввел термин racine caractéristique (характеристический корень) для того, что теперь называется собственным значением ; его термин сохранился в характеристическом уравнении . [b]
Позже Жозеф Фурье использовал работу Лагранжа и Пьера-Симона Лапласа для решения уравнения теплопроводности методом разделения переменных в своей знаменитой книге 1822 года «Аналитическая теория тепла» . [12] Шарль-Франсуа Штурм развил идеи Фурье дальше и привлек к ним внимание Коши, который объединил их со своими собственными идеями и пришел к тому факту, что действительные симметричные матрицы имеют действительные собственные значения. [11] Это было распространено Шарлем Эрмитом в 1855 году на то, что сейчас называется эрмитовыми матрицами . [13]
Примерно в то же время Франческо Бриоски доказал, что собственные значения ортогональных матриц лежат на единичной окружности , [11] а Альфред Клебш нашел соответствующий результат для кососимметричных матриц . [13] Наконец, Карл Вейерштрасс прояснил важный аспект в теории устойчивости, начатой Лапласом, поняв, что дефектные матрицы могут вызывать нестабильность. [11]
В то же время Жозеф Лиувилль изучал проблемы собственных значений, подобные проблемам Штурма; дисциплина, которая выросла из их работы, теперь называется теорией Штурма–Лиувилля . [14] Шварц изучал первое собственное значение уравнения Лапласа в общих областях к концу 19-го века, в то время как Пуанкаре изучал уравнение Пуассона несколько лет спустя. [15]
В начале 20-го века Давид Гильберт изучал собственные значения интегральных операторов , рассматривая операторы как бесконечные матрицы. [16] Он был первым, кто использовал немецкое слово eigen , что означает «собственный», [6] для обозначения собственных значений и собственных векторов в 1904 году, [c] хотя он, возможно, следовал связанному использованию Германа фон Гельмгольца . Некоторое время стандартным термином в английском языке было «собственное значение», но более характерный термин «собственное значение» является стандартным сегодня. [17]
Первый численный алгоритм для вычисления собственных значений и собственных векторов появился в 1929 году, когда Рихард фон Мизес опубликовал степенной метод . Один из самых популярных методов сегодня, алгоритм QR , был предложен независимо Джоном ГФ Фрэнсисом [18] и Верой Кублановской [19] в 1961 году. [20] [21]
Собственные значения и собственные векторы часто представляются студентам в контексте курсов линейной алгебры, посвященных матрицам. [22] [23] Кроме того, линейные преобразования в конечномерном векторном пространстве могут быть представлены с помощью матриц, [3] [4], что особенно распространено в числовых и вычислительных приложениях. [24]
Рассмотрим n -мерные векторы, сформированные как список из n скаляров, например, трехмерные векторы
Говорят, что эти векторы являются скалярными кратными друг другу, параллельными или коллинеарными , если существует скаляр λ такой, что
В этом случае, .
Теперь рассмотрим линейное преобразование n -мерных векторов, определяемое матрицей A размером n на n , или где для каждой строки
Если окажется, что v и w являются скалярными множителями, то есть если
тогда v — собственный вектор линейного преобразования A , а масштабный коэффициент λ — собственное значение, соответствующее этому собственному вектору. Уравнение ( 1 ) — это уравнение собственных значений для матрицы A.
Уравнение ( 1 ) можно эквивалентно записать как
где I — единичная матрица размером n на n , а 0 — нулевой вектор.
Уравнение ( 2 ) имеет ненулевое решение v тогда и только тогда, когда определитель матрицы ( A − λI ) равен нулю. Поэтому собственные значения A являются значениями λ , которые удовлетворяют уравнению
Используя формулу Лейбница для определителей , левая часть уравнения ( 3 ) является полиномиальной функцией переменной λ , а степень этого полинома равна n , порядку матрицы A. Ее коэффициенты зависят от элементов матрицы A , за исключением того, что ее член степени n всегда равен (−1) n λ n . Этот полином называется характеристическим полиномом матрицы A. Уравнение ( 3 ) называется характеристическим уравнением или секулярным уравнением матрицы A.
Основная теорема алгебры подразумевает, что характеристический многочлен матрицы A размером n на n , будучи многочленом степени n , может быть разложен на множители n линейных членов:
где каждое λ i может быть действительным, но в общем случае является комплексным числом. Числа λ 1 , λ 2 , ..., λ n , которые могут не все иметь различные значения, являются корнями многочлена и являются собственными значениями A .
В качестве краткого примера, который более подробно описан в разделе примеров далее, рассмотрим матрицу
Взяв определитель ( A − λI ) , характеристический многочлен A равен
Приравнивая характеристический многочлен к нулю, он имеет корни при λ=1 и λ=3 , которые являются двумя собственными значениями A. Собственные векторы, соответствующие каждому собственному значению, можно найти, решив для компонентов v в уравнении . В этом примере собственные векторы — это любые ненулевые скалярные кратные
Если все элементы матрицы A являются действительными числами, то коэффициенты характеристического многочлена также будут действительными числами, но собственные значения могут по-прежнему иметь ненулевые мнимые части. Элементы соответствующих собственных векторов, следовательно, также могут иметь ненулевые мнимые части. Аналогично, собственные значения могут быть иррациональными числами, даже если все элементы матрицы A являются рациональными числами или даже если они все целые числа. Однако, если все элементы матрицы A являются алгебраическими числами , которые включают рациональные числа, собственные значения также должны быть алгебраическими числами.
Недействительные корни действительного многочлена с действительными коэффициентами можно сгруппировать в пары комплексно сопряженных чисел , а именно, с двумя членами каждой пары, имеющими мнимые части, которые отличаются только знаком, и одинаковую действительную часть. Если степень нечетная, то по теореме о промежуточном значении по крайней мере один из корней является действительным. Следовательно, любая действительная матрица с нечетным порядком имеет по крайней мере одно действительное собственное значение, тогда как действительная матрица с четным порядком может не иметь никаких действительных собственных значений. Собственные векторы, связанные с этими комплексными собственными значениями, также являются комплексными и также появляются в комплексно сопряженных парах.
Спектр матрицы — это список собственных значений, повторяющихся в соответствии с кратностью; в альтернативной записи — множество собственных значений с их кратностями.
Важной величиной, связанной со спектром, является максимальное абсолютное значение любого собственного значения. Это известно как спектральный радиус матрицы.
Пусть λ i — собственное значение матрицы A размером n на n . Алгебраическая кратность μ A ( λ i ) собственного значения — это его кратность как корня характеристического многочлена, то есть наибольшее целое число k, такое, что ( λ − λ i ) k делит этот многочлен нацело . [9] [25] [26]
Предположим, что матрица A имеет размерность n и d ≤ n различных собственных значений. В то время как уравнение ( 4 ) разлагает характеристический многочлен матрицы A на произведение n линейных членов с некоторыми потенциально повторяющимися членами, характеристический многочлен также может быть записан как произведение d членов, каждый из которых соответствует отдельному собственному значению и возведен в степень алгебраической кратности,
Если d = n, то правая часть является произведением n линейных членов, и это то же самое, что и уравнение ( 4 ). Величина алгебраической кратности каждого собственного значения связана с размерностью n как
Если μ A ( λ i ) = 1, то λ i называется простым собственным значением . [26] Если μ A ( λ i ) равно геометрической кратности λ i , γ A ( λ i ), определенной в следующем разделе, то λ i называется полупростым собственным значением .
Дано конкретное собственное значение λ матрицы A размером n на n , определим множество E как все векторы v, которые удовлетворяют уравнению ( 2 ),
С одной стороны, это множество является в точности ядром или нулевым пространством матрицы ( A − λI ). С другой стороны, по определению любой ненулевой вектор, удовлетворяющий этому условию, является собственным вектором A, связанным с λ . Таким образом, множество E является объединением нулевого вектора с множеством всех собственных векторов A , связанных с λ , и E равно нулевому пространству ( A − λI ). E называется собственным пространством или характеристическим пространством A, связанным с λ . [27] [9] В общем случае λ является комплексным числом, а собственные векторы являются комплексными матрицами размера n на 1. Свойство нулевого пространства состоит в том, что оно является линейным подпространством , поэтому E является линейным подпространством .
Поскольку собственное пространство E является линейным подпространством, оно замкнуто относительно сложения. То есть, если два вектора u и v принадлежат множеству E , записанному как u , v ∈ E , то ( u + v ) ∈ E или, что эквивалентно, A ( u + v ) = λ ( u + v ) . Это можно проверить, используя дистрибутивное свойство умножения матриц. Аналогично, поскольку E является линейным подпространством, оно замкнуто относительно скалярного умножения. То есть, если v ∈ E и α является комплексным числом, ( α v ) ∈ E или, что эквивалентно, A ( α v ) = λ ( α v ) . Это можно проверить, заметив, что умножение комплексных матриц на комплексные числа коммутативно . Пока u + v и α v не равны нулю, они также являются собственными векторами A , связанными с λ .
Размерность собственного пространства E, связанного с λ , или, что эквивалентно, максимальное число линейно независимых собственных векторов, связанных с λ , называется геометрической кратностью собственного значения . Поскольку E также является нулевым пространством ( A − λI ), геометрическая кратность λ является размерностью нулевого пространства ( A − λI ), также называемой нулевым значением ( A − λI ), которое относится к размерности и рангу ( A − λI ) как
Из-за определения собственных значений и собственных векторов геометрическая кратность собственного значения должна быть не менее единицы, то есть каждое собственное значение имеет не менее одного связанного с ним собственного вектора. Более того, геометрическая кратность собственного значения не может превышать его алгебраическую кратность. Кроме того, напомним, что алгебраическая кратность собственного значения не может превышать n .
Чтобы доказать неравенство , рассмотрим, как определение геометрической кратности подразумевает существование ортонормированных собственных векторов , таких, что . Поэтому мы можем найти (унитарную) матрицу, первые столбцы которой являются этими собственными векторами, а остальные столбцы могут быть любым ортонормированным набором векторов, ортогональных этим собственным векторам . Тогда имеет полный ранг и, следовательно, обратим. Оценивая , мы получаем матрицу, верхний левый блок которой является диагональной матрицей . Это можно увидеть, оценив то, что левая часть делает с базисными векторами первого столбца. Реорганизуя и добавляя с обеих сторон, мы получаем , поскольку коммутирует с . Другими словами, аналогично , и . Но из определения мы знаем, что содержит множитель , что означает, что алгебраическая кратность должна удовлетворять .
Предположим, что имеет различные собственные значения , где геометрическая кратность равна . Общая геометрическая кратность , является размерностью суммы всех собственных пространств собственных значений , или, что эквивалентно, максимальным числом линейно независимых собственных векторов . Если , то
Пусть будет произвольной матрицей комплексных чисел с собственными значениями . Каждое собственное значение появляется в этом списке раз, где — алгебраическая кратность собственного значения. Ниже приведены свойства этой матрицы и ее собственных значений:
Многие дисциплины традиционно представляют векторы как матрицы с одним столбцом, а не как матрицы с одной строкой. По этой причине слово «собственный вектор» в контексте матриц почти всегда относится к правому собственному вектору , а именно вектору- столбцу , который умножает справа матрицу в определяющем уравнении, уравнении ( 1 ),
Проблема собственных значений и собственных векторов может быть также определена для векторов- строк , которые оставили матрицу умножения . В этой формулировке определяющее уравнение имеет вид
где — скаляр, а — матрица. Любой вектор-строка, удовлетворяющий этому уравнению, называется левым собственным вектором и — его связанным собственным значением. Транспонируем это уравнение,
Сравнивая это уравнение с уравнением ( 1 ), сразу следует, что левый собственный вектор совпадает с транспонированным правым собственным вектором , с тем же собственным значением. Более того, поскольку характеристический многочлен совпадает с характеристическим многочленом , левые и правые собственные векторы связаны с теми же собственными значениями.
Предположим, что собственные векторы матрицы A образуют базис, или, что эквивалентно, A имеет n линейно независимых собственных векторов v 1 , v 2 , ..., v n с соответствующими собственными значениями λ 1 , λ 2 , ..., λ n . Собственные значения не обязательно должны быть различными. Определим квадратную матрицу Q , столбцы которой являются n линейно независимыми собственными векторами матрицы A ,
Поскольку каждый столбец Q является собственным вектором A , правое умножение A на Q масштабирует каждый столбец Q на соответствующее ему собственное значение,
Имея это в виду, определим диагональную матрицу Λ, где каждый диагональный элемент Λ ii является собственным значением, связанным с i -м столбцом матрицы Q. Тогда
Поскольку столбцы Q линейно независимы, Q обратим. Умножая обе части уравнения справа на Q −1 ,
или вместо этого умножив обе стороны на Q −1 ,
Следовательно, A можно разложить на матрицу, составленную из ее собственных векторов, диагональную матрицу с собственными значениями вдоль диагонали и матрицу, обратную матрице собственных векторов. Это называется собственным разложением и является преобразованием подобия . Такая матрица A называется подобной диагональной матрице Λ или диагонализируемой . Матрица Q является матрицей изменения базиса преобразования подобия. По сути, матрицы A и Λ представляют одно и то же линейное преобразование, выраженное в двух разных базисах. Собственные векторы используются в качестве базиса при представлении линейного преобразования как Λ.
Наоборот, предположим, что матрица A диагонализируема. Пусть P — невырожденная квадратная матрица, такая что P −1 AP — некоторая диагональная матрица D . Умножая обе на P слева , получаем AP = PD . Таким образом, каждый столбец P должен быть собственным вектором A , собственное значение которого является соответствующим диагональным элементом D . Поскольку столбцы P должны быть линейно независимыми для того, чтобы P была обратимой, существует n линейно независимых собственных векторов A . Из этого следует, что собственные векторы A образуют базис тогда и только тогда, когда A диагонализируема.
Матрица, которая не диагонализируется, называется дефектной . Для дефектных матриц понятие собственных векторов обобщается до обобщенных собственных векторов , а диагональная матрица собственных значений обобщается до жордановой нормальной формы . Над алгебраически замкнутым полем любая матрица A имеет жорданову нормальную форму и, следовательно, допускает базис обобщенных собственных векторов и разложение в обобщенные собственные пространства .
В эрмитовом случае собственным значениям можно дать вариационную характеристику. Наибольшее собственное значение является максимальным значением квадратичной формы . Значение , которое реализует этот максимум, является собственным вектором.
Рассмотрим матрицу
Рисунок справа показывает влияние этого преобразования на координаты точек на плоскости. Собственные векторы v этого преобразования удовлетворяют уравнению ( 1 ), а значения λ , для которых определитель матрицы ( A − λI ) равен нулю, являются собственными значениями.
Используя определитель, находим характеристический многочлен A ,
Приравняв характеристический многочлен к нулю, получим корни при λ =1 и λ =3 , которые являются двумя собственными значениями A.
При λ =1 уравнение ( 2 ) принимает вид:
Любой ненулевой вектор с v 1 = − v 2 решает это уравнение. Следовательно, является собственным вектором A, соответствующим λ = 1, как и любой скалярный кратный этого вектора.
При λ =3 уравнение ( 2 ) принимает вид
Любой ненулевой вектор с v 1 = v 2 решает это уравнение. Следовательно,
является собственным вектором A, соответствующим λ = 3, как и любое скалярное кратное этого вектора.
Таким образом, векторы v λ =1 и v λ =3 являются собственными векторами матрицы A , связанными с собственными значениями λ =1 и λ =3 соответственно.
Рассмотрим матрицу
Характеристический многочлен A равен
Корни характеристического многочлена — 2, 1 и 11, которые являются единственными тремя собственными значениями A. Эти собственные значения соответствуют собственным векторам , , и , или любым их ненулевым кратным.
Рассмотрим матрицу циклической перестановки
Эта матрица сдвигает координаты вектора на одну позицию вверх и перемещает первую координату вниз. Ее характеристический полином равен 1 − λ 3 , корни которого равны , где — мнимая единица с .
Для действительного собственного значения λ 1 = 1 любой вектор с тремя равными ненулевыми элементами является собственным вектором. Например,
Для комплексно-сопряженной пары мнимых собственных значений,
Тогда и
Следовательно, два других собственных вектора A являются комплексными и имеют собственные значения λ 2 и λ 3 соответственно. Два комплексных собственных вектора также появляются в комплексно-сопряженной паре,
Матрицы с элементами только по главной диагонали называются диагональными матрицами . Собственные значения диагональной матрицы — это сами диагональные элементы. Рассмотрим матрицу
Характеристический многочлен A равен
который имеет корни λ 1 = 1 , λ 2 = 2 и λ 3 = 3. Эти корни являются диагональными элементами , а также собственными значениями A.
Каждый диагональный элемент соответствует собственному вектору, единственный ненулевой компонент которого находится в той же строке, что и этот диагональный элемент. В примере собственные значения соответствуют собственным векторам,
соответственно, а также скалярные кратные этих векторов.
Матрица, элементы которой выше главной диагонали все равны нулю, называется нижней треугольной матрицей , а матрица, элементы которой ниже главной диагонали все равны нулю, называется верхней треугольной матрицей . Как и в случае с диагональными матрицами, собственные значения треугольных матриц являются элементами главной диагонали.
Рассмотрим нижнюю треугольную матрицу,
Характеристический многочлен A равен
который имеет корни λ 1 = 1 , λ 2 = 2 и λ 3 = 3. Эти корни являются диагональными элементами , а также собственными значениями A.
Эти собственные значения соответствуют собственным векторам,
соответственно, а также скалярные кратные этих векторов.
Как и в предыдущем примере, нижняя треугольная матрица имеет характеристический многочлен, являющийся произведением ее диагональных элементов,
Корни этого многочлена, а значит и собственные значения, равны 2 и 3. Алгебраическая кратность каждого собственного значения равна 2; другими словами, они оба являются двойными корнями. Сумма алгебраических кратностей всех различных собственных значений равна μ A = 4 = n , порядок характеристического многочлена и размерность A .
С другой стороны, геометрическая кратность собственного значения 2 равна только 1, поскольку его собственное пространство охватывается всего одним вектором и, следовательно, является одномерным. Аналогично, геометрическая кратность собственного значения 3 равна 1, поскольку его собственное пространство охватывается всего одним вектором . Общая геометрическая кратность γ A равна 2, что является наименьшим возможным значением для матрицы с двумя различными собственными значениями. Геометрические кратности определяются в следующем разделе.
Для эрмитовой матрицы квадрат нормы j -го компонента нормализованного собственного вектора можно вычислить, используя только собственные значения матрицы и собственные значения соответствующей младшей матрицы , где — подматрица, образованная путем удаления j -й строки и столбца из исходной матрицы. [33] [34] [35] Это тождество также распространяется на диагонализуемые матрицы и многократно переоткрывалось в литературе. [34] [36]
Определения собственных значений и собственных векторов линейного преобразования T остаются в силе, даже если базовое векторное пространство является бесконечномерным гильбертовым или банаховым пространством . Широко используемый класс линейных преобразований, действующих на бесконечномерных пространствах, — это дифференциальные операторы на функциональных пространствах . Пусть D — линейный дифференциальный оператор на пространстве C ∞ бесконечно дифференцируемых действительных функций действительного аргумента t . Уравнение собственных значений для D — это дифференциальное уравнение
Функции, удовлетворяющие этому уравнению, являются собственными векторами D и обычно называются собственными функциями .
Рассмотрим оператор производной с уравнением собственных значений
Это дифференциальное уравнение можно решить, умножив обе части на dt / f ( t ) и проинтегрировав . Его решение, экспоненциальная функция, является собственной функцией оператора производной. В этом случае собственная функция сама является функцией своего соответствующего собственного значения. В частности, при λ = 0 собственная функция f ( t ) является константой.
В основной статье о собственных функциях приведены и другие примеры.
Понятие собственных значений и собственных векторов естественным образом распространяется на произвольные линейные преобразования в произвольных векторных пространствах. Пусть V — любое векторное пространство над некоторым полем K скаляров , а T — линейное преобразование, отображающее V в V ,
Мы говорим, что ненулевой вектор v ∈ V является собственным вектором T тогда и только тогда, когда существует скаляр λ ∈ K такой, что
Это уравнение называется уравнением собственных значений для T , а скаляр λ является собственным значением T, соответствующим собственному вектору v . T ( v ) является результатом применения преобразования T к вектору v , тогда как λ v является произведением скаляра λ на v . [37] [38]
При заданном собственном значении λ рассмотрим множество
который является объединением нулевого вектора с множеством всех собственных векторов, связанных с λ . E называется собственным пространством или характеристическим пространством T, связанным с λ . [39]
По определению линейного преобразования,
для x , y ∈ V и α ∈ K. Следовательно, если u и v являются собственными векторами T , связанными с собственным значением λ , а именно u , v ∈ E , то
Итак, и u + v, и α v являются либо нулями, либо собственными векторами T , связанными с λ , а именно u + v , α v ∈ E , и E замкнуто относительно сложения и скалярного умножения. Собственное пространство E, связанное с λ, является, таким образом, линейным подпространством V. [40] Если это подпространство имеет размерность 1, его иногда называют собственной линией . [41]
Геометрическая кратность γ T ( λ ) собственного значения λ — это размерность собственного пространства, связанного с λ , т. е. максимальное число линейно независимых собственных векторов, связанных с этим собственным значением. [9] [26] [42] По определению собственных значений и собственных векторов, γ T ( λ ) ≥ 1, поскольку каждое собственное значение имеет по крайней мере один собственный вектор.
Собственные пространства T всегда образуют прямую сумму . Как следствие, собственные векторы различных собственных значений всегда линейно независимы. Следовательно, сумма размерностей собственных пространств не может превышать размерность n векторного пространства, на котором действует T , и не может быть более n различных собственных значений. [d]
Любое подпространство, охватываемое собственными векторами T, является инвариантным подпространством T , и ограничение T на такое подпространство диагонализуемо. Более того, если все векторное пространство V может быть охватываемо собственными векторами T , или, что эквивалентно, если прямая сумма собственных пространств, связанных со всеми собственными значениями T, является всем векторным пространством V , то базис V , называемый собственным базисом, может быть образован из линейно независимых собственных векторов T. Когда T допускает собственный базис, T диагонализуемо.
Если λ является собственным значением T , то оператор ( T − λI ) не является взаимно-однозначным , и, следовательно, его обратный оператор ( T − λI ) −1 не существует. Обратное верно для конечномерных векторных пространств, но не для бесконечномерных векторных пространств. В общем случае оператор ( T − λI ) может не иметь обратного оператора, даже если λ не является собственным значением.
По этой причине в функциональном анализе собственные значения могут быть обобщены на спектр линейного оператора T как множество всех скаляров λ, для которых оператор ( T − λI ) не имеет ограниченного обратного. Спектр оператора всегда содержит все его собственные значения, но не ограничивается ими.
Можно обобщить алгебраический объект, действующий на векторное пространство, заменив один оператор, действующий на векторное пространство, представлением алгебры – ассоциативной алгеброй, действующей на модуль . Изучение таких действий является областью теории представлений .
Представление в теории весов является аналогом собственных значений, тогда как весовые векторы и весовые пространства являются аналогами собственных векторов и собственных пространств соответственно.
Собственный пучок Гекке является тензорным кратным самого себя и рассматривается в соответствии Ленглендса .
Простейшие разностные уравнения имеют вид
Решение этого уравнения относительно x относительно t находится с помощью его характеристического уравнения
которые можно найти, сложив в матричную форму набор уравнений, состоящий из вышеприведенного дифференциального уравнения и k – 1 уравнений, дающих k -мерную систему первого порядка в сложенном векторе переменных в терминах его однократно запаздывающего значения, и взяв характеристическое уравнение матрицы этой системы. Это уравнение дает k характеристических корней для использования в уравнении решения
Аналогичная процедура используется для решения дифференциального уравнения вида
Вычисление собственных значений и собственных векторов — это тема, где теория, представленная в учебниках элементарной линейной алгебры, часто очень далека от практики.
Классический метод заключается в том, чтобы сначала найти собственные значения, а затем вычислить собственные векторы для каждого собственного значения. Он в нескольких отношениях плохо подходит для неточной арифметики, такой как числа с плавающей точкой .
Собственные значения матрицы можно определить, найдя корни характеристического полинома. Это легко для матриц, но сложность быстро возрастает с размером матрицы.
Теоретически коэффициенты характеристического многочлена могут быть вычислены точно, поскольку они являются суммами произведений элементов матрицы; и существуют алгоритмы, которые могут найти все корни многочлена произвольной степени с любой требуемой точностью . [43] Однако этот подход нежизнеспособен на практике, поскольку коэффициенты будут загрязнены неизбежными ошибками округления , а корни многочлена могут быть чрезвычайно чувствительной функцией коэффициентов (как показано на примере многочлена Уилкинсона ). [43] Даже для матриц, элементы которых являются целыми числами, вычисление становится нетривиальным, поскольку суммы очень длинные; постоянный член является определителем , который для матрицы является суммой различных произведений. [e]
Явные алгебраические формулы для корней многочлена существуют только если степень равна 4 или меньше. Согласно теореме Абеля–Руффини не существует общей, явной и точной алгебраической формулы для корней многочлена степени 5 или больше. (Общность имеет значение, поскольку любой многочлен степени является характеристическим многочленом некоторой сопутствующей матрицы порядка .) Поэтому для матриц порядка 5 или больше собственные значения и собственные векторы не могут быть получены явной алгебраической формулой и поэтому должны вычисляться приближенными численными методами . Даже точная формула для корней многочлена степени 3 численно непрактична.
Как только (точное) значение собственного значения известно, соответствующие собственные векторы могут быть найдены путем нахождения ненулевых решений уравнения собственных значений, которое становится системой линейных уравнений с известными коэффициентами. Например, как только известно, что 6 является собственным значением матрицы
мы можем найти его собственные векторы, решив уравнение , то есть
Это матричное уравнение эквивалентно двум линейным уравнениям , то есть
Оба уравнения сводятся к одному линейному уравнению . Следовательно, любой вектор вида , для любого ненулевого действительного числа , является собственным вектором с собственным значением .
Матрица выше имеет еще одно собственное значение . Аналогичное вычисление показывает, что соответствующие собственные векторы являются ненулевыми решениями , то есть любым вектором вида , для любого ненулевого действительного числа .
Обратный подход, сначала поиск собственных векторов, а затем определение каждого собственного значения из его собственного вектора, оказывается гораздо более податливым для компьютеров. Самый простой алгоритм здесь состоит в выборе произвольного начального вектора и последующем многократном умножении его на матрицу (опционально нормализуя вектор, чтобы сохранить его элементы разумного размера); это заставляет вектор сходиться к собственному вектору. Вариация заключается в том, чтобы вместо этого умножить вектор на ; это заставляет его сходиться к собственному вектору собственного значения, ближайшего к .
Если является (хорошим приближением) собственным вектором , то соответствующее собственное значение можно вычислить как
где обозначает сопряженное транспонирование .
Эффективные и точные методы вычисления собственных значений и собственных векторов произвольных матриц не были известны до тех пор, пока в 1961 году не был разработан алгоритм QR . [43] Объединение преобразования Хаусхолдера с LU-разложением приводит к алгоритму с лучшей сходимостью, чем у алгоритма QR. [ требуется ссылка ] Для больших эрмитовых разреженных матриц алгоритм Ланцоша является одним из примеров эффективного итеративного метода вычисления собственных значений и собственных векторов, среди нескольких других возможностей. [43]
Большинство численных методов, вычисляющих собственные значения матрицы, также определяют набор соответствующих собственных векторов как побочный продукт вычисления, хотя иногда разработчики решают отбросить информацию о собственных векторах, как только она больше не нужна.
Собственные векторы и собственные значения могут быть полезны для понимания линейных преобразований геометрических фигур. В следующей таблице представлены некоторые примеры преобразований на плоскости вместе с их матрицами 2×2, собственными значениями и собственными векторами.
Характеристическое уравнение для поворота — это квадратное уравнение с дискриминантом , которое является отрицательным числом, когда θ не является целым кратным 180°. Поэтому, за исключением этих особых случаев, два собственных значения являются комплексными числами, ; и все собственные векторы имеют недействительные элементы. Действительно, за исключением этих особых случаев, поворот изменяет направление каждого ненулевого вектора в плоскости.
Линейное преобразование, переводящее квадрат в прямоугольник той же площади ( отображение сжатия ), имеет обратные собственные значения.
Собственное разложение симметричной положительно полуопределенной (PSD) матрицы дает ортогональный базис собственных векторов , каждый из которых имеет неотрицательное собственное значение. Ортогональное разложение матрицы PSD используется в многомерном анализе , где выборочные ковариационные матрицы являются PSD. Это ортогональное разложение называется анализом главных компонент (PCA) в статистике. PCA изучает линейные связи между переменными. PCA выполняется на ковариационной матрице или корреляционной матрице (в которой каждая переменная масштабируется так, чтобы ее выборочная дисперсия была равна единице). Для ковариационной или корреляционной матрицы собственные векторы соответствуют главным компонентам , а собственные значения - дисперсии , объясняемой главными компонентами. Анализ главных компонент корреляционной матрицы обеспечивает ортогональный базис для пространства наблюдаемых данных: в этом базисе наибольшие собственные значения соответствуют главным компонентам, которые связаны с большей частью ковариации среди ряда наблюдаемых данных.
Анализ главных компонент используется как средство снижения размерности при изучении больших наборов данных , таких как те, которые встречаются в биоинформатике . В методологии Q собственные значения корреляционной матрицы определяют суждение Q-методиста о практической значимости (которая отличается от статистической значимости проверки гипотез ; ср. критерии определения числа факторов ). В более общем плане анализ главных компонент может использоваться как метод факторного анализа в моделировании структурных уравнений .
В спектральной теории графов собственное значение графа определяется как собственное значение матрицы смежности графа или (все чаще) матрицы Лапласа графа из-за его дискретного оператора Лапласа , который является либо (иногда называемым комбинаторным Лапласианом ), либо (иногда называемым нормализованным Лапласианом ), где — диагональная матрица с равной степени вершины , а в , й диагональный элемент равен . й главный собственный вектор графа определяется либо как собственный вектор, соответствующий й наибольшему или й наименьшему собственному значению Лапласа. Первый главный собственный вектор графа также называется просто главным собственным вектором.
Главный собственный вектор используется для измерения центральности его вершин. Примером является алгоритм PageRank от Google . Главный собственный вектор модифицированной матрицы смежности графа Всемирной паутины дает ранги страниц в качестве своих компонентов. Этот вектор соответствует стационарному распределению цепи Маркова , представленной нормализованной по строкам матрицей смежности; однако матрица смежности должна быть сначала изменена, чтобы обеспечить существование стационарного распределения. Второй наименьший собственный вектор может быть использован для разбиения графа на кластеры с помощью спектральной кластеризации . Для кластеризации также доступны другие методы.
Цепь Маркова представлена матрицей, элементы которой являются вероятностями переходов между состояниями системы. В частности, элементы неотрицательны, и каждая строка матрицы в сумме дает единицу, являющуюся суммой вероятностей переходов из одного состояния в некоторое другое состояние системы. Теорема Перрона–Фробениуса дает достаточные условия для того, чтобы цепь Маркова имела единственное доминирующее собственное значение, которое управляет сходимостью системы к устойчивому состоянию.
Проблемы собственных значений возникают естественным образом при анализе вибрации механических конструкций со многими степенями свободы . Собственные значения являются собственными частотами (или собственными частотами ) вибрации, а собственные векторы являются формами этих колебательных мод. В частности, незатухающая вибрация регулируется или
То есть ускорение пропорционально положению (т.е. мы ожидаем, что оно будет синусоидальным во времени).
В измерениях становится матрицей масс и матрицей жесткости . Допустимые решения тогда являются линейной комбинацией решений обобщенной задачи собственных значений , где - собственное значение, а - (мнимая) угловая частота . Основные моды колебаний отличаются от основных мод податливости, которые являются собственными векторами только . Кроме того, затухающая вибрация , регулируемая приводит к так называемой квадратичной задаче собственных значений ,
Эту задачу можно свести к обобщенной задаче на собственные значения с помощью алгебраических манипуляций, но за счет решения более крупной системы.
Свойства ортогональности собственных векторов позволяют разделить дифференциальные уравнения , так что система может быть представлена в виде линейной суммы собственных векторов. Проблема собственных значений сложных структур часто решается с использованием конечно-элементного анализа , но аккуратно обобщает решение для скалярно-значных задач вибрации.
В механике собственные векторы тензора момента инерции определяют главные оси твердого тела . Тензор момента инерции является ключевой величиной, необходимой для определения вращения твердого тела вокруг его центра масс .
В механике твердого тела тензор напряжений симметричен и поэтому может быть разложен на диагональный тензор с собственными значениями на диагонали и собственными векторами в качестве базиса. Поскольку он диагональный, в этой ориентации тензор напряжений не имеет компонент сдвига ; компоненты, которые у него есть, являются главными компонентами.
Примером уравнения на собственные значения, в котором преобразование представлено в терминах дифференциального оператора, является не зависящее от времени уравнение Шредингера в квантовой механике :
где , Гамильтониан , является дифференциальным оператором второго порядка , а , волновая функция , является одной из его собственных функций, соответствующей собственному значению , интерпретируемому как его энергия .
Однако в случае, когда интерес представляют только решения уравнения Шредингера для связанного состояния , ищут в пространстве квадратично интегрируемых функций. Поскольку это пространство является гильбертовым пространством с хорошо определенным скалярным произведением , можно ввести базисный набор , в котором и могут быть представлены как одномерный массив (т. е. вектор) и матрица соответственно. Это позволяет представить уравнение Шредингера в матричной форме.
В этом контексте часто используется обозначение скобок . Вектор, представляющий состояние системы, в гильбертовом пространстве квадратично интегрируемых функций представлен как . В этой записи уравнение Шредингера имеет вид:
где — собственное состояние и представляет собственное значение. — наблюдаемый самосопряженный оператор , бесконечномерный аналог эрмитовых матриц. Как и в случае матрицы, в приведенном выше уравнении подразумевается вектор, полученный путем применения преобразования к .
Свет , акустические волны и микроволны случайным образом рассеиваются много раз при прохождении через статическую неупорядоченную систему. Несмотря на то, что многократное рассеяние многократно рандомизирует волны, в конечном итоге когерентный перенос волн через систему является детерминированным процессом, который можно описать матрицей передачи поля . [44] [45] Собственные векторы оператора передачи образуют набор входных волновых фронтов, специфичных для беспорядка, которые позволяют волнам связываться с собственными каналами неупорядоченной системы: независимые пути, по которым волны могут проходить через систему. Собственные значения, , соответствуют коэффициенту пропускания интенсивности, связанному с каждым собственным каналом. Одним из замечательных свойств оператора передачи диффузионных систем является их бимодальное распределение собственных значений с и . [45] Кроме того, одним из поразительных свойств открытых собственных каналов, помимо идеального коэффициента пропускания, является статистически надежный пространственный профиль собственных каналов. [46]
В квантовой механике , и в частности в атомной и молекулярной физике , в рамках теории Хартри-Фока атомные и молекулярные орбитали могут быть определены собственными векторами оператора Фока . Соответствующие собственные значения интерпретируются как потенциалы ионизации с помощью теоремы Купманса . В этом случае термин собственный вектор используется в несколько более общем смысле, поскольку оператор Фока явно зависит от орбиталей и их собственных значений. Таким образом, если кто-то хочет подчеркнуть этот аспект, он говорит о нелинейных задачах на собственные значения. Такие уравнения обычно решаются с помощью итерационной процедуры, называемой в этом случае методом самосогласованного поля . В квантовой химии часто представляют уравнение Хартри-Фока в неортогональном базисном наборе . Это конкретное представление является обобщенной задачей на собственные значения, называемой уравнениями Рутана .
В геологии , особенно при изучении ледникового тилла , собственные векторы и собственные значения используются как метод, с помощью которого масса информации об ориентации и наклоне составляющих обломочной ткани может быть суммирована в трехмерном пространстве шестью числами. В полевых условиях геолог может собирать такие данные для сотен или тысяч обломков в образце почвы, которые можно сравнить только графически, например, на диаграмме Tri-Plot (Sneed and Folk), [47] [48] или как стереосеть на сети Вульфа. [49]
Выходные данные для тензора ориентации находятся в трех ортогональных (перпендикулярных) осях пространства. Три собственных вектора упорядочены по их собственным значениям ; [50] тогда — это первичная ориентация/падение обломка, — вторичная и — третичная, с точки зрения прочности. Ориентация обломка определяется как направление собственного вектора на компасе 360 ° . Падение измеряется как собственное значение, модуль тензора: оно оценивается от 0° (нет падения) до 90° (вертикально). Относительные значения , и определяются природой структуры осадка. Если , структура называется изотропной. Если , структура называется плоской. Если , структура называется линейной. [51]
Базовое число воспроизводства ( ) является фундаментальным числом в изучении того, как распространяются инфекционные заболевания. Если один инфекционный человек поместить в популяцию полностью восприимчивых людей, то это среднее число людей, которых заразит один типичный инфекционный человек. Время генерации инфекции - это время, , от момента заражения одного человека до момента заражения следующего человека. В гетерогенной популяции матрица следующего поколения определяет, сколько людей в популяции заразятся по прошествии времени . Тогда это значение является наибольшим собственным значением матрицы следующего поколения. [52] [53]
При обработке изображений обработанные изображения лиц можно рассматривать как векторы, компонентами которых являются яркости каждого пикселя . [54] Размерность этого векторного пространства — это количество пикселей. Собственные векторы ковариационной матрицы , связанной с большим набором нормализованных изображений лиц, называются собственными лицами ; это пример анализа главных компонент . Они очень полезны для выражения любого изображения лица как линейной комбинации некоторых из них. В ветви биометрии распознавания лиц собственные лица предоставляют средство применения сжатия данных к лицам в целях идентификации . Также были проведены исследования, связанные с системами собственного зрения, определяющими жесты рук.
Подобно этой концепции, собственные голоса представляют собой общее направление изменчивости в человеческом произношении конкретного высказывания, например, слова в языке. На основе линейной комбинации таких собственных голосов может быть построено новое голосовое произношение слова. Эти концепции оказались полезными в системах автоматического распознавания речи для адаптации говорящего.
Викиверситет использует вводную физику для введения в собственные значения и собственные векторы