stringtranslate.com

Матрица (математика)

Две высокие квадратные скобки с m-многими строками, каждая из которых содержит n-многие переменные с индексом «a». Каждой букве «а» присваивается номер строки и номер столбца в качестве нижнего индекса.
Матрица размера m × n : строки m горизонтальны, а столбцы n вертикальны. Каждый элемент матрицы часто обозначается переменной с двумя индексами . Например, 2,1 представляет элемент во второй строке и первом столбце матрицы.

В математике матрица ( мн. : матрицы ) — это прямоугольный массив или таблица чисел , символов или выражений , расположенных в строках и столбцах, которая используется для представления математического объекта или свойства такого объекта.

Например,

Матрицы используются для представления линейных карт и позволяют выполнять явные вычисления в линейной алгебре . Следовательно, изучение матриц составляет большую часть линейной алгебры, и большинство свойств и операций абстрактной линейной алгебры можно выразить через матрицы. Например, умножение матриц представляет собой композицию линейных карт.

Не все матрицы относятся к линейной алгебре. Это, в частности, имеет место в теории графов , матрицах инцидентности и матрицах смежности . [1] Эта статья посвящена матрицам, связанным с линейной алгеброй, и, если не указано иное, все матрицы представляют собой линейные карты или могут рассматриваться как таковые.

Квадратные матрицы , матрицы с одинаковым количеством строк и столбцов, играют важную роль в теории матриц. Квадратные матрицы заданной размерности образуют некоммутативное кольцо , которое является одним из наиболее распространенных примеров некоммутативного кольца. Определитель квадратной матрицы — это число , связанное с матрицей, которое имеет фундаментальное значение для изучения квадратной матрицы; например, квадратная матрица обратима тогда и только тогда, когда она имеет ненулевой определитель, а собственные значения квадратной матрицы являются корнями полиномиального определителя .

В геометрии матрицы широко используются для определения и представления геометрических преобразований (например, поворотов ) и изменений координат . В численном анализе многие вычислительные задачи решаются путем сведения их к матричным вычислениям, и это часто предполагает вычисления с матрицами огромной размерности. Матрицы используются в большинстве областей математики и большинстве научных областей либо напрямую, либо посредством их использования в геометрии и численном анализе.

Теория матриц — это раздел математики , который занимается изучением матриц. Первоначально это была часть линейной алгебры , но вскоре она расширилась и включила в себя предметы, связанные с теорией графов , алгеброй , комбинаторикой и статистикой .

Определение

Матрица это прямоугольный массив чисел (или других математических объектов), называемый элементами матрицы. С матрицами выполняются стандартные операции , такие как сложение и умножение. [2] Чаще всего матрица над полем F представляет собой прямоугольный массив элементов F . [3] [4] Действительная матрица и комплексная матрица — это матрицы, элементами которых являются соответственно действительные или комплексные числа . Более общие типы записей обсуждаются ниже. Например, это реальная матрица:

Числа, символы или выражения в матрице называются ее записями или элементами . Горизонтальные и вертикальные линии записей в матрице называются строками и столбцами соответственно.

Размер

Размер матрицы определяется количеством содержащихся в ней строк и столбцов. Не существует ограничений на количество строк и столбцов, которые может иметь матрица (в обычном смысле), если они являются целыми положительными числами. Матрица со строками и столбцами называется матрицей или поматрицей , где и называются ее размерностями . Например, матрица выше — это матрица.

Матрицы с одной строкой называются векторами-строками , а матрицы с одним столбцом — векторами-столбцами . Матрица с одинаковым количеством строк и столбцов называется квадратной матрицей . [5] Матрица с бесконечным числом строк или столбцов (или того и другого) называется бесконечной матрицей. В некоторых контекстах, например в программах компьютерной алгебры , полезно рассматривать матрицу без строк и столбцов, называемую пустой матрицей.

Обозначения

Специфика обозначения символьных матриц широко варьируется, но преобладают некоторые тенденции. Матрицы обычно записываются в квадратных скобках или круглых скобках , поэтому матрица представляется в виде

Матрицы обычно обозначаются прописными буквами (например, в примерах выше), а соответствующие строчные буквы с двумя индексами нижнего регистра (например, или ) обозначают записи. Помимо использования прописных букв для обозначения матриц, многие авторы используют специальный типографский стиль , обычно жирный римский (не курсив), чтобы еще больше отличать матрицы от других математических объектов. Альтернативное обозначение предполагает использование двойного подчеркивания имени переменной с жирным шрифтом или без него, как в .

Запись в i -й строке и j -м столбце матрицы A иногда называют записью или матрицы и обычно обозначают или . Альтернативные обозначения для этой записи: и . Например, запись следующей матрицы равна 5 (также обозначается , или ) :

Иногда элементы матрицы можно определить по такой формуле, как . Например, каждый из элементов следующей матрицы определяется по формуле .

В этом случае сама матрица иногда определяется этой формулой в квадратных или двойных скобках. Например, приведенная выше матрица определяется как или . Если размер матрицы равен , вышеупомянутая формула действительна для любого и любого . Это можно указать отдельно или указать в качестве нижнего индекса. Например, приведенная выше матрица равна , и ее можно определить как или .

Некоторые языки программирования используют массивы с двойным индексом (или массивы массивов) для представления матрицы размером m на n . Некоторые языки программирования начинают нумерацию индексов массива с нуля, и в этом случае элементы матрицы m - n индексируются с помощью и . [6] Эта статья следует более распространенному соглашению в математической литературе, согласно которому нумерация начинается с 1 .

Звездочка иногда используется для обозначения целых строк или столбцов в матрице. Например, относится к i -й строке A , а относится к j -му столбцу.

Множество всех действительных матриц размером m на n часто обозначается или. Набор всех матриц размером m на n над другим полем или над кольцом R обозначается аналогичным образом , или Если m = n , например, в случае квадратные матрицы , размерность не повторяется: или [7] Часто используется вместо   

Основные операции

Существует ряд основных операций, которые можно применять к матрицам. Некоторые из них, такие как транспонирование и подматрица, не зависят от характера записей. Другие, такие как сложение матриц , скалярное умножение , умножение матриц и операции со строками , включают операции с элементами матрицы и, следовательно, требуют, чтобы элементы матрицы были числами или принадлежали полю или кольцу . [8]

В этом разделе предполагается, что элементы матрицы принадлежат фиксированному кольцу, которое обычно представляет собой поле чисел.

Сложение, скалярное умножение, вычитание и транспонирование.

Добавление

Сумма A + B двух матриц A и B размером mxn вычисляется по пунктам :

( A + B ) я , j знак равно А я , j + B я , j , где 1 ≤ ям и 1 ≤ jп .

Например,

Скалярное умножение

Произведение c A числа c (также называемого в этом контексте скаляром ) и матрицы A вычисляется путем умножения каждой записи A на c :

( c А ) я , j знак равно c · А я , j .

Эта операция называется скалярным умножением , но ее результат не называется «скалярным произведением», чтобы избежать путаницы, поскольку «скалярное произведение» часто используется как синоним « внутреннего произведения ». Например:

Вычитание

Вычитание двух матриц размера m × n определяется путем сложения матриц со скалярным умножением на –1 :

Транспонирование

Транспонирование матрицы A размером m на n представляет собой матрицу A T размером n на m (также обозначаемую A tr или t A ), образованную путем преобразования строк в столбцы и наоборот:

( А Т ) я , j знак равно А j , я .

Например:

На эти операции над матрицами распространяются знакомые свойства чисел: например, сложение коммутативно , то есть сумма матриц не зависит от порядка слагаемых: A  + B = B + A. [9] Транспонирование совместимо со сложением и скалярным умножением, что выражается формулами ( c A ) T = c ( A T ) и ( A + B ) T = AT + BT . Наконец, ( А Т ) Т знак равно А .             

Умножение матрицы

Схематическое изображение матричного произведения AB двух матриц A и B.

Умножение двух матриц определяется тогда и только тогда, когда количество столбцов левой матрицы совпадает с количеством строк правой матрицы. Если A — матрица размером m на n , а B — матрица размером n на p , то их матричный продукт AB — это матрица размером m на p , элементы которой задаются скалярным произведением соответствующей строки A и соответствующей строки. столбец B : [10]

где 1 ≤ im и 1 ≤ jp . [11] Например, подчеркнутая запись 2340 в произведении рассчитывается как (2 × 1000) + (3 × 100) + (4 × 10) = 2340:

Умножение матриц удовлетворяет правилам ( AB ) C = A ( BC ) ( ассоциативность ) и ( A + B ) C = AC + BC , а также C ( A + B ) = CA + CB (левая и правая дистрибутивность ), всякий раз, когда размер матриц таков, что определены различные продукты. [12] Произведение AB может быть определено без определения BA , а именно, если A и B представляют собой матрицы m -by- n и n -by- k соответственно, и mk . Даже если оба продукта определены, они, как правило, не обязательно должны быть равными, то есть:

АВБА ,

Другими словами, умножение матриц не является коммутативным , в отличие от чисел (рациональных, действительных или комплексных), произведение которых не зависит от порядка множителей. [10] Пример двух матриц, не коммутирующих друг с другом:

тогда как

Помимо только что описанного обычного умножения матриц, существуют и другие менее часто используемые операции с матрицами, которые можно рассматривать как формы умножения, такие как произведение Адамара и произведение Кронекера . [13] Они возникают при решении матричных уравнений, таких как уравнение Сильвестра .

Операции со строками

Существует три типа операций со строками:

  1. добавление строки, то есть добавление одной строки к другой.
  2. умножение строк, то есть умножение всех записей строки на ненулевую константу;
  3. переключение строк, то есть замена двух строк матрицы;

Эти операции используются несколькими способами, включая решение линейных уравнений и поиск обратных матриц .

Подматрица

Подматрица матрицы — это матрица, полученная удалением любого набора строк и/или столбцов. [14] [15] [16] Например, из следующей матрицы 3х4 мы можем построить подматрицу 2х3, удалив строку 3 и столбец 2:

Миноры и кофакторы матрицы находятся путем вычисления определителя определенных подматриц. [16] [17]

Главная подматрица — это квадратная подматрица, полученная удалением определенных строк и столбцов. Определение варьируется от автора к автору. По мнению некоторых авторов, главная подматрица — это подматрица, в которой набор оставшихся индексов строк такой же, как набор оставшихся индексов столбцов. [18] [19] Другие авторы определяют главную подматрицу как такую, в которой первые k строк и столбцов для некоторого числа k являются теми, которые остаются; [20] этот тип подматрицы также называют ведущей главной подматрицей . [21]

Линейные уравнения

Матрицы можно использовать для компактной записи и работы с несколькими линейными уравнениями, то есть системами линейных уравнений. Например, если A — матрица размером m x n , x обозначает вектор-столбец (то есть матрицу n × 1) из n переменных x 1 , x 2 , ..., x n , а bматрица m ×1-вектор-столбец, то матричное уравнение

эквивалентна системе линейных уравнений [22]

Используя матрицы, эту задачу можно решить более компактно, чем это было бы возможно, выписав все уравнения по отдельности. Если n = m и уравнения независимы , то это можно сделать, написав

где A 1 — обратная матрица A. Если A не имеет обратного, решения (если таковые имеются) можно найти, используя его обобщенное обратное .

Линейные преобразования

Векторы, представленные матрицей 2х2, соответствуют сторонам единичного квадрата, преобразованного в параллелограмм.

Матрицы и умножение матриц раскрывают свои существенные особенности, когда они связаны с линейными преобразованиями , также известными как линейные карты . Действительная матрица A размером mxn приводит к линейному преобразованию Rn Rm , отображающему каждый вектор x в Rn в (матричное) произведение Ax , которое является вектором в Rm . И наоборот, каждое линейное преобразование f : R nR m возникает из уникальной матрицы A размером m x n : явно, ( i , j )-запись A является i - й координатой f ( e j ), где e j = (0,...,0,1,0,...,0)единичный вектор с 1 в j позиции и 0 в остальных местах. Говорят, что матрица A представляет линейное отображение f , а A называется матрицей преобразования f .

Например, матрица 2×2

можно рассматривать как преобразование единичного квадрата в параллелограмм с вершинами в точках (0, 0) , ( a , b ) , ( a + c , b + d ) и ( c , d ) . Параллелограмм, изображенный справа, получается путем умножения A на каждый из вектор-столбцов и по очереди. Эти векторы определяют вершины единичного квадрата.

В следующей таблице показано несколько действительных матриц 2×2 с соответствующими линейными отображениями R 2 . Синий оригинал сопоставляется с зеленой сеткой и фигурами. Начало координат (0,0) отмечено черной точкой.

При соответствии 1 к 1 между матрицами и линейными картами умножение матриц соответствует композиции карт: [23] если матрица B размером k x m представляет другую линейную карту g : R mR k , то композиция gf представлено BA , поскольку

( гж )( Икс ) знак равно г ( ж ( Икс )) знак равно г ( Ах ) знак равно B ( Ах ) знак равно ( BA ) Икс .

Последнее равенство следует из отмеченной выше ассоциативности умножения матриц.

Ранг матрицы A — это максимальное количество линейно независимых векторов-строк матрицы, которое совпадает с максимальным количеством линейно независимых векторов-столбцов. [24] Эквивалентно, это размерность изображения линейной карты, представленной A . [25] Теорема о ранге-нулевости гласит, что размерность ядра матрицы плюс ранг равна количеству столбцов матрицы. [26]

Квадратная матрица

Квадратная матрица – это матрица с одинаковым количеством строк и столбцов. [5] Матрица размера n x n известна как квадратная матрица порядка n. Любые две квадратные матрицы одного порядка можно складывать и перемножать. Элементы a ii образуют главную диагональ квадратной матрицы. Они лежат на воображаемой линии, идущей из левого верхнего угла в правый нижний угол матрицы.

Основные типы

Диагональная и треугольная матрица

Если все элементы A ниже главной диагонали равны нулю, A называется верхней треугольной матрицей . Аналогично, если все элементы A выше главной диагонали равны нулю, A называется нижней треугольной матрицей . Если все элементы за пределами главной диагонали равны нулю, A называется диагональной матрицей .

Единичная матрица

Единичная матрица I n размера n — это матрица размером n × n , в которой все элементы на главной диагонали равны 1, а все остальные элементы равны 0, например,

Это квадратная матрица порядка n , а также особый вид диагональной матрицы . Она называется единичной матрицей, потому что умножение на нее оставляет матрицу неизменной:

AI n = I m A = A для любойматрицы A размера m x n .

Ненулевое скалярное кратное единичной матрицы называется скалярной матрицей. Если элементы матрицы происходят из поля, скалярные матрицы образуют группу при умножении матриц, которая изоморфна мультипликативной группе ненулевых элементов поля.

Симметричная или кососимметричная матрица

Квадратная матрица A , равная ее транспонированной, то есть A = AT , является симметричной матрицей . Если вместо этого A равно отрицательному результату транспонирования, то есть A =AT , то A является кососимметричной матрицей . В комплексных матрицах симметрию часто заменяют понятием эрмитовых матриц , которые удовлетворяют A = A , где звездочка или звездочка обозначает сопряженное транспонирование матрицы, то есть транспонирование комплексно- сопряженного A.

По спектральной теореме вещественные симметричные матрицы и комплексные эрмитовые матрицы имеют собственный базис ; то есть каждый вектор выражается как линейная комбинация собственных векторов. В обоих случаях все собственные значения действительны. [27] Эту теорему можно обобщить на бесконечномерные ситуации, связанные с матрицами с бесконечным числом строк и столбцов, см. ниже.

Обратимая матрица и ее обратная

Квадратная матрица A называется обратимой или неособой , если существует матрица B такая, что

АВ = БА = I н , [28] [29]

где I nединичная матрица размера n × n с единицами на главной диагонали и нулями в остальных местах. Если B существует, то она уникальна и называется обратной матрицей A , обозначаемой A −1 .

Определенная матрица

Симметричная вещественная матрица A называется положительно определенной, если соответствующая ей квадратичная форма

ж ( Икс ) знак равно Икс Т А  Икс

имеет положительное значение для каждого ненулевого вектора x в Rn . Если f ( x ) дает только отрицательные значения, то A является отрицательно определенным ; если f действительно дает как отрицательные, так и положительные значения, то A является неопределенным . [30] Если квадратичная форма f дает только неотрицательные значения (положительные или нулевые), симметричная матрица называется положительно-полуопределенной (или, если только неположительные значения, то отрицательно-полуопределенной); следовательно, матрица является неопределенной именно тогда, когда она не является ни положительно-полуопределенной, ни отрицательно-полуопределенной.

Симметричная матрица является положительно определенной тогда и только тогда, когда все ее собственные значения положительны, то есть матрица положительно-полуопределенна и обратима. [31] В таблице справа показаны две возможности для матриц 2х2.

Разрешение в качестве входных данных двух разных векторов вместо этого дает билинейную форму , связанную с A : [32]

B А ( Икс , y ) знак равно Икс Т Ay .

В случае комплексных матриц применяются та же терминология и результат: симметричная матрица , квадратичная форма , билинейная форма и транспонирование x T заменяются соответственно эрмитовой матрицей , эрмитовой формой , полуторалинейной формой и сопряженным транспонированием x H.

Ортогональная матрица

Ортогональная матрица — это квадратная матрица с действительными элементами, столбцы и строки которой являются ортогональными единичными векторами (то есть ортонормированными векторами). Эквивалентно, матрица A ортогональна, если ее транспонирование равно обратному :

что влечет за собой

где I nединичная матрица размера n .

Ортогональная матрица A обязательно обратима (с обратным A −1 = A T ), унитарна ( A −1 = A * ) и нормальна ( A * A = AA * ). Определитель любой ортогональной матрицы равен +1 или −1 . Специальная ортогональная матрица — это ортогональная матрица с определителем +1. В качестве линейного преобразования каждая ортогональная матрица с определителем +1 представляет собой чистое вращение без отражения, т. е. преобразование сохраняет ориентацию преобразованной структуры, в то время как каждая ортогональная матрица с определителем -1 меняет ориентацию, т. е. представляет собой композицию чистое отражение и (возможно, нулевое) вращение. Единичные матрицы имеют определитель 1 и представляют собой чистые повороты на нулевой угол.

Комплексным аналогом ортогональной матрицы является унитарная матрица .

Основные операции

След

След tr( A ) квадратной матрицы A представляет собой сумму ее диагональных элементов. Хотя умножение матриц не является коммутативным, как упоминалось выше, след произведения двух матриц не зависит от порядка множителей:

.

Это следует из определения умножения матриц:

Отсюда следует, что след произведения более чем двух матриц не зависит от циклических перестановок матриц, однако это, вообще говоря, неприменимо для произвольных перестановок (например, tr( ABC ) ≠ tr( BAC ), вообще говоря). Кроме того, след матрицы равен следу ее транспонирования, то есть

тр( А ) знак равно тр( А Т ) .

Определитель

Линейное преобразование на R2 , заданное указанной матрицей. Определитель этой матрицы равен -1, поскольку площадь зеленого параллелограмма справа равна 1, но карта меняет ориентацию на противоположную, поскольку она меняет ориентацию векторов против часовой стрелки на ориентацию по часовой стрелке.

Определитель квадратной матрицы A (обозначается det( A ) или | A | ) — это число, кодирующее определенные свойства матрицы. Матрица обратима тогда и только тогда, когда ее определитель отличен от нуля. Его абсолютное значение равно площади (в R 2 ) или объему (в R 3 ) изображения единичного квадрата (или куба), а его знак соответствует ориентации соответствующей линейной карты: определитель положителен тогда и только тогда, когда если ориентация сохраняется.

Определитель матриц 2х2 определяется выражением

[33]

Определитель матриц 3х3 включает 6 членов ( правило Сарруса ). Более длинная формула Лейбница обобщает эти две формулы на все измерения. [34]

Определитель произведения квадратных матриц равен произведению их определителей:

det( AB ) = det( A ) · det( B ) или используя альтернативные обозначения:
| АБ | = | А | · | Б |. [35]

Добавление кратного любой строки к другой строке или кратного любого столбца к другому столбцу не меняет определитель. Перестановка двух строк или двух столбцов влияет на определитель, умножая его на -1. [36] С помощью этих операций любую матрицу можно преобразовать в нижнюю (или верхнюю) треугольную матрицу, и для таких матриц определитель равен произведению элементов на главной диагонали; это обеспечивает метод вычисления определителя любой матрицы. Наконец, разложение Лапласа выражает определитель через миноры , то есть определители меньших матриц. [37] Это расширение можно использовать для рекурсивного определения определителей (взяв в качестве начального случая определитель матрицы 1 на 1, который является ее уникальным элементом, или даже определитель матрицы 0 на 0, который равно 1), что, как можно видеть, эквивалентно формуле Лейбница. Определители можно использовать для решения линейных систем с использованием правила Крамера , где деление определителей двух связанных квадратных матриц приравнивается к значению каждой из переменных системы. [38]

Собственные значения и собственные векторы

Число и ненулевой вектор v, удовлетворяющие

называются собственным значением и собственным вектором A соответственно . [39] [40] Число λ является собственным значением n × n -матрицы A тогда и только тогда, когда A − λ I n не обратима, что эквивалентно

[41]

Полином p A от неопределенного X , заданный вычислением определителя det( X I nA ), называется характеристическим многочленом A . Это монический полином степени n . Следовательно, полиномиальное уравнение p A (λ)  =  0 имеет не более n различных решений, т. е. собственных значений матрицы. [42] Они могут быть сложными, даже если элементы A реальны. Согласно теореме Кэли-Гамильтона , p A ( A ) = 0 , то есть результат подстановки самой матрицы в собственный характеристический полином дает нулевую матрицу .

Вычислительные аспекты

Матричные вычисления часто могут выполняться с использованием различных методов. Многие задачи можно решить как прямыми алгоритмами, так и итеративными подходами. Например, собственные векторы квадратной матрицы можно получить, найдя последовательность векторов x n , сходящихся к собственному вектору, когда n стремится к бесконечности . [43]

Чтобы выбрать наиболее подходящий алгоритм для каждой конкретной задачи, важно определить как эффективность, так и точность всех доступных алгоритмов. Область, изучающая эти вопросы, называется числовой линейной алгеброй . [44] Как и в других числовых ситуациях, двумя основными аспектами являются сложность алгоритмов и их численная стабильность .

Определение сложности алгоритма означает нахождение верхних границ или оценок того, сколько элементарных операций, таких как сложение и умножение скаляров, необходимо для выполнения некоторого алгоритма, например, умножения матриц . Для вычисления матричного произведения двух матриц размером n на n с использованием приведенного выше определения требуется n 3 умножений, поскольку для любого из n 2 элементов произведения необходимо n умножений. Алгоритм Штрассена превосходит этот «наивный» алгоритм; для этого нужно всего лишь n 2,807 умножений. [45] Усовершенствованный подход также включает в себя специфические особенности вычислительных устройств.

Во многих практических ситуациях известна дополнительная информация об используемых матрицах. Важным случаем являются разреженные матрицы , то есть матрицы, большинство элементов которых равны нулю. Существуют специально адаптированные алгоритмы, скажем, для решения линейных систем Ax = b для разреженных матриц A , такие как метод сопряженных градиентов . [46]

Алгоритм, грубо говоря, численно устойчив, если небольшие отклонения входных значений не приводят к большим отклонениям результата. Например, вычисление обратной матрицы с помощью расширения Лапласа (adj( A ) обозначает сопряженную матрицу A )

А −1 = прил( А ) / det( А )

может привести к значительным ошибкам округления, если определитель матрицы очень мал. Норму матрицы можно использовать для определения обусловленности линейных алгебраических задач, таких как вычисление обратной матрицы. [47]

Большинство языков программирования поддерживают массивы, но не имеют встроенных команд для работы с матрицами. Вместо этого доступные внешние библиотеки обеспечивают матричные операции с массивами почти на всех используемых в настоящее время языках программирования. Манипулирование матрицами было одним из первых численных применений компьютеров. [48] ​​Оригинальный Dartmouth BASIC имел встроенные команды для матричной арифметики с массивами, начиная с его второго издания в 1964 году. Еще в 1970-х годах некоторые инженерные настольные компьютеры, такие как HP 9830 , имели картриджи ПЗУ для добавления команд BASIC для матриц . Некоторые компьютерные языки, такие как APL , были разработаны для управления матрицами, а для вычислений с матрицами можно использовать различные математические программы . [49] По состоянию на 2023 год большинство компьютеров имеют ту или иную форму встроенных матричных операций на низком уровне, реализующих стандартную спецификацию BLAS , на которую опирается большинство библиотек матриц и линейной алгебры более высокого уровня (например, EISPACK , LINPACK , LAPACK ). . Хотя большинство этих библиотек требуют профессионального уровня кодирования, доступ к LAPACK можно получить с помощью привязок более высокого уровня (и удобных для пользователя), таких как NumPy / SciPy , R , GNU Octave , MATLAB .

Разложение

Существует несколько методов преобразования матриц в более доступную форму. Их обычно называют методами матричной декомпозиции или матричной факторизации . Интерес всех этих методов состоит в том, что они сохраняют определенные свойства рассматриваемых матриц, такие как определитель, ранг или обратные значения, так что эти величины можно вычислить после применения преобразования или что определенные матричные операции алгоритмически легче выполнять. для некоторых типов матриц.

Матрицы факторов разложения LU как произведение нижней ( L ) и верхней треугольных матриц ( U ). [50] После расчета этого разложения линейные системы можно решать более эффективно с помощью простого метода, называемого прямой и обратной заменой . Аналогично, обратные треугольные матрицы алгоритмически легче вычислять. Исключение Гаусса — аналогичный алгоритм; он преобразует любую матрицу в форму эшелона строк . [51] Оба метода основаны на умножении матрицы на подходящие элементарные матрицы , что соответствует перестановке строк или столбцов и добавлению кратных одной строки к другой строке. Разложение по сингулярным значениям выражает любую матрицу A как произведение UDV * , где U и Vунитарные матрицы , а D — диагональная матрица.

Пример матрицы в жордановой нормальной форме. Серые блоки называются блоками Жордана.

Собственное разложение или диагонализация выражает A как произведение VDV −1 , где D — диагональная матрица, а V — подходящая обратимая матрица. [52] Если A можно записать в такой форме, то оно называется диагонализируемым . В более общем смысле и применимо ко всем матрицам, разложение Жордана преобразует матрицу в нормальную форму Жордана , то есть матрицы, единственными ненулевыми элементами которых являются собственные значения от λ 1 до λ n матрицы A , расположенные на главной диагонали и, возможно, элементы, равные один прямо над главной диагональю, как показано справа. [53] Учитывая собственное разложение, n- я степень A (то есть n -кратное итерированное умножение матрицы) может быть вычислена с помощью

А n = ( ВДВ −1 ) n = ВДВ −1 ВДВ −1 ... ВДВ −1 = VD n V −1

а степень диагональной матрицы можно вычислить, взяв соответствующие степени диагональных элементов, что намного проще, чем вместо этого возводить в степень A. Это можно использовать для вычисления матричной экспоненты e A , что часто возникает при решении линейных дифференциальных уравнений , матричных логарифмов и квадратных корней матриц . [54] Чтобы избежать численно плохо обусловленных ситуаций, можно использовать дополнительные алгоритмы, такие как разложение Шура . [55]

Абстрактные алгебраические аспекты и обобщения

Матрицы можно обобщать по-разному. Абстрактная алгебра использует матрицы с элементами в более общих полях или даже кольцах , тогда как линейная алгебра кодифицирует свойства матриц в понятии линейных карт. Можно рассматривать матрицы с бесконечным числом столбцов и строк. Еще одним расширением являются тензоры , которые можно рассматривать как многомерные массивы чисел, в отличие от векторов, которые часто можно реализовать как последовательности чисел, тогда как матрицы представляют собой прямоугольные или двумерные массивы чисел. [56] Матрицы при соблюдении определенных требований имеют тенденцию образовывать группы , известные как матричные группы. Аналогичным образом при определенных условиях матрицы образуют кольца , известные как матричные кольца . Хотя произведение матриц, как правило, не является коммутативным, некоторые матрицы образуют поля, известные как матричные поля .

Матрицы с более общими записями

В этой статье основное внимание уделяется матрицам, элементы которых являются действительными или комплексными числами. Однако матрицы можно рассматривать с гораздо более общими типами элементов, чем действительные или комплексные числа. В качестве первого шага обобщения вместо R или C можно использовать любое поле , то есть набор , в котором определены и корректно выполняются операции сложения , вычитания , умножения и деления , например рациональные числа или конечные поля . Например, теория кодирования использует матрицы над конечными полями. Везде, где рассматриваются собственные значения , поскольку они являются корнями многочлена, они могут существовать только в более широком поле, чем поле элементов матрицы; например, они могут быть сложными в случае матрицы с действительными элементами. Возможность по-новому интерпретировать элементы матрицы как элементы большего поля (например, рассматривать действительную матрицу как комплексную матрицу, все элементы которой оказываются вещественными), а затем позволяет считать, что каждая квадратная матрица обладает полным набором собственных значений. В качестве альтернативы можно с самого начала рассматривать только матрицы с элементами в алгебраически замкнутом поле , таком как C.

В более общем смысле, в математике широко используются матрицы с элементами в кольце R. [57] Кольца — более общее понятие, чем поля, поскольку операция деления не требуется. На этот параметр распространяются те же операции сложения и умножения матриц. Множество M( n , R ) (обозначаемое также Mn ( R) [7] ) всех квадратных матриц размером n- × n над R представляет собой кольцо, называемое матричным кольцом , изоморфное кольцу эндоморфизмов левого R - модуля R. н . [ 58] Если кольцо R коммутативно , то есть его умножение коммутативно, то кольцо M( n , R ) также является ассоциативной алгеброй над R. Определитель квадратных матриц над коммутативным кольцом R все еще можно определить с помощью формулы Лейбница ; такая матрица обратима тогда и только тогда, когда ее определитель обратим в R , что обобщает ситуацию над полем F , где каждый ненулевой элемент обратим. [59] Матрицы над суперкольцами называются суперматрицами . [60]

Матрицы не всегда содержат все свои элементы в одном кольце  или даже в каком-либо кольце вообще. Особым, но распространенным случаем являются блочные матрицы , которые можно рассматривать как матрицы, элементы которых сами являются матрицами. Элементы не обязательно должны быть квадратными матрицами и, следовательно, не обязательно должны быть членами какого-либо кольца ; но их размеры должны соответствовать определенным условиям совместимости.

Связь с линейными картами

Линейные отображения R nR m эквивалентны матрицам размером m x n , как описано выше. В более общем смысле, любое линейное отображение f : VW между конечномерными векторными пространствами может быть описано матрицей A = ( a ij ) после выбора баз v 1 , ..., v n из V и w 1 , . .., w m W (так что n — размерность V , а m — размерность W ), что таково, что

Другими словами, столбец j таблицы A выражает образ v j в терминах базисных векторов w i из W ; таким образом, это соотношение однозначно определяет элементы матрицы A . Матрица зависит от выбора оснований: разный выбор оснований порождает разные, но эквивалентные матрицы . [61] Многие из вышеупомянутых конкретных понятий могут быть переосмыслены в этом свете, например, матрица транспонирования AT описывает транспонирование линейного отображения, заданного A , относительно двойственных оснований . [62]

Эти свойства можно сформулировать более естественно: категория всех матриц с элементами в поле с умножением как композиция эквивалентна категории конечномерных векторных пространств и линейных отображений над этим полем.

В более общем смысле набор матриц размера m × n можно использовать для представления R -линейных отображений между свободными модулями R m и R n для произвольного кольца R с единицей. Когда n  = m возможна композиция этих отображений, и это приводит к появлению матричного кольца из матриц размера n × n , представляющего кольцо эндоморфизмов R n . 

Группы матриц

Группа — это математическая структура, состоящая из набора объектов вместе с бинарной операцией , то есть операцией объединения любых двух объектов с третьим при соблюдении определенных требований. [63] Группа, в которой объектами являются матрицы, а групповой операцией является умножение матриц, называется матричной группой . [64] [65] Поскольку каждый элемент группы должен быть обратимым, наиболее общими матричными группами являются группы всех обратимых матриц заданного размера, называемые общими линейными группами .

Любое свойство матриц, которое сохраняется при матричных произведениях и обратных, может быть использовано для определения дальнейших групп матриц. Например, матрицы заданного размера и с определителем 1 образуют подгруппу ( то есть меньшую группу, содержащуюся в) их общей линейной группы, называемой специальной линейной группой . [66] Ортогональные матрицы , определяемые условием

М Т М = Я ,

образуют ортогональную группу . [67] Каждая ортогональная матрица имеет определитель 1 или -1. Ортогональные матрицы с определителем 1 образуют подгруппу, называемую специальной ортогональной группой .

Каждая конечная группа изоморфна группе матриц, в чем можно убедиться, рассмотрев регулярное представление симметрической группы . [68] Общие группы можно изучать с помощью матричных групп, которые сравнительно хорошо изучены, с помощью теории представлений . [69]

Бесконечные матрицы

Также возможно рассматривать матрицы с бесконечным числом строк и/или столбцов [70], хотя, поскольку они являются бесконечными объектами, такие матрицы нельзя записать явно. Все, что имеет значение, это то, что для каждого элемента в строках индексирования набора и для каждого элемента в столбцах индексирования набора существует четко определенная запись (эти наборы индексов не обязательно должны быть даже подмножествами натуральных чисел). Основные операции сложения, вычитания, скалярного умножения и транспонирования по-прежнему можно определить без проблем; однако умножение матриц может включать в себя бесконечное суммирование для определения результирующих элементов, и в целом они не определены.

Если R — любое кольцо с единицей, то кольцо эндоморфизмов правого модуля R изоморфно кольцу конечных матриц-столбцов , элементы которых индексируются , и каждый столбец которого содержит только конечное число ненулевых элементов. Эндоморфизмы M , рассматриваемого как левый R- модуль, приводят к аналогичному объекту - матрицам, конечным строкам, каждая строка которых имеет только конечное число ненулевых элементов.

Если для описания линейных карт используются бесконечные матрицы, то можно использовать только те матрицы, все столбцы которых имеют лишь конечное число ненулевых элементов, по следующей причине. Чтобы матрица A описывала линейное отображение f : VW , должны быть выбраны базы для обоих пространств; Напомним, что по определению это означает, что каждый вектор в пространстве может быть записан однозначно как (конечная) линейная комбинация базисных векторов, так что записанный как вектор (столбец) v коэффициентов только конечное число элементов v i ненулевые . Теперь столбцы A описывают изображения f отдельных базисных векторов V в базисе W , что имеет смысл только в том случае, если эти столбцы имеют только конечное число ненулевых записей. Однако ограничений на строки A нет : в произведении A · v задействовано только конечное число ненулевых коэффициентов при v , поэтому каждая из его записей, даже если она задана как бесконечная сумма произведений, включает только конечное число много ненулевых членов и поэтому корректно определен. Более того, это равносильно формированию линейной комбинации столбцов A , которая эффективно включает только конечное число из них, следовательно, результат имеет только конечное число ненулевых элементов, поскольку оно есть в каждом из этих столбцов. Произведения двух матриц данного типа корректно определены (при условии совпадения наборов индексов столбцов и индексов строк), являются однотипными и соответствуют композиции линейных отображений. 

Если Rнормированное кольцо, то условие конечности строки или столбца можно ослабить. При наличии нормы вместо конечных сумм можно использовать абсолютно сходящиеся ряды . Например, матрицы, суммы столбцов которых представляют собой абсолютно сходящиеся последовательности, образуют кольцо. Аналогично, кольцо образуют и матрицы, суммы строк которых представляют собой абсолютно сходящиеся ряды.

Бесконечные матрицы также можно использовать для описания операторов в гильбертовых пространствах , где возникают вопросы сходимости и непрерывности , что снова приводит к определенным ограничениям, которые необходимо наложить. Однако явная точка зрения на матрицы имеет тенденцию запутывать дело [71] , и вместо этого можно использовать абстрактные и более мощные инструменты функционального анализа .

Пустая матрица

Пустая матрица — это матрица, в которой количество строк или столбцов (или того и другого) равно нулю. [72] [73] Пустые матрицы помогают работать с картами, включающими нулевое векторное пространство . Например, если A — матрица 3 на 0, а B — матрица 0 на 3, то AB — это нулевая матрица 3 на 3, соответствующая нулевой карте из трехмерного пространства V в себя, в то время как BA является матрицей 0 на 0. Не существует общего обозначения пустых матриц, но большинство систем компьютерной алгебры позволяют создавать и выполнять вычисления с их использованием. Определитель матрицы размером 0 на 0 равен 1, как показано ниже, относительно пустого произведения , встречающегося в формуле Лейбница для определителя, равного 1. Это значение также согласуется с тем фактом, что тождественное отображение любого конечномерного пространства в себя имеет детерминант  1, факт, который часто используется как часть характеристики детерминантов.

Приложения

Существует множество применений матриц как в математике, так и в других науках. Некоторые из них просто используют преимущества компактного представления набора чисел в матрице. Например, в теории игр и экономике матрица выигрышей кодирует выигрыш для двух игроков в зависимости от того, какую из заданного (конечного) набора стратегий игроки выбирают. [74] Анализ текста и автоматизированная компиляция тезауруса используют матрицы терминов документа , такие как tf-idf, для отслеживания частоты встречаемости определенных слов в нескольких документах. [75]

Комплексные числа могут быть представлены конкретными действительными матрицами 2 на 2 с помощью

при котором сложение и умножение комплексных чисел и матриц соответствуют друг другу. Например, матрицы вращения 2х2 представляют собой умножение на некоторое комплексное число с абсолютным значением 1, как указано выше. Аналогичная интерпретация возможна для кватернионов [76] и алгебр Клиффорда в целом.

Ранние методы шифрования , такие как шифр Хилла, также использовали матрицы. Однако из-за линейной природы матриц эти коды сравнительно легко взломать. [77] Компьютерная графика использует матрицы для представления объектов; вычислять преобразования объектов с использованием матриц аффинного вращения для выполнения таких задач, как проецирование трехмерного объекта на двухмерный экран, что соответствует теоретическому наблюдению камеры; а также применять свертки изображения, такие как повышение резкости, размытие, обнаружение краев и многое другое. [78] Матрицы над кольцом многочленов важны при изучении теории управления .

Химия использует матрицы по-разному, особенно после использования квантовой теории для обсуждения молекулярных связей и спектроскопии . Примерами являются матрица перекрытия и матрица Фока , используемые при решении уравнений Рутана для получения молекулярных орбиталей метода Хартри-Фока .

Теория графов

Неориентированный граф с матрицей смежности:

Матрица смежности конечного графа является основным понятием теории графов . [79] Он записывает, какие вершины графа соединены ребром. Матрицы, содержащие только два разных значения (1 и 0 означают, например, «да» и «нет» соответственно), называются логическими матрицами . Матрица расстояний (или стоимости) содержит информацию о расстояниях ребер. [80] Эти концепции можно применять к веб-сайтам , соединенным гиперссылками , или к городам, соединенным дорогами, и т. д., и в этом случае (если сеть соединений не очень плотная) матрицы имеют тенденцию быть разреженными , то есть содержать мало ненулевых элементов. Следовательно, в теории сетей можно использовать специально адаптированные матричные алгоритмы .

Анализ и геометрия

Матрица Гессе дифференцируемой функции ƒ : R nR состоит из вторых производных ƒ по нескольким координатным направлениям, то есть [ 81]

В седловой точке ( x  =  0, y =  0  ) (красный) функции f ( x ,− y ) = x 2y 2 матрица Гессе неопределенна .   

Он кодирует информацию о локальном росте функции: при наличии критической точки x  =  ( x 1 ,  ..., x n ), то есть точки, в которой первые частные производные ƒ обращаются в нуль, функция имеет локальный минимум. если матрица Гессе положительно определена . Квадратичное программирование можно использовать для поиска глобальных минимумов или максимумов квадратичных функций, тесно связанных с функциями, связанными с матрицами (см. Выше). [82] 

Другая матрица , часто используемая в геометрических ситуациях, — это матрица Якоби дифференцируемого отображения f : RnRm . Если f 1 , ..., f m обозначают компоненты f , то матрица Якоби определяется как [83]

Если n > m и если ранг матрицы Якоби достигает максимального значения m , f локально обратима в этой точке по теореме о неявной функции . [84]

Уравнения в частных производных можно классифицировать, рассматривая матрицу коэффициентов дифференциальных операторов высшего порядка уравнения. Для эллиптических уравнений в частных производных эта матрица положительно определена, что оказывает решающее влияние на множество возможных решений рассматриваемого уравнения. [85]

Метод конечных элементов — важный численный метод решения уравнений в частных производных, широко применяемый при моделировании сложных физических систем. Он пытается аппроксимировать решение некоторого уравнения кусочно-линейными функциями, где кусочки выбираются относительно достаточно мелкой сетки, которая, в свою очередь, может быть преобразована в матричное уравнение. [86]

Теория вероятностей и статистика

Две разные цепи Маркова. На диаграмме показано количество частиц (всего 1000) в состоянии «2». Оба предельных значения можно определить из матриц перехода, которые обозначены (красным) и (черным).

Стохастические матрицы — это квадратные матрицы, строки которых представляют собой векторы вероятности , то есть элементы которых неотрицательны и в сумме дают единицу. Стохастические матрицы используются для определения цепей Маркова с конечным числом состояний. [87] Строка стохастической матрицы дает распределение вероятностей для следующей позиции некоторой частицы, находящейся в данный момент в состоянии, соответствующем этой строке. Свойства поглощающих состояний , подобных цепям Маркова , то есть состояний, которых в конечном итоге достигает любая частица, можно прочитать по собственным векторам матриц перехода. [88]

В статистике также используются матрицы во многих различных формах. [89] Описательная статистика занимается описанием наборов данных, которые часто могут быть представлены в виде матриц данных , которые затем могут быть подвергнуты методам уменьшения размерности . Ковариационная матрица кодирует взаимную дисперсию нескольких случайных величин . [90] Другой метод использования матриц — это линейный метод наименьших квадратов , метод, который аппроксимирует конечный набор пар ( x 1 , y 1 ), ( x 2 , y 2 ), ..., ( x N , y N ), с помощью линейная функция

y яax i + b , я знак равно 1, ..., N

которое можно сформулировать в терминах матриц, связанных с разложением матриц по сингулярным значениям . [91]

Случайные матрицы — это матрицы, элементы которых представляют собой случайные числа, подчиняющиеся подходящим распределениям вероятностей , таким как матричное нормальное распределение . Помимо теории вероятностей, они применяются в самых разных областях: от теории чисел до физики . [92] [93]

Симметрии и преобразования в физике

Линейные преобразования и связанные с ними симметрии играют ключевую роль в современной физике. Например, элементарные частицы в квантовой теории поля классифицируются как представления группы Лоренца специальной теории относительности и, более конкретно, по их поведению под спиновой группой . Конкретные представления, включающие матрицы Паули и более общие гамма-матрицы, являются неотъемлемой частью физического описания фермионов , которые ведут себя как спиноры . [94] Для трёх легчайших кварков существует теоретико-групповое представление, включающее специальную унитарную группу SU(3); для своих расчетов физики используют удобное матричное представление, известное как матрицы Гелла-Манна , которые также используются для калибровочной группы SU(3) , составляющей основу современного описания сильных ядерных взаимодействий — квантовой хромодинамики . Матрица Кабиббо-Кобаяши-Маскавы , в свою очередь, выражает тот факт, что основные состояния кварков, важные для слабых взаимодействий, не совпадают, а линейно связаны с основными состояниями кварков, которые определяют частицы с конкретными и различными массами . [95]

Линейные комбинации квантовых состояний

Первая модель квантовой механики ( Гейзенберг , 1925) представляла операторы теории бесконечномерными матрицами, действующими на квантовые состояния. [96] Это также называется матричной механикой . Одним из конкретных примеров является матрица плотности , которая характеризует «смешанное» состояние квантовой системы как линейную комбинацию элементарных, «чистых» собственных состояний . [97]

Другая матрица служит ключевым инструментом для описания экспериментов по рассеянию, которые составляют краеугольный камень экспериментальной физики частиц: реакции столкновения, подобные тем, которые происходят в ускорителях частиц , когда невзаимодействующие частицы направляются навстречу друг другу и сталкиваются в небольшой зоне взаимодействия с новой множество невзаимодействующих частиц в результате можно описать как скалярное произведение состояний исходящих частиц и линейную комбинацию состояний входящих частиц. Линейная комбинация задается матрицей, известной как S-матрица , которая кодирует всю информацию о возможных взаимодействиях между частицами. [98]

Обычные режимы

Общее применение матриц в физике — это описание линейно связанных гармонических систем. Уравнения движения таких систем можно описать в матричной форме: матрица масс, умножающая обобщенную скорость, дает кинетический член, а матрица сил , умножающая вектор смещения, для характеристики взаимодействий. Лучший способ получить решения — определить собственные векторы системы , ее нормальные моды , путем диагонализации матричного уравнения. Подобные методы имеют решающее значение, когда речь идет о внутренней динамике молекул : внутренних колебаниях систем, состоящих из взаимно связанных атомов-компонентов. [99] Они также необходимы для описания механических вибраций и колебаний в электрических цепях. [100]

Геометрическая оптика

Геометрическая оптика обеспечивает дополнительные матричные приложения. В этой приближенной теории не учитывается волновая природа света. В результате получается модель, в которой световые лучи действительно являются геометрическими лучами . Если отклонение световых лучей оптическими элементами невелико, то действие линзы или отражающего элемента на данный световой луч можно выразить как умножение двухкомпонентного вектора на матрицу два на два, называемое лучевым анализом матрицы переноса : компонентами вектора являются наклон светового луча и его расстояние от оптической оси, а матрица кодирует свойства оптического элемента. На самом деле существует два вида матриц, а именно. матрицу преломления , описывающую преломление на поверхности линзы, и матрицу перемещения , описывающую перенос плоскости отсчета к следующей преломляющей поверхности, где применяется другая матрица преломления. Оптическая система, состоящая из комбинации линз и/или отражающих элементов, просто описывается матрицей, полученной в результате произведения матриц компонентов. [101]

Электроника

Традиционный сеточный анализ и узловой анализ в электронике приводят к системе линейных уравнений, которую можно описать с помощью матрицы.

Поведение многих электронных компонентов можно описать с помощью матриц. Пусть A будет двумерным вектором с входным напряжением v 1 компонента и входным током i 1 в качестве его элементов, и пусть B будет двумерным вектором с выходным напряжением v 2 компонента и выходным током i 2 в качестве его элементов. Тогда поведение электронного компонента можно описать формулой B = H · A , где H — матрица 2 x 2, содержащая один элемент импеданса ( h 12 ), один элемент адмиттанса ( h 21 ) и два безразмерных элемента ( h 11 и ч 22 ). Расчет схемы теперь сводится к умножению матриц.

История

Матрицы имеют долгую историю применения при решении линейных уравнений , но до 1800-х годов они были известны как массивы. Китайский текст «Девять глав математического искусства» , написанный в 10–2 веках до нашей эры, является первым примером использования методов массива для решения одновременных уравнений , [102] включая концепцию определителей . В 1545 году итальянский математик Джероламо Кардано представил этот метод Европе, опубликовав Ars Magna . [103] Японский математик Секи использовал те же методы массивов для решения одновременных уравнений в 1683 году. [104] Голландский математик Ян де Витт представил преобразования с использованием массивов в своей книге 1659 года « Элементы кривых» (1659). [105] Между 1700 и 1710 годами Готфрид Вильгельм Лейбниц опубликовал информацию об использовании массивов для записи информации или решений и экспериментировал с более чем 50 различными системами массивов. [103] Крамер представил свое правило в 1750 году.

Термин «матрица» (лат. «матка», «плотина» (животное женского пола, не являющееся человеком, содержащееся для разведения), «источник», «происхождение», «список», «регистр», образованный от mater — мать [106] ) был придуман Джеймсом Джозефом Сильвестром в 1850 году [107] , который понимал матрицу как объект, порождающий несколько определителей, сегодня называемых минорами , то есть определителей меньших матриц, которые получаются из исходной путем удаления столбцов и строк. В статье 1851 года Сильвестр объясняет: [108]

В предыдущих статьях я определил «Матрицу» как прямоугольный набор терминов, из которого могут быть порождены различные системы определителей, как будто из лона общего родителя.

Артур Кэли опубликовал трактат о геометрических преобразованиях с использованием матриц, которые не были повернутыми версиями исследуемых коэффициентов, как это делалось ранее. Вместо этого он определил такие операции, как сложение, вычитание, умножение и деление, как преобразования этих матриц и доказал, что ассоциативные и распределительные свойства верны. Кэли исследовал и продемонстрировал некоммутативное свойство умножения матриц, а также коммутативное свойство сложения матриц. [103] Ранняя теория матриц ограничивала использование массивов почти исключительно детерминантами, а абстрактные матричные операции Артура Кэли были революционными. Он сыграл важную роль в предложении матричной концепции, независимой от систем уравнений. В 1858 году Кэли опубликовал свои мемуары по теории матриц [109] [110] , в которых он предложил и продемонстрировал теорему Кэли-Гамильтона . [103]

Английский математик Катберт Эдмунд Каллис был первым, кто использовал современное обозначение скобок для матриц в 1913 году, и одновременно он продемонстрировал первое значимое использование обозначения A = [ai , j ] для представления матрицы, где a i , j относится к i. -я строка и j- й столбец. [103]

Современное изучение детерминант возникло из нескольких источников. [111] Теоретико-числовые проблемы привели Гаусса к тому, чтобы связать коэффициенты квадратичных форм , то есть такие выражения, как x 2 + xy - 2 y 2 , и линейные отображения в трех измерениях с матрицами. Эйзенштейн развил эти понятия, включая замечание, что, говоря современным языком, матричные произведения некоммутативны . Коши был первым, кто доказал общие утверждения об определителях, используя в качестве определения определителя матрицы A = [ a i , j ] следующее: заменить степени a j k на a jk в многочлене

,

где обозначает произведение указанных слагаемых. В 1829 году он также показал, что собственные значения симметричных матриц действительны. [112] Якоби изучал «функциональные определители» — позже названные Сильвестром определителями Якоби — которые можно использовать для описания геометрических преобразований на локальном (или бесконечно малом ) уровне, см. выше. В работах Кронекера « Vorlesungen über die Theorie der Determinanten» [113] и « Zur Determinantentheorie » Вейерштрасса [114] , опубликованных в 1903 году, детерминанты впервые рассматривались аксиоматически , в отличие от предыдущих более конкретных подходов, таких как упомянутая формула Коши. На тот момент определяющие факторы были твердо установлены.

Многие теоремы были впервые установлены только для небольших матриц, например, теорема Кэли-Гамильтона была доказана для матриц 2 × 2 Кэли в вышеупомянутых мемуарах и Гамильтоном для матриц 4 × 4. Фробениус , работая над билинейными формами , обобщил теорему на все измерения (1898). Также в конце 19-го века Вильгельм Йордан установил исключение Гаусса-Жордана (обобщающее особый случай, ныне известный как исключение Гаусса ) . В начале 20 века матрицы приобрели центральную роль в линейной алгебре [115] , отчасти благодаря их использованию в классификации гиперкомплексных систем счисления предыдущего столетия.

Зарождение матричной механики Гейзенбергом , Борном и Джорданом привело к изучению матриц с бесконечным числом строк и столбцов. [116] Позже фон Нейман осуществил математическую формулировку квантовой механики , путем дальнейшего развития функционально-аналитических понятий, таких как линейные операторы в гильбертовых пространствах , которые, очень грубо говоря, соответствуют евклидову пространству , но с бесконечностью независимых направлений .

Другие исторические варианты использования слова «матрица» в математике.

Это слово необычным образом использовалось как минимум двумя авторами, имеющими историческое значение.

Бертран Рассел и Альфред Норт Уайтхед в своих Principia Mathematica (1910–1913) используют слово «матрица» в контексте своей аксиомы сводимости . Они предложили эту аксиому как средство последовательного сведения любой функции к функции более низкого типа так, чтобы на «низу» (нулевой порядок) функция была идентична своему расширению : [117]

Назовем матрицей любую функцию любого количества переменных, которая не включает в себя какие-либо видимые переменные . Тогда любая возможная функция, отличная от матрицы, выводится из матрицы посредством обобщения, то есть путем рассмотрения утверждения о том, что рассматриваемая функция истинна со всеми возможными значениями или с некоторым значением одного из аргументов, другого аргумента или аргументы остаются неопределенными.

Например, функцию Φ( x, y ) двух переменных x и y можно свести к набору функций одной переменной, например, y , «рассмотрев» функцию для всех возможных значений «индивидуумов» a. я заменил переменную x . И тогда полученный набор функций одной переменной y , то есть a i : Φ( a i , y ) , можно свести к «матрице» значений, «рассмотрев» функцию для всех возможных значений « люди" b i подставлены вместо переменной y :

б jа я : Φ( а я , б j ).

Альфред Тарский в своем «Введении в логику» 1946 года использовал слово «матрица» как синоним понятия таблицы истинности , используемого в математической логике. [118]

Смотрите также

Примечания

  1. ^ Однако в случае матриц смежности умножение матриц или его вариант позволяет одновременно вычислить количество путей между любыми двумя вершинами и кратчайшую длину пути между двумя вершинами.
  2. ^ Ланг 2002
  3. ^ Фрели (1976, стр. 209)
  4. ^ Неринг (1970, стр. 37)
  5. ^ аб Вайсштейн, Эрик В. «Матрица». mathworld.wolfram.com . Проверено 19 августа 2020 г.
  6. ^ Oualline 2003, гл. 5
  7. ^ аб Поп; Фурдуи (2017). Квадратные матрицы порядка 2 . Международное издательство Спрингер. ISBN 978-3-319-54938-5.
  8. ^ Браун 1991, Определение I.2.1 (сложение), Определение I.2.4 (скалярное умножение) и Определение I.2.33 (транспонирование)
  9. ^ Браун 1991, Теорема I.2.6.
  10. ^ ab «Как умножать матрицы». www.mathsisfun.com . Проверено 19 августа 2020 г.
  11. ^ Браун 1991, Определение I.2.20.
  12. ^ Браун 1991, Теорема I.2.24.
  13. ^ Horn & Johnson 1985, гл. 4 и 5
  14. ^ Бронсон (1970, стр. 16)
  15. ^ Крейциг (1972, стр. 220)
  16. ^ аб Проттер и Морри (1970, стр. 869)
  17. ^ Крейциг (1972, стр. 241, 244)
  18. ^ Шнайдер, Ганс; Баркер, Джордж Филлип (2012), Матрицы и линейная алгебра, Dover Books on Mathematics, Courier Dover Corporation, стр. 251, ISBN 978-0-486-13930-2.
  19. ^ Перлис, Сэм (1991), Теория матриц, Дуврские книги по высшей математике, Courier Dover Corporation, стр. 103, ISBN 978-0-486-66810-9.
  20. ^ Антон, Ховард (2010), Элементарная линейная алгебра (10-е изд.), John Wiley & Sons, стр. 414, ISBN 978-0-470-45821-1.
  21. ^ Хорн, Роджер А.; Джонсон, Чарльз Р. (2012), Матричный анализ (2-е изд.), Cambridge University Press, стр. 17, ISBN 978-0-521-83940-2.
  22. ^ Браун 1991, I.2.21 и 22.
  23. ^ Греуб 1975, Раздел III.2.
  24. ^ Браун 1991, Определение II.3.3
  25. ^ Греуб 1975, Раздел III.1
  26. ^ Браун 1991, Теорема II.3.22.
  27. ^ Хорн и Джонсон 1985, Теорема 2.5.6.
  28. ^ Браун 1991, Определение I.2.28.
  29. ^ Браун 1991, Определение I.5.13.
  30. ^ Хорн и Джонсон 1985, Глава 7
  31. ^ Хорн и Джонсон 1985, Теорема 7.2.1.
  32. ^ Horn & Johnson 1985, пример 4.0.6, с. 169
  33. ^ «Матрица | математика». Британская энциклопедия . Проверено 19 августа 2020 г.
  34. ^ Браун 1991, Определение III.2.1
  35. ^ Браун 1991, Теорема III.2.12.
  36. ^ Браун 1991, следствие III.2.16
  37. ^ Мирский 1990, Теорема 1.4.1.
  38. ^ Браун 1991, Теорема III.3.18.
  39. ^ Eigen означает «собственный» на немецком и голландском языках .
  40. ^ Браун 1991, Определение III.4.1
  41. ^ Браун 1991, Определение III.4.9
  42. ^ Браун 1991, следствие III.4.10
  43. ^ Домохозяин 1975, Гл. 7
  44. ^ Бау III и Трефетен, 1997 г.
  45. ^ Голуб и Ван Лоан 1996, Алгоритм 1.3.1
  46. ^ Голуб и Ван Лоан 1996, главы 9 и 10, особенно. раздел 10.2
  47. ^ Голуб и Ван Лоан 1996, Глава 2.3
  48. ^ Грчар, Джозеф Ф. (1 января 2011 г.). «Анализ исключения Гаусса Джоном фон Нейманом и истоки современного численного анализа». Обзор СИАМ . 53 (4): 607–682. дои : 10.1137/080734716. ISSN  0036-1445.
  49. ^ Например, Mathematica , см. Wolfram 2003, Ch. 3,7
  50. ^ Пресс, Фланнери и Теукольский и др. 1992 год
  51. ^ Стер и Булирш 2002, раздел 4.1.
  52. ^ Хорн и Джонсон 1985, Теорема 2.5.4.
  53. ^ Horn & Johnson 1985, гл. 3.1, 3.2
  54. ^ Арнольд и Кук 1992, разделы 14.5, 7, 8.
  55. ^ Бронсон 1989, гл. 15
  56. ^ Коберн 1955, гл. В
  57. ^ Ланг 2002, Глава XIII
  58. ^ Ланг 2002, XVII.1, с. 643
  59. ^ Ланг 2002, Предложение XIII.4.16
  60. ^ Райхл 2004, Раздел L.2.
  61. ^ Греуб 1975, Раздел III.3
  62. ^ Греуб 1975, Раздел III.3.13.
  63. ^ См. любую стандартную ссылку в группе.
  64. ^ Кроме того, группа должна быть замкнутой в общей линейной группе.
  65. ^ Бейкер 2003, Def. 1.30
  66. ^ Бейкер 2003, Теорема 1.2.
  67. ^ Артин 1991, Глава 4.5.
  68. ^ Роуэн 2008, пример 19.2, с. 198
  69. ^ См. любую ссылку по теории представлений или представлению групп .
  70. ^ См. пункт «Матрица» в Ито, изд. 1987 год
  71. ^ «Немногие из теории матриц переносятся на бесконечномерные пространства, и то, что это делает, не так уж полезно, но иногда помогает». Халмос 1982, с. 23, Глава 5
  72. ^ «Пустая матрица: матрица пуста, если размер ее строки или столбца равен нулю», глоссарий, заархивировано 29 апреля 2009 г. на Wayback Machine , Руководство пользователя O-Matrix v6.
  73. ^ «Матрица, имеющая хотя бы одно измерение, равное нулю, называется пустой матрицей», Структуры данных MATLAB. Архивировано 28 декабря 2009 г. на Wayback Machine.
  74. ^ Фуденберг и Тироль, 1983, раздел 1.1.1.
  75. ^ Мэннинг 1999, раздел 15.3.4.
  76. ^ Уорд 1997, гл. 2,8
  77. ^ Стинсон 2005, гл. 1.1.5 и 1.2.4
  78. ^ Ассоциация вычислительной техники 1979, гл. 7
  79. ^ Годсил и Ройл 2004, гл. 8.1
  80. ^ Пуннен 2002
  81. ^ Ланг 1987a, гл. XVI.6
  82. ^ Нокедал 2006, гл. 16
  83. ^ Ланг 1987a, гл. XVI.1
  84. ^ Ланг 1987a, гл. XVI.5. Более продвинутое и общее утверждение см. в Lang 1969, Ch. VI.2
  85. ^ Гилбарг и Трудингер, 2001 г.
  86. ^ Шолин 2005, Гл. 2.5. См. также метод жесткости .
  87. ^ Латуш и Рамасвами, 1999 г.
  88. ^ Мехата и Шринивасан 1978, гл. 2,8
  89. ^ Хили, Майкл (1986), Матрицы для статистики , Oxford University Press , ISBN 978-0-19-850702-4
  90. ^ Кржановский 1988, гл. 2.2., с. 60
  91. ^ Кржановский 1988, гл. 4.1
  92. ^ Конри  2007
  93. ^ Забродин, Брезин и Казаков и др. 2006 г.
  94. ^ Ицыксон и Зубер 1980, гл. 2
  95. ^ см. Burgess & Moore 2007, раздел 1.6.3. (SU(3)), раздел 2.4.3.2. (матрица Кобаяши – Маскавы)
  96. ^ Шифф 1968, гл. 6
  97. ^ Бом 2001, разделы II.4 и II.8.
  98. ^ Вайнберг 1995, гл. 3
  99. ^ Уэрретт 1987, часть II
  100. ^ Райли, Хобсон и Бенс 1997, 7.17
  101. ^ Гюнтер 1990, гл. 5
  102. ^ Шен, Кроссли и Лун 1999, цитируется Бретчером 2005, стр. 1
  103. ^ abcde Дискретная математика, 4-е изд. Досси, Отто, Спенс, Ванден Эйнден, опубликовано Аддисоном Уэсли, 10 октября 2001 г., ISBN 978-0-321-07912-1 , стр. 564-565 
  104. ^ Нидхэм, Джозеф ; Ван Лин (1959). Наука и цивилизация в Китае. Том. III. Кембридж: Издательство Кембриджского университета. п. 117. ИСБН 978-0-521-05801-8.
  105. ^ Дискретная математика 4-е изд. Досси, Отто, Спенс, Ванден Эйнден, опубликовано Аддисоном Уэсли, 10 октября 2001 г., ISBN 978-0-321-07912-1 , стр. 564 
  106. Словарь Merriam-Webster, Merriam-Webster , получено 20 апреля 2009 г.
  107. ^ Хотя многие источники утверждают, что Дж. Дж. Сильвестр ввел математический термин «матрица» в 1848 году, Сильвестр ничего не опубликовал в 1848 году . Джеймс Джозеф Сильвестр (Кембридж, Англия: издательство Кембриджского университета, 1904), т. 1). , «О новом классе теорем» и о теореме Паскаля, The London, Edinburgh and Dublin Philosophical Magazine and Journal of Science , 37 : 363-370. Со страницы 369: «Для этой цели мы должны начать не с квадрата, а с продолговатого набора терминов, состоящего, предположим, из m строк и n столбцов. Это само по себе не представляет собой определитель, но является, поскольку оно были Матрицей, из которой мы можем формировать различные системы определителей...»
  108. ^ Сборник математических статей Джеймса Джозефа Сильвестра: 1837–1853, статья 37, стр. 247
  109. ^ Фил.Транс. 1858, т. 148, стр. 17-37 Матем. Документы II 475-496
  110. ^ Дьедонне, изд. 1978, Том. 1, гл. III, с. 96
  111. ^ Кноблох 1994 г.
  112. ^ Хокинс 1975
  113. ^ Кронекер 1897 г.
  114. ^ Вейерштрасс 1915, стр. 271–286.
  115. ^ Бошер 2004
  116. ^ Мехра и Рехенберг 1987
  117. ^ Уайтхед, Альфред Норт; и Рассел, Бертран (1913) Principia Mathematica до *56 , Кембридж в University Press, Кембридж, Великобритания (переиздано в 1962 г.), см. стр. 162 и далее.
  118. ^ Тарский, Альфред; (1946) Введение в логику и методологию дедуктивных наук , Dover Publications, Inc, Нью-Йорк, штат Нью-Йорк, ISBN 0-486-28462-X

Рекомендации

Ссылки по физике

Исторические справки

дальнейшее чтение

Внешние ссылки