Н.Ю. Золотых, А.П. Ильичев, В.А. Таланов
БИЛИНЕЙНЫЕ ФУНКЦИИ И ИХ ПРИМЕНЕНИЕ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Госу...
7 downloads
210 Views
661KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Н.Ю. Золотых, А.П. Ильичев, В.А. Таланов
БИЛИНЕЙНЫЕ ФУНКЦИИ И ИХ ПРИМЕНЕНИЕ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Нижегородский государственный университет им. Н.И. Лобачевского»
Н.Ю. Золотых А.П. Ильичев В.А. Таланов
БИЛИНЕЙНЫЕ ФУНКЦИИ И ИХ ПРИМЕНЕНИЕ Учебное пособие Рекомендовано методической комиссией факультета ВМК для студентов высших учебных заведений, обучающихся по направлениям подготовки 010500 «Прикладная математика и информатика», 010502 «Прикладная информатика», 010400 «Информационные технологии»
Нижний Новгород 2005
ББК 22.151.5 З88 УДК 512.647.2
Золотых Н.Ю., Ильичев А.П., Таланов В.А. Билинейные функции и их применение: Учебное пособие. — Нижний Новгород: Издательство Нижегородского государственного университета, 2005. — 68 с. Пособие содержит необходимый теоретический материал, примеры решения задач и упражнения по теме «Билинейные функции» курса «Геометрия и алгебра». Часть материала предназначена для самостоятельной работы студентов. Для студентов, обучающихся по направлениям (специальностям) «Прикладная математика и информатика», «Прикладная информатика», «Информационные технологии» Рецензенты: А.В. Баркалов, к.ф.-м.н., доц. каф. МО ЭВМ, С.А. Белов, к.ф.-м.н., доц. каф. ЧиФА УДК 512.647.2
c
Нижегородский государственный университет им. Н. И. Лобачевского, 2005
Предисловие Пособие предназначено для студентов, обучающихся по направлениям (специальностям) «Прикладная математика и информатика», «Прикладная информатика», «Информационные технологии» и содержит необходимый теоретический материал, примеры решения задач и упражнения по темам «Билинейные и полуторалинейные функции», «Евклидовы и унитарные пространства» курса «Геометрия и алгебра». Часть материала предназначена для самостоятельной работы студентов. Пособие представляет собой расширенное издание методической разработки [3]. Мы предполагаем, что читатель знаком с темами «Линейные векторные пространства», «Матрицы и определители», «Системы линейных уравнений». В разделах 1, 2 под термином «пространство» понимается конечномерное вещественное линейное пространство, в разделе 3 — конечномерное комплексное линейное пространство. В некоторых задачах мы иногда обращаемся к примерам бесконечномерных пространств.
3
Обозначения R C Fn
поле действительных чисел; поле комплексных чисел; линейное арифметическое пространство столбцов высоты n над полем F ; F n×m линейное пространство матриц размера n × m над полем F ; R(a, b) пространство вещественных непрерывных функций, заданных на отрезке [a, b]; V2 линейное пространство радиус-векторов плоскости; V3 линейное пространство радиус-векторов пространства; F [t] линейное пространство многочленов над полем F ; Fn [t] линейное пространство многочленов над полем F степени не большей n; AT матрица, транспонированная к A; A матрица, полученная из A заменой всех элементов на сопряженные; dim V размерность линейного пространства V ; L(a1 , . . . , ak ) линейная оболочка системы векторов a1 , . . . , ak ; diag(d1 , . . . , dn ) диагональная матрица с элементами d1 , . . . , dn на диагонали; diag(D1 , . . . , Dk ) блочно-диагональная матрица с блоками D1 , D2 , . . . , Dk на диагонали; E единичная матрица (порядок ясен из контекста); det A определитель матрицы A; [x]e столбец координат вектора x в базисе e = {e1 , . . . , en }: [x]e = (x1 , . . . , xn )T ⇔ x =
n X
xi ei ;
i=1
[e0 ]e
матрица перехода от базиса e = {e1 , . . . , en } к базису e0 = {e01 , . . . , e0n }: [e0 ]e = (qij ) ⇔ e0j =
n X i=1
4
qij ei .
1.
Вещественные билинейные функции
1.1.
Определения
Рассмотрим линейное векторное пространство V над полем вещественных чисел R. Определение 1. Функция f : V × V → R,
(1)
ставящее каждой паре векторов x, y из V число f (x, y) из R, называется билинейной, если для любых x, y, z из V и любых α, β из R выполнены соотношения 1) f (x + y, z) = f (x, z) + f (y, z), 2) f (αx, y) = αf (x, y), 3) f (x, y + z) = f (x, y) + f (x, z), 4) f (x, βy) = βf (x, y). Обозначим множество всех билинейных функций, действующих в пространстве V , через F(V ). Пример 2. Легко проверить, что следующие функции являются билинейными: 1) f (x, y) = x1 y1 + . . . + xn yn в Rn ; 2) скалярное произведение f (x, y) = (x, y) = |x||y| cos ϕ в пространствах V2 и V3 , где ϕ — угол между векторами x и y. Упражнение 3. 1) Доказать, что f (0, x) = 0 для любой билинейной функции f и любого вектора x ∈ V . 2) Доказать, что для любых x1 , . . . xm , y1 , . . . yl из V и любых α1 , . . . , αm , β, . . . , βl из R справедливо m l m l X X X X f αi xi , βj yj = αi βj f (xi , yj ). i=1
j=1
i=1
5
j=1
3) Доказать, что для любой матрицы A = (aij ) ∈ Rn×n отображение f : Rn × Rn → R, заданное формулой f (x, y) = xT Ay =
n X n X
aij xi yj ,
i=1 j=1
является билинейной функций. 4) Доказать, что для любой функции k(t) ∈ R(a, b) отображение f : R(a, b) × R(a, b) → R, заданное формулой Zb f (x, y) =
k(t)x(t)y(t)dt, a
является билинейной функций. 5) Привести пример отображения Rn × Rn → R, не являющегося билинейной функцией.
1.2.
Матрица билинейной функции
1.2.1.
Определение матрицы билинейной функции
Определение 4. Пусть e = {e1 , . . . , en } — базис пространства V . Матрицу A = (aij ) ∈ Rn×n , в которой aij = f (ei , ej )
(i = 1, . . . , n; j = 1, . . . , n),
назовем матрицей билинейной функции f ∈ F(V ) в базисе e и обозначим [f ]e = A. Пример 5. Определим в R3 билинейную функцию f следующим образом: если x = (x1 , x2 , x3 )T , y = (y1 , y2 , y3 )T , то f (x, y) = x1 y1 + x2 y2 + z3 y3 . Найдем матрицу функции f в базисе e1 = (1, 1, 0)T ,
6
e2 = (1, 0, 1)T , e3 = (0, 1, 1)T . По определению имеем: a11 a22 a33 a12 a13 a23
= f (e1 , e1 ) = 1 · 1 + 1 · 1 + 0 · 0 = 2, = f (e2 , e2 ) = 1 · 1 + 0 · 0 + 1 · 1 = 2, = f (e3 , e3 ) = 0 · 0 + 1 · 1 + 1 · 1 = 2, = f (e1 , e2 ) = a21 = f (e2 , e1 ) = 1 · 1 + 1 · 0 + 0 · 1 = 1, = f (e1 , e3 ) = a31 = f (e3 , e1 ) = 1 · 0 + 1 · 1 + 0 · 1 = 1, = f (e2 , e3 ) = a32 = f (e3 , e2 ) = 1 · 0 + 0 · 1 + 1 · 1 = 1,
откуда
2 [f ]e = 1 1 1.2.2.
1 2 1
1 1 . 2
Матричное представление билинейной функции
Пусть [x]e = (x1 , . . . xn )T ,
[y]e = (y1 , . . . yn )T ,
тогда n n n n X X X X f (x, y) = f xi ei , yj ej = xi yj f (ei , ej ), i=1
j=1
i=1
j=1
или на матричном языке f (x, y) = [x]T (2) e [f ]e [y]e . Пример 6. Найдем в базисе e = 1, t, t2 пространства R2 [t] матрицу билинейной функции Z1 f (x, y) =
x(t)y(t)dt. 0
Имеем a11 = a22 = a33 =
R1 0 R1 0 R1
1 · 1dt = 1, t · tdt = 1 /3 , t2 · t2 dt = 1 /5 ,
a12 = a21 = a13 = a31 = a23 = a32 =
0
R1 0 R1 0 R1 0
7
1 · tdt = 1 /2 , 1 · t2 dt = 1 /3 , t · t2 dt = 1 /4 ,
откуда 1
1 [f ]e = 1 /2 1 /3
/2 1 /3 1 /4
1
/3 1 /4 . 1 /5
Используя матрицу [f ]e , вычислим Z1 x(t)y(t)dt, 0
где x(t) = 1 + t + t2 , y(t) = 1 + t + t2 . Так как [x]e = (1, 1, 1)T , [y]e = (1, 1, 1)T , то Z1 1 1 /2 1 /3 1 37 (1 + t + t2 )(1 + t + t2 )dt = (1, 1, 1) 1 /2 1 /3 1 /4 1 = . 10 1 1 /3 1 /4 1 /5 0 1.2.3.
Представление билинейных функций билинейными формами
Утверждение 7. Пусть e = {e1 , . . . , en } — произвольный базис пространства V , A = (aij ) — произвольная матрица из Rn×n . Функция n X n X f (x, y) = aij xi yj = [x]T (3) e A[y]e i=1 j=1
является билинейной, причем A = [f ]e . Доказательство. Непосредственной проверкой свойств 1–4 убеждаемся, что функция f — билинейная. Кроме того, по формуле (3) получаем f (ei , ej ) = aij , следовательно, A = [f ]e . t u Итак, формула (3) задает общий вид билинейной функции. Выражения вида n X n X aij xi yj i=1 j=1
8
называются билинейными формами. Таким образом, в заданном базисе произвольная билинейная форма определяет билинейную функции и, наоборот, любая билинейная функция определяется некоторой билинейной формой. Переформулировка результатов последних двух пунктов приводит нас к следующему. Следствие 8. Пусть e — базис пространства V . Отображение, ставящее в соответствие всякой билинейной функции f ∈ F(V ) ее матрицу [f ]e , является биекцией из F(V ) в Rn×n . 1.2.4.
Связь матриц билинейной функции в разных базисах
Пусть e1 , e2 , . . . , en и e01 , e02 , . . . , e0n — два базиса пространства V . Исследуем, как меняется матрица билинейной функции f ∈ F(V ) при переходе от первого базиса ко второму. Для произвольных векторов x, y из V имеем 0 T 0 T 0 T 0 f (x, y) = [x]T e [f ]e [y]e = ([e ]e [x]e0 ) [f ]e [e ]e [y]e0 = [x]e0 ([e ]e [f ]e [e ]e )[y]e0 .
Из утверждения 7 0 [f ]e0 = [e0 ]T e [f ]e [e ]e .
Так как [e0 ]e — матрица невырожденная, то rank[f ]e0 = rank[f ]e . Таким образом, ранг матрицы билинейной функции не зависит от базиса и называется рангом билинейной функции. Обозначение: rank f . Определение 9. Матрицы A и B называются конгруэнтными, если существует такая невырожденная матрица Q, что B = QT AQ. Таким образом, матрицы конгруэнтны тогда и только тогда, когда они являются матрицами одной и той же билинейной функции в разных базисах. Упражнение 10. Докажите, что отношение конгруэнтности рефлексивно, симметрично и транзитивно.
9
1.3.
Синхронные элементарные преобразования строк и столбцов вещественной матрицы
Пусть Eij — матрица, полученная из единичной перестановкой ее i-й и j-й строк; Ei (α) — матрица, полученная из единичной умножением i-й строки на число α; Eij (α) — матрица, полученная из единичной прибавлением к i-й строке j-й, умноженной на α. Матрицы Eij , Ei (α), Eij (α) называются матрицами элементарных преобразований. Напомним, что три типа элементарных преобразований со строками матрицы A можно осуществить домножая A слева на эти матрицы: • умножение на Eij осуществляет перестановку строк с номерами i и j, • умножение на Ei (α) — умножение i-й строки на число α, • умножение на Eij (α) — прибавление к i-й строке j-й, умноженной на α. Элементарные преобразования со столбцами матрицы A можно осуществить умножая A справа на те же матрицы: • умножение на Eij осуществляет перестановку столбцов c номерами i, j, • умножение на Ei (α) — умножение i-го столбца на число α, • умножение на Eij (α) — прибавление к j-му столбцу i-го, умноженного на α. Так как T Eij = Eij ,
Ei (α)T = Ei (α),
Eij (α)T = Eji (α),
то каждое из следующих пар синхронных элементарных преобразований переводит матрицу в конгруэнтную ей: • перестановка строк с номерами i, j вместе с перестановкой столбцов с номерами i, j,
10
• умножение i-й строки на α, умножение i-го столбца на α, • прибавление к i-й строке j-й, умноженной на α, прибавление к i-му столбцу j-го, умноженного на α.
1.4.
Симметричные билинейные функции
Определение 11. Билинейную функцию f ∈ F(V ) назовем симметричной, или симметрической, если для любых x, y из V f (x, y) = f (y, x). Определение 12. Матрица A ∈ Rn×n называется симметричной, или симметрической, если AT = A. Упражнение 13. Докажите эквивалентность следующих утверждений: 1) Билинейная функция f — симметричная. 2) В произвольном базисе e1 , . . . , en матрица [f ]e симметрична. 3) Существует базис e1 , . . . , en , в котором матрица [f ]e симметрична. Теорема 14 (Лагранж). Любая симметричная матрица A ∈ Rn×n конгруэнтна некоторой диагональной. Доказательство. Опишем алгоритм приведения матрицы A = (aij ) к диагональному виду с помощью синхронных элементарных преобразований. Возможны два исчерпывающих случая. I. a11 6= 0. Выполним над матрицей A следующие синхронные элементарные преобразования: для каждого i ∈ {2, . . . , n} вычтем из i-й строки 1-ю строку, умноженную на ai1 /a11 , и вычтем из i-го столбца 1-ый столбец, умноженный на a1i /a11 . Очевидно, что после этих преобразований матрица A перейдет в конгруэнтную ей матрицу следующего вида a11 0 , (4) 0 B (1) причем матрица B (1) симметрична. 11
II. a11 = 0. Возможны следующие варианты: 1. ∀i ∈ {2, 3 . . . , n} ai1 = a1i = 0. Матрица A уже имеет вид (4). В данном случае никаких действий производить не нужно. 2. ∃k ∈ {2, 3 . . . , n} ak1 = a1k 6= 0. Выберем такое k. 1) Если akk 6= 0, то переставляем строки и столбцы с номерами 1 и k и тем самым приходим к случаю I. 2) Если akk = 0, то прибавляем к 1-ой строке k-ую строку и 1-му столбцу k-ый столбец, тем самым снова приходим к случаю I. После выполнения описанных здесь действий матрица A перейдет в конгруэнтную ей матрицу вида (4). Далее достаточно те же действия провести с матрицей B (1) и т. д. t u Следствие 15. Любая симметричная матрица A ∈ Rn×n конгруэнтна некоторой диагональной матрице с диагональными элементами 0, ±1. Доказательство. Можем считать, что матрица A уже имеет диагональный вид: A = diag(d1 , . . . , dn ). Для каждого i ∈ {1, p 2, . . . , n}, если di 6= 0, поделим i-ую строчку и i-ый столбец на |di |. При этом исходная матрица переходит в конгруэнтную матрицу, обладающую требуемым свойствам. t u Определение 16. Базис e1 , e2 , . . . , en называется каноническим для симметричной билинейной функции f , если f (ei , ej ) = 0
(i, j = 1, 2, . . . , n; i 6= j),
иными словами, если матрица [f ]e , называемая в данном случае каноническим представлением функции f , диагональна. Заметим, что если базис e1 , . . . , en — канонический для симметричной функции f и [x]e = (x1 , . . . , xn )T , [y]e = (y1 , . . . , yn )T , то f (x, y) =
n X j=1
где dj = f (ej , ej ) (j = 1, . . . , n). 12
dj xj yj ,
Следствие 17. Для любой симметричной билинейной функции f существует канонический базис. Доказательство. Для матрицы [f ]e построим конгруэнтную ей диагональную матрицу B такую, что B = QT [f ]e Q для некоторой невырожденной матрицы Q. Осталось рассмотреть Q как матрицу перехода к новому базису e0 , тогда [f ]e0 = B, следовательно, базис e0 — канонический. t u Определение 18. Базис e1 , e2 , . . . , en называется нормальным для симметричной билинейной функции f , если 0 при i 6= j, f (ei , ej ) = ±1 или 0 при i = j. В данном случае матрица [f ]e называется нормальным представлением функции f . Следствие 19. Для любой симметричной билинейной функции f существует нормальный базис. Pn Определение 20. Билинейная форма j=1 dj xj yj называется канонической. Если при этом коэффициенты dj канонической билинейной формы равны ±1 или 0, то она называется нормальной. Итак, базис является каноническим (соответственно нормальным) для симметричной билинейной функции f тогда и только тогда, когда в этом базисе функция f представляется канонической (соответственно нормальной) билинейной формой. Пример 21. Найдем нормальный базис e0 для симметричной билинейной функции f , заданной в базисе e = {e1 , e2 , e3 , e4 } матрицей 1 2 3 4 2 4 7 10 . [f ]e = 3 7 9 12 4 10 12 20
13
Припишем к [f ]e справа единичную матрицу. С полученной матрицей будем делать преобразования строк одновременно с преобразованиями столбцов. 1 2 3 4 1 0 0 0 2 4 7 10 0 1 0 0 . 3 7 9 12 0 0 1 0 4 10 12 20 0 0 0 1 Имеет место случай I: a11 случаю преобразования. 1 2 3 4 1 0 0 0 0 1 2 −2 1 0 0 1 0 0 −3 0 1 0 2 0 4 −4 0 0
6= 0. Выполним соответствующие этому 0 1 0 0 0 1 0 0 1 2 −2 0 → 0 1 0 0 −3 0 1 0 2 0 4 −4
0 1 0 0
0 0 1 0
0 0 . 0 1
Для подматрицы, расположенной в строках и столбцах с номерами 2, 3, 4 имеет место случай II-2. Прибавим ко второй строке третью и такое же преобразование проделаем с соответствующими столбцами. 1 0 0 0 1 0 0 0 0 2 1 2 −5 1 1 0 0 1 0 0 −3 0 1 0 . 0 2 0 4 −4 0 0 1 Теперь для подматрицы, расположенной в строках со 2-й по 4-ю и в столбцах с теми же номерами, имеем случай I. Из третьей строки вычтем вторую, умноженную на 1 /2 , из четвертой вычтем вторую и такие же преобразования проделаем с соответствующими столбцами. 1 0 0 0 1 0 0 0 0 2 1 1 0 1 2 −5 0 0 −1 /2 −1 −1 /2 −1 /2 1 /2 0 → 0 0 −1 2 1 −1 −1 1 →
1 0 0 2 0 0 0 0
0 0 −1 /2 −1
0 0 −1 2
1 −5 −1 /2 1 14
0 1 −1 /2 −1
0 1 1 /2 −1
0 0 0 1
Для подматрицы, расположенной в строках 3-й и 4-й и в столбцах с теми же номерами, имеем случай I. Из четвертой строки вычтем удвоенную третью и такое же преобразование проделаем с соответствующими столбцами. 1 0 0 0 1 0 0 0 0 2 1 1 0 0 0 −5 0 0 −1 /2 −1 −1 /2 −1 /2 1 /2 0 → 2 0 −2 1 0 0 0 4
1 0 0 2 0 0 0 0
0 0 −1 /2 0
0 0 0 4
1 −5 −1 /2 2
0 1 −1 /2 0
0 1 1 /2 −2
0 0 0 1
Приведение матрицы билинейной функции к каноническому виду закончено. Для приведения матрицы √ к нормальному виду поделим вторую строчку и второй столбец на 2, третью строчку и третий √ столбец умножим на 2, четвертую строчку и четвертый столбец поделим на 2. 1 0 0 0 1 0 0 0 √ √ √ 2 2 0 1 / / 0 0 0 −5√ 2 /2 √ 2 √ 2 0 0 −1 0 − 2 / 2 − 2 /2 /2 0 2 0 0 0 1 1 0 −1 1 /2 Матрицу перехода получаем, транспонируя матрицу, стоящую справа: √ √ 2 1 −5 /2 −√2 /2 1 √ 2 − 2 0 / /2 0 √ 2 √ [e0 ]e = . 2 2 0 /2 /2 0 1 0 0 −1 /2 Таким образом, получен нормальный базис e01 e02 e03 e04
= √ = − 5√ 2 /2 = − 2 /2 =
e1 , √ √ e1 + √2 /2 e2 + √2 /2 e3 , e1 − 2 /2 e2 + 2 /2 e3 , e1 − e3 + 1 /2 e4 . 15
По матрице билинейной функции в найденном нормальном базисе легко определяется соответствующая нормальная форма: f (x, y) = x1 y1 +x2 y2 −x3 y3 +x4 y4 , где [x]e0 = (x01 , . . . , x04 )T . [y]e0 = (y10 , . . . , y40 )T . По матрице перехода к нормальному базису определяются формулы, связывающие координаты в старом и новом базисах e и e0 соответственно: √ √ 0 2 0 0 5 2 x04 , x1 = x1 − √ /2 x2 − √ /2 x3 + 2 / x02 − √2 /2 x03 x2 = √ 2 2 x3 = /2 x02 + 2 /2 x03 x4 = − x03 + 1 /2 x04 . В разделе 1.6 будет описан другой алгоритм нахождения нормального базиса билинейной функции (метод выделения полного квадрата). Определение 22. Минор ∆k , расположенный в первых k строках и первых k столбцах матрицы A называется угловым минором порядка k. Теорема 23 (Якоби). Пусть матрица A = [f ]e симметричной билинейной функции ранга r имеет отличные от нуля угловые миноры ∆1 , . . . , ∆r (при r < n угловые миноры большего порядка, очевидно, равны 0). Тогда существует канонический базис e01 , . . . , e0n , для которого ∆1 , если i = 1, ∆i /∆i−1 , если i = 2, . . . , r, f (e0i , e0i ) = 0, если i = r + 1, . . . , n. Доказательство. Докажем индукцией по количеству шагов, что в условиях теоремы алгоритм, приведенный в доказательстве теоремы Лагранжа, не изменяет угловых миноров матрицы A. Так как a11 = ∆1 6= 0, то на первом шаге имеем случай I. Выполняемые при этом преобразования (строка вычитается из строк, расположенных ниже; столбец вычитается из столбцов, расположенных правее) не изменяют угловых миноров матрицы A. По окончании преобразований первого шага матрица A переходит в матрицу вида (4), в которой ∆2 = a011 b011 6= 0, откуда b011 6= 0.
16
На k-м шаге (k ≤ r) матрица приобретает вид diag(a011 , . . . , a0kk , Bk ). По предположению индукции угловые миноры этой матрицы совпадают с ∆i . Так как ∆k+1 = a011 · . . . · a0kk · b011 6= 0, то b011 6= 0 и снова имеем случай I. Выполняемые при этом преобразования не меняют угловых миноров. После r шагов получаем матрицу diag(d1 , . . . , dr , 0, . . . , 0), в которой ∆i = d1 · . . . · di (i = 1, 2, . . . , r), откуда получаем доказываемое. t u Упражнение 24. Докажите, что для любой билинейной функции f ранга r найдется базис e, такой, что все угловые миноры матрицы [f ]e порядка не большего r не равны 0. Теорема 25 (Закон инерции). Нормальное представление симметричной билинейной функции определено однозначно с точностью до перестановок диагональных элементов. Доказательство. Пусть e1 , . . . , en и e01 , . . . , e0n — два нормальных базиса пространства V для функции f , такие, что f (x, y) =
t X
xj yj −
j=1 t X
xj yj ,
(5)
x0j yj0 ,
(6)
j=t+1
0
f (x, y) =
r X
0
x0j yj0 −
r X j=t0 +1
j=1
где [x]e = (x1 , . . . , xn )T , [x]e0 = (x01 , . . . , x0n )T , [y]e = (y1 , . . . , yn )T , [y]e0 = (y10 , . . . , yn0 )T . Имеем rank f = r = r0 . Предположим, что t > t0 . Обозначим L1 = L(e1 , . . . , et ),
L2 = L(et0 +1 , . . . , en ).
Имеем dim(L1 ∩ L2 ) = dim L1 + dim L2 − dim(L1 + L2 ) ≥ t − t0 > 0, | {z } | {z } | {z } =t
=n−t0
17
≤n
поэтому найдется x 6= 0 такой, что x ∈ L1 ∩ L2 . Так как x ∈ L1 , то xj = 0 (j = t + 1, . . . , n), поэтому из (5) получаем f (x, x) =
t X
xj xj =
j=1
t X
x2j > 0.
j=1
Однако, так как x ∈ L2 , то x0j = 0 (j = 1, . . . , t0 ), поэтому из (6) получаем r r X X 2 f (x, x) = − x0j x0j = − x0j ≤ 0. j=t0 +1
j=t0 +1
Полученное противоречие завершает доказательство теоремы.
t u
Определение 26. Положительным индексом s+ (f ) (соответственно отрицательным индексом s− (f )) симметричной билинейной функции f называется число положительных (соответственно отрицательных) диагональных элементов в каноническом виде. Сигнатурой функции называется величина σ(f ) = s+ (f ) − s− (f ). Замечание 27. Из теоремы инерции следует, что положительный и отрицательный индексы инерции, и, следовательно, сигнатура, есть величины, не зависящие от базиса.
1.5.
Знакоопределенные симметричные функции
Определение 28. Пусть f — симметричная билинейная функция. Функция f называется положительно определенной (обозначение f > 0), если для любого x 6= 0 выполнено f (x, x) > 0. Функция f называется отрицательно определенной (обозначение f < 0), если для любого x 6= 0 выполнено f (x, x) < 0. Функция f называется неотрицательно определенной (обозначение f ≥ 0), если для любого x выполнено f (x, x) ≥ 0. Функция f называется неположительно определенной (обозначение f ≤ 0), если для любого x выполнено f (x, x) ≤ 0. В остальных случаях f называется знакопеременной.
18
Упражнение 29. Пусть f ∈ F(V ), dim V = n. Докажите следующие утверждения: f > 0 ⇔ s+ (f ) = n, f < 0 ⇔ s− (f ) = n,
f ≥ 0 ⇔ s− (f ) = 0, f ≤ 0 ⇔ s+ (f ) = 0.
Упражнение 30. Докажите, что для положительной определенности симметричной билинейной функции необходима, но не достаточна положительность всех диагональных элементов ее матрицы в любом базисе. Теорема 31 (Критерий Сильвестра). Следующие три условия эквивалентны: 1) билинейная функция f положительно определена; 2) для любого базиса e1 , . . . , en все угловые миноры матрицы [f ]e положительны; 3) cуществует базис e1 , . . . , en , в котором все угловые миноры матрицы [f ]e положительны. Доказательство. Докажем импликацию 1) ⇒ 2). Пусть f > 0, тогда в любом базисе диагональные элементы матрицы этой функции положительны. Следовательно, во время приведения алгоритмом, описанным при доказательстве теоремы Лагранжа, матрицы к каноническому виду никогда не возникает случая II, поэтому угловые миноры ∆i не изменяются. Однако по предыдущему утверждению ∆i = d1 · . . . · dn > 0. Импликация 2) ⇒ 3) тривиальна, а импликация 3) ⇒ 1) немедленно следует из теоремы Якоби. t u Определение 32. Пусть A — симметричная матрица, а e — некоторый базис пространства. По матрице A определим билинейную функцию f , такую, что A = [f ]e . Матрица A называется положительно определенной, если функция f положительно определена. Аналогично вводятся определения отрицательно, неположительно и неотрицательно определенной симметричной матрицы, а также ее положительного и отрицательного индексов и сигнатуры. Легко видеть, что эти определения не зависят от выбранного базиса e. 19
Упражнение 33. Докажите, что для того, чтобы f < 0, необходимо и достаточно, чтобы (−1)i ∆i > 0 (i = 1, 2, . . . , n). Упражнение 34. Докажите, что для того, чтобы f ≥ 0, необходимо, но не достаточно, чтобы ∆i ≥ 0 (i = 1, 2, . . . , n). Аналогично, для f ≤ 0 необходимо, но не достаточно, чтобы (−1)i ∆i ≥ 0 (i = 1, 2, . . . , n). Упражнение 35. Минор матрицы A называется диагональным (или главным), если в нем с каждой строкой участвует столбец матрицы A с таким же номером. Докажите, что для того, чтобы f ≥ 0, необходимо и достаточно, чтобы все главные миноры матрицы [f ]e были неотрицательны. Докажите, что для того, чтобы f ≤ 0, необходимо и достаточно, чтобы все главные миноры четного порядка матрицы [f ]e были неотрицательны. а все главные миноры нечетного порядка — неположительны. Упражнение 36 (Разложение Холецкого). Пусть A — симметричная положительно определенная матрица. Доказать, что найдется единственная нижнетреугольная матрица L, такая, что A = LLT .
(7)
Разложение (7) называется разложением Холецкого матрицы A. Пусть все угловые миноры матрицы A не равны нулю. Доказать, что тогда найдется единственная нижнетреугольная матрица L с единичными диагональными элементами и диагональная матрица D, такие, что A = LDLT . (8) Разложение (8) называется LDLT -разложением матрицы A.
1.6.
Квадратичные вещественные функции
Определение 37. Пусть f ∈ F(V ), тогда функция g : V → R, определяемая равенством g(x) = f (x, x), называется квадратичной. Пример 38. Функция g(x) = x21 −2x1 x22 +2x22 в R2 является квадратичной. Действительно, функция f (x, y) = x1 y1 − x1 y2 − x2 y1 +
20
2x2 y2 — билинейная и g(x) = f (x, x). Заметим, что по квадратичной функции соответствующая ей билинейная восстанавливается неоднозначно. Например, функции g соответствует также билинейная функция f1 (x, y) = x1 y1 − 2x1 y2 + 2x2 y2 и бесконечно много других. Утверждение 39. Пусть g — квадратичная функция, тогда билинейная симметричная функция f , для которой g(x) = f (x, x), существует и единственна. Доказательство. Предположим, что билинейная функция f с указанными в утверждении свойствами существует. Докажем ее единственность. Имеем g(x + y) = f (x + y, x + y) = f (x, x) + 2f (x, y) + f (y, y), g(x − y) = f (x − y, x − y) = f (x, x) − 2f (x, y) + f (y, y). Вычитая из первого равенства второе, после очевидных преобразований получаем f (x, y) =
1 g(x + y) − g(x − y) . 4
(9)
Таким образом, f по g восстанавливается однозначно. Существование. Легко проверить, что f , определяемая форt u мулой (9), симметрична и g(x) = f (x, x). В силу доказанного утверждения на квадратичные функции переносятся основные определения и теоремы теории симметричных билинейных функций. Так, матрицей квадратичной функции называется матрица соответствующей билинейной симметрической функции. Вводятся понятия канонического и нормального базиса, знакопостоянной и знакопеременной квадратичной функции, переносятся теорема Якоби, закон инерции и критерий Сильвестра. Пусть e = {e1 , . . . , en } — произвольный базис пространства V . Если A = (aij ) ∈ Rn×n , AT = A, то, легко проверить, что g(x) =
n X n X
aij xi xj = [x]T e A[x]e
i=1 j=1
21
(10)
является квадратичной функцией, причем A = [f ]e . Таким образом, формула (10) Pn задает Pn общий вид квадратичной функции. Выражения вида i=1 j=1 aij xi xj называются квадратичными формами. Pn Квадратичная форма j=1 dj x2j называется канонической. Если коэффициенты dj канонической квадратичной формы равны ±1 или 0, то она называется нормальной. Для нахождения канонического базиса квадратичной функции мы можем воспользоваться алгоритмом, приведенным в доказательстве теоремы Лагранжа. Можно также воспользоваться другим методом, называемым метод выделения полного квадрата. Объясним метод на двух примерах. Пример 40. Рассмотрим квадратичную форму g(x) = x21 + 2x22 + 6x23 + 2x1 x2 + 4x1 x3 + 2x2 x3 , которую преобразуем следующим образом: g(x)
= = = =
x21 + 2x22 + 6x23 + 2x1 x2 + 4x1 x3 + 2x2 x3 (x1 + x2 + 2x3 )2 + x22 − 2x2 x3 + 2x23 (x1 + x2 + 2x3 )2 + (x2 − x3 )2 + x23 2 2 2 x01 + x02 + x03 .
где x01 x1 1 1 2 x02 = Q · x2 , Q = 0 1 −1 . 0 x3 x3 0 0 1 Заметим, что матрица Q невырождена, поэтому можно положить [e0 ]e = Q−1 . Базис e0 — нормальный.
Пример 41. Форма g(x) = x1 x2 + x1 x3 + x2 x3 не содержит ни одного квадрата x2j , поэтому сначала сделаем замену x1 = x01 + x02 , x2 = x01 − x02 , (11) x3 = x03 . 2
2
Тогда получим g(x) = x01 − x02 + 2x01 x03 Теперь можно выделить 2 2 2 2 2 полный квадрат: g(x) = (x01 + x03 )2 − x02 − x03 = x001 − x002 − x003 , где 00 x1 = x01 + x03 , x00 = x02 , (12) 200 x3 = x03 . 22
Объединяя (11) и (12), получаем следующие формулы, связывающие старые xj и новые x00j координаты: x1 = x001 + x002 − x003 , x2 = x001 − x002 − x003 , x3 = x003 , по которым легко определяется матрица перехода. Очевидно, метод выделения полного квадрата можно применять также для нахождения канонического (или нормального) базиса билинейных функций.
2. 2.1.
Евклидовы пространства Основные определения
Определение 42. Линейное вещественное пространство V называется евклидовым, если задано отображение V × V → R, ставящее каждой паре векторов x, y ∈ V число (x, y) ∈ R, называемое скалярным произведением, обладающее следующими свойствами: 1) (x, y) = (y, x), 2) (x + y, z) = (x, z) + (y, z), 3) (αx, y) = α(x, y), 4) x 6= 0 ⇒ (x, x) > 0 для любых x, y, z из V и α из R. Свойства 1)–4) называются аксиомами евклидова пространства. Утверждение 43. Скалярное произведение в евклидовом пространстве есть положительно определенная симметричная билинейная функция. И наоборот, любую положительно определенную симметричную функцию можно выбрать в качестве скалярного произведения.
23
Доказательство. Аксиомы 2, 3 означают линейность по первому аргументу. Далее, (x, y + z) = (y + z, x) (по аксиоме 1) = (y, x) + (z, x) (по аксиоме 2) = (x, y) + (x, z) (по аксиоме 1) для любых x, y, z из V . Аналогично можно показать, что (x, αy) = α(x, y) для любых x, y, из V и α из R. Итак скалярное произведение (x, y) является билинейной функцией. По аксиоме 1 эта функция симметричная и по аксиоме 4 — положительно определенная. Вторая часть утверждения очевидна. t u Пример 44. Следующие билинейные функции являются симметричными положительно определенными и, следовательно, их можно выбрать в качестве скалярного произведения: 1) скалярное произведение (x, y) = |x||y| cos ϕ в пространствах V2 , V3 ; 2) в пространстве Rn :
(x, y) =
n X j=1
xj yj ,
где
x1 x = ... , xn
y1 y = ... ; yn
3) в пространстве R(a, b) непрерывных функций, заданных на отрезке [a, b] Zb (f, g) = f (t)g(t) dt. a
Приведенные функции будем называть стандартными скалярными произведениями в соответствующих пространствах.
24
2.2.
Матрица Грама
Определение 45. Матрицей Грама, построенной по системе векторов a1 , . . . , ak называется матрица (a1 , a1 ) (a1 , a2 ) . . . (a1 , ak ) (a2 , a1 ) (a2 , a2 ) . . . (a2 , ak ) Γ(a1 , . . . , ak ) = ............................... . (ak , a1 ) (ak , a2 ) . . . (ak , ak ) Пример 46. Пусть A ∈ Rn×k . Рассмотрим столбцы a1 , . . . , ak матрицы A как систему векторов арифметического пространства Rn со стандартным скалярным произведением. Легко видеть, что Γ(a1 , . . . , ak ) = AT A. Если e = {e1 , . . . , en } — базис пространства, то Γe = Γ(e1 , . . . , en ) — матрица билинейной функции f (x, y) = (x, y), записанная в этом базисе. Поэтому справедливо Утверждение 47. (Выражение скалярного произведения через координаты векторов.) (x, y) = [x]T e Γe [y]e . Утверждение 48 (Свойство определителя Грама). 1) Если система векторов a1 , . . . , ak линейно независима, то det Γ(a1 , . . . , ak ) > 0. 2) Если система векторов a1 , . . . , ak линейно зависима, то det Γ(a1 , . . . , ak ) = 0. Доказательство. 1) Дополним линейно независимую систему векторов a1 , . . . , ak до базиса пространства V. По критерию Сильвестера k-ый угловой минор ∆k = det Γ(a1 , . . . , ak ) матрицы билинейной функции f (x, y) = (x, y) в этом базисе положителен.
25
2) Предположим теперь, что система a1 , . . . , ak линейно зависима, тогда найдутся вещественные числа α1 , . . . , αk , не равные нулю одновременно, такие, что k X
αj aj = 0.
(13)
j=1
Домножая скалярно справа обе части равенства (13) на ai (i = 1, . . . , k), получаем α1 (a1 , a1 ) + α1 (a2 , a1 ) + . . . + α1 (ak , a1 ) = 0, α2 (a1 , a2 ) + α2 (a2 , a2 ) + . . . + α2 (ak , a2 ) = 0, (14) ............................................. αk (a1 , ak ) + αk (a2 , ak ) + . . . + αk (ak , ak ) = 0. Рассмотрим равенства (14) как систему линейных уравнений относительно неизвестных α1 , . . . , αk . Система имеет ненулевое решение, следовательно, ее определитель, совпадающий с det Γ(a1 , . . . , ak ), равен нулю. t u p Определение 49. Величина |x| = (x, x) называется длиной или нормой вектора x. Часто для норм векторов используют обозначение kxk. Из 4-ой аксиомы евклидова пространства следует, что |x| = 0 тогда и только тогда, когда x = 0. Утверждение 50 (Неравенство Коши–Буняковского). Для любых векторов a, b евклидова пространства V выполнено неравенство |(a, b)| ≤ |a| · |b|. Доказательство. По свойству определителя Грама для системы векторов a, b (a, a) (a, b) = (a, a)(b, b)−(a, b)(b, a) = |a|2 |b|2 −(a, b)2 , 0 ≤ Γ(a, b) = (b, a) (b, b) откуда (a, b)2 ≤ |a|2 |b|2 . Извлекая квадратный корень из обеих частей неравенства, получаем требуемое. t u 26
Пример 51. Рассмотрим неравенство Коши–Буняковского в пространствах V2 , V3 , Rn , R(a, b), с введенными в них стандартными скалярными произведениями: 1) |(a, b)| ≤ |a||b| в пространствах V2 , V3 следует также из определения (a, b) = |a||b| cos ϕ; 2) в пространстве Rn : 2 n n n X X X xj yj ≤ x2j yj2 ; j=1
j=1
j=1
3) в пространстве R(a, b): b 2 Z Zb Zb f (t)g(t) dt ≤ f 2 (t) dt g 2 (t) dt. a
a
a
Неравенство Коши-Буняковского позволяет ввести следующее Определение 52. Углом между векторами a, b называется вещественное число (a, b) ϕ = arccos . |a||b| Данное определение согласуется с понятием угла в геометрических пространствах V2 , V3 . Утверждение 53 (Неравенство треугольника). Для любых векторов a, b евклидова пространства V выполнено неравенство |a + b| ≤ |a| + |b|.
(15)
Доказательство. Требуемое неравенство следует из цепочки соотношений: |a + b|2 = (a + b, a + b) = (a, a) + 2(a, b) + (b, b) ≤ |a|2 + 2|(a, b)| + |b|2 так как (a, b) ≤ |(a, b)| ≤ |a|2 + 2|a||b| + |b|2 так как |(a, b)| ≤ |a||b| = (|a| + |b|)2 . 27
t u Упражнение 54. Дайте геометрическую интерпретацию неравенству треугольника в пространствах V2 , V3 . Упражнение 55. Докажите, что (15) выполняется как равенство тогда и только тогда, когда a = αb или b = αa для некоторого α ≥ 0 (в геометрических пространствах V2 и V3 векторы a и b коллинеарны и соноправлены).
2.3.
Ортогональность
Определение 56. Векторы a, b называются ортогональными (в пространствах V2 и V3 — перпендикулярными), если (a, b) = 0. Обозначение: a⊥b. Определение 57. Система векторов a1 , . . . , ak называется ортогональной, если ai ⊥aj при i 6= j, i = 1, . . . , k, j = 1, . . . , k. Система векторов a1 , . . . , ak называется ортонормированной, если 0 при i 6= j (т. е. ai ⊥aj ), (ai , aj ) = 1 при i = j (т. е. |ai | = 1). Утверждение 58 (Теорема Пифагора). Если a⊥b, то |a + b|2 = |a|2 + |b|2 . Доказательство. Требуемое равенство следует из соотношений: |a + b|2 = (a + b, a + b) = (a, a) + (a, b) + (b, a) +(b, b) = |a|2 + |b|2 . | {z } | {z } 0
0
t u Упражнение 59 (Теорема, обратная к теореме Пифагора). Докажите, что если |a + b|2 = |a|2 + |b|2 , то a⊥b. Упражнение 60 (Обобщение теоремы Пифагора). Докажите, что если система a1 , . . . , ak ортогональна, то |a1 + . . . + ak |2 = |a1 |2 + . . . + |ak |2 . 28
Утверждение 61. Ортогональная система ненулевых векторов линейно независима. Ортонормированная система линейно независима. Доказательство. Очевидно, матрица Грама ортогональной системы ненулевых векторов — диагональная с ненулевыми диагональными элементами. Матрица Грама ортонормированной системы единичная. По свойству определителя Грама в обоих случаях системы линейно независимы. t u
2.4.
Ортогональный и ортонормированный базисы
Определение 62. Базис e = {e1 , . . . , en } называется ортогональным (ортонормированным), если он представляет собой ортогональную (соответственно ортонормированную) систему. Замечание 63. В ортогональном базисе матрица Грама диагональная: Γe = diag(d1 , . . . , dn ), поэтому, если [x]e = (x1 , . . . , xn )T , [y]e = (y1 , . . . , yn )T , то (x, y) = [x]T e Γe [y]e = d1 x1 y1 + . . . + dn xn yn . В ортонормированном базисе матрица Грама единичная, поэтому (x, y) = x1 y1 + . . . + xn yn . Из теоремы Лагранжа получаем, что в любом евклидовом пространстве существует ортогональный и, следовательно, ортонормированный базисы. Ниже мы опишем алгоритм нахождения ортонормированного базиса любого подпространства евклидова пространства. Утверждение 64. Пусть e1 , . . . , en — ортогональный базис и a = α1 e1 + . . . + αn en , тогда αj =
(a, ej ) . (ej , ej ) 29
(16)
Доказательство. Домножая скалярно справа равенство a = α1 e1 + . . . + αn en на ej (j = 1, . . . , n), получаем (a, ej ) = α1 (e1 , ej ) + . . . + αn (en , ej ). Так как базис ортогональный, то в правой части этого равенства останется только одно ненулевое слагаемое (ej , ej ), откуда и следуют доказываемые формулы. t u Аналогично доказывается Утверждение 65. Пусть e1 , . . . , en — ортонормированный базис и a = α1 e1 + . . . + αn en , тогда αj = (a, ej ). Пример 66. В пространствах V2 , V3 со стандартным скалярным произведением j-ая координата вектора в ортонормированном базисе e1 , . . . , en (n = 2, 3 соответственно) равна (x, ej ) = |x| cos ϕ, где ϕ — угол между вектором x и ej . Пример 67. В трехмерном линейном вещественном пространстве V определим скалярное произведение так, чтобы система векторов a = {a1 , a2 , a3 }, заданных своими координатными столбцами в базисе e = {e1 , e2 , e3 }: −1 −1 1 [a1 ]e = −1 , [a2 ]e = 1 , [a3 ]e = −1 . −1 1 −1 — стала ортонормированной. Так как система a линейно независима, то она образует базис трехмерного пространства V . Скалярное произведение однозначно определяется матрицей Грама в некотором базисе. Например, в базисе a матрица Грама Γa — это единичная матрица. Таким образом, решение задачи существует и единственно. Чтобы найти матрицу Грама в исходном базисе e воспользуемся соотношением Γa = AT Γe A, где 1 −1 −1 1 −1 , A = [a]e = −1 −1 −1 1
30
откуда
Γe = (A · AT )−1
2.5.
2 1 = 1 4 1
1 2 1
1 1 . 2
Изоморфизм евклидовых пространств
Пусть V , V 0 — два линейных пространства над полем F . Напомним, что изоморфизмом линейных пространств называется взаимно однозначное отображение ϕ : V → V 0 , ставящее в соответствие каждому вектору x ∈ V вектор ϕx ∈ V 0 , такое, что для любых векторов x, y из V и любого скаляра α из F выполняются равенства 1) ϕ(x + y) = ϕx + ϕy, 2) ϕ(αx) = α(ϕx). Линейные пространства V и V 0 называются изоморфными, если существует изоморфизм ϕ : V → V 0 . Упражнение 68. Доказать, что отношение изоморфности линейных пространств рефлексивно, симметрично и транзитивно. Упражнение 69. Доказать, что линейные пространства V и V 0 , заданные над произвольным полем F , изоморфны тогда и только тогда, когда dim V = dim V 0 . Определение 70. Пусть V и V 0 — евклидовы пространства. Взаимно однозначное отображение ϕ : V → V 0 называется изоморфизмом евклидовых пространств, если для любых векторов x, y из V и любого вещественного числа α выполняются равенства 1) ϕ(x + y) = ϕx + ϕy, 2) ϕ(αx) = α(ϕx), 3) (ϕx, ϕy) = (x, y). Евклидовы пространства V и V 0 называются изоморфными, если существует изоморфизм ϕ : V → V 0 .
31
Упражнение 71. Доказать, что отношение изоморфности евклидовых пространств рефлексивно, симметрично и транзитивно. Теорема 72. Евклидовы пространства V и V 0 изоморфны тогда и только тогда, когда dim V = dim V 0 . Доказательство. Необходимость следует из свойств отношения изоморфности линейных пространств. Для доказательства достаточности покажем, что произвольное евклидово пространство V изоморфно арифметическому пространству Rn со стандартным скалярным произведением, далее необходимо воспользоваться транзитивностью отношения изоморфности. Выберем в V произвольный ортонормированный базис e1 , . . . , en и определим изоморфизм ϕ по правилу: ϕx = [x]e . Тогда (ϕx, ϕy) =
n X
xj yj = (x, y).
j=1
Таким образом, свойство 3) из определения изоморфизма евклидовых пространств также выполнено. t u
2.6.
Ортогональные матрицы
Определение 73. Матрица A ∈ Rn×n называется ортогональной, если AT = A−1 , т. е. AAT = AT A = E. Упражнение 74. Докажите, что строки (столбцы) ортогональной матрицы A ∈ Rn×n , рассматриваемые как векторы арифметического пространства Rn со стандартным скалярным произведением, образуют ортонормированную систему. Утверждение 75. Пусть e = {e1 , e2 , . . . , en } — ортонормированный базис евклидова пространства V . Для того чтобы система векторов e0 = {e01 , e02 , . . . , e0n } также образовывала ортонормированный базис необходимо и достаточно, чтобы матрица перехода [e0 ]e была бы ортогональной.
32
Доказательство. Так как базис e — ортонормированный, то 0 0 (e0i , e0j ) = [e0i ]T e [ej ]e . Поэтому базис e — ортонормированный тогда и только тогда, когда 1, если i = j; 0 [e0i ]T [e ] = (17) e j e 0, если i 6= j. Условие (17) эквивалентно ортогональности матрицы [e0 ]e .
2.7.
t u
Ортогональные суммы и ортогональные дополнения
Определение 76. Множества S и T векторов евклидова пространства V называются ортогональными, если (a, b) = 0 для любых a ∈ S, b ∈ T . Обозначение: S⊥T . Условие {a} ⊥T будем записывать a⊥T . Утверждение 77. Для того, чтобы a⊥L(a1 , . . . , ak ), необходимо и достаточно выполнения условий a⊥ai для любого i ∈ {1, . . . , k}. Доказательство. Необходимость очевидна. Докажем достаточность. Пусть x — произвольный вектор из L(a1 , . . . , ak ). Рассмотрим его разложение по векторам a1 , . . . , ak : x = x1 a1 + . . . + xk ak , откуда получаем (x, a) = x1 (a1 , a) + . . . + xk (ak , a) = 0, | {z } | {z } 0
0
t u
следовательно, x⊥a.
Определение 78. Сумму попарно ортогональных подпространств Wi (i = 1, . . . , k) назовем ортогональной (k ≥ 2). Напомним, что сумма подпространств W1 + W2 + . . . + Wk называется прямой суммой, если для любого вектора a ∈ V векторы a1 , . . . , ak , такие, что a = a1 + . . . + ak , (18) ai ∈ Wi (i = 1, . . . , k), определяются единственным образом. 33
Утверждение 79. Ортогональная сумма подпространств является прямой суммой. Доказательство. Единственность разложения (18) достаточно доказать для нулевого вектора. Пусть 0 = a1 + . . . + ak ,
(19)
ai ∈ Wi (i = 1, . . . , k), Wi ⊥Wj (i 6= j). Последовательно скалярно домножая равенство (19) на векторы ai (i = 1, . . . , k) получаем 0 = (ai , ai ), откуда ai = 0. Таким образом, векторы ai (i = 1, . . . , k) в (19) определяются единственным образом, следовательно, рассматриваемая сумма — прямая. t u Определение 80. Ортогональным дополнением подпространства W ⊆ V называется множество W ⊥ всех векторов из V , ортогональных с каждым вектором из W : W ⊥ = {x ∈ V : x⊥W } . Теорема 81. Для любого подпространства W евклидова пространства V ортогональное дополнение W ⊥ является подпространством и V = W + W ⊥ . Доказательство. Если W = {0}, то утверждение очевидно. Предположим теперь, что подпространство W ненулевое. Выберем в V произвольный ортонормированный базис e1 , . . . , en , а в W произвольный базис a1 , . . . , ak , тогда условия ортогональности произвольного вектора x ∈ V подпространству W примут вид (ai , x) = 0 (i = 1, . . . , k). Записанные в координатной форме эти условия представляют собой систему линейных однородных уравнений. Матрица этой системы составлена из координат базисных векторов a1 , . . . , ak и поэтому имеет ранг k, отсюда dim W ⊥ = n − k, и, так как сумма W +W ⊥ — прямая, то dim(W +W ⊥ ) = dim W +dim W ⊥ = k+(n−k) = n, откуда W + W ⊥ = V . t u Следствие 82. Пусть W — подпространство евклидова пространства V , тогда dim W + dim W ⊥ = dim V .
34
Следствие 83. Пусть W — произвольное подпространство евклидова пространства V . Любой вектор a из V однозначно можно представить в виде a = b + c,
где
b ∈ W,
c ∈ W ⊥.
(20)
Определение 84. Вектор b в (20) называется ортогональной проекцией вектора a на подпространство W , вектор c называется перпендикуляром, или ортогональной составляющей, вектора a на подпространство W . Обозначения: b = prW a, c = ortW a. Замечание 85. Из определения следует, что prW a = ortW ⊥ a.
ortW a = prW ⊥ a,
Упражнение 86. Пусть W, W1 , W2 — подпространства евклидова пространства V . Доказать утверждения 1) V ⊥ = {0}, ⊥ 2) W ⊥ = W , 3) W1 ⊆ W2 ⇔ W2⊥ ⊆ W1⊥ , 4) (W1 + W2 )⊥ = W1⊥ ∩ W2⊥ , 5) (W1 ∩ W2 )⊥ = W1⊥ + W2⊥ .
2.8.
Способы описания линейных подпространств
Пусть e1 , . . . , en — произвольный базис линейного пространства V . Из теории систем линейных уравнений известно, что произвольное подпространство W пространства V можно представить двумя способами: как множество векторов x, координаты которых получаются по формулам вида x1 = a11 t1 + . . . + ak1 tk , x2 = a12 t1 + . . . + ak2 tk , (21) ........................ xn = a1n t1 + . . . + akn tk , 35
где t1 , t2 , . . . , tk — произвольные числа, или как множество векторов, координаты которых удовлетворяют однородной системе линейных уравнений b11 x1 + b12 x2 + . . . + b1n xn = 0, b21 x1 + b22 x2 + . . . + b2n xn = 0, (22) .................................. bm1 x1 + bm2 x2 + . . . + bmn xn = 0. Выражения (21) можно записать в векторной форме: x = a1 t1 + . . . + ak tk . Этот способ описания соответствует равенству W = L(a1 , . . . , ak ), где [ai ]e = (ai1 , ai2 , . . . , aik )T
(i = 1, . . . , k).
(23)
Пусть пространство V — евклидово, а базис e1 , . . . , en — ортонормированный. Определим векторы b1 , . . . , bm : [bi ]e = (bi1 , bi2 , . . . , bim )T
(i = 1, . . . , m).
(24)
Теперь уравнения (22) можно записать в векторном виде (bi , x) = 0,
(i = 1, . . . , m).
Этот способ описания соответствует равенству W = L(b1 , . . . , bm )⊥ . Если каждая из систем a1 , . . . , ak и b1 , . . . , bm линейно независима, то k + m = n. Подводя итог вышесказанному, получаем Следствие 87. Пусть подпространство W евклидова пространства V , в котором выбран ортонормированный базис, имеет описания (21) и (22). Векторы a1 , . . . , ak , b1 , . . . , bm определены условиями (23) и (24). Тогда 1) L(a1 , a2 , . . . , ak ) = L(b1 , b2 , . . . , bm )⊥ ; 2) L(b1 , b2 , . . . , bm ) = L(a1 , a2 , . . . , ak )⊥ . 36
2.9.
Способы описания линейных многообразий
Напомним, что линейным многообразием называется множество a0 + W , где a0 — вектор, а W — подпространство линейного пространства V . Из теории систем линейных уравнений известно, что линейное многообразие a0 + W можно представить двумя способами: как множество векторов x, координаты которых получаются по формулам вида x1 = a01 + a11 t1 + . . . + ak1 tk , x2 = a02 + a12 t1 + . . . + ak2 tk , (25) ............................... xn = a0n + a1n t1 + . . . + akn tk , где t1 , t2 , . . . , tk — произвольные числа, или как множество векторов, координаты которых удовлетворяют системе линейных уравнений b11 x1 + b12 x2 + . . . + b1n xn = b01 ; b21 x1 + b22 x2 + . . . + b2n xn = b02 ; (26) ................................... bm1 x1 + bm2 x2 + . . . + bmn xn = b0n . Выражения (25) можно записать в векторной форме: x = a0 + a1 t1 + . . . + ak tk . Этот способ описания соответствует равенству a0 + W = a0 + L(a1 , . . . , ak ), где [ai ]e = (ai1 , ai2 , . . . , aik )T
(i = 0, . . . , k).
(27)
Пусть пространство V — евклидово, а базис e1 , . . . , en — ортонормированный. Определим векторы b1 , . . . , bm : [bi ]e = (bi1 , bi2 , . . . , bim )T
(i = 1, . . . , m).
Теперь уравнения (26) можно записать в векторном виде (bi , x) = b0i
или (bi , x − a0 ) = 0, 37
(i = 1, . . . , m).
(28)
Этот способ описания соответствует равенству a0 + W = a0 + L(b1 , . . . , bm )⊥ . Напомним, что размерностью многообразия a0 + W называется dim W . Прямой называется одномерное линейное многообразие (по аналогии с геометрическими пространствами V2 , V3 ). Гиперплоскостью называется n−1-мерное линейное многообразие, где n = dim V . Из вышесказанного следует, что прямую можно задать параметрически x = a0 + a1 t, где a1 6= 0, а гиперплоскость можно задать уравнением (x, b1 ) = β, где b1 6= 0.
2.10.
Метод нахождения проекции и перпендикуляра
Пусть a1 , . . . , ak — произвольный базис подпространства W евклидова пространства V , a — произвольный вектор из V . Задача заключается к нахождению вещественных коэффициентов α1 , . . . , αk , для которых prW a = α1 a1 + . . . + αk ak ; ortW a = a − prW a; (ortW a, aj ) = 0;
(29)
(j = 1, . . . , k).
Откуда (a − prW a, aj ) = 0 и (prW a, aj ) = (a, aj ) (j = 1, . . . , k). Перепишем последние равенства в виде α1 (a1 , a1 ) + α2 (a2 , a1 ) + . . . + αk (ak , a1 ) = (a, a1 ), α1 (a1 , a2 ) + α2 (a2 , a2 ) + . . . + αk (ak , a2 ) = (a, a2 ), (30) .................................................. α1 (a1 , ak ) + α2 (a2 , ak ) + . . . + αk (ak , ak ) = (a, ak ). Рассмотрим (30) как систему линейных уравнений относительно неизвестных α1 , . . . , αk . Тогда матрица этой системы есть матрица Грама Γ(a1 , . . . , ak ). Так как векторы a1 , . . . , ak линейно независимы, то det Γ(a1 , . . . , ak ) 6= 0 и система (30) имеет единственное решение. После того, как решение найдено, prW a и ortW a находятся по двум первым формулам (29). Система (30) назывется системой нормальных уравнений. 38
Пример 88. Найдем проекцию вектора a = (19, −12, −99, 27)T ∈ R на подпространство W = L(a1 , a2 , a3 )T , где a1 = (5, −3, 1, 0)T , a2 = (4, 3, 0, −5)T , a3 = (3, −1, 1, 3)T . Скалярное произведение — стандартное. Система (30) принимает вид 35α1 + 11α2 + 19α3 = 32, 11α1 + 50α2 − 6α3 = −95, 19α1 − 6α2 + 20α3 = 51. 4
Решая ее, находим α1 = 1, α2 = −2, α3 = 1. Откуда, по формулам (29), 19 0 −10 и ortW a = −2 . prW a = −101 2 14 13 Замечание 89. Заметим, что описанный здесь способ применим и в случае, когда a1 , . . . , ak — линейно зависимые и W = L(a1 , . . . , ak ). В силу существования проекции система (30) имеет решение, но не единственное. Однако по любому решению вектор prW a определяется однозначно. Замечание 90. Пусть a1 , . . . , ak — столбцы матрицы A ∈ Rn×k , рассматриваемые как векторы евклидова пространства Rn со стандартным скалярным произведением, a ∈ Rn , тогда Γ(a1 , . . . , ak ) = AT A и система уравнений (30) приобретает вид: AT Ay = AT a, где y = (α1 , . . . , αk )T .
(31)
С помощью любого решения y этой системы можно найти искомую проекцию: prW a = Ay. Замечание 91. Так как ortW a = a − α1 a1 − . . . − αk ak , 39
то L(a1 , . . . ak , a) = L(a1 , . . . , ak , ortW a) и, следовательно, 1) если a ∈ / L(a1 , . . . , ak ), то ortW a 6= 0, 2) если a ∈ L(a1 , . . . , ak ), то ortW a = 0. Замечание 92. Если k = 1, то система (30) приобретает вид α1 (a1 , a1 ) = (a, a1 ), откуда при a1 6= 0 prW a =
(a, a1 ) a1 . (a1 , a1 )
Замечание 93. Если система векторов a1 , . . . , ak — ортогональная, то система уравнений (30) приобретает простой вид αi (ai , ai ) = (a, ai )
(i = 1, . . . , k),
откуда при ai 6= 0 (i = 1, . . . , k) (ср. с (16)) αi =
(a, ai ) (ai , ai )
(i = 1, . . . , k),
поэтому prW a =
(a, a1 ) (a, a2 ) (a, ak ) a1 + a2 + . . . + ak , (a1 , a1 ) (a2 , a2 ) (ak , ak )
ortW = a −
(a, a1 ) (a, a2 ) (a, ak ) a1 − a2 − . . . − ak . (a1 , a1 ) (a2 , a2 ) (ak , ak )
(32) (33)
По теореме Пифагора |a|2 = | prW a|2 + | ortW a|2 ,
(34)
поэтому |a|2 ≥ | prW a|2 . Теперь, применяя обобщенную теорему Пифагора к правой части последнего неравенства, с помощью (32) получаем неравенство Бесселя: k X (a, a1 )2 (a, ak )2 (a, ai ) + ... + = . |a|2 ≥ (a1 , a1 ) (ak , ak ) |ai | i=1 40
Из (34) следует, что равенство |a|2 =
(a, a1 )2 (a, ak )2 + ... + . (a1 , a1 ) (ak , ak )
возможно тогда и только тогда, когда ortW = 0, т.е. a ∈ W (равенство Парсеваля). Утверждение 94 (Теорема о длине перпендикуляра). Пусть a1 , . . . , ak — базис подпространства W , тогда для произвольного вектора a справедливо равенство s det Γ(a1 , . . . , ak , a) . (35) | ortW a| = det Γ(a1 , . . . , ak ) Доказательство. Пусть prW a = α1 a1 + . . . + αk ak . Вычтем из последнего столбца определителя Грама det Γ(a1 , . . . , ak , a) линейную комбинацию остальных столбцов с коэффициентами α1 , . . . , αk . Тогда (a1 , a1 ) (a1 , a2 ) . . . (a1 , ak ) (a1 , a) (a2 , a1 ) (a2 , a2 ) . . . (a2 , ak ) (a2 , a) = ... det Γ(a1 , . . . , ak , a) = (ak , a1 ) (ak , a2 ) . . . (ak , ak ) (ak , a) (a, a1 ) (a, a2 ) . . . (a, ak ) (a, a) (a1 , a1 ) (a1 , a2 ) . . . (a1 , ak ) (a1 , a − α1 a1 − . . . − αk ak ) (a2 , a1 ) (a2 , a2 ) . . . (a2 , ak ) (a2 , a − α1 a1 − . . . − αk ak ) . ... = (ak , a1 ) (ak , a2 ) . . . (ak , ak ) (ak , a − α1 a1 − . . . − αk ak ) (a, a1 ) (a, a2 ) . . . (a, ak ) (a, a − α1 a1 − . . . − αk ak ) Учитывая равенства a − α1 a1 − . . . − αk ak = ortW a, (ai , ortW a) = 0, (a, ortW a) = (ortW a, ortW a), получаем (a1 , a1 ) . . . (a1 , ak ) 0 . . . det Γ(a1 , . . . , ak , a) = 0 (ak , a1 ) . . . (ak , ak ) (a, a1 ) . . . (a, ak ) (ortW a, ortW a) 41
.
Теперь, с помощью теоремы Лапласа раскрывая определитель по последнему столбцу, получаем det Γ(a1 , . . . , ak , a) = (ortW a, ortW a) det Γ(a1 , . . . , ak ), откуда и следует доказываемая формула.
2.11.
t u
Процесс ортогонализации Грама–Шмидта
Опишем процедуру нахождения ортогонального базиса b1 , . . . , bk подпространства W по заданному произвольно заданному базису a1 , . . . , ak . Положим Wi = L(a1 , . . . , ai )
(i = 1, . . . , k)
и построим векторы b1 = a1 , bi = ortWi−1 ai ,
(i = 2, . . . , k).
(36)
Имеем Wi = L(b1 , . . . , bi ) и поэтому, учитывая замечание 93, bi = ortWi−1 ai можно вычислять по формуле bi = a −
(a, a1 ) (a, a2 ) (a, ai−1 ) a1 − a2 − . . . − ai−1 . (a1 , a1 ) (a2 , a2 ) (ai−1 , ai−1 )
(37)
Замечание 95. Из теоремы Пифагора следует, что |bi | ≤ |ai | (i = 1, . . . , k). Замечание 96. Описанная процедура годится и для случая, когда W = L(a1 , . . . ak ), но векторы a1 , . . . ak не обязательно являются линейно независимыми. По замечанию 91, bi в (37) равен нулю тогда и только тогда, когда ai ∈ Wi . Пример 97 (Многочлены Лежандра). Пусть в пространстве многочленов скалярное произведение задано формулой: Z1 (x, y) =
x(t)y(t)dt −1
42
(38)
Многочлены, полученные из системы 1, t, t2 , t3 . . . с помощью процесса ортогонализации называются многочленами Лежандра. Вычислим, например, первые четыре многочлена Лежандра. Применим процесс ортогонализации к системе многочленов a1 (t) = 1,
a3 (t) = t2 ,
a2 (t) = t,
a4 (t) = t3 .
По формуле (33) имеем: b1 (t) = 1; R1 t · 1 dt −1 b2 (t) = t − 1 · 1 = t; R 1 · 1 dt −1
R1 b3 (t) = t2 −
−1 R1
R1
t2 · 1 dt ·1− 1 · 1 dt
−1
R1 b4 (t) = t
3
−1 − 1 R
−1 R1
t · t dt
1 · t = t2 − ; 3
−1
R1
t3 · 1 dt 1 · 1 dt
t2 · t dt
−1 ·1− 1 R
−1
R1
t3 · t dt ·t−
t3 · (t2 − 1 /3 ) dt
−1
R1
t · t dt
−1
· (t2 − 1 /3 ). (t2 − 1 /3 )2 dt
−1
Итак, мы нашли первые 4 многочлена Лежандра: 1 3 L2 (t) = t2 − , L3 (t) = t3 − t. (39) 3 5 Пример 98. Пусть в пространстве многочленов R[t] скалярное произведение задано формулой (38). Найдем проекцию многочлена x(t) = t5 на подпространство W многочленов степени не выше 3. Воспользуемся тем, что нам известен ортогональный базис (39) данного подпространства. По формуле (32) получаем: L0 (t) = 1,
R1 prW x =
−1 R1 −1
L1 (t) = t,
R1
t5 · 1 dt ·1+ 1 · 1 dt
−1 R1
R1
t5 · t dt ·t+ t · t dt
−1
t5 · (t2 − 1 /3 ) dt
−1
R1 −1
43
· (t2 − 1 /3 ) (t2 − 1 /3 )2 dt
R1 +
t5 · (t3 − 3 /5 t) dt
−1
R1
· (t3 − 3 /5 t) = (t3 − 3 /5 t)2 dt
10 3 5 t − t. 9 21
−1
Упражнение 99. Решить задачу из предыдущего примера другим способом, взяв за базис подпространства W многочлены 1, t, t2 , t3 и воспользовавшись методом решения системы нормальных уравнений (30). Постройте график многочлена t5 и найденной проекции. Объясните, почему для t ∈ [−1, 1] проекция хорошо приближает многочлен t5 . Упражнение 100 (Многочлены Чебыше¨ ва). Пусть в пространстве многочленов скалярное произведение задано формулой: Z1 (x, y) = −1
x(t) · y(t) √ dt 1 − t2
Многочлены, полученные из системы 1, t, t2 , t3 . . . с помощью процесса ортогонализации называются многочленами Чебыш¨ева. Постройте первые 4 многочлена Чебышева. Упражнение 101 (qR- и QR-разложения). Докажите, что для любой матрицы A ∈ Rn×k существуют матрица Q ∈ Rn×k с ортонормированными (относительно стандартного скалярного произведения в Rn ) столбцами и верхнетреугольная матрица R ∈ Rk×k с положительными диагональными элементами, для которых A = QR.
(40)
Представление матрицы A в виде (40) называется ее qR-разложением. Указание: к столбцам матрицы A применить процесс ортогонализации. Докажите, что для любой матрицы A ∈ Rn×k существуют орe ∈ Rn×n и верхнетреугольная матрица R e∈ тогональная матрица Q n×k R , для которых e R. e A=Q (41) 44
Представление матрицы A в виде (41) называется ее QR-разложением. Докажите, что если матрица A — квадратная и невырожденная, то ее qR- и QR-разложения единственны.
2.12.
Объем гиперпараллелепипеда
Определение 102. Пусть a1 , . . . , ak — линейно независимая система векторов линейного пространства V . Гиперпараллелепипедом, построенным на векторах a1 , . . . , ak , называется множество ) ( k X αi ai , 0 ≤ αi ≤ 1 . Π(a1 , . . . , ak ) = x : x = i=1
Упражнение 103. Дайте геометрическую интерпретацию множествам Π(a1 ), Π(a1 , a2 ), Π(a1 , a2 , a3 ) в пространствах V2 , V3 . Особо рассмотрите случай, когда векторы a1 , a2 , a3 линейно зависимы. Определение 104. Объемом гиперпараллелепипеда Π(a1 , . . . , ak ) называется величина |a1 |, если k = 1, V (a1 , . . . , ak ) = V (a1 , . . . , ak−1 ) · | ortL(a1 ,...,ak−1 ) ak |, если k ≥ 2. (42) Упражнение 105. Дайте геометрическую интерпретацию формулам (42) в пространствах V2 , V3 . Теорема 106. Пусть b1 , . . . , bk — векторы, полученные из системы a1 , . . . , ak с помощью процесса ортогонализации, тогда V (a1p , . . . ak ) = V (b1 , . . . bk )p = det Γ(a1 , . . . , ak ) = det Γ(b1 , . . . bk ) = |b1 | · . . . · |bk | ≤ |a1 | · . . . · |ak |. Последнее неравенство превращается в равенство тогда и только тогда, когда система векторов a1 , . . . , ak — ортогональная или по крайней мере один из векторов ai нулевой.
45
Доказательство. Применяя несколько раз формулы (35), (36), (42), получаем V (a1 , . . . , ak ) = |a1 | · | prW1 a2 | · | prW2 a3 | · . . . · | prWk−1 ak | =r |b1 | · . . . · |bk | det Γ(a1 , a2 ) det Γ(a1 , . . . ak ) = det Γ(a1 ) · · ... · det Γ(a ) det Γ(a1 , . . . , ak−1 ) 1 p = det Γ(a1 , . . . , ak ). Так как |bi | = | ortWi−1 ai | ≤ |ai |, то V (a1 , . . . , ak ) ≤ |a1 | · . . . · |ak |. t u
Теорема доказана.
Замечание 107. Доказанная теорема обладает следующим геометрическим содержанием: определитель Грама системы векторов является квадратом объема гиперпараллелепипеда, построенного на этой системе; объем гиперпараллелепипеда не превосходит произведения длин его ребер.
2.13.
Неравенство Адамара
Во многих задачах необходимо уметь оценивать сверху величину определителя, исходя из величин его элементов. Неравенство Адамара, которое мы выведем, является одной из таких оценок. Теорема 108 (Неравенство Адамара). Пусть A = (aij ) ∈ Rn×n и |aij | ≤ α, тогда √ | det A| ≤ (α n)n . (43) Доказательство. Рассмотрим арифметическое пространство Rn со стандартным скалярным произведением. Пусть a1 , . . . , an — столбцы матрицы A. Тогда Γ(a1 , . . . , an ) = AT A. Из теоремы 106 получаем, что q det (AT A) ≤ |a1 | · . . . · |an |. Теперь воспользуемся равенством det AT A = (det A)2 и очевидной √ оценкой |aj | ≤ α n (j = 1, . . . , n). t u 46
Упражнение 109. Доказать, что максимальная величина определителя 3-го порядка с элементами ±1 равна 4. Таким образом, на вещественных матрицах 3-го порядка оценка (43) не достигается. Упражнение 110. Доказать, что для матриц Адамара Hi , определяемых по формулам Hi−1 −Hi−1 H1 = (1), Hi = при i ≥ 2 Hi−1 Hi−1 неравенство (43) превращается в равенство. Указание: доказать, что строки (столбцы) матрицы Адамара образуют ортонормированную систему (т. е. матрица Адамара ортогональна). Упражнение 111. Доказать, что если матрица A = (aij ) ∈ Rn×n симметрична и положительно определена, то det A ≤ a11 a22 · . . . · ann .
2.14.
Метрические задачи в евклидовых пространствах
В этом разделе, имея ввиду геометрическую интерпретацию, векторы евклидова пространства иногда будем называть точками. Определение 112. Вектор l называется наклонной из точки x к подпространству W , если l = x − y для некоторого y ∈ W . Утверждение 113 (Теорема о длине наклонной). Величина inf |x − y|
y∈W
достигается в единcтвенной точке y = prW x. Иными словами, inf |x − y| = |x − prW x| = | ortW x|,
y∈W
z 6= prW x
⇒
inf |x − y| < |x − z|.
y∈W
47
Доказательство. Для произвольного y ∈ W , используя теорему Пифагора, получаем p |x−y| = | ortW x+prW x − y | = | ortW x|2 + | prW x − y|2 ≥ | ortW x|, | {z } ∈W
причем равенство возможно тогда и только тогда, когда | prW x−y| = 0, т. е. y = prW x. u t Упражнение 114. Дайте геометрическую интерпретацию теореме о длине наклонной. Определение 115. Расстоянием между точками x, y евклидова пространства называется величина ρ(x, y) = |x − y|. Определение 116. Расстоянием между множествами S, T векторов евклидова пространства называется величина ρ(S, T ) =
inf ρ(x, y). x∈S y∈T
Теорема 117. Пусть U , W — подпространства, а x0 , y0 — произвольные векторы евклидова пространства V , тогда ρ(x0 + W, y0 + U ) = | ortW +U (x0 − y0 )|. Доказательство. ρ(x0 + W, y0 + U ) = inf |x − y| x ∈ x0 + W y ∈ y0 + U = inf |(x0 + x) − (y0 + y)| x∈W y∈U = inf |(x0 − y0 ) − (y − x) | | {z } x∈W z∈W +U y∈U = inf |(x0 − y0 ) − z| z∈W +U
= ρ(x0 − y0 , W + U ). 48
По теореме о длине наклонной ρ(x0 − y0 , W + U ) = | ortW +U (x0 − y0 )|. t u Следствие 118. Пусть W — подпространство, а x, x0 — произвольные векторы евклидова пространства V , тогда 1) ρ(x, W ) = | ortW x|, 2) ρ(x, x0 + W ) = | ortW (x − x0 )|. Пример 119. Найдем расстояние ρ между линейными многообразиями W = x0 + L(a1 ) и U = y0 + L(a2 ), если координаты векторов заданы в некотором ортонормированном базисе e: 1 1 0 1 2 −2 1 −1 [x0 ]e = 2 , [a1 ]e = 1 , [y0 ]e = 1 , [a2 ]e = 1 . 0 −1 −1 0 Первый способ. Имеем:
0 1 [a] = [x0 − y0 ] = 1 1
и
W + U = L(a1 , a2 )
Для нахождения prW +U a составим систему нормальных уравнений по формуле (30): 3α1 + 3α2 = 1, 3α1 + 6α2 = 3, откуда α1 = −1 /3 , α2 = 2 /3 и поэтому, по формулам (29), 2 −2 1 3 , [ortW +U a]e = 1 0 , [prW +U a]e = 1 2 3 3 1 2 откуда находим искомое расстояние: √ 2 3 ρ = | ortW +U a| = . 3 49
Второй способ. Для нахождения | ortW +U a| воспользуемся формулой (35): 3 3 1 3 6 3 √ 1 3 3 4 2 3 2 2 = , ρ= ρ = | ortW +U a| = . 3 3 3 3 3 6 Пример 120. Найдем общую формулу, выражающую расстояние между прямыми W = x1 + L(a1 ) и U = x2 + L(a2 ) в предположении, что векторы a1 , a2 линейно независимы. ρ2 (W, U ) = | ortL(a1 ,a2 ) (x1 − x2 )|2 = (a1 , a1 ) (a1 , a2 ) (a1 , x1 − x2 ) (a2 , a1 ) (a2 , a2 ) (a2 , x1 − x2 ) (x1 − x2 , a1 ) (x1 − x2 , a2 ) (x1 − x2 , x1 − x2 ) = (a1 , a1 ) (a1 , a2 ) (a2 , a1 ) (a2 , a2 )
.
В частности, в V3 многообразия W , U — скрещивающиеся или пересекающиеся прямые. Если [xi ]e = (xi1 , xi2 , xi3 ), [ai ]e = (ai1 , ai2 , ai3 ) (i = 0, 1) и базис e — ортонормированный, то a11 a21 x01 − x11 2 a12 a22 x02 − x12 a13 a23 x03 − x13 2 ρ (W, U ) = a11 a21 a11 a12 a13 det × a12 a22 a21 a22 a23 a13 a23 и по теореме Бинэ–Коши
ρ(W, U ) = s a12 a13
a11 a21 x01 − x11 a12 a22 x02 − x12 a13 a23 x03 − x13 2 a11 a23 2 a12 a22 + + a23 a13 a23 a13 50
2 . a22 a23
Пример 121. Найдем общую формулу, выражающую расстояние между точкой x0 и прямой W = x1 + L(a1 ) (a1 6= 0). (a1 , a1 ) (a1 , x0 − x1 ) (x0 − x1 , a1 ) (x0 − x1 , x0 − x1 ) 2 2 ρ (x0 , W ) = | ortL(a1 ) (x0 −x1 )| = . |a1 |2 В частности, в V3 , если [xi ]e = (xi1 , xi2 , xi3 ) (i = 0, 1), [a1 ]e = (a11 , a12 , a13 ) и базис e — ортонормированный, то a11 x01 − x11 a a a 11 12 13 a12 x02 − x12 det x01 − x11 x02 − x12 x03 − x13 a13 x03 − x13 ρ2 = 2 2 2 a11 + a12 + a13 и по теореме Бинэ–Коши s a12 x02 − x12 2 a11 x01 − x11 2 a11 + + a13 x03 − x13 a13 x03 − x13 a12 p ρ= a211 + a212 + a213
2 x01 − x11 x02 − x12
.
Пример 122. Найдем общую формулу, выражающую расстояние между точкой x0 и гиперплоскостью W = {x : (x, a1 ) = α} (a1 6= 0). Пусть x1 ∈ W , тогда (x1 , a1 ) = α. (x0 − x1 , a1 ) a1 |(x1 , a1 ) − α| = ρ(x1 , W ) = | prW ⊥ (x0 − x1 )| = . (a1 , a1 ) |a1 | Для нахождения проекции мы воспользовались замечанием 92. В частности, в пространстве V3 многообразие W — плоскость. Если [xi ]e = (xi1 , xi2 , xi3 ) (i = 0, 1), [a1 ]e = (a11 , a12 , a13 ) и базис e — ортонормированный, то ρ(x1 , W ) =
|a11 x01 + a12 x02 + a13 x03 − α| . |a211 + a212 + a213 |
Упражнение 123. Найти формулу для нахождения расстояния между параллельными прямыми x1 + L(a) и x2 + L(a). Привести вариант этой формулы, удобный в пространстве V3 51
Упражнение 124. Найти формулу для нахождения расстояния между параллельными гиперплоскостями (x, b) = β1 , (x, b) = β2 . Привести вариант этой формулы, удобный в пространстве V3 . Упражнение 125. Найти формулу для нахождения расстояния между прямой x0 + L(a) и гиперплоскостью (x, b) = β. Рассмотреть два случая: 1) (a, b) = 0, 2) (a, b) 6= 0 Привести вариант формул, удобный в пространстве V3 .
2.15.
Нормальное решение системы линейных уравнений
Пусть A ∈ Rm×n , b ∈ Rm . Пусть в Rn введено некоторым образом скалярное произведение. Определение 126. Решение x b ∈ Rn системы линейных уравнений Ax = b минимальной нормы называется ее нормальным решением. Напомним, что множество всех решений совместной системы Ax = b есть линейное многообразие x0 + W , где x0 — частное решение системы Ax = b, а W — множество всех решений системы Ax = 0. Из определения нормального решения получаем |b x| =
inf
x∈x0 +W
|x| = inf |x0 + y|. y∈W
По теореме о длине наклонной нормальное решение определяется единственным образом и равно x b = ortW x0 = prW ⊥ x0 . Теперь предположим, что скалярное произведение в Rn стандартное. Тогда W ⊥ = L(a01 , . . . , a0m ) (см. теорему 81) и, кроме того, Γ(a01 , . . . , a0m ) = AAT . Теперь система нормальных уравнений (30) для нахождения prW ⊥ x0 примет вид AAT y = Ax0 , или AAT y = b,
(44)
где y = (α1 , . . . , αm )T . По решению y системы (44) можно найти нормальное решение: x b = AT y. (45) 52
Пример 127. Найдем нормальное решение системы x1 + 2x2 + x3 − x4 = 3, x1 − x2 + x4 = 1. Система (44) принимает вид: 7y1 − 2y2 = 3, −2y1 + 3y2 = 1, откуда y=
11
/17 13 /17
.
По формуле (45) находим нормальное решение: 24 1 9 . x b= 17 11 2
2.16.
Псевдорешения несовместной системы линейных уравнений
Рассмотрим систему линейных уравнений Ax = b, где A ∈ Rm×n , b ∈ Rm . Определение 128. Невязкой вектора x ∈ Rn относительно системы Ax = b называется столбец Ax − b ∈ Rm . Предположим, что в Rm введено скалярное произведение. Определение 129. Псевдорешением системы Ax = b называется вектор x e, на котором норма невязки |Ax − b| минимальна: |Ae x − b| = inf n |Ax − b|. x∈R
Заметим, что если система совместна, то любое ее решение является псевдорешением и других псевдорешений нет.
53
Теорема 130. Множество всех псевдорешений системы Ax = b есть множество решений системы Ax = prW b, где W = L(a1 , . . . , an ) и a1 , . . . , an — столбцы матрицы A. Доказательство. Обозначая y = Ax ∈ Rm , по теореме о длине наклонной получаем inf |Ax − b| = inf |y − prW b|.
x∈Rn
y∈W
t u
Теорема доказана.
Теперь предположим, что скалярное произведение в Rm стандартное. Тогда Γ(a1 , . . . , an ) = AT A. Теперь система (30) для нахождения prW b примет вид AT Ax = AT b, откуда prW b = Ax. Последнее равенство показывает, что множество решений системы AT Ax = AT b
(46)
совпадает со множеством всех псевдорешений системы Ax = b. Пример 131. Найдем все псевдорешения системы x1 + x2 + x3 + x4 = 2, x1 + x2 + x3 − x4 = 2, x1 + x2 + x3 = 5, если скалярное произведение в R3 — стандартное. Первый способ. В нашем примере a1 = a2 = a3 = (1, 1, 1)T , a4 = (1, −1, 0)T , b = (2, 2, 5)T и W = L(a1 , a2 , a3 , a4 ) = L(a1 , a4 ). Найдем prW b = α1 a1 + α2 a4 . Система для определения α1 , α2 имеет вид: (a1 , a1 )α1 + (a1 , a4 )α2 = (b, a1 ), (a4 , a1 )α1 + (a4 , a4 )α2 = (b, a2 ), или 3α1 + 0α2 = 9, 0α1 + 3α2 = 0, откуда α1 = 3 и α2 = 0, следовательно, prW b = (3, 3, 3)T . Решая систему x1 + x2 + x3 + x4 = 3, x1 + x2 + x3 − x4 = 3, x1 + x2 + x3 = 3, 54
находим, что множество псевдорешений исходной системы есть линейное многообразие x1 = 1 + t1 + t2 , x2 = 1 − t1 , (47) x3 = 1 − t2 , x3 = 0, где t1 , t2 ∈ R. Для каждого вектора √ этого многообразия норма невязки равна |(2, 2, 5)T − (3, 3, 3)T | = 6. Второй способ. В нашем примере система (46) имеет вид: 3x1 + 3x2 + 3x3 + 0x4 = 9, 3x1 + 3x2 + 3x3 + 0x4 = 9, 3x1 + 3x2 + 3x3 + 0x4 = 9, 0x1 + 0x2 + 0x3 + 2x4 = 0. Множество ее решений можно представить, например, в виде (47). Далее до конца раздела предполагается, что скалярное произведение — стандартное. Упражнение 132. Доказать, что каждое псевдорешение e t = (e t1 , e t2 )T системы уравнений a01 + t1 a11 = b01 + t2 b11 , a02 + t1 a12 = b02 + t2 b12 , a03 + t1 a13 = b03 + t2 b13 определяет пару точек на прямых x1 = a01 + t1 a11 , x2 = a02 + t1 a12 , и x3 = a03 + t1 a13
x1 = b01 + t2 b11 , x2 = b02 + t2 b12 , x3 = b03 + t2 b13 ,
таких, что расстояние между этими точками равно расстоянию между прямыми. Упражнение 133. Пусть A = QR — qR-разложение матрицы A ∈ Rm×n . Докажите, что множество всех псевдорешений системы Ax = b совпадает с множеством решений треугольной системы Rx = QT b. 55
Замечание 134. Задача нахождения псевдорешения возникает, например, при аппроксимации данных. Предположим, что имеются пары значений (x1 , y1 ), (x2 , y2 ), . . . , (xm , ym ).
(48)
Пусть f1 (x), f2 (x), . . . , fn (x) — заданные функции. Требуется найти функцию вида f (x) = α1 f1 (x) + α2 f2 (x) + . . . + αn fn (x),
(49)
для которой f (xi ) ≈ yi (i = 1, 2, . . . , m), т. е. функцию, приближающую данные (48). Более точно: требуется найти значения параметров α1 , . . . , αn , на которых достигается минимум min
α1 ,...,αn
m X
2 yi − α1 f1 (xi ) − . . . − αn fn (xi ) .
i=1
Задача отыскания таких αj называется линейной задачей наименьших квадратов. Легко видеть, что набор этих параметров является псевдорешением системы α1 f1 (x1 ) + α2 f2 (x1 ) + . . . + αn fn (x1 ) = y1 , α1 f1 (x2 ) + α2 f2 (x2 ) + . . . + αn fn (x2 ) = y2 , (50) ............................................... α1 f1 (xm ) + α2 f2 (xm ) + . . . + αn fn (xm ) = ym . И наоборот, если α1 , . . . , αn — псевдорешение указанной системы, то функция f (x), определяемая по формуле (49), является решением задачи наименьших квадратов. Часто в качестве f1 (x), f2 (x), . . . , fn (x) рассматриваются многочлены 1, x, . . . , xn−1 . Таким образом, речь идет об аппроксимации данных полиномами. Например, при аппроксимации данных (48) линейной функцией y = α1 + α2 x система уравнений (50) примет вид α1 + α2 x1 = y1 , α1 + α2 x2 = y2 , ................. α1 + α2 xm = ym . 56
Согласно (46), система линейных уравнений для определения неизвестных α1 , α2 имеет вид m m P P α1 + xi α2 = yi , i=1 m i=1 m m P P P xi α1 + x2i α2 = xi yi . i=1
i=1
i=1
Определение 135. Псевдорешение x ˇ системы Ax = b, имеющее среди всех псевдорешений минимальную норму, называется нормальным псевдорешением. Обозначим через ej ∈ Rm столбец, в котором j-я компонента равна 1, а все остальные равны 0 (j = 1, 2, . . . , m). Определение 136. Пусть x ˇj — нормальное псевдорешение системы Ax = ej , где A ∈ Rm×n (j = 1, 2, . . . , m). Матрица размеров n × m, составленная из столбцов x ˇ1 , x ˇ2 , . . . , x ˇm , называется псевдообратной к матрице A и обозначается A+ . Упражнение 137. Докажите, что для любой матрицы A ∈ Rm×n и столбца b ∈ Rm нормальное псевдорешение x ˇ системы Ax = b можно найти по формуле x ˇ = A+ b. Упражнение 138. Докажите, что если строки матрицы A ∈ Rm×n линейно независимы, то A+ = AT (AAT )−1 . Если столбцы матрицы A линейно независимы, то A+ = (AT A)−1 AT .
3.
Полуторалинейные функции и унитарные пространства
В данном разделе понятия и результаты предыдущих разделов распространяются на случай комплексного линейного пространства.
3.1.
Полуторалинейные функции
Рассмотрим комплексное линейное пространство V .
57
Определение 139. Отображение f : V × V → C,
(51)
ставящее каждой паре векторов x, y из V число f (x, y) из C, называется полуторалинейной функцией, если для любых x, y, z из V и любых α, β из C выполнены соотношения 1) f (x + y, z) = f (x, z) + f (y, z), 2) f (αx, y) = αf (x, y), 3) f (x, y + z) = f (x, y) + f (x, z), 4) f (x, βy) = βf (x, y). Упражнение 140. Пусть A = (aij ) ∈ Cn×n . Доказать, что следующая функция в Cn является полуторалинейной: f (x, y) = xT Ay =
n n X X
aij xi y j .
i=1 j=1
Основные результаты о билинейных функциях переносятся на случай полуторалинейных функций. Утверждения с несколькими изменениями сохраняются, а доказательства легко переносятся на комплексный случай, поэтому дадим только краткий обзор основных результатов. Из свойств 1)–4) вытекает их обобщение: l m l m X X X X βj yj = αi f αi xi , β j f (xi , yj ). i=1
j=1
i=1
j=1
Как и в случае билинейных функций, вводится понятие матрицы [f ]e полуторалинейной функции. Легко видеть, что формула, выражающая значение функции через координаты векторов, примет вид f (x, y) = [x]T e [f ]e [y]e , причем формула f (x, y) = [x]T e A[y]e , 58
где A ∈ Cn×n , задает общий вид билинейной функции. Формула, связывающая матрицы одной и той же билинейной функции в базисах e и e0 , примет вид [f ]e0 = [e0 ]e [f ]e [e0 ]e . Матрицы A и B называются соединенными, если существует такая невырожденная матрица Q, что B = QT AQ. Таким образом, соединенные матрицы являются матрицами одной и той же полуторалинейной функции в разных базисах. Каждая из следующих пар элементарных преобразований матрицы переводит ее в соединенную: • перестановка строк с номерами i, j вместе с перестановкой столбцов с номерами i, j, • умножение i-й строки на α, умножение i-го столбца на α, • прибавление к i-й строке j-й, умноженной на α, прибавление к i-му столбцу j-го, умноженного на α. Полуторалинейная функция называется эрмитовой, если для любых x, y из V справедливо равенство f (x, y) = f (y, x). Матрица A ∈ Cn×n называется эрмитовой, или самосопряженной, если AT = A. Можно доказать Утверждение 141. Пусть f — полуторалинейная функция, тогда следующие условия эквивалентны: 1) f — эрмитова; 2) для произвольного базиса e матрица [f ]e эрмитова; 3) существует базис e, в котором матрица [f ]e эрмитова; 4) для любого x ∈ V справедливо f (x, x) ∈ R. Теорема Лагранжа также справедлива для полуторалинейных функций, однако алгоритм нахождения канонического базиса несколько усложнится.
59
I. a11 6= 0. Выполним над матрицей A следующие синхронные элементарные преобразования: для каждого i ∈ {2, . . . , n} вычтем из i-й строки 1-ю строку, умноженную на ai1 /a11 ; для каждого j ∈ {2, . . . , n} вычтем из j-го столбца 1-й столбец, умноженный на a1j /a11 . Очевидно, что после этих преобразований матрица A перейдет в соединенную матрицу следующего вида 0 a11 . (52) 0 B (1) II. a11 = 0. Возможны следующие варианты: 1. ∀i ∈ {2, 3 . . . , n} ai1 = a1i = 0. Матрица A уже имеет вид (4). В данном случае никаких действий производить не нужно. 2. ∃k ∈ {2, 3 . . . , n} ak1 = a1k 6= 0. 1) Если akk 6= 0, то переставляем строки и столбцы с номерами 1 и k и тем самым приходим к случаю I. 2) Если akk = 0, то а) если Re a1k 6= 0, то прибавляем к 1-й строке kю строку и 1-му столбцу k-й столбец, тем самым снова приходим к случаю I; б) если Re a1k = 0, то прибавляем к 1-й строке k-ю строку, умноженную на i; вычитаем из 1-го столбца k-й столбец, умноженный на i; мы снова приходим к случаю I. После выполнения описанных здесь действий матрица A перейдет в соединенную матрицу вида (52). Далее достаточно те же действия провести с матрицей B (1) и т. д. На полуторалинейные функции переносятся понятия канонического и нормального базисов, (не)положительно и (не)отрицательно определенных функций, сохраняются теорема Якоби, закон инерции, критерий Сильвестра. Пример 142. Найдем нормальный базис e0 для эрмитовой полуторалинейной функции f , заданной в базисе e = {e1 , e2 } формой f (x, y) = ix1 y 2 − ix2 y 1 . 60
Построим матрицу [f ]e и припишем к ней справа единичную: 0 i 1 0 . −i 0 0 1 Имеем случай II-2.2б. Прибавляем к первой строке вторую, умноженную на i; вычитаем из первого столбца второй, умноженный на i. Получаем: 2 i 1 i . −i 0 0 1 Приходим к случаю I. Прибавляем ко второй строке первую, умноженную на i /2 ; вычитаем из второго столбца первый, умноженный на i /2 . Получаем: 1 i 2 0 . 0 −1 /2 i /2 1 /2 Приведение матрицы полуторалинейной функции к каноническому виду закончено. Для приведения матрицы√ к нормальному виду поделим первую строку и первый столбец на 2 и умножим вторую √ строку и втрой столбец на 2: ! √ √ 2 i 2 1 0 / / 2 √ 2 √ . 2 /2 0 −1 i 2 /2 Матрицу перехода получаем, транспонируя матрицу, стоящую справа: ! √ √ 2 /2 i√ 2 /2 0 √ [e ]e = . 2 i 2 /2 /2 Таким образом, получен нормальный базис √
√
e01 = √2 /2 e1 + i√ 2 /2 e2 , e02 = i 2 /2 e1 + 2 /2 e2 . По матрице полуторалинейной функции в найденном базисе легко определяется соответствующая нормальная форма: f (x, y) = x1 y 1 − x2 y 2 , где [x]e0 = (x01 , x02 )T . [y]e0 = (y10 , y20 )T . По матрице перехода к
61
нормальному базису определяются формулы, связывающие координаты в старом и новом базисах e и e0 соответственно: ( √ √ x1 = √2 /2 x01 + i√ 2 /2 x02 , x2 = i 2 /2 x01 + 2 /2 x02 .
3.2.
Эрмитовы квадратичные функции
Функция g : V → C называется квадратичной, если g(x) = f (x, x) для некоторой полуторалинейной функции f . Пример 143. Функция g(x) = |x1 |2 −2x1 x2 +2|x2 |2 в C2 является квадратичной. Действительно, функция f (x, y) = x1 y 1 −x1 y 2 −x2 y 1 + 2x2 y 2 — полуторалинейная и g(x) = f (x, x). Напомним, что в вещественном пространстве по квадратичной функции соответствующую ей билинейную можно восстановить бесконечным числом способов. В отличие от этого в комплексном пространстве по квадратичным функциям соответствующая полуторалинейная восстанавливается единственным образом. Утверждение 144. Пусть g : V → C — квадратичная функция, тогда полуторалинейная функция f , для которой g(x) = f (x, x), существует и единственна. Доказательство. Единственность. Предположим, что полуторалинейная функция f с указанными в утверждении свойствами существует. Докажем ее единственность. Имеем g(x + y) = f (x + y, x + y) = f (x, x) + f (x, y) + f (y, x) + f (y, y), g(x − y) = f (x − y, x − y) = f (x, x) − f (x, y) − f (y, x) + f (y, y), g(x + iy) = f (x + iy, x + iy) = f (x, x) − if (x, y) + if (y, x) − f (y, y), g(x − iy) = f (x − iy, x − iy) = f (x, x) + if (x, y) − if (y, x) − f (y, y). Складывая четыре равенства, получаем 1 g(x + y) + g(x − y) + g(x + iy) + g(x − iy) . (53) 4 Таким образом, f по g восстанавливается однозначно. Существование. Легко проверить, что f , определяемая формулой (53), эрмитова и g(x) = f (x, x). t u f (x, y) =
62
Матрицей квадратичной функции называется матрица соответствующей полуторалинейной функции. Квадратичная функция g : V → C называется эрмитовой, если соответствующая ей полуторалинейная функция f эрмитова. В силу доказанного утверждения на эрмитовы квадратичные функции переносятся основные определения и теоремы теории эрмитовых полуторалинейных функций: вводятся понятия канонического и нормального базиса, знакопостоянной и знакопеременной эрмитовой квадратичной функции, переносятся теорема Якоби, закон инерции и критерий Сильвестра.
3.3.
Унитарные пространства
Определение 145. Линейное комплексное пространство V называется унитарным, если задано отображение V × V → C, ставящее каждой паре векторов x, y ∈ V число (x, y) ∈ C, называемое скалярным произведением, обладающее следующими свойствами: 1) (x, y) = (y, x), 2) (x + y, z) = (x, z) + (y, z), 3) (αx, y) = α(x, y), 4) x 6= 0 ⇒ (x, x) > 0 для любых x, y, z из V и α из R. Свойства 1)–4) называются аксиомами унитарного пространства. Замечание 146. Если 1-ую аксиому унитарного пространства заменить на (x, y) = (y, x), то выполнение 4-й аксиомы не будет возможно. Действительно, в этом случае, если (x, x) > 0, то (ix, ix) = i2 (x, x) = −(x, x) < 0. Как и в случае евклидовых пространств, можно показать, что скалярное произведение в унитарном пространстве есть положительно определенная симметричная эрмитова функция, и наоборот, любую положительно определенную симметричную эрмитову функцию можно выбрать в качестве скалярного произведения.
63
Пример 147. Симметричная эрмитова функция x1 n X (x, y) = xj y j , где x = ... , y = j=1 xn
y1 .. , . yn
в пространстве Cn является положительно определенной и, следовательно, может быть выбрана в качестве скалярного произведения в пространстве Cn (стандартное скалярное произведение в Cn ). На случай унитарных пространств переносится понятие матрицы Грама. Определитель матрицы Грама неотрицателен и равен нулю тогда и только тогда, когда векторы линейно зависимы. Формула выражения скалярного произведения через координаты векторов примет вид: (x, y) = [x]T e Γe [y]e . На случай унитарных пространств переносится понятие нормы вектора, угла между векторами, ортогональности векторов и систем векторов, сохраняется неравенство Коши–Буняковского, неравенство треугольника, теорема Пифагора. Доказательства в целом повторяют доказательства соответствующих утверждений для евклидовых пространств, однако требуют аккуратного обращения с операцией комплексного сопряжения. В унитарных пространствах вводится понятие ортогонального и ортонормированного базисов, причем свойства координат векторов в этих базисах (см. утверждения 64, 65) сохраняются. В ортонормированном базисе скалярное произведение выражается через координаты векторов по формуле: (x, y) = x1 y 1 + . . . + xn y n . Пусть V и V 0 — унитарные пространства. Взаимно однозначное отображение ϕ : V → V 0 называется изоморфизмом унитарных пространств, если для любых векторов x, y из V и любого вещественного числа α выполняются равенства 1) ϕ(x + y) = ϕx + ϕy, 2) ϕ(αx) = α(ϕx), 64
3) (ϕx, ϕy) = (x, y). Унитарные пространства V и V 0 называются изоморфными, если существует изоморфизм ϕ : V → V 0 . Как и в случае евклидовых пространств, можно показать, что унитарные пространства V и V 0 изоморфны тогда и только тогда, когда dim V = dim V 0 . T Матрица A ∈ Cn×n называется унитарной, если A = A−1 , т. е. AAT = AT A = E. Легко показать, что строки (столбцы) унитарной матрицы A ∈ Cn×n , рассматриваемые как векторы арифметического пространства Cn со стандартным скалярным произведением, образуют ортонормируемую систему. Пусть e = {e1 , e2 , . . . , en } — ортонормированый базис унитарного пространства. Для того, чтобы система векторов e0 = {e01 , e02 , . . . , e0n } также образовывала ортонормированный базис необходимо и достаточно, чтобы матрица перехода [e0 ]e была бы унитарной. В унитарных пространствах вводится понятие ортогонального дополнения, справедлива теорема 81 о разложении пространства в прямую сумму подпространства и его ортогонального дополнения. Вводятся понятия ортогональной проекции и перпендикуляра. Сохраняется алгоритм из раздела 2.10 нахождения проекции с помощью решения системы нормальных уравнений (30). Если a1 , . . . , ak — столбцы матрицы A ∈ Cn×k , рассматриваемые как векторы унитарного пространства Cn со стандартным скалярным произведением, a ∈ Cn , то Γ(a1 , . . . , ak ) = AT A и система уравнений (30) приобретает вид: T
T
A Ay = A a, где y = (α1 , . . . , αk )T . В унитарном пространстве справедлива теорема о длине перпендикуляра. Ее доказательство требует аккуратного обращения со знаками комплексного сопряжения. Сохраняется процесс ортогонализации Грама–Шмидта и теорема 106 Неравенство Адамара переносится и на случай комплексных матриц. Действительно, из теоремы 106 получаем, что | det A|2 = det(AT A) ≤ |a1 |2 · . . . · |ak |2 , √ откуда | det A| ≤ (α n)n . 65
Упражнение 148. Докажите, что для матриц вида 2π 2π + i sin , n n неравенство Адамара превращается в равенство. Указание: Найти det(AT A). A = (aij ) ∈ Cn×n ,
где
aij = ε(i−1)(j−1) ,
ε = cos
Как и в евклидовом пространстве, в унитарном пространстве вводятся понятия наклонной и расстояния, сохраняется теорема о длине наклонной и теорема о выражении расстояния между линейными многообразиями через длину перпендикуляра. Для систем линейных уравнений с комплексными коэффициентами определяется понятие нормального решения. Нормальное решение можно найти по формуле x e = ortW x0 = prW ⊥ x0 , где x0 — частное решение исходной системы, а W — пространство решений соответствующей однородной системы. Если скалярное произведение стандартное, то нормальное решение x e системы Ax = b определяется T T из равенства x e = A y, где y — частное решение системы AA y = b. Для несовместных систем определяется понятие псевдорешения. Как и в вещественном случае, все псевдорешения системы Ax = b можно найти из решений системы Ax = prW b, где W — линейная оболочка столбцов матрицы A. В случае стандартного скалярного произведения все псевдорешения можно найти из решений системы T T A Ax = A b.
Список литературы [1] Беклемишев Д. В. Курс аналитической геометрии и линейной алгебры. — М.: Наука, 1983. [2] Беклемишева Л. А., Петрович А. Ю., Чубаров И. А. Сборник задач по аналитической геометрии и линейной алгебре. — М.: Наука, 1987. [3] Билинейные функции и их применение: Методическая разработка / Составители: Ильичев А. П., Таланов В. А. — 1-e издание: Горький: Горьковский государственный университет, 1980. 2-e издание: Н. Новгород: Нижегородский государственный университет, 1990. [4] Воеводин В. В. Линейная алгебра. — М.: Наука, 1974. [5] Задачи в евклидовых пространствах: Методическая разработка / Составители: Веселов С. И., Ильичев А. П., Чирков А. Ю. — Н. Новгород: Нижегородский государственный университет, 1998.
66
Содержание Предисловие
3
Обозначения
4
1. Вещественные билинейные функции 5 1.1. Определения . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2. Матрица билинейной функции . . . . . . . . . . . . . . . . . 6 1.2.1. Определение матрицы билинейной функции . . . . . 6 1.2.2. Матричное представление билинейной функции . . . 7 1.2.3. Представление билинейных функций билинейными фор8 мами . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.4. Связь матриц билинейной функции в разных базисах 9 1.3. Синхронные элементарные преобразования строк и столбцов вещественной матрицы . . . . . . . . . . . . . . . . . . . . 10 1.4. Симметричные билинейные функции . . . . . . . . . . . . . . 11 1.5. Знакоопределенные симметричные функции . . . . . . . . . 18 1.6. Квадратичные вещественные функции . . . . . . . . . . . . 20 2. Евклидовы пространства 2.1. Основные определения . . . . . . . . . . . . . . . . . . . . . . 2.2. Матрица Грама . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Ортогональность . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Ортогональный и ортонормированный базисы . . . . . . . . 2.5. Изоморфизм евклидовых пространств . . . . . . . . . . . . . 2.6. Ортогональные матрицы . . . . . . . . . . . . . . . . . . . . . 2.7. Ортогональные суммы и ортогональные дополнения . . . . . 2.8. Способы описания линейных подпространств . . . . . . . . . 2.9. Способы описания линейных многообразий . . . . . . . . . . 2.10.Метод нахождения проекции и перпендикуляра . . . . . . . 2.11.Процесс ортогонализации Грама–Шмидта . . . . . . . . . . . 2.12.Объем гиперпараллелепипеда . . . . . . . . . . . . . . . . . . 2.13.Неравенство Адамара . . . . . . . . . . . . . . . . . . . . . . . 2.14.Метрические задачи в евклидовых пространствах . . . . . . 2.15.Нормальное решение системы линейных уравнений . . . . . 2.16.Псевдорешения несовместной системы линейных уравнений
23 23 25 28 29 31 32 33 35 37 38 42 45 46 47 52 53
3. Полуторалинейные функции и унитарные пространства 3.1. Полуторалинейные функции . . . . . . . . . . . . . . . . . . . 3.2. Эрмитовы квадратичные функции . . . . . . . . . . . . . . . 3.3. Унитарные пространства . . . . . . . . . . . . . . . . . . . . .
57 57 62 63
Литература
66
67
Николай Юрьевич Золотых Александр Павлович Ильичев Владимир Александрович Таланов БИЛИНЕЙНЫЕ ФУНКЦИИ И ИХ ПРИМЕНЕНИЕ Учебное пособие
Государственное образовательное учреждение высшего профессионального образования «Нижегородский государственный университет им. Н.И. Лобачевского» 603950, Нижний Новгород, пр. Гагарина, 23 Подписано в печать Формат 60 × 84 1/16. Бумага офсетная. Печать офсетная. Гарнитура Computer Modern. Усл. печ. л. 4,25. Уч.-изд. л. 4,75. Заказ Тираж 250 экз. Отпечатано в типографии Нижегородского госуниверситета им. Н. И. Лобачевского 603600, г. Нижний Новгород, ул. Большая Покровская, 37 Лицензия ПД № 18 − 0099 от 14.05.01