МАТЕМАТИКА МАТРИЦЫ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ В. А. БРУСИН Нижегородский государственный архитектурно-строительный уни...
22 downloads
198 Views
113KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МАТЕМАТИКА МАТРИЦЫ И СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ В. А. БРУСИН Нижегородский государственный архитектурно-строительный университет
MATRICES AND SYSTEMS OF LINEAR EQUATIONS
1. ВВЕДЕНИЕ. ПРЕДСТАВЛЕНИЕ СИСТЕМЫ В МАТРИЧНОЙ ФОРМЕ И РЕШЕНИЕ В НЕОСОБОМ СЛУЧАЕ Будем рассматривать систему из трех уравнений с тремя неизвестными:
V. A. BRUSIN
The paper is a continuation of the paper “Matrices as linear operators” and it is devoted to matrix apparatus application to linear system solutions. In particular, if no such precise solution exists, then a solution of location problems is given. If no such minimal location solution exists, then their innumerable set is given either. Статья является продолжением статьи “Матрицы как линейные операторы” и посвящена применению матричного аппарата к решению систем линейных уравнений. В частности, дается решение проблем нахождения наилучшего приближенного решения, если точных решений не существует, и нахождения минимальных решений, если их бесчисленное множество.
a 11 x 1 + a 12 x 2 + a 13 x 3 = b 1 , a 21 x 1 + a 22 x 2 + a 23 x 3 = b 2 , a 31 x 1 + a 32 x 2 + a 33 x 3 = b 3 . Если изначально имеется только одно или два уравнения, то недостающие уравнения можно приписать, повторив уже имеющиеся. Аналогично если имеются три уравнения, но только два неизвестных x1 и x2 , то можно дополнить эти уравнения членами с неизвестным x3 и нулевыми коэффициентами ai3 , приведя систему к виду (1). Как известно [2, 3], решением системы (1) называется тройка чисел (x1 , x2 , x3), которая после подстановки в систему (1) обращает каждое уравнение в тождество. Известно также, что система (1) может иметь единственное решение, бесчисленное множество решений или не иметь решений вообще. Ниже, используя матричный аппарат и интерпретацию матриц как операторов [1], мы дадим геометрическую трактовку этим трем случаям. Введем в рассмотрение квадратную матрицу A, столбцы b и x:
© Брусин В.А., 2000
a 11 A = a 21 a 31
108
(1)
a 12 a 22 a 32
a 13 a 23 a 33
,
b 1 b = b2 , b3
x 1 x = x 2 . (2) x3
Согласно правилам действий с матрицами [1, 2] (формула (8) из [1]), система (1) будет эквивалентна одному уравнению Ax = b.
(3)
Решением уравнения (3) считается столбец x (или трехмерный вектор x ∈ R3 с координатами x1 , x2 , x3), удовлетворяющий данному равенству как равенству двух
С О Р О С О В С К И Й О Б РА З О В АТ Е Л Ь Н Ы Й Ж У Р Н А Л , ТО М 6 , № 1 , 2 0 0 0
МАТЕМАТИКА столбцов (или соответствующих векторов). Легко видеть, что если столбец x является решением уравнения (3), то набор (x1 , x2 , x3) будет решением системы (1), и наоборот. Пусть A – неособая матрица [1–3]. Значит, существует обратная матрица A −1 (формулы (6), (7) из [1]). Умножая на нее слева обе части равенства (3) и используя правила умножения матриц [1–3] (формулы (3)–(5) из [1]), а также факт, что A −1A = E – единичная матрица, получаем равенство x = A −1b.
(4)
Таким образом, в этом случае имеется единственное решение, которое можно найти по формуле (4). (Заметим, что, вычислив A −1 [1, 2], можно с помощью формулы (4) быстро находить решения для различных столбцов b.) Больше сложностей возникает в случае, когда матрица A особая. К этому случаю, в частности, приводятся системы, у которых число уравнений не совпадает с числом неизвестных. Но именно такая ситуация наиболее часто встречается в прикладных задачах [4]. Чтобы разобраться во всех возникающих вариантах и дать им геометрическое истолкование, потребуются дополнительные сведения к тем, что приведены в [1]. 2. ОСНОВНЫЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА, ПОРОЖДАЕМЫЕ МАТРИЦЕЙ Определение 1. Говорят, что множество векторов образует линейное пространство L, если удовлетворяются следующие условия: а) для любых векторов a, b ∈ L a + b ∈ L;
(5)
б) для любого вектора a ∈ L и числа k k ⋅ a ∈ L.
Используя материал из [1], можно сказать, что N(A ) – это множество всех тех точек пространства (или их радиусов-векторов), которые с помощью преобразования TA переводятся в начало координат: x ∈ N(A)
(6)
(7)
TA
θ.
Нетрудно проверить, что N(A) – это линейное пространство. В случае неособой матрицы N(A) состоит из одной точки – начала координат. Определение 3. Областью значений R(A) или образом матрицы A третьего порядка [3, 6] называется множество тех векторов-столбцов y, которые можно получить после применения матрицы A, то есть ∃x ∈ R3.
y = Ax,
(8)
Переводя на язык преобразований [1], R(A) – это множество точек (или радиусов-векторов), в которые переводятся точки пространства R3 преобразованием TA : x ∈ R3
TA
y ∈ R(A).
Нетрудно проверить, что R(A) – линейное пространство. Если A – неособая матрица, то R(A) = R3. Определение 4 [6]. Говорят, что пространство трехмерных векторов R3 разлагается в ортогональную сумму R3 = L1 ⊕ L2 линейных пространств L1 и L2 , если: 1) любой ненулевой вектор из L1 ортогонален (перпендикулярен) любому (ненулевому) вектору из L2 , то есть L1 ⊥ L2 ; 2) любой трехмерный вектор a можно единственным образом представить в виде суммы векторов из L1 и L2 : a = a1 + a2 ,
Замечание. Для двумерных и трехмерных векторов указанные в (5), (6) действия определены в [1]. Определение 1 справедливо и для векторов (столбцов) произвольной размерности, для которых эти операции с указанными в [1] свойствами также могут быть определены [3, 5, 6]. Легко понять, что в качестве линейных пространств трехмерных векторов могут служить само трехмерное пространство R3, множества радиусов-векторов, составляющих плоскости и прямые, и, наконец, начало координат. Определение 2. Аннулируемым пространством N(A ) [6] матрицы A третьего порядка называется множество векторов-столбцов x ∈ R3, удовлетворяющих равенству Ax = θ,
где θ – нулевой вектор: θ = col(0, 0, 0).
∃a1 ∈ L1 ,
a2 ∈ L2 .
Пример. Пусть L1 – координатная плоскость. Тогда L2 – перпендикулярная ей ось координат. В этом случае ai (i = 1, 2) – это вектор-проекции вектора a на координатную плоскость и ось координат соответственно. Если L1 – любая плоскость, проходящая через начало координат, то L2 будет прямая, проходящая через начало координат и ей перпендикулярная. Определение 5 [2–6]. Матрица A T называется транспонированной к матрице A, если ее строки (столбцы) являются столбцами (строками) матрицы A с одинаковыми номерами. Лемма. Для любой матрицы A имеет место R3 = R(A) ⊕ N(A T ) = R(A T )⊕ N(A).
(9)
Достаточно простое доказательство этой леммы приведено в приложении.
Б Р УС И Н В . А . М А Т Р И Ц Ы И С И С Т Е М Ы Л И Н Е Й Н Ы Х У РА В Н Е Н И Й
109
МАТЕМАТИКА 3. РАССМОТРЕНИЕ СИСТЕМЫ (1) В СЛУЧАЕ ОСОБОЙ МАТРИЦЫ A Согласно изложенному выше, если матрица A особая (и ненулевая), то оператор TA переводит все точки (радиусы-векторы) пространства в некоторую плоскость или прямую, проходящие через начало координат. Тогда для системы (1) (или уравнения (2)) возможны два варианта: вариант I: b ∉R(A);
bˆ = n p R ( A ) b.
(10)
Следующая теорема дает алгоритм для нахождения НПР. Теорема 1 . Вектор-столбец xˆ есть НПР в том и только том случае, если он удовлетворяет уравнению T
T
A Axˆ = A b,
T
В первом варианте система решений не имеет. В этом случае возникает задача о нахождении приближенного решения с наименьшей погрешностью – наилучшего приближенного решения (НПР). Во втором варианте система будет иметь бесчисленное множество решений. Здесь очень часто возникает задача об отыскании вектора-решения наименьшей длины [4]: минимального решения (МР). Рассмотрим решение этих задач в отдельности. 3.1. Нахождение наилучшего приближенного решения Пусть x1 – произвольно выбранный вектор-столбец, который мы хотим рассматривать как приближенное решение (ПР) уравнения (2). Тогда за меру погрешности такого ПР обычно принимают величину |b − Ax1 |, то есть длину вектора b − Ax1 (рис. 1). Если b ∉R(A), то эта величина больше нуля. Чем меньше эта величина, тем ПР считается точнее. Тогда наилучшим ПР (НПР) будет такой вектор-столбец xˆ , для которого величина |Ax − b| будет наименьшей. Возникает задача нахождения такого вектора xˆ . Обозначим через bˆ проекцию вектора b на плоскость R(A) (см. рис. 1). Очевидно, что искомый вектор xˆ должен удовлетворять равенству Axˆ = bˆ . Ибо только в этом случае Axˆ – b ⊥ R ( A ) и, следовательно, величина Axˆ – b принимает минимально возможное
b
b – ^b
M
π --2
^ M Ax1
R(A)
Рис. 1
110
Axˆ = bˆ ,
(11)
или в другой форме – уравнению
вариант II: b ∈ R(A).
O ^b = Ax ^
значение. Таким образом, НПР должно удовлетворять соотношению
Ax2
M2
T
A yˆ = A b,
yˆ := Axˆ .
(12)
При этом вектор yˆ определяется однозначно: yˆ = bˆ .
(13)
Замечание. Система (12) может иметь бесчисленное множество решений, и вектор xˆ определяется неоднозначно. Но вектор yˆ и, значит, невязка Axˆ – b будут вполне определенными. Доказательство. 1) Пусть xˆ удовлетворяет (10). Поскольку bˆ – проекция вектора b на R(A), то bˆ ∈ R ( A ) и bˆ ⊥ b – bˆ (см. рис. 1). Отсюда по лемме получаем T T b – bˆ ∈ N ( A ). Это значит, что A ( b – bˆ ) = 0, то есть справедливо (11); 2) Наоборот, пусть xˆ удовлетворяет уравнению (11). Тогда yˆ = Axˆ будет удовлетворять равенству (12). Следует показать, что yˆ = bˆ является проекцией вектора b на R(A). По свойству проекций достаточно показать, что yˆ ⊥ b – yˆ (см. рис. 1). Из (11), (12) следует, что T T A ( b – yˆ ) = 0, то есть b – yˆ ∈ N ( A ). Но yˆ ∈ R ( A ), значит, согласно опять-таки лемме, yˆ ⊥ b – yˆ , что и требовалось доказать. Таким образом, согласно теореме 1, для того чтобы найти НПР, нужно найти любое решение системы (11). Заметим, что эта система относится к варианту II. Замечание. Схема нахождения НПР xˆ является одновременно и схемой проверки соотношения b ∈ R(A). Если решение системы (11) будет удовлетворять исходной системе, то, значит, это соотношение верно и в действительности мы получили не ПР, а точное решение. В противном случае имеет место b ∉R(A). Данная схема является альтернативной к ранговому критерию теоремы Кронекера–Капелли [2, 3]. Пример 1. Рассмотрим систему x 1 + x 2 – x 3 = 1,
M1
– x 1 + 2x 2 + 2x 3 = 0, 3x 2 + x 3 = 0. Легко видеть, что эта система несовместна. Найдем ее НПР. Имеем
С О Р О С О В С К И Й О Б РА З О В АТ Е Л Ь Н Ы Й Ж У Р Н А Л , ТО М 6 , № 1 , 2 0 0 0
МАТЕМАТИКА 1 A = –1 0 1 b = 0 ; 0
1 2 3
–1 2 1
1 T A = 1 –1
,
2 T A A = –1 –3
–1 14 6
3 6 6
,
–1 2 2
0 3 1
,
Замечание. Геометрически множество точек – концов радиусов-векторов x вида (16) представляет собой плоскость, перпендикулярную радиусу-вектору x0 ∈ ∈ R(A) и проходящему через его конец (рис. 2).
1 T A b = 1 . –1
Система (11) имеет вид –2 –1 –3
–1 14 6
3 6 6
xˆ 1 1 xˆ 2 = 1 xˆ 3 – 1
.
Исключая из первого и третьего уравнений xˆ 1 , получим последовательно 9xˆ 2 + 3xˆ 3 = 1, xˆ 1 = 1 – 4xˆ 2 .
Д оказ ательств о теоремы 2 . Пусть x ∈ R3 – произвольное решение системы. Согласно лемме, он может быть однозначно представлен в виде суммы (16), где x0 ∈ R(A T ), ∆x ∈ N(A), причем x0 ⊥ ∆x (см. рис. 2). Вектор x0 будет решением исходной системы, так как Ax0 = A(x − ∆x) = Ax − A∆x = Ax = b, ∆x ∈ N(A). В силу перпендикулярности (и теоремы Пифагора) имеем |x| 2 = = |x0 | 2 + |∆x| 2 (|a| – длина вектора a). Отсюда вытекает, что среди всех решений x0 имеет минимальную длину (для него |∆x| = 0). То есть x0 есть МР и любое другое решение имеет вид (16). Теорема доказана.
Полагая xˆ 2 = t свободным параметром, записываем множество всех НПР в виде xˆ 1 – 4t 1 t xˆ 2 = 1 xˆ 3 --3- – 3t
,
x3 M
t∈R . 1
M0 x x0
Проекция вектора b на R(A) вычисляется по формуле (12): 1 ˆ yˆ = b = 1 0
1 2 3
–1 2 1
1 – 4t t 1 --- – 3t 3
2⁄3 = –1 ⁄ 3 1⁄3
.
x1
3.2. Нахождение “минимального” решения Пусть теперь b ∈ R(A). Тогда справедлива следующая теорема. Те ор е ма 2 . Минимальный по длине вектор-столбец x0 решения уравнения (2) (МР) имеет вид x0 = A Tz,
(14)
где z – любой вектор-столбец, удовлетворяющий уравнению AA Tz = b.
(15)
Множество всех решений будет иметь вид ∆x ∈ N(A).
x2 Рис. 2
Мы видим, что этот вектор действительно вычисляется однозначно. Легко получить, что НПР минимальной 11 длины получается при t = ------ . 26
x = x0 + ∆x,
∆x
(16)
4. ЗАКЛЮЧЕНИЕ Изложенная теория имеет прямое обобщение на n уравнений с n неизвестными, n > 3, что и представляет действительный интерес для приложений [4]. Идейная, геометрическая часть при этом остается той же самой – нужно только представить, что все действия происходят в n-мерном пространстве. Техническая часть теории, конечно, усложняется, но это усложнение в основном носит количественный характер: при вычислении длин векторов, произведений матриц и т.п. вместо трех слагаемых в соответствующих выражениях будут присутствовать n слагаемых, отвечающих новым размерностям. Более сложной по сравнению с трехмерными матрицами [1] будет процедура нахождения обратной матрицы A −1. Но здесь помогает наличие стандартных компьютерных программ точного и приближенного (в случае очень больших размерностей) отыскания A −1.
Б Р УС И Н В . А . М А Т Р И Ц Ы И С И С Т Е М Ы Л И Н Е Й Н Ы Х У РА В Н Е Н И Й
111
МАТЕМАТИКА ПРИЛОЖЕНИЕ
Тогда 〈 x˜ , Az〉 = 0 для любого z ∈ R 3. Отсюда получаем
Доказательство леммы основано на формуле [6]
〈 x˜ , Az〉 = 〈 A x˜ , z〉 = 0. Но тогда A x˜ должен быть нулевым вектором, ибо в противном случае он должен быть перпендикулярным любому вектору z ∈ R 3. Это и доказывает наше утверждение.
〈x, Ay〉 = 〈A Tx, y〉
(I)
(I)
для любых векторов x, y ∈ R и матриц A n-го порядка, где через 〈a, b〉 обозначено скалярное произведение векторов-столбцов a = (a1 , a2 , …, an), b = (b1 , b2 , …, bn): n
n
〈 a, b〉 =
∑a b . i i
В случае трехмерных векторов (n = 3)
i=1
известно, что два ненулевых вектора a и b перпендикулярны в том и только том случае, если 〈a, b〉 = 0 [2–6] 1. Формула (I) для n = 3 легко проверяется прямым вычислением левой и правой частей. 1. Пусть x1 ∈ R(A), x2 ∈ N(A T )– ненулевые трехмерные векторы из соответствующих пространств. По определению этих пространств, x1 = Az,
∃z ∈ R 3 ;
A Tx = θ.
T
Из доказанного вытекает, что размерность пространства N(A T ) дополняет размерность пространства R(A) до полной размерности, n = 3. Значит, R(A) ⊕ ⊕ N(A T ) = R 3 и имеет место разложение x = x1 + x2 , x1 ∈ ∈ R(A), x2 ∈ N(A T ), причем x 1 = n p R ( A ) x, x 2 = n p N ( AT ) x. ЛИТЕРАТУРА 1. Брусин В.А. Матрицы как линейные операторы // Соросовский Образовательный Журнал. 2000. Т.6, № 1. С. 102–107. 2. Бугров Я.С., Никольский С.М. Элементы линейной алгебры и аналитической геометрии. М.: Наука, 1980. 175 с.
(II)
3. Курош А.Г. Лекции по общей алгебре. М.: Наука, 1973. 399 с.
Покажем, что отсюда следует x1 ⊥ x2 . Вычислим скалярное произведение 〈x1 , x2〉. Подставляя в него соотноше-
4. Альберт А. Регрессия, псевдоинверсия и рекуррентное оценивание. М.: Наука, 1977. 223 с.
(II)
ния (II) и используя равенство (I), получаем 〈x1 , x2〉 = (II)
(I)
(II)
= 〈Az, x2〉 = 〈z, A Tx2〉 = 0. Таким образом, x1 ⊥ x2 . Поскольку x1 и x2 – произвольные векторы пространств, отсюда следует R(A) ⊥ N(A T ). 2. Покажем теперь, что любой вектор x˜ , перпендикулярный R(A), принадлежит N(A T ). Пусть x˜ ⊥ R ( A ). 1
Это вытекает из известной формулы вычисления косинуса угла между векторами a и b: 3
∑a b i
i
i=1 -. cos ( a, b ) = --------------------------------------------------------------2 2 2 2 2 2 a1 + a2 + a3 b1 + b2 + b3
112
T
5. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука, 1984. 831 с. 6. Ланкастер П. Теория матриц. М.: Наука, 1982. 270 с.
Рецензент статьи В.А. Ильин *** Владимир Александрович Брусин, доктор физико-математических наук, профессор, зав. кафедрой высшей математики Нижегородского государственного архитектурно-строительного университета, член-корреспондент РАЕН. Область научных интересов – математические проблемы теории устойчивости и теории управления. Автор более 160 научных статей и учебного пособия.
С О Р О С О В С К И Й О Б РА З О В АТ Е Л Ь Н Ы Й Ж У Р Н А Л , ТО М 6 , № 1 , 2 0 0 0