Prof. dr.
sc.
Ivan Ivanšić
NUMERIĆKA MATEMATIKA
ISBN 953-197-526-4
I van Ivanšić Redoviti profesor Fakulteta elektrotehnike i računarstva Zavod za primijenjenu matematiku
NUMERIČKA MATEMATIKA
Zagreb, 2002.
© Prof. dr. sc. Ivan lvanšić, 1 998.
Prof.
Urednik dr. sc. Neven Elezović
Slog, crteži i prijelom Nataša Jocić, dipl. inž
Design ovitka Palete, Zagreb
Nakladnik
ELEMENT, Zagreb,
Republike Austrije I I tel. 01/37-717-37, 0 1/37-777-44, 0 1/37-777-52 faks 01/37-736-4 1 http://www.element.hr/ e-mail:
[email protected]
Tisak Nova promocija. Zagreb
Nijedan dio ove knjige ne smij7 se preslikavati niti umnažati na bilo koji način. bez pismenog dopu�tenja nakladnika .
PREDGOVOR Numerička analiza je vrlo opsežna grana matematike koja je u punom raz voju iako su prvi numerički postupci stari koliko i cijela matematika. Ne samo da se rješavaju novi problemi, već se i za klasične probleme, koje su nekada rješavali npr. Newton, Gauss, Euler i drugi, nalaze pod stanovitim (za primjenu važnim) uvjetima novi računski efikasni postupci (algoritmi). Zbog te opsež nosti ova knjiga prvenstveno prati program predmeta "Numerička matematika" koji se predaje studentima Fakulteta elektrotehnike i računarstva (FER) u Zag rebu i time nosi naziv tog predmeta. Time prvenstveno služi studentima FER-a, ali može poslužiti i drugima u dijelu njihovog programa koji se preklapa sa gore spomenutim. Pretpostavlja se da je student prošao kroz uobičajeni tečaj matematičke analize i linearne algebre i taj se aparat koristi uz mali podsjetnik na licu mjesta. Kod proučavanja numeričkih metoda nije dovoljno poznavati samo "re cept", potrebno ga je razumijeti barem u svojem elementarnom dijelu. Stoga su gotovo svi postupci izvedeni. Za primjenu je važno poznavati i ocjenu pogreške upotrebljenog postup ka, pa su iste izvedene. U nekoliko slučajeva su navedeni gotovi rezultati iIi se poziva na neki detaljno obrađeni dokaz jer je promatrani potpuno analogan. Spo menimo da je obrađeno i nekoliko "mlađih postupaka" izvan gornjeg programa. Ti postupci imaju značajnu primjenu u novije vrijeme. Svi prezentirani postupci su računski upotrebljivi i široko se koriste. Da pojasnimo misao o upotrebljivosti postupka ilustrirajmo ju na primjeru tzv. Hor nerove šeme pomoću koje se računa vrijednost polinoma
P(
" ,,-I X ) = aoX + alx
+
a2x
11-2
+
...
+
an_IX
+
" '""" x,,-i. a" = � ai i=O
Pretpostavimo da treba izračunati P(xo ) , tj. vrijednost polinoma za X = Xo. Ćitanjem zapisa polinoma nudi se postupak da izračunamo redom sve potencije x , i = 0, 1,2, .. , IZ; zatim svaku pomnožirno sa an-i i onda to sve zbrojimo. Da ne duljimo oko toga da je takav postupak nespretan napišimo odmah polinom u ovom obliku (zapis izvodimo postupno);
&
.
P(x )
=
,,-2 + x ( aox,,-l + ajx .. + a,,_1X + all-d + a" n 2 ,,= x (x( a()X - + alx 3 + ... + an-2 ) + all-d + a" n" + = x (x (x ( aox -3 alx 4 + ... + a,,-3) + a,,-2 ) + a,,-l) =
.
x (x (... (x (xao
+
ad
+
a2 )
+
.
_ .
+
+ a,,-2) + a,,-d + all
a"
Pogledajmo u čemu je prednost ovakvog zapisa. Zagrade nam kažu u kojem redosljedu se provode operacije. Polazimo od nutarnje zagrade u kojoj za X = Xo treba izračunati vrijednost polinoma prvog stupnja aox + al Taj rezultat glasi .
+ a()Xo al
= YI -
Izračunavši Yl prelazimo na drugu zagradu (gledano naravno iz unutra prema van) i vidimo da za dobiveni Y I treba opet izračunati vrijednost poIinoma prvog stupnja. koji rezultat glasi
Y1XO + a2 = Y2·
I sljedeći korak je isti s time da ulogu od Y I preuzima Y 2 Y2XO + a3 = Y3,
i računamo
i tako redom
Yi-IXO
+ ai = Yi
Yn-IXO + an
= = Yn
P(xo}
da u zadnjem koraku izračunamo vrijednost danog polinoma II točki Xo. Vidimo da je ao bio početni Yo i da u svakom koraku imamo isti račun s promijenjenim podacima. naime mijenjaju se koeficijenti polinoma prvog stupnja dok je argu ment Xo stalno isti. Nadalje. ono što smo u jednom koraku izračunali koristimo u sljedećem pa kažemo da se radi o iteracijskom postupku. Takav se postupak lako programira na računskom stroju. Spomenimo da se može i tabelirati što obično susrećemo u ovom obliku
+
ao
al YoXo
a2 YIXO
a3 Y2XO
an Yn-IXO
ao = Yo
YI
Y2
Y3
Yn = P(xo}
J.xo
Tablica se izgradi ovako. U prvi red popišemo koeficijente polinoma P. zatim prema gornjim formulama formiramo drugi i treći red. To znači da prvo u treći red upišemo a o = Yo. koji zatim pomnožimo sa Xo (označen na desno od tablice) i potpišemo ispod a l . Zbrojimo li al i potpisani YoXo (što ističe znak .. " + na lijevo od tablice) dobivamo YI. Zatim YI pomnožirno sa Xo i produkt potpišemo ispod a 2. to zbrojeno daje Y 2 i tako redom dok ne dođemo do kraja dobivši Yn = P(xn). Teme obrađene u ovoj knjizi daju u stanovitom smislu temeljna znanja. Zbog opsežnosti numeričke analize imamo specijalizirane knjige. koje obrađuju pojedina područja numeričke analize, kakvih prije pedesetak godina gotovo da nije bilo. llustrirajmo to na sustavu linearnih jednadžbi. U poglavlju "Sustavi linearnih jednadžbi" obrađene su direktne i iteracijske metode koje su u principu primjenjive na oPĆi slučaj. Medutim, danas se u istraživanjima primjenjuju su stavi s velikim brojem nepoznanica. Pri tome često matrica takvog sustava ima mnogo elemenata koji su nula Uoš se kaže da je matrica rijetka) (engl. sparse). Da bi se efikasno riješio takav sustav potrebna je metoda koja tu pojavu uzima u obzir. pa je time efikasnija od neke opće metode. Stoga će oni koji se budu bavili istraživanjima u kojima se pojavljuju posebni problemi morati posegnuti za specijaliziranom literaturom, a stečeno znanje će im pomoći da to razumiju. I u ovoj knjizi ima pogrešaka. Ako mi na njih ukažete. onda postoji mo gućnost da tih ne bude u eventualno ponovljenom izdanju. •
Zagreb, 20. ožujka
1998.
Autor
SADRZˇ AJ
1. Interpolacija i aproksimacija funkcija . . . . . . . . . . . . . . . . . . . . . . 1.1. Interpolacijski polinom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Interpolacijski splajn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3. Trigonometrijska interpolacija . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4. Cˇ ebisˇevljevi polinomi, minimaks polinom i teleskopiranje redova potencija . . . . . . . . . . . . . . . . . . . . . . . . . 1.5. Polinom najmanjih kvadrata . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Numericˇko integriranje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1. Newton–Cotesove formule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Ponavljanje raspolavljanja i Rombergov algoritam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Gaussove formule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Integriranje brzo oscilirajuc´ih funkcija. Filonova formula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 1 18 23 31 36 40 41 50 54 58
3. Sustavi linearnih jednadzˇ bi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1. Direktne metode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Iteracijske metode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65 66 85
4. Svojstvene vrijednosti i svojstveni vektori matrice . . . . . . . . . . . . 4.1. Metoda neodredenih koeficijenata . . . . . . . . . . . . . . . . . . . . . . . 4.2. Danilevskijeva metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3. Krilovljeva metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4. Nalazˇ enje karakteristicˇnog polinoma Leverrierovom metodom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5. Misesova metoda potencija — spektralni radijus matrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
110 115 117 124 127 129
5. Nelinearne jednadzˇ be . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1. Jednadzˇ be s jednom nepoznanicom . . . . . . . . . . . . . . . . . . . . . . 5.2. Algebarske jednadzˇ be . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3. Sustavi nelinearnih jednadzˇ bi . . . . . . . . . . . . . . . . . . . . . . . . . . .
134 134 148 164
6. Aproksimacija rjesˇenja obicˇnih diferencijalnih jednadzˇ bi . . . . . . 6.1. Metoda sukcesivne aproksimacije . . . . . . . . . . . . . . . . . . . . . . . 6.2. Eulerova metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3. Runge–Kuttini postupci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
180 181 185 189
Kazalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 Literatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
1.1. INTERPOLACIJSKI POLINOM
1
1.
Interpolacija i aproksimacija funkcija
1.1. 1.2. 1.3. 1.4.
Interpolacijski polinom . . . . . . . . . . . . . Interpolacijski splajn . . . . . . . . . . . . . . Trigonometrijska interpolacija . . . . . . . . Cebisevljevi polinomi, minimaks polinom i teleskopiranje redova potencija . . . 1.5. Polinom najmanjih kvadrata . . . . . . . . .
. . . . . . .1 . . . . . . 18 . . . . . . 23 . . . . . . 31 . . . . . . 36
Jedan od osnovnih problema numerickih metoda je kako aproksimirati danu funkciju f pomoc´u funkcije g koja je prikladnija za izracunavanje, te ocijeniti pogresku koja je ucinjena pri takvoj aproksimaciji. Uobicajeni oblik aproksimacije g je linearna kombinacija g x = a0 g0 x + a1 g1 x + : : : + an gn x nekih “jednostavnih” funkcija gi , i = 0 1 2 : : : n . Najcesc´i izbor funkcija gk su potencije x k , trigonometrijske funkcijue sin kx , cos kx , te eksponencijalne funkcije ebk x . Nadalje, same gk mogu biti linearne kombinacije kao sto su npr. ortogonalni polinomi itd. U novije vrijeme sve vise se koriste racionalne funkcije, tj. funkcije oblika a0 + a1 x + : : : + an x n Pn x : g x = = b0 + b1 x + : : : + bm x m Pm x Ovdje c´emo se najvise ograniciti na aproksimaciju polinomima.
1.1. Interpolacijski polinom
7!
Da bismo motivirali problem zamislimo da eksperimentalnim mjerenjem istrazujemo nepoznatu funkciju x f x . Time dobivamo seriju podataka x 0 f x 0 x 1 f x 1 : : : x n f x n 1 koji u ravnini predstavljaju tocke grafa * f ne zaboravimo da su u 1 svi podaci aproksimativne vrijednosti.
2
1. INTERPOLACIJA I APROKSIMACIJA
FUNKCIJA
Ln (x)
x0
x1
xn
x2
Sl. 1.1.
Postavlja se pitanje izracunavanja aproksimativnih vrijednosti funkcije f izvan tocaka x i , tj. za vrijednosti argumenta x , x 6= x i . Oblik funkcije nam je potpuno nepoznat znamo samo njezinu vrijednosti u tockama x 0 x 1 : : : x n . Stoga nepoznatu funkciju f zamijenjujemo s drugom, nama poznatom funkcijom, koja ima iste vrijednosti u zadanim tockama. Svakako je najjednostavnija takva funkcija polinom. To nas vodi na problem iznalazenja tzv. interpolacijskog polinoma stupnja vrijedi
?n
Px
= a0 + a1x +
:::
+ an xn
2
cije se vrijednosti u tockama x i podudaraju s vrijednostima f x i , tj. Px i = f x i
i=0 1
:::
3
n:
Tocke x i zovu se cvorovi bazne tocke ili interpolacijske tocke, dok se P zove interpolacijski polinom. Lako se uvjerimo da je interpolacijski polinom jedinstven, tj. da kroz n + 1 cvoriste 1 prolazi samo jedan polinom P stupnja ? n takav da vrijedi Px i = f x i , i = 0 : : : n . Naime, uvrstimo li redom tocke x i dobivamo sljedec´i sustav linearnih jednadzbi po nepoznatim koeficijentima a0 a1 : : : an . a0 + a1 x 0 + a2 x 20 + : : : + an x n0 a0 + a1 x 1 +
a2 x 21
+
:::
+
an x n1
a0 + a1 x n + a2 x 2n + : : : + an x nn
= f x0 = f x1
4
.. .
= f xn
:
Sustav 4 ima jedinstveno rjesenje zbog toga sto je determinanta sustava 1 x 0 x 20 1 x 1 x 21 1 x n x 2n
::: :::
.. . :::
x n0 x n1 x nn
=
Y
xi xj 6= 0
:
5
i j
Determinanta 5 poznata je pod imenom Vandermondeova determinanta, cija je vrijednost jednaka umnosku svih razlika x i x j , i j . Rjesenjem sustava 4 dobivamo koeficijente a0 a1 : : : an , odnosno trazeni interpolacijski polinom.
1.1. INTERPOLACIJSKI POLINOM
3
Lagrangeov oblik interpolacijskog polinoma
Rjesavanje sustava jednadzbi 4 iz uvoda nije jednostavno, medutim, pokazuje se da se P moze pronac´i u zapisu koji je razlicit od zapisa 2 iz uvoda, pa ovdje izvodimo zapis od P u formi u kojoj se naziva Lagrangeov oblik interpolacijskog polinoma i oznacava sa Ln . Ogranicimo li se na restrikciju od f na skup fx 0 x 1 : : : x n g , vidimo da tu restrikciju mozemo prikazati kao linearnu kombinaciju ovih n + 1 funkcija Mi x j
=
Gij
=
1 za j = i 0 za j 6= i
jer ocito vrijedi f xj =
n X i=0
i j=0 1
:::
n
f x i Mi x j :
6
Pronademo li interpolacijski polinom pi za svaku od pomoc´nih funkcija Mi , dobit c´emo trazeni interpolacijski polinom Ln kao Ln x
=
n X i=0
f x i pi x :
7
Interpolacijski polinom pi lako nalazimo, zato sto su sva cvorista, osim x i , njegove nultocke. Imamo dakle da je pi x
=
Ci x x 0 x x 1 x x i
1
x x i+1 x x n
gdje je Ci konstanta, koju lako odredujemo uvrstavanjem x = x i . Kako je pi x i = 1 , imamo 1 = Ci x i x 0 x i x 1 x i x i 1 x i x i+1 x i x n odnosno Ci
xi x0 xi x1
=
Time je pi x
=
1 xi xi
x x0 x x1 x xi xi x0 xi x1 xi xi
1
x i x i+1 x i x n
1 1
:
8
x x i+1 x x n x i x i+1 x i x n
sto prema 7 daje Ln x
=
=
n X i=0
n X i=0
f xi f xi
x x0 x x1 x xi xi x0 xi x1 xi xi
Y 6
i=j 0 j n
??
x xj : xi xj
x x i+1 x x n 1 x i x i+1 x i x n
1
9
Zapis 9 zove se Lagrangeov oblik interpolacijskog polinoma. Vidimo da Ln nismo dobili u obliku razvijenom po potencijama od x vec´ kao linearnu kombinaciju polinoma pi , sto je posljedica postupka nalazenja Ln . Zelimo li izracunati koeficijent
4
1. INTERPOLACIJA I APROKSIMACIJA
FUNKCIJA
ak uz potenciju x k , moramo izvrsiti pripadna mnozenja i zbrajanja. Za n = 1 imamo jednadzbu pravca kroz tocke x 0 f x 0 , x 1 f x 1 , napisanu u ovom obliku: x x1 x x0 L1 x = f x 0 + f x 1 10 x0 x1 x1 x0 dok za n = 2 dobivamo jednadzbu parabole kroz zadane tri tocke, napisanu u ovom obliku x x1 x x2 f x + x x0 x x2 f x + x x0 x x1 f x : L2 x = x0 x1 x0 x2 0 x1 x0 x1 x2 1 x2 x0 x2 x1 2 11 Primjer 1.1. Odredite interpolacijski polinom za funkciju y = sin S x pri sljedec´em izboru cvorova: x 0 = 0 , x 1 = 16 , x 2 = 12 . Lako sada izracunamo f x 0 = 0 , f x 1 = sin S6 = 12 , f x 2 = sin S2 = 1 pa uvrstavanjem u 11 i sredivanjem dobivamo 7 L2 x = x 3x 2 : 2
Sada npr. za x = 14 dobivamo sin S4 0:6875 . To je aproksimacija od sin S4 0:7021 s greskom 2 102 sto moze zadovoljavati neke racune.
=
p2 2
Lagrangeov oblik interpolacijskog polinoma za ekvidistantne cvorove
Izvedimo i Lagrangeov oblik interpolacijskog polinoma za ekvidistantne cvorove, tj. x i+1 x i = h , i = 0 1 2 : : : n 1 . Velicinu h zovemo korak inx x0 terpolacije. Oznacimo li sa t = , imamo: x x 0 = th , x = x 0 + th ; h x x 1 = x x 0 x 1 x 0 = th h ; x i x 0 = ih , x i x 1 = i 1h , itd. pa mozemo pisati x x0 x x1 x xi1 x xi+1 x xn xi x0 xi x1 xi xi1 xi xi+1 xi xn = thth h ih ith 1hi h1hhth i +n1hih th nh ni = t t 1t it n i!n1 i! ni = t t 1t it n 1n! i!nn! i! = 1n1 ni t 1 i t t 1 n! t n 12 Time Lagrangeov oblik interpolacijskog polinoma 9 poprima oblik Ln x
= Lnx0 + th = 1n t t
1 t n!
n n X i=0
1i
n f x i : i t i
13
1.1. INTERPOLACIJSKI POLINOM
5
Iz 12 vidimo da koeficijenti uz f x i ne ovise niti od f niti od koraka h . Stoga se koeficijenti 12 mogu tabelirati. Takve tablice postoje i zovu se tablice Lagrangeovih koeficijenata. Sada L2 x izgleda ovako: t t 1 t 2 f x 0 f x 0 + h f x 0 + 2h L2 x = L2 x 0 + th = 2 + 2 t t 1 t 2 sto je naravno polinom drugog stupnja u varijabli t . Izracunavanje interpolacijskog polinoma, Aitkenova interpolacijska shema
Kao sto znamo, polinomi su funkcije koje su definirane na svim realnim brojevima, pa prema tome mozemo izracunati Ln x za bilo koji realan broj x 2 R . Ipak, u tome razlikujemo dva slucaja obzirom na polaznu funkciju f . Ako izracunamo Ln x za neki x izmedu x 0 i x n , tj. x 0 x x n , onda govorimo da smo izvrsili interpolaciju, dok za ostale x , tj. x izvan segmenta x 0 x n , kazemo da smo izvrsili ekstrapolaciju. U slucaju da nam ne treba opc´i izraz za Ln nego samo njegove vrijednosti za neke x spretno je sluziti se tzv. Aitkenovom interpolacijskom semom Aitkenov algoritam koja se jos zove i iterirana linearna interpolacija. Radi krac´eg zapisivanja oznacimo f x i = y i . Napisimo ponovo jednadzbu linearnog interpolacijskog polinoma koji prolazi tockama x 0 y 0 i x 1 y 1 . Oznacimo taj polinom sa L01 . Prema 10 imamo slijedec´i zapis L01 x
= = =
x x0
x1 x y0 + x1 x1
1
x0 y1 x0
x1 x y1 x0 1 y 0 x 0 x : x1 x0 y1 x1 x x1
y 0
x0
x
14
Analogno mozemo odrediti L12 , L23 ,: : : , odnosno Ljk , j k . Promotrimo interpolacijski polinom drugog stupnja kroz tocke x 0 y 0 , x 1 y 1 , x 2 y 2 koji oznacavamo sa L012 . Prema 10 imamo L012 x
=
x x0
x1 x x2 x y0 + x1 x0 x2 x1
x0 x x2 x y1 + x0 x1 x2 x2
x0 x x1 y2: x0 x2 x1
Uocimo da rastavljanjem na parcijalne razlomke vrijedi 1 a x
x
b
=
1 a
1 bx
a
+
1 b
1 ax
b
sto primijenjeno na srednji pribrojnik od L012 daje 1 x1
x0 x1
x2
=
1 x0
1 x2 x1
x0
+
1 x2
1 x0 x1
x2
6
1. INTERPOLACIJA I APROKSIMACIJA
FUNKCIJA
tako da L012 mozemo ovako zapisati 1 n x x1 x2 x x x0 x2 x L012 x = y0 + y1 x2 x0 x0 x1 x1 x0 x0 x x x2 x x0 x x1 o y1 + y2 x1 x2 x2 x1 1 nh x 1 x x0 x i = y0 y1 x2 x x2 x0 x1 x0 x1 x0 h o x2 x x1 x i y1 y2 x0 x x2 x1 x2 x1 o 1 n = L01 x x 2 x L12 x x 0 x : x2 x0 Izraz u zagradi je ponovo razvoj determinante drugog reda sto u takvom zapisu izgleda ovako 1 L01 x x 0 x L012 x = 15 : x 2 x 0 L12 x x 2 x Izrazi 14 i 15 su potpuno analogno gradeni pa nasluc´ujemo da opc´enito vrijedi 1 L01::: n 1 x x 0 x Ln x = L01:::n x = : 16 x n x 0 L12:::n x x n x Formulu 16 lako dokazujemo indukcijom. Primijetimo da L01::: n 1 nije nista drugo nego interpolacijski polinom za cvorove x 0 , x 1 , : : : , x n 1 , dok je L12:::n interpolacijski polinom za cvorove x 1 , x 2 ,: : : x n . Zapisemo li ih u Lagrangeovom obliku 9 imamo L01::: n
1
x
=
n 1 X
yi i=0
x x0 x xi x0 xi
x1 : : : x x1 : : : xi
xi xi
1 1
x x i+1 : : : x x n 1 x i x i+1 : : : x i x n 1 17
odnosno L12:::n x
=
n X
yi i=1
x x1 x xi x1 xi
x2 : : : x x2 : : : xi
xi xi
1 1
x x i+1 : : : x x n : x i x i+1 : : : x i x n
Izracunamo li determinantu 16 dobivamo x n x L01::: n 1 x0 L01:::n x = xn x0
x L12:::n
18
:
xn x x xn = predxn x0 x0 xn stavlja prvi pribrojnik sume 9 i da zadnji pribrojnik sume 18 pomnozen sa x0 x x x0 = predstavlja zadnji pribrojnik sume 9. Ostaje jos da poglexn x0 xn x0 damo koeficijente od y i za 1 ? i ? n 1 . Tada je koeficijent od y i jednak 1 n x x 0 : : : x x i 1 x x i+1 : : : x x n 1 x xn xn x0 x i x 0 : : : x i x i 1 x i x i+1 : : : x i x n 1 x x 1 : : : x x i 1 x x i+1 : : : x x n o + x x0 x i x 1 : : : x i x i 1 x i x i+1 : : : x i x n
Ocigledno je da prvi pribrojnik sume 17 pomnozen sa
1.1. INTERPOLACIJSKI POLINOM
=x
x
1 n
x0
7
x 0 x x 1 : : : x x i 1 x x i+1 : : : x x n 1 x x n x i +x n x i x 0 xi x0 xi x1 : : : xi xi 1xi xi+1 : : : xi xn 1xi xn
sto je tocno koeficijent od y i u prikazu 9. Formula 16 daje drugi zapis interpolacijskog polinoma. Taj zapis je veoma podesan za izracunavanje vrijednosti interpolacijskog polinoma, posebno na racunskim strojevima jer se radi o visestrukoj uzastopnoj primjeni istog postupka. Sema racunanja interpolacijskog polinoma izgleda sada ovako: xi
yi
xi
x
Li
x0 x1 x2 x3 x4 x5
y0 y1 y2 y3 y4 y5
x0 x1 x2 x3 x4 x5
x x x x x x
L01 x L12 x L23 x L34 x L45 x
1i
Li
2i 1i
Li
L012 x L123 x L234 x L345 x
3i 2i 1i
L0123 x L1234 x L2345 x
Li
4i 3i 2i 1i
L01234 x L12345 x
Kod iznalazenja interpolacijskog polinoma nismo nista govorili o poredaju cvorova. Automatski smo mislili da ih uzimamo po velicini, medutim, to nismo nigdje koristili. Mozemo dakle proizvoljno permutirati cvorove i zatim ispisivati Lagrangeov interpolacijski polinom, dobivamo isti rezultat. Sada se moze izvrsiti jedno opc´e kombinatoricko razmatranje i uz nesto racunanja dobiti jedan opc´i zapis interpolacijskog polinoma iz kojega se specijaliziranjem indeksa i permutacija dobiva nekoliko drugih zapisa oblika interpolacijskog polinoma. To ovdje izostavljamo. Vratimo se primjeru aproksimacije y = sin S x za x = 0:25 = 14 iz 1.1. Sada bez nalazenja interpolacijskog polinoma imamo postupnim racunanjem sljedec´u tablicu cija je zadnja vrijednost jednaka L012 14 . xi
0:25
xi
yi
0 0:1666
0 0 :5
0:25 0:0834
0:75
0 :5
1
0:25
0:6252
0:6876
sin
S
4
Newtonovi oblici interpolacijskog polinoma
Prvo c´emo izvesti tzv. Newtonov oblik s kvocijentima diferencija. Vec´ na samom pocetku diferencijalnog racuna sreli smo pojam kvocijenta diferencija i na njemu proveli granicni proces da dobijemo derivaciju u tocki. Sada ne provodimo granicni proces nego kratko uvodimo odgovarajuc´e pojmove. Za tocke x 0 f x 0 i x 1 f x 1 definiramo i oznacavamo kvocijent diferencija funkcije f kao f x 0 x 1 =
f x 1 f x 0 x1 x0
= x f x0x + x f x1x 0 1 1 0
19
8
1. INTERPOLACIJA I APROKSIMACIJA
FUNKCIJA
i zovemo kvocijent diferencija. Za tri tocke x 0 f x 0 , x 1 f x 1 , x 2 f x 2 uvodimo kvocijent diferencija drugog reda funkcije f kao f x 0 x 1 x 2 =
= =
f x 2 x 1 f x 1 x 0 x2 x0 f x2 f x1 f x1 f x0 x2 x1 x1 x0 x2 x0 f x0 f x1 + x0 x1 x0 x2 x1 x0 x1
x2
+
x2
f x2 x0 x2
x1
20 tj. kao kvocijent diferencija od kvocijenata diferencija prvog reda. Induktivno definiramo kvocijent diferencija n -tog reda kvocijent diferencija n -tog reda od f kao f x 0 x 1
:::
xn =
f x 1 x 2
x n f x 0 x 1 xn x0
:::
:::
xn
1
:
21
Za jednu tocku x 0 f x 0 definiramo kvocijent diferencija 0 -tog reda kao funkcijsku vrijednost u toj tocki i oznacavamo f x 0 = f x 0 . Dokazimo da za kvocijent diferencija vrijedi formula f x 0 x 1
:::
xn =
x1 x0
x0 +
x0
xn
f x0 + ::: x2 : : : x0 xn f xn xn x1 : : : xn xn 1
X Qf x = x n
i
i=0
6
i=j 0 j n
i
xj
22
:
??
Jednakost 22 dokazuje se indukcijom. Za n = 1 formula 19 daje takav rastav. Pretpostavimo induktivno da rastav vrijedi za prirodne brojeve n . Sada je po definiciji f x 0 x 1
:::
xn =
1 xn
x0
f f x1
x2
:::
x n f x 0 x 1
:::
x n1 g:
Prema induktivnoj pretpostavci mozemo pisati f x 1 x 2
:::
xn =
f x1 + ::: x1 x2 x1 x3 : : : x1 xn f xn + x n x 1 x n x 2 : : : x n x n1
X Qf x x x n
=
i
i=1
6
i=j 1 i n
??
i
j
1.1. INTERPOLACIJSKI POLINOM
9
i analogno
X Qf x x n 1
f x0 x1
Sada je f x0 x1
:::
xn =
xn
:::
1 =
nX
xn
x0
i=1
i=0
Q f xx
n
1
6
i=j 1 j n
6
i=j 0 j n 1
i
xj
i
:
??
i
i
X Q f xx n 1
xj
i=0
??
6
i=j 0 j n 1
o
i
xj
i
:
23
??
Iz 23 direktno citamo da uz f x 0 i f x n imamo koeficijent koji propisuje 22. Ostaje da to provjerimo za indekse 1 ? j ? n 1 . Nadalje citamo da je u 23 koeficijent od f x j jednak
n
1 xn
x0
Q 6
i=j 1 j n
1 x i
xj
??
=
xn
Q
xn x0
Qx 6
6
i=j 0 j n 1
??
0
i=j 0 j n
??
xi
xj
o
1 x i
=
xj
Q 6
i=j 0 j n
=
xi
xn
x0 x0
Qxx
6
i=j 0 j n
i
i
xn xj
??
1 xi
xj
??
cime je dokaz proveden. Iz definicije 21 i jednakosti 22 lako se dokazuju ova osnovna svojstva kvocijenta diferencija n -tog reda: a kvocijent diferencija n -tog reda je linearan operator, tj. vrijedi D f + E g x 0 x 1 : : : x n = D f x 0 x 1 : : : x n + E g x 0 x 1 : : : x n ; b kvocijent diferencija je simetricna funkcija svojih argumenata x 0 , x 1 ,: : : , x n , tj. ne mijenja vrijednost pri proizvoljnoj permutaciji argumenata. Ako je funkcija f zadana u tockama x 0 , x 1 ,: : : , x n onda se tablica f x0 f x0 x1 f x1 f x0 x1 x2 ... f x1 x2 f x2 f x1 x2 x3 f x2 x3 f x0 x1 : : : xn .. . .. f x3 . .. f x n2 x n1 x n . .. . f x n1 x n f xn
10
1. INTERPOLACIJA I APROKSIMACIJA
FUNKCIJA
zove tablica kvocijenata diferencija od f . Da iz Lagrangeovog oblika interpolacijskog polinoma izvedemo Newtonov postupimo ovako. Promatrajmo u prvom redu razliku
X n
f x
Ln x
=
f x
Y
=
??
i=0
x
f xi
xj
n
Y 6
i=j 0 j n
??
x xi
Q f xx
??
0 j n
xj xj
X n
xi
0 j n
+
i=0
Q
o
f xi x
xi
6
j=i 0 j n
xi
xj
??
pri cemu smo drugu jednakost dobili izlucivanjem produkta ispred viticaste zagrade. Promatramo li izraz u viticastoj zagradi uvidamo prema 4 da iznosi f x x 0 x 1 : : : x n , tj. da je to kvocijent diferencija n + 1 -og reda x je shvac´en kao dodatno cvoriste, pa mozemo pisati f x
Ln x
=
f x x 0 x 1
:::
Y
xn
??
xj
x
24
0 j n
sto c´e nam trenutak kasnije korisno posluziti. Nadalje, zapisimo interpolacijski polinom Ln u obliku Ln x = L0 x + L1 x L0 x + : : : + Ln x Ln1 x 25 gdje Lk oznacava interpolacijski polinom u Lagrangeovom obliku odreden cvorovima x 0 , x 1 , : : : , x k i L0 x = f x 0 . Tada je razlika Lk x Lk1 x polinom k -tog stupnja kojemu su x 0 , x 1 ,: : : , x k1 nultocke jer vrijedi f x j = Lk1 x j = Lk x j za j = 0 1 2 : : : k 1 . Prema tome mozemo pisati Lk x Lk1 x = Ak1 x x 0 x x 1 : : : x x k1 26 = Ak1 x xj
Y
??
0 j k 1
gdje koeficijent Ak1 moramo odrediti. Za x Lk x k
=
Lk1 x k = Ak1
Y
x k dobivamo iz 26
??
xk
xj
0 j k 1
dok iz 24 za n = k f xk
1ix
=
x k dobivamo
Lk1 x k = f x k x 0
:::
x k1
Y ??
xk
x j :
0 j k 1
Kako je Lk x k = f x k to iz zadnje dvije jednakosti i svojstva b slijedi Ak1 = f x 0 x 1 : : : x k1 x k : Uvrstimo li dobiveni rezultat u 25 imamo Ln x = f x 0 + f x 0 x 1 x x 0 + f x 0 x 1 x 2 x x 0 x x 1 + : : : + f x 0 x 1 : : : x n x x 0 x x 1 : : : x x n1 27 koji zapis interpolacijskog polinoma zovemo Newtonov oblik s kvocijentima diferencija.
1.1. INTERPOLACIJSKI POLINOM
11
Stupanj pribrojnika u 27 raste, na osnovi cega direktno citamo da je Ln x polinom n -tog stupnja onda i samo onda ako je za dana cvorista pripadni kvocijent diferencija n -tog reda razlicit od nule. Kada imamo ekvidistantne cvorove tada se interpolacijski polinom moze zapisati pomoc´u visih diferencija unaprijed, odnosno unatrag. Promatrajmo funkciju f u tocki x . Prva diferencija unaprijed od f u x oznacava se sa ' f x i definira kao ' f x = f x + h
f x :
28
Ako nam je poznata prva diferencija unaprijed od f u tocki x + h , tj. ako znamo ' f x + h = f x + h + h f x + h = f x + 2h f x + h , onda drugu diferenciju od f u tocki x definiramo kao '2 f x = ' f x + h = f x + 2h = f x + 2h
' f x f x + h f x + h 2 f x + h + f x
f x
29
tj. kao prvu diferenciju unaprijed od prve diferencije unaprijed. Induktivno definiramo r -tu diferenciju unaprijed od f u tocki x kao 'r f x = 'r
1
'r
f x + h
1
f x :
30
Izvedimo vezu izmedu diferencija unaprijed i kvocijenata diferencija. Sada je x k+1 x k + h , jer radimo s ekvidistantnim cvorovima, pa imamo ' f x0 h
=
f x 0 + h h
f x0
f x1
=
f x0 h
=
=
f x 0 x 1
iz cega slijedi ' f x 0 = 1!h f x 0 x 1 : Za kvocijent diferencija drugog reda imamo f x 0 x 1 x 2 = = =
f x2 x2
f x1 f x1 f x0 x1 x1 x0 x2 x0 f x 0 + 2h 2 f x 0 + h + f x 0 2h2 2 ' f x0 2h2
iz cega slijedi '2 f x 0 = 2!h2 f x 0 x 1 x 2 : Opc´enito vrijedi formula f x 0 x 1 : : : x r =
'r f x 0 r!hr
x k +1
xk
=
k = 0 1 : : : r
h
31
1
ili 'r f x 0 = r!hr f x 0 x 1 : : : x r
x k +1
xk
=
h
k = 0 1 : : : r
1:
32
12
1. INTERPOLACIJA I APROKSIMACIJA
Uvrstimo li redom 31 u 27 za r
=
1 2
:::
FUNKCIJA
n dobivamo
' f x0 ' f x0 x x 0 + x x 0 x x 1 + 1!h 2!h2 33 'n f x 0 :::+ x x : : : x x : 0 n 1 n!hn x x0 Uvedemo li u 33 t = , ili x = x 0 + th , kao sto smo to ucinili za h Lagrangeov oblik, formula 33 poprima ovaj oblik Ln x = Ln x 0 + th t t 1 t t 1 : : : t n + 1 2 = f x 0 + ' f x 0 t + ' f x 0 ! + : : : + 'n f x 0 2 n! 34 koji se zove Newtonov oblik interpolacijskog polinoma s diferencijama unaprijed. Usporedite formulu 34 sa formulom 13. Ponekad je spretno sluziti se s tzv. diferencijama unatrag. Tako se diferencija unatrag od f u tocki x oznacava sa r f x i definira kao r f x = f x f x h: 35 Induktivno se definira r -ta diferencija unatrag od f u tocki x kao 2
Ln x
=
f x 0 +
rr f
x = rr 1 f x r r 1 f x h: 36 Pomicuc´i se unatrag moramo sada krenuti od zadnjeg cvorista x n , tako da analogno formuli 31 sada dobivamo rr f xn f x n x n 1 : : : x n r = 37 r!hr ili rr f xn = r0 hr f xn xn1 : : : xnr : 38
Uz 37 i 38 spomenimo samo da je zbog svojstva b f x n x n1 : : : x nr = f x nr x nr+1 : : : x n . Ako u formuli 27 podemo od x n prema x 0 ona poprima ovaj zapis Ln x = f x n + f x n x n1 x x n + f x n x n1 x n2 x x n x x n1 + : : : + f x n x n1 : : : x 0 x x n x x n1 : : : x x 1 39 u sto redom uvrstavamo 37 za r = 1 2 : : : n i dobivamo xn r2 f x n x x x x + : : : x xn + n n1 1!h 2!h2 rn f xn x x x x : : : x x : + n n1 1 n!hn x xn Ako i u 40 provedemo supstituciju t = , x = x n + ht prelazi ona u h t t t + 1 Ln x = Ln x n + th = f x n + r f x n + r2 f x n + ::: 1! 2! t t + 1 : : : t + n 1 n + r f xn n! Ln x
=
f xn +
rf
40
41
1.1. INTERPOLACIJSKI POLINOM
13
sto se zove Newtonov oblik interpolacijskog polinoma s diferencijama unatrag. Spomenimo na kraju da postoje i drugi oblici interpolacijskog polinoma u sto se ovdje ne upustamo. Ocjena pogreske, minimiziranje ocjene pogreske
Ocijenimo pogresku j f x Ln x j uz pretpostavku da funkcija f ima na segmentu a b , a ? x 0 x 1 : : : x n ? b , neprekinute derivacije do ukljucivo n + 1 -og reda. U tom cilju promatrajmo pomoc´nu funkciju f x Ln x M t = f t Ln t t x 0 t x 1 : : : t x n 42 x x0 x x1 : : : x xn gdje je x 6= x i i = 0 1 2 : : : n proizvoljna ali fiksirana tocka segmenta a b . Ta funkcija ima na a b derivacije do ukljucivo n + 1 -og reda. Osim toga M ima barem n + 2 nultocke na a b jer vrijedi M x 0 = M x 1 = : : : = M x n = M x = 0: Prema Rolleovom teoremu derivacija M 0 se ponistava barem jednom izmedu susjednih nultocaka, pa se dakle ponistava u barem n + 1 tocaka segmenta a b . Neka su [0
1
[1
1
[n 1
:::
tocke u kojima se M ponistava, tj. vrijedi
2
a b
0
M 0 [i 1
=
0 i = 0 1 2 : : : n: Primjenimo ponovo Rolleov teorem na funkciju M 0 . Time analogno prethodnom dobivamo barem n tocaka 2 2 2 2 [0 [1 [2 : : : [n1 u kojima se ponistava druga derivacija M 00 , tj. M 00 [i 2
=
i=0 1 2
0
:::
n 1:
Primijenimo li redom gornji postupak na funkcije M , : : : , M ljucka da postoji barem jedna tocka 000
[0
n+1
=
[
2
n+1
dolazimo do zak-
a b
za koju vrijedi M
n+1
[
=
0:
Istaknimo da tocka [ ovisi o x . Izracunamo li n + 1 -vu derivaciju od M dobivamo f x Ln x M n+1 t = f n+1 t n + 1!: x x0 x x1 : : : x xn Uvrstimo li t = [ imamo f x Ln x f n+1 [ n + 1! = 0: 43 x x0 x x1 : : : x xn Iz 43 dobivamo pogresku ili ostatak u ovom obliku Rn x
=
f x Ln x
=
f
n+1
[
n + 1!
x x 0 x x 1 : : : x x n :
44
14
1. INTERPOLACIJA I APROKSIMACIJA
Neka je f
n+1
x
? Mn
+1
x
2 a
FUNKCIJA
b:
Tada dobivamo sljedec´u ocjenu apsolutne pogreske M jRn x j ? n+1 j x x 0 x x 1 : : : x x n j: 45 n + 1! Istaknimo na kraju da se 45 odnosi samo na tocke segmenta x 0 x n , tj. x 2 x 0 x n . Ako se sluzimo ekvidistantnim cvoristima , onda 44 i 45 poprimaju ove oblike: Rn x
=
hn+1 t t 1 t 2 : : : t n f n + 1 !
jRn x j ?
n+1
[
Mn+1 hn+1 jt t 1 t 2 : : : t nj: n + 1!
46 47
Analiziramo li formulu 44 vidimo da je n + 1! konstanta, nadalje je f n+1 [ odredeno promatranom funkcijom f pa na te faktore ne mozemo utjecati. Postavimo li pitanje da li mozemo utjecati na produkt x x 0 x x 1 : : : x x n , onda u stvari pitamo da li izborom cvorista mozemo utjecati na pogreske. Naravno, zelja je da ju minimiziramo. Uocimo dvije cinjenice vezane za produkt x x 0 x x 1 : : : x x n . To je polinom n + 1 -og stupnja u normiranom obliku vodec´i koeficijent je jedinica i nadalje x 0 , x 1 , : : : , x n su njegove jednostruke nultocke. Proucavanjem tzv. Cebisevljevih polinoma u normiranom obliku dolazi se do ovakvog rezultata: Medu svim normiranim polinomima n -tog stupnja promatranih na segmentu 1 1 , normirani Cebisevljev polinom n -tog stupnja ima najmanju gornju ogradu za svoju apsolutnu vrijednost. Taj nam rezultat kaze da za cvorove x 0 , x 1 , : : : , x n treba uzeti nultocke Cebisevljevog polinoma n + 1 -og stupnja. Gornja tvrdnja je izrecena za segment 1 1 . To ne predstavlja ogranicenje, jer transformacija 2[ b a x= ba preslikava segment a b na 1 1 , dok njena inverzna x b a + b + a [ = 2 preslikava segment 1 1 na a b . Cebisevljev polinom n - tog stupnja je definiran ovako Tn x = cos nM M = arc cos x : 48 Prema tome nama trebaju nultocke od Tn+1 , tj. rjesenja jednadzbe cos n + 1M = 0 M = arc cos x : Rijesimo li jednadzbu u M dobivamo S n + 1M = + kS k = 0 1 2 ::: n 2 odnosno, 2 k + 1 S Mk = k = 0 1 ::: n 2 n + 1
1.1. INTERPOLACIJSKI POLINOM
sto uvrsteno u M
15
= arc cos x i rijeseno u varijabli x daje 2k + 1S k = 0 1 2 x k = cos 2 n + 1
:::
49
n:
To su dakle nultocke od Tn+1 i one se sve nalaze unutar segmenta 1 1 . Trebamo li cvorove unutar segmenta a b treba primijeniti gornju transformaciju po kojoj su
= xk b a2+ b + a k = 0 1 n 50 trazeni cvorovi unutar a b . Odredimo li interpolacijski polinom Ln uz tako odabrane cvorove a cesto se cvorovi i inace mogu birati dobit c´emo minimalnu pogresku prema ocjeni pogreske 45. Istaknimo jos jednom, ovo razmatranje je minimiziralo desnu stranu formule 45, dakle uz takvu ocjenu pogreske, mozemo pogresku minimizirati [k
:::
izabravsi za cvorove interpolacijskog polinoma Ln nultocke Cebisevljevog polinoma Tn+1 . Ocjena pogreske od netocnih funkcijskih vrijednosti f (xi )
Formula 45 daje ocjenu pogreske koju cinimo ako funkcijsku vrijednost f x zamijenimo vrijednosc´u interpolacijskog polinoma Ln x . U toj su formuli f x i tocne vrijednosti od f u cvorovima x i . Medutim, te vrijednosti nisu tocne. Ocijenimo time uvedenu pogresku. Opc´i oblik interpolacijskih formula je linearna kombinacija polinoma s koeficijentima koji su funkcijske vrijednosti u cvorovima tj. za dani x racunamo sumu oblika
X n
i=0
f x i Pi x
Ln x
51
koja aproksimira Ln x . Kako u realnom slucaju nemamo tocne f x i to u lijevu stranu uvrstavamo priblizne vrijednosti f x i = f x i + Ki , tako da smo izracunali
X n
i=0
f x i Pi x
=
X +X n
i=0
n
f x i Pi x
i=0
X =
=
K i Pi x
X + n
i=0
f x i Pi x
H:
52
Dobili smo da je time uzrokovana pogreska jednaka n
H
i=0
K i Pi x
53
:
Ako znamo granice od Ki npr. znamo tocnost mjerenja f x i , onda iz 53 mozemo ocijeniti gornju ogradu pogreske. Napose, ako je jKi j ? K , dobivamo ocjenu
jH j ? K
X j j n
i=0
Pi x
:
54
Uocimo da 54 daje ocjenu uz pretpostavku da tocno racunamo vrijednosti polinoma Pi .
16
1. INTERPOLACIJA I APROKSIMACIJA
FUNKCIJA
U slucaju linearne interpolacije x x1 x x0 + f x1 x0 x1 x1 x0 x1 x x x0 = f x0 + f x1 x1 x0 x1 x0 x x x0 i P1 x = , pa prema 54 za x izmedu x 0 i x 1 , tj. x0 x1 x0 L1 x
x1 imamo P0 x = x1 x 0 x x 1 imamo
j
=
f x0
x x x x 0 + 1 x1 x0 x1 x0 jx1 xj + jx x0 j = K x1 x0 = K: =K
j + jP1 xj = K
K P0 x
jx1 x0 j
x1 x0 Dobiveni rezultat kaze da kod linearne interpolacije pogreska izazvana netocnosc´u f x 0 i f x 1 ne prelazi tu netocnost, tj. pogreska u racunanju L1 x uzrokovana pogresnim funkcijskim vrijednostima f x 0 i f x 1 ne prelazi pogresku tih funkcijskih vrijednosti. Napomena. 1 Dobiveni rezultat ne mozemo primijeniti na korake Aitkenove seme, jer npr. ako x nije izmedu x 0 i x 1 , onda to ne vrijedi za L01 x . 2 U gornjem razmatranju nisu uzete u obzir pogreske izracunavanja Pi x . Neke daljnje primjene interpolacije. Inverzna interpolacija
Pocetni cilj je bio aproksimacija funkcije u tockama izvan cvorova. Medutim, aparat interpolacije moze se primijeniti i na neke druge zadac´e. Opisujemo ideju nekoliko takovih postupaka. Ekstrem funkcije jedne varijable. Pretpostavimo da treba odrediti ekstrem funkcije jedne varijable i tocku u kojoj funkcija poprima ekstrem. U prvom koraku sastavimo tablicu funkcijskih vrijednosti s velikim korakom i pogledajmo da li mozemo locirati polozaj ekstrema. Ako x 0 ne mozemo locirati, usitnimo korak i razmotrimo finiju tablicu, itd. Naravno, to ne mozemo provoditi bez kraja i konca. U nekom koraku mozemo kroz tri ili cetiri cvora oko lociranog polozaja ekstrema nac´i kvadratni ili kubicni interpolacijski polinom. Zatim deriviramo taj polinom i odredimo polozaj njegovog ekstrema koji aproksimira polozaj ekstrema funkcije, dok vrijednost polinoma u toj tocki aproksimira ekstrem funkcije. Jednadzba s jednom nepoznanicom. Pregledavanjem tablica kao gore lociramo polozaj rjesenja jednadzbe f x = 0 , tj. polozaj nultocke od f . Kroz okolna dva ili tri cvora odredimo interpolacijski polinom prvog, odnosno drugog stupnja. Za dovoljno bliza cvorista nultocka interpolacijskog polinoma aproksimira nultocku funkcije pa time rjesavamo linearnu odnosno kvadratnu jednadzbu. To se moze i iterirati tako da se dobivena nultocka uzme za novi cvor pri cemu se jedan stari cvor odbaci. To nas u slucaju linearne interpolacije vodi na metodu sekante, a u slucaju kvadratne interpolacije na tzv. Mullerovu metodu. U slucaju invertibilne funkcije y = f x , tj. funkcije koja dopusta inverznu funkciju x = g y = f 1 y , rjesavanje jednadzbe f x = d svodi se na nalazenje
1.1. INTERPOLACIJSKI POLINOM
17
funkcijske vrijednosti inverzne funkcije, tj. rjesenje je jednako f 1 d . Taj slucaj c´emo komentirati nakon opisa inverzne interpolacije. Inverzna interpolacija. Neka funkcija y = f x dopusta inverznu u okolini od y = d f ne mora imati inverznu na cijeloj domeni, sjetite se trigonometrijskih funkcija, tj. na nekoj okolini od d imamo funkciju x = g y = f 1 y tako da za y iz te okoline vrijedi f g y = y . Podemo li od cvorova x i y i = f x i , mozemo ih shvatiti kao cvorove od g , tj. y i g y i i nac´i interpolacijski polinom od g . Time dobivamo polinom Ln y , za koji naravno vrijedi Ln y i = x i i = 0 1 : : : n: Opisani postupak nalazenja Ln y zovemo inverzna interpolacija. Vratimo li se na jednadzbu f x = d , onda je njeno rjesenje jednako x g d , ciju aproksimaciju dobivamo ako izracunamo Ln d , tj. dobili smo c = g d
=
f
1
d
=
c
=
Ln d:
Ovo napose moze biti korisno ako u jednadzbi f x = d variramo d . Racionalna interpolacija
Pod racionalnom interpolacijom razumijevamo nalazenje racionalne funkcije R x
=
Pp x Qq x
koja prolazi zadanim cvorovima x i f x i , i polinomi stupnja p , odnosno q . Neka je Pp x Qq x
= =
=
0 1 2
1
+
:::
+ a1 x + a0
q 1
+
:::
+ b1 x + b0 :
apx p + ap 1 x p bq x
q
+ bq 1 x
55 :::
n , pri cemu su P p i Qq
56
Da nademo R x treba iz uvjeta R x i = f x i odrediti koeficijente ak i bk kojih ima ukupno p + 1 + q + 1 = p + q + 2 . Kako se brojnik i nazivnik mogu pomnoziti istom konstantom to jedan koeficijent mozemo izabrati, obicno se uzima b0 = 1 ili b2k = 1 , pa smo time ostali sa p + q + 1 nepoznatih koeficijenata. Prema tome da odredimo R trebamo toliko razlicitih cvorova koliko je i nepoznanica tj. n + 1 = p + q + 1 , odnosno n = p + q: 57
P
Opisimo prakticni postupak rjesavanja problema racionalne interpolacije. Pretpostavimo oblike 56 od P p i Qq i uvrstimo redom cvorove u 55 R xi =
Pp xi Qq x i
=
f xi
i=0 1 2
:::
n = p + q:
Nakon mnozenja sa Qq x i dobivamo homogen sustav linearnih jednadzbi P p x i f x i Qq x i = 0 i = 0 1 2 : : : n: 58 Taj sustav ima uvijek netrivijalnih rjesenja u nepoznanice ak , bk jer ima jednu nepoznanicu vise. Nadalje, Qq ne moze biti identicki nula u rjesenju problema racionalne interpolacije.
18
1. INTERPOLACIJA I APROKSIMACIJA
FUNKCIJA
Sljedec´i korak je da provjerimo da li je Qq nula u nekom cvoru. Ako nije, onda smo nasli rjesenje problema 55, tj. nasli smo racionalnu funkciju koja prolazi zadanim cvorovima. To rjesenje je jedinstveno do na mnozenje brojnika i nazivnika istim faktorom. Ako je Qq x i = 0 za svaki cvor, onda formula 58 povlaci da je i P p x i = 0 . Iz toga slijedi da polinomi P p i Qq imaju x x i kao zajednicki faktor, koji mozemo skratiti. Gotovo je izvjesno da u tom cvoru ne vrijedi R x i = f x i , pa ako se to dogodi onda nemamo rjesenje problema. Ipak se mozemo pitati sto smo to dobili u drugom slucaju, jer nakon skrac´ivanja imamo i dalje racionalnu funkciju. Radi krac´eg pisanja neka je x 0 jedini cvor u kome je Qq x 0 = 0 . Tada dobivena racionalna funkcija prolazi kroz cvorove x 1 , x 2 , : : : , x n i predstavlja rjesenje problema R x i = f x i
i = 1 2 : : : n
a ne polaznog. Naravno da se moze dogoditi da je Qp nula u vise cvorova. Na kraju spomenimo da za q = 0 , tj. Qq = b0 = 0 dobivamo interpolacijski polinom kao poseban slucaj racionalne interpolacije.
6
1.2. Interpolacijski splajn
!
Promatrajmo funkciju f : a b R i cvorove a = x 0 , x 1 , : : : , x n = b . Na svakom segmentu x i 1 x i mozemo promatrati interpolacijski polinom 1. stupnja x xi x xi 1 Li1 x = f xi 1 + f x i i = 1 : : : n 1 n: 1 xi 1 xi xi xi 1
PL
a=x0
x1
x2
xn-1
x n =b
Sl. 1.2.
Na slici 1.2 je skiciran graf *L tako dobivene funkcije L , koja se jos zove po dijelovima linearna funkcija. Istaknimo da je to neprekinuta funkcija, ali nije diferencijabilna. Time smo iz interpolacijskih polinoma 1. stupnja sastavili neprekinutu funkciju L : a b R , koja predstavlja izvjesnu aproksimaciju funkcije f . Uzmemo li vise cvorova dobit c´emo bolju aproksimaciju. Ta se ideja prosiruje i na polinome viseg stupnja. Promatrajmo segmente x 0 x 1 , : : : , x n 1 x n i oznacimo taj izbor cvorova sa ' . Zamislimo da smo nad pojedinim segmentom x i 1 x i nasli polinom m -tog stupnja
!
Pim x
=
ai0 + ai1 x + : : : + aim x m
xi
1
? x ? xi
:
2
1.2. INTERPOLACIJSKI SPLAJN
19
Od tih n polinoma zahtijevamo sljedec´e: U pocetnom i krajnjem cvoru vrijedi P1 m x 0 = f x 0 , odnosno Pn m x n = f x n . U svakom nutarnjem cvoru x i , i = 1 2 : : : n 1 , polinomi Pim i Pi+1 m , tj. polinomi nad susjednim segmentima imaju redom: jednake vrijednosti i to jednake funkcijskoj vrijednosti u cvoru, jednake vrijednosti prvih derivacija, jednake vrijednosti drugih derivacija, i tako dalje sve do derivacija m 1 -og reda. Zapisano formulama to izgleda ovako: Pim x i 1 = f x i 1 i = 1 2 : : : n; Pim x i = f x i i = 1 2 : : : n; 0 0 Pim x i = Pi+1 m x i i = 1 2 : : : n 1; 00 00 3 Pim x i = Pi+1 m x i i = 1 2 : : : n 1; .. . m1
Pimm1 x i = Pi+1 m x i i = 1 2 : : : n 1: m Tako dobivena funkcija, oznacimo ju sa S f ' , zove se interpolacijski splajn m -tog stupnja engl. spline. U oznaci Smf' je istaknut red m , funkcija f i izbor cvorova ' . Dakle, Smf' je po dijelovima polinom m -tog stupnja ciji se dijelovi u unutarnjim cvoristima glatko nadovezuju. Jednadzbe 3 predstavljaju linearan sustav jednadzbi uz nepoznate koeficijente aij , i = 1 2 : : : n , j = 0 1 2 : : : m . Sustav 3 ima ukupno n m + 1 nepoznanica i 2n + m 1 n 1 = n m + 1 m 1 jednadzbi. Sada vidimo da je za m = 1 funkcija L sa slike nista drugo nego interpolacijski splajn prvog stupnja, tj. vrijedi L = S1f ' . Sustav jednadzbi 3 poprima u tom slucaju oblik Pi1 x i1 = ai0 + ai1 x i1 = f x i1 4 Pi1 x i = ai0 + ai1 x i = f x i : To je sustav od 2n jednadzbi s 2n nepoznanica. Rijesimo li taj sustav dobivamo f x i f x i1 ai1 = i = 1 2 ::: n x i x i1 5 ai0 = f x i1 ai1 x i1 : Sredimo li 1 po potencijama od x , dobit c´emo formule 5, s time da je u drugoj formuli provedena supstitucija vec´ poznatog koeficijenta ai1 . Spomenimo jos da se interpolacijski splajn prvog stupnja koristi u trapeznoj formuli za aproksimaciju integrala, a koristi se i u drugim prilikama. Ovdje c´emo jos izvesti formule za koeficijente interpolacijskog splajna trec´eg stupnja ili krac´e kubnog splajna ne ulazec´i u razlog koji posebno istice vaznost trec´eg stupnja. Trazimo dakle S3f ' . Polazimo od Pi3 x = ai0 + ai1 x + ai2 x 2 + ai3 x 3 x i1 ? x ? x i i = 1 2 : : : n: 6 Kako trazimo n polinoma trec´eg stupnja vidimo da treba odrediti 4n nepoznatih koeficijenata aij , i = 1 2 : : : n , j = 0 1 2 3 . Jednadzbe 3 sada glase Pi3 x i1 = f x i1 i = 1 2 : : : n; Pi3 x i = f x i i = 1 2 : : : n; 7 0 0 Pi3 x i = Pi+1 3 x i i = 1 2 : : : n 1; P00i3 x i = P00i+1 3 x i
i=1 2
:::
n
1:
20
1. INTERPOLACIJA I APROKSIMACIJA
FUNKCIJA
To su ukupno 4n 2 jednadzbe s 4n nepoznanica aij . Prema tome, linearnom sustavu 7 treba dodati jos dvije jednadzbe. Njih dobivamo iz uvjeta koje zahtijevamo da vrijede na rubu. Uobicajeno ti uvjeti glase P0013 x 0 = 0 8 P00n3 x n = 0 i vode na tridijagonalni sustav tj. na krajevima segmenta zahtijevamo da je druga derivacija splajna S3f ' jednaka nuli. Da bi rijesili sustav 7– 8 uocimo sljedec´e. Druga derivacija polinoma trec´eg stupnja je polinom prvog stupnja. Iz P00i3 x i = P00i+1 3 x i slijedi da je druga derivacija od S3f ' neprekidna po dijelovima linearna funkcija koju mozemo shvatiti kao splajn prvog stupnja. Primijenimo 1 na P00i3 . To daje x x i 00 x x i1 00 P00i3 x = Pi3 x i1 + P x i na x i1 x i : 9 x i1 x i x i x i1 i3 Oznacimo li hi = x i x i1 , 9 prelazi u x i x 00 x x i1 00 P00i3 x = Pi3 x i1 + Pi3 x i na x i1 x i : 10 hi hi Uvedimo krac´e oznake P00i3 x i = Mi i = 1 2 ::: n tako da 10 poprima oblik xi x x x i1 P00i3 x = Mi1 + Mi na x i1 x i : 11 hi hi Dvostrukom integracijom dobivamo x i x 3 x x i1 3 Pi3 x = Mi1 + Mi + Ci x + Di 12 6hi 6hi gdje su Ci i Di konstante integracije koje treba odrediti. Odredujemo ih iz zadanih vrijednosti na rubovima, tj. iz Pi3 x i1 = f x i1 i Pi3 x i = f x i . Imamo dakle f x i1 = f xi =
x i1 3 Mi1 + Ci x i1 + Di 6hi x i x i1 3 Mi + Ci x i + Di 6hi xi
odnosno Ci x i1 + Di Ci x i + Di
= =
h2i Mi1 6
f x i1
13
h2i Mi : 6
f xi
Oduzmemo li prvu jednadzbu od druge dobivamo x i1 = f x i
Ci x i
ili Ci
=
1n f xi hi
f x i1 +
f x i1 +
h2i Mi1 6
h2i Mi1 6
Mi
o
Mi
:
1.2. INTERPOLACIJSKI SPLAJN
21
Sada iz druge jednadzbe 13 imamo o h2i xi n h2 Di = f x i Mi f x i f x i 1 + i Mi 1 Mi : 6 hi 6 Izracunate vrijednosti od Ci i Di uvrstimo sada u 12 tako da dobivamo o x i x 3 x x i 1 3 xn h2 Pi3 x = Mi 1 + Mi + f x i f x i 1 + i Mi 1 Mi 6hi 6hi hi 6 n o 2 2 hi xi h Mi f x i f x i 1 + i Mi 1 Mi + f xi 6 hi 6 3 3 xi x x xi 1 xi x n Mi 1 2 o = Mi 1 + Mi + f xi 1 h 6hi 6hi hi 6 i xh h2i i h2i x i 1 + hi h h2i i + f xi Mi + f x i Mi f xi Mi hi 6 6 hi 6 x i x 3 x x i 1 3 xi x n Mi 1 h2i o Mi 1 + Mi + f xi 1 = 6hi 6hi hi 6 h i h i 2 2 2 x hi hi xi 1 hi h2 + f xi Mi + f x i Mi f xi Mi f x i + i Mi hi 6 6 hi 6 6 sto nakon sredivanja glasi x i x 3 x x i 1 3 Pi3 x = Mi 1 + Mi 6hi 6hi 14 xi x n Mi 1 h2i o x x i 1 n Mi h2i o + f xi 1 + f xi hi 6 hi 6 na x i 1 x i , i = 1 2 3 : : : n . 14 predstavlja trazeni splajn 3. stupnja S3f ' u kome su jos ostali nepoznati parametri Mi , i = 0 1 2 : : : n . Prisjetimo se da Mi predstavlja vrijednost druge derivacije splajna u cvoru x i . Kako do sada nismo koristili uvjet na prve derivacije to c´emo ga sada upotrijebiti. Ti uvjeti glase P0i3 x i = P0i+1 3 x i i = 1 2 : : : n 1: To predstavlja n 1 jednadzbu s n + 1 nepoznanica Mi , pa su nam potrebna dva dodatna uvjeta. To su uvjeti 8 koji odreduju M0 i Mn , tj. P0013 x 0 = M0 = 0 P00n3 x n = Mn = 0: Deriviranjem 14 dobivamo i x i x 2 x x i1 2 1h h2 P0i 3 x = Mi1 + Mi + f x i f x i1 + i Mi1 Mi 2hi 2hi hi 6 h i 2 2 h2 x i+1 x x xi 1 P0i+1 3 x = Mi + Mi+1 + f x i+1 f x i + i+1 Mi Mi+1 2hi+1 2hi+1 hi+1 6 sto za x = x i daje jednakost i h2i 1h h2 Mi + f x i f x i1 + i Mi1 Mi 2hi hi 6 i h2i+1 h2 1 h = Mi + f x i+1 f x i + i+1 Mi Mi+1 : 2hi+1 hi+1 6
22
1. INTERPOLACIJA I APROKSIMACIJA
FUNKCIJA
Sredimo li tu jednakost po nepoznanicama Mi imamo hi hi + hi+1 hi+1 f x i+1 f x i f x i f x i 1 Mi 1 + Mi + Mi+1 = : 6 3 6 hi+1 hi Time smo rjesavanje sustava 7, koji je imao 4n nepoznanica, sveli na sustav od n 1 jednadzbe s n 1 nepoznanicom M1 , M2 , : : : , Mn 1 koji glasi hi hi + hi+1 hi+1 f x i+1 f x i f x i f x i 1 Mi 1 + Mi + Mi+1 = 6 3 6 hi+1 hi 15 i = 1 2 3 : : : n 1: U matricnom zapisu CM = d
2 6 M=6 4
je
3
2 6 d=6 4
M1 M2 7 .. 7 . 5 Mn 1
= f xi+1h f xi f xi h f xi 1 i 2 h +ih+1 h 1 2 2 0 6 3 6 6 h2 h2 +h3 h3 6 0 6 6 3 6 6 6 h3 h3 +h4 h4 6 0 0 C = cij = 6 6 3 6 6
pri cemu je di
:::
6 6 6 6 6 4
3
d1 d2 7 .. 7 . 5 dn 1
i
:::
:::
:::
:::
:::
3 77 77 0 77 77 0 77 7 hn 1 7 77 6 hn 1 +hn 5 0
... ... hn 2 hn 2 +hn 1 0 ::: ::: 0 6 3 hn 1 0 ::: ::: ::: 0 6 3 je tridijagonalna matrica izgled matrice C sugerira naziv. Elemente C mozemo ovako zapisati 8 hi za j = i 1 6 hi + hi+1 za j = i cij = 3 hi+1 za j = i + 1 : 06 za ji jj 1: Rjesavanjem sustava 15 dobivamo trazene parametre Mi koje zatim uvrstimo u 14. Izraz u 14 predstavlja trazeni splajn 3. stupnja na segmentu xi 1 xi , i = 1 2 3 : : : n . Postoje i sazeti zapisi kubnog splajna sto nije od posebne koristi. ...
1.3. ru
U �WS.Iik\i&iA.Q
'. / '
23
TRIGONOMETRIJSKA INTERPOLACIJA
> .,
-
'
,
, ." ....... tr,!/r,lU I j
'
•...
.
"
.
.:. . "�'lm;___ruru'3\" ', ..' .
.' .. 1.3/;,:rrigc;in()metrijska interpolacija .
• i!Lm__d0s,""$��"B;rliiili!3\J:n i
;
nRru:l'WS:
lh'iiJ t
Trigonometrijski i fazni interpolacijski pOlinom
Trigonometrijska interpolacija u svom najvažnijem obliku koristi linearne kom binacije funkcija cosmx i sinmx gdje je m prirodan broj, tj. izraz koji ima jedan od ovih oblika M A )Am cosmx + Bm sinmx), + m =!
1/I(X) = 2° 2
(1)
M-I
(2) 1/I(x) = 2° + m2 )Am cosmx + Bm sinmx) + A2 cos Mx, =! pri čemu se (1) koristi u slučaju kada imamo neparan broj čvorova N = 2M + l, dok se (2) koristi kada imamo paran broj čvorova N = 2M. Označimo li sa (Xk' Yk ) , Yk = /(Xk ) čvorove, onda se koeficijenti Am , Bm određuju iz uvjeta (3) 1/I(Xk ) = Yk. k = 0, 1, 2, . . . , N-l A
M
a 1/1 se zove trigonometrijski interpolacijski polinom. Interpolacija trigonometrijs kim polinomom prikladna je za periodičke funkcije poznatog perioda. Istaknimo da
x [0, 2n] [a, b] (1) (2)
2n .
� = b 2n- a x a [0, 2n].
je 1/1 periodička funkcija od s periodom Transformacijom + preslikavamo na , stoga se opća razmatranja vrše na segmentu Naravno da nas formule i podsjećaju na parcijalne sume Fourierovog reda. Sada se postavlja problem iznalaženja koeficijenata Am i Bm . Očigledno je sa (3) dan linearan sustav jednadžbi u nepoznate koeficijente Am i Bm čije rješenje tražimo. Da dođemo do formula za koeficijente Am , Bm činimo izvjesna pojednostavnjenja. Osnovno pojednostavnjenje je da razmatramo jednoliku raspodjelu čvorova i da pre đemo na eks onencijalni zapis trigonometrijskih funkcija služeći se De Moivreovom formulom e' coskx + sinkx , otkuda kao što znamo, imamo eila + e-ila cosJx
g=
i
= 2 ' eila e -ila sinkx = 2i _
[O, 2n]
Kod jednolike (ekvidistantne) raspodjele čvorova dijelimo segment na N jed nakih dijelova pomoću kojih određujemo nepoznate koeficijente. Sada su nam čvorovi dani sa . . . , N-L (4) ' N Zbog periodičnosti, točka koja predstavlja (N + l) -vi čvor, ne predstav lja novi uvjet, pa je obično ne spominjemo. Sada nam jednolika raspodjela čvorova omogućava da problem nalaženja koeficijenata svedemo na traženje koeficijenata tzv. raznog interpolacijskog polinoma koji ima ovaj oblik l (5) f30 + f3 1 eix + ... + f3N_le(N- jix
Xk = 2nk k = 0, 1, 2, x = 2n ,
P(x) =
z4
pri čemu su polacije
l.
INTERPOLACUA I APROKSIMACUA FUNKCUA
(j j kompleksni koeficijenti, koji se određuju iz uobičajenog uvjeta inter P(Xk) = Y*, k = 0, 1, 2, " " N l. (6)
U tu svrhu provedimo slijedeći račun. Svakako vrijedi - ix = :=
e m l e -� e-� .e" =e -- =e ( N - m )' 1.i(N-m)! N
IX!,
To nam omogućava da cosmxk i sinmxk zapišemo u obliku eimxk + ei{N-m)xk eimxk ei{N-m)xk cosmx" sinmxk
_ ----:2i= :- -2 Uvrstimo li to u i dobiveni izraz sredimo po.potencijama odeLcI;, dobivamo fazni polinom P s koeficijentima (j j , j = l, 2, ' , , , N - l . Ti me su u slučajue kvidist ant nog izbora čvorova koe ficije nt i J aznog polinoma pove zani s koe ficije nt imat rigonomet rijs kog polinoma na slje de ći način: a) Ako je N neparan, tj. N = 2M + l, onda vrijedi: l , Bj), (j N-j = 2l (Aj + l.Bj), j = 1, 2, ' . ., M; (7) 2' (j j 2(Aj - t /30 = Ao lfI
odnosno,
Ao = 2/30 , Am ={j m + (j N-,m Bm = i({j m - (j N-, m ) m = 1, 2, . .., M. b) Ako je N paran, tj. N = 2M , onda vrijedi: Ao ' = 2 l . (j j = 2(Aj - lBj), (8) {j N-j = � (Aj + iBj ), j 1, 2, . . . , M - l, M {jM = A2; odnosno, Ao = 2/30, Am ={j m +{j N-m , Bm = i({j m - (j N-m ) , m = 1, 2, . , . , M l, AM = 2{j m' Izvedimo formule (7), Uvrštenjem u imamo M ( eimx• + ei(N-m)Xk eimxk ei( N- m ) xl; Ao + L Am + lJ lfI(x) = 2 2 ----::2-i =1 m Kako m varira između l i M to N m varira između M + l i 2M = N - l tako da imamo zastupljene sve potencije ode/Xi za l � j � N - l . Vidimo da prvi pribrojnici razlomaka daju potencije odeix• između l i M , pa ako ih zbrojimo imamo im l l ex ' imx. 2i - 2(Am - tBm e) , a
KJ
lfI
_
•
_
l.3 .
25
TRIGONOMETRIJSKA INTERPOLACIJA
::::;j::::; M imamo . j = 1, 2, . . . , M. {J j = "2l (Aj - IBj), Drugi pribrojnici razlomaka imaju potencije između M + l N l, ako ih zbrojimo imamo iIN( -x. m) m . �(A ' iN( -m xk eiN( -)x B m 2 = 2 m + IBm ) e ) , 2 dakle za 1::::;j::::; M imamo M + l ::::; N - j ::::; 2M = N - l, odnosno {JN-j = "21 (Aj + iBj) j = 1, 2, . . . , M. Očigledno je IJO = �o Formule koje daju Am i Bm pomoću koeficijenata {J j sli
dakle za l
-
,
.
jede direktno iz gornjih. zbrajanjem, odnosno oduzimanjem odgovarajućih jednakosti. Istaknimo odmah da i uz jednoliku raspodjelu čvorova, trigonometrijski interpo lacijski polinom i njemu odgovarajući fazni polinom poprimaju u čvorovima iste vrijednosti tj. međutim, općenito je lII(x) P(x) u točkama x tj. izvan čvorova. Fazni polinorn je po svojoj građi jednostavniji od trigonometrijskog. pa se mnoga zaključivanja lakše provode na nivou faznog polinoma. Da to potkrijepirno provedimo npr. sljedeću supstituciju •. Tada poprima slijedeći oblik.
III III (Xk ) = P(Xk ) = Y",
"# XA ,
P
"#
W =e ix, Wk =eix
P
P(x) = p(w) = IJO + {J WI + + {JN_IWN- I , što je običan polinom u Primijetimo slijedeće: kod ekvidistantne podjele j "# k povlači da je W j "# Wk. O ::::; j, k ::::; N - l, što opet povlači da imamo N različitih čvorova u varijabliW i nadalje, u svakom čvoru vrijedi P(Xk ) = P W( k ) = Yk , k = 0, 1, 2, . . . ,N 1. Prema tome (sada je varijabla kompleksna), p je uobičajeni interpolacijski polinom. Iz toga odmah zaključujemo da je kode kvidistantnog izbora čvorova/azni inte rp olacij ski p olinom P je dinstve lI. Preko rezultata (7) taj se rezultat prenosi i na trigonometrijski . . .
w.
interpolacijski polinom
III,
dakle
III
je jedinstven za ekvidistantne čvorove.
Teorem 1 .1 . za je dnolik u podje lu se gme nta [0, 2:n:] na N dije lova, k oe ficije nti /aznog interp olacij skog polinoma (5) dani su/orolUlom NI l (9) {J j = N I:>kek=O gd!Je· Je. Xk = 2:n: k ' k = O, l 2, N l
N
,
Da dokažemo formule vrijedi:
. . . ,
.
(9) postupimo ovako. za Wk = e/.Xj = e-,;rl O::::; j, k::::; N - l, .
ld·
očigledno
1.
26
INTERPOLACIJA I APROKSIMACIJA FUNKCIJA
gdje W označava konjugirano kompleksnu vrijednost. Pokažimo prvo da vrijedi slje deća jednakost za za
j= m j =f. m
(lO)
kojom ćemo se kasnije poslužiti. Da provjerimo primijetimo da su Wk= e�i ništa drugo nego N -ti korijeni jedinice, tj. rješenja jednadžbe ZN = O. Uočimo li Wj-m i shvatimo ga kao nultočku polinoma ZN , onda iz faktorizacija
(1 0 )
-
-1
1
N-I N L z* 1 = ( l ) z Z .k=O
slijedi da je ako je
Wj-m
Wj-m - 1 = O,
nultočka prvog faktora, odnosno da je
Wj-m = 1,
N-I L (Wj-m)k= O k=O
1, (10 )
nultočka drugog faktora. U prvom slučaju imamo Wj-m = ili što daje j m = O, odnosno, m = j. U tom se slučaju suma sastoji od N pribrojnika jednakih pa je time slučaj m = j formule provjeren. U drugom slučaju imamo ako je 21riU-m)
e-N-
(10 )
-
1,
(10 )
N-I N-I N-I L (wd· (Wk)-m= L (wd-m= L (Wj_m)k= O k=O k=O k=O
čime je u potpunosti provjereno. Vratimo se sada dokazu formule U tom cilju promatrajmo N -komponentne vektora s kompleksnim brojevima kao skalarima. Vektori su ortogonalni ako je njihov skalami produkt nula. Stoga se prisjetimo definicije skalarnog produkta vektora s kompleksnim komponentama. Ako su
(9).
WI=
[;] ZI
W2=
Zln
[�] ZI
Z2n (WI' (2) definiran kao n (W), (2) = LZIk' Zu· k=1
dva vektora, onda je skalami produkt
Promatrajmo sada sljedećih N vektora s kompleksnim komponentama
1
(WI)mm (W2)
= 0 , 1, 2,
m
.
.
.
,N-L
1.3 .
27
TRIGONOMETRJJSKA INTERPOLACJJA
(10 )
Vidimo sada da suma u formuli predstavlja skalami produkt (wj, wm) i kaže se da su vektori Wj i Wm međusobno ortogonalni (tu smo zatrebali uočenu činjenicu (Wk)-j = (WkY)' Pri tome spomenimo da ti vektori nisu jedinični jer prema vrije-
(wm, wm) = N. Ortogonalnost koristimo sada ovako. Uvrstimo li čvor Xk = 2�k , k 0, l, ... , N - l u fazni interpojacijski polinom dobivamoJineami sustav jednadžbi P (Xk) = Yk = f30 + f3leixk + f32e2ixk + ... + f3N_le(N-I)iXk 2 = f30 + f3IWk + f32 (Wk) + ... + f3N-1 (Wkt-I , k = 0 , 1, 2, ... , N - l, u nepoznate koeficijente f3j. Taj sustav u vektorskom zapisu izgleda ovako (ll) Y f30wo + f3lwl + f32W2 + ... + f3N-IWN-l gdje je s Y označen vektor
(10 )
di
=
=
Pomnožimo li (ll) skalamo s
Wj dobit ćemo na osnovu gore rečenog (y, Wj) = f3j(wj, Wj) = f3jN
ili
N-l N-I N-I j L L = ) = (W jN = (w Yk Yk d f3 k - L Yke -;';ijk k=O k=O
(9).
(9)
pa dijeljenje s N daje formulu Time smo dokazali formule koje daju koefici jente faznog interpolacijskog polinoma za ekvidistantnu podjelu. Vratimo se sada polaznom trigonometrijskom polinomu (l) i formulama (7) i l N-I (8), iz kojih dobivamo formule za Am i Bm· Uočimo li da je f30 = f3N = - E Yk N
k=O
možemo prema (7) i (8) pisati
Sada za
m 0 , 1, 2, . . . , M - l imamo =
Am = f3m + f3N-m � L Yk (e-mixk + e-(N-m)ixk ) k=O =
=
dok za paran
N-l
2 NL-l YkCOSmxk 2 NL-l YkCOS 2nmk,
N
k=O
=
N
k=O
( 12)
�
N, N = 2M, vrijedi M = N - M, pa možemo pisati AM = 2f3M = f3M + f3N-M'
(l3)
28
1.
Za koeficijente
INTERPOLACIJA I APROKSIMACIJA FUNKCIJA
Bm, neovisno o paritetu od N, imamo . N-I Bm = i({j m - (j N -m ) = * 2:Yk(e-miXk _ e(N-m)iXk ) k=O
2 L.JYk SIn 2nmk . = N2 ,""" L.JYk SInl/lXk = N ,""" ---;;;N-I
N-I
k=O
k=O
(14)
Time smo u stvari dokazali ovaj teorem. Teorem 1 .2. za jedlloliku podjelu segmenta [O, 2n] na N dijelova, koeficijenti trigonometrijskog mi erp olacijskog polinoma ( 1) dani su fon nulama ( 12) i (14) Skrenimo pažnju na to da su sva razmatranja vršena na segmentu [ O, 2n] . Za opći segment [a, b] potrebno je izvršiti transformaciju x = b 2n_ a ( � - a), koja preslikava segment [a, b] na segment [O, 2n] , dok inverzna transformacija b - ax + a � = -2n preslikava segment [O, 2n] na [a, b] . To naravno daje jednoliku podjelu na [a, b] vrijednosti čvorova su b - a k, k = 0, 1, 2, . .. , N-L �k = a + ---; ;;-
Brzi Fourierovi transformati
I
P (x) 2nk ' k = 0, 1, 2, .. . , N-l 2:= eiiX, te za ekvidistantna čvorišta (Xb Yk), Xk = N j {jj U prethodnom smo paragrafu promatrali fazni interpolacijski polinom
N-I
=O
(jj
dobili formulu za njegove koeficijente
{jj =
koja glasi
l '""' !!l!. L.JYke _!:! N , N k=O N-I
j = 0, 1, ... , N-L
(15)
Izračunavanje takvih izraza pojavljuje se u Fourierovoj analizi, pa je zbog toga od prvenstvene važnosti. Takvi se izrazi pojavljuju i kod diskretne aproksimacije slike po Fourierovoj transformaciji (Fourierovog transformata) koja se definira kao
F
F(s) = i: f(t)e - 21ti"tdt
(16) s.
s time, da računamo u N ekvidistantnih točaka varijable Međutim, kod nu meričkog izračunavanja izraza oblika poznavali smo do nedavno postupke koji zahtjevaju mnogo množenja. Točnije, red množenja je bio N , što za velike N, kakve zahtjeva diskretna aproksimacija integrala predstavlja poteškoću. J.w. Cooley i
(15)
(16),
2
1 .3.
29
TRIGONOMETRIJSKA INTERPOLACIJA
J.W. Tukey otkrili su 1965.g. postupak za brzo izračunavanje izraza ( 1 5), ali za po sebne vrijednosti od N . Kod njihovog postupka je red množenja za takve N jednak N log N. Ta metoda kao i njene varijante dobila je ime brzi Fourierovi transformati (engl. jer je njome ubrzano računanje. Zadržat ćemo se na Cooley-Thkeyevoj metodi. Metoda se bazira na cjelobrojnoj faktorizaciji broja N čime se postiže raščlanjivanje polaznog problema na potprobleme nižeg stupnja. To se raščlanjivanje provodi rekurzivno i najlakše funkcionira kada je N oblika N i > prirodan broj. To je ujedno i najvažniji i najjednostavniji slučaj . Ovdje se ograničavamo samo na taj slučaj, iako analogne tehnike funkcioniraju i u općenitijem slučaju, tj. kada je N N . N2 . . . . . Nn, gdje su Nk , . . . , II prirodni brojevi. Prikažimo Cooley-Tukeyev pristup pomoću faznih interpolacijskih polinoma. Ne ka je N - l) -og stupnja Promatrajmo dva fazna interpolacijska polinoma i određena sa
Fast Fourier Transfon ns), = 2n n O
k = 1, 2,
= I
= 2M . (M Q(x) R(x) Q(X2m ) = Y2m , R(x2m ) = Y2m+ I , = O, l, . . . , M - L Vidimo da i Q i R prolaze kroz čvorove parnog indeksa, međutim, translacijom za � iz R dobivamo fazni interpolacijski polinom k(x) R (x - �) R (X - ;) , III
=
koji prolazi kroz čvorove neparnog indeksa. Zbog
_Mxt; = e .. = en k;
e-
1
1,; N
=
{+
=
k k
za paran l, za neparan -l, koji prolazi kroz sve čvorove izraziti pomoću
možemo fazni interpolacijski polinom P Q i k na ovaj način P(x) = Q(x) l +2eMx; + R (x - M ) l -2eMx; ' Tr
( 1 7)
ili
( 1 8) Uočimo da je svaki pribrojnik u ( 17) polinom u njihova suma. Nadalje,
e;
stupnja � N
- l, pa je takva i
; P(Xk ) = Q(Xk ) l + 2eMXt .+ R (Xk - M ) l - 2eM"'; k paran Yk l ; l + R (Xk ; ) l ; l Yk , = l- l 1+1 k neparan Q(xk ) + Y k 2 2 - = Yk , tj . za svaki k vrijedi P(Xk ) = Yk , pa time ( 17) predstavlja rastav faznog interpolacijs kog polinoma određenog svim čvorištima (ne smijemo zaboraviti da je N = 2M ). Ovakav rastav faznog interpolacijskog polinoma sugerira sljedeće razmatranje. Pođemo li od N = 2n = 2 · 2n - 1 = 2M onda prema ( 1 7 ) traženi fazni interpolacijski polinom P stupnja N - l = 2 n - l = 2M - l dobivamo pomoću dva fazna inter polacijska polinoma (N - l) = (2 · 2n - 1 - l) -og stupnja. Zbog 2n- 1 = 2· 2n - 2 možemo prema ( 1 7 ) svaki od njih dobiti pomoću dva fazna interpolacijska polinoma (2 . 2n- 1 - l) -og stupnja što ukupno daje 22 = 4 fazna interpolacijska polinoma
{
Tr
_
=
L
30
INTERPOLACI1A I APROKSIMACIJA FUNKCIJA
(2·2n-2 - 1) -og stupnja. U sljedećem koraku bi imali 23 = 8 faznih interpolacijskih po1inoma (2· 2n-3 - l ) -og stupnja i tako dalje redom dok ne dođemo do zadnjeg koraka tj. do 2n = N faznih interpolacijskih polinorna O--og stupnja. To nam sugerira sljedeću rekurzivnu šemu od n koraka. Opišimo sada opći korak te šeme. Neka je m � n, N = 2n Zapišimo N u obliku •
N
=
2·2m-1 ·2n-m
2MS, M
=
2m-l, S
=
2n-m.
Po gore opisanom u tom koraku treba odrediti 2n-m = S faznih interpolacijskih polinoma (2 . 2m-1 - 1) = (2M 1) -og stupnja. Označimo te poli nome sa
p�m)(x)
=
13;;) + 13;�) eix
+ ..
.
;1-1 e(2M-I)ix,
+ 13;
s
=
O, 1,2, ... ,S
l.
Prema rekurziji (17) oni se odreduju pomoću is faznih interpolacijskih polinoma pim-lj, S = 0,1,... ,2S 1, pri čemu (17) daje 2p�m)(x )
=
)
(
( ;) (1- �ix) .
p!m-I)(X) l + �ix + p�:-;I) X
_
Ta relacija povlači jednakost među koeficijentima istog stupnja, pa dobivamo sljedeće rekurzivne relacije između koeficijenata gornjih faznih interpolacijskih polinoma j a ( ,? ) = a (,?-I) + a ( m- IJ e-� 2/JsJ s = 0,1,... ,S 1 /JsJ /JS+sJ j a ( m-I) e-� = 0, l , . .. ,M - l . /JS+sj Uvedemo l i kraću oznaku Em pisati ovako a(m) 2/JsJ
a(m). 2/Js,M+)
( ) ( )
=
e -� ,
m =
a (,?-I) + a(m- I J ( E y
= /JsJ
a(,?-II
f-'sJ
/JS+sJ
_
alO) =
/JsO
0,1,2,... , n, možemo dobiveni rezultat
'
m ' m
s
a (m - I)( f y
/JS+sJ
m =
Rekurzija počinje od ° prema
j
n,
j
= =
0, 1,2,... , n.
0, l , . .. ,S
1
0, l , . . . ,M - l
tj. da stavimo
Yn
s
=
/JOarnj)'
j
=
0, l , 2,. .. , N
što su fazni interpolacijski polinomi O-og stupnja i završava s O, l, 2,. . . , N
što su koeficijenti traženog faznog interpolacijskog polinoma j predstavljaju sume oblika (15). Opisana rekurzija j e tipična za Cooley-Tukeyevu metodu.
1.4. ČEBIŠEVLJEVI POLINOMI, MINIMAKS POLINOM I TELESKOPIRANJE...
Čebiševljevi polinoml
31
I
Promatramo li potencije 1 = xO , x , X2, , XII na segmentu [-1, 1] onda zna mo da apsolutna vrijednost svakog od njih poprima maksimalnu vrijednost l u točki x = ± l , a minimalna O u točki x = O. Ako J aproksimiramo s I PII (x) = (lo + a,x + . .. + alIxI (l) na [-1 , l] , onda zanemarivanje članova s višom potencijom, ili mala izmjena koeficije nata al , a 2, .. . , all, izaziva malu pogrešku za male x (oko nule), a vjerojatno znatnu pogrešku oko krajeva segmenta, tj. oko ±1. Ograničimo razmatranje na segment [-1 , l]. To ne predstavlja bitno ograničenje jer supstitucijom 2� - b a (2) x= b a transformiramo segment [a, b] na segment [-1,1] , dok • • •
a) + (b + a ) 2 transformiramo segment [-l, l] na [a; b]. Naša je opća želja da polinomom Pil aproksimiramo funkciju tako da pogreška aproksimacije IJ(x) - Pn(x) I bude "jednoličnije" raspoređena duž segmenta, zatim da se Pil lako nalazi i da maksimalnu pogrešku svede na minimum. To ne možemo općenito postići ali, promatramo li kosinus funkcije cos qJ, cos 2qJ, ... , cos nqJ vidi mo da svaka ima (po apsolutnoj vrijednosti) jednake maksimalne vrijednosti koje su jednoliko raspoređene nad segmentom, recimo [O, n] . Nadalje, ekstremne vrijednosti dviju takvih funkcija cosjqJ i cos kqJ, k ne događaju se općenito na istom mjestu. Međutim, koristimo li kosinus funkcije onda ih trebamo aproksimirati da bi izračuna li njihove vrijednosti. Jednostavan i koristan rezultat dobivamo ako transformiramo cos nqJ na segmentu [O,n] u polinom n -tog stupnja na segmentu 1, l]. Polinomi (4 ) Tn(x) = cosnqJ, qJ arc cosx, n = 0,1,2, . .. zovu se Čebiševljevi polinomi. Da je Til polinom n -tog stupnja vidimo tako da cosnqJ prikažemo kao polinom n -tog stupnja od cos lp i zatim uvrstimo qJ = arc cos x. Od mah vidimo da je To (x) = cos O = l , dok je Čebiševljev polinom prvog stupnja Tl(X) = cos qJ cos(arc cosx) = x. Odredimo još T 2 iz čega će nam biti jasna rekurzivna formula koja vrijedi za Čebišev ljeve polinome. Znamo da vrijedi cos 2qJ = 2 cos2qJ - l . To nam daje cos 2qJ = 2 cos 2(arc cos x) - l �=
x(b
3( )
#-j
ili
l. INTERPOLACIJA I APROKSIMACIJA FUNKCIJA
32
Općenito, primjenom trigonometrijskog identiteta cos
nep = 2 cos ep cos(n - l )ep
cos(n
- 2)ep
(5)
izračunavamo Čebiševljeve polinome višeg stupnja, pomoću onih nižeg stupnja. For mula daje ovu rekurzivnu formulu
(5)
(6)
(5) pođimo od cos a+cos f3 = 2cos a + cos a ; f3 i uvrstimo .. a nep, f3 = (n 2)ep. Prvih deset Čebiševljevih po1inoma glasi: To(x) = l, TI (x) = X, Tz(x) = 2xz - l, T3 (X) = 4x3 - 3x, T4 (X) = 8x4 - 8xz + l, (7) T5 (X) = 16x5 - 20x3 + 5x, T6(X) = 32x6 - 18x4 + 18x2 l, T7(X) = 64x7 - l l2x5 + 56x3 7x, Ts(x) = 128x8 - 256x6+ 160x4 32x2 + l, T9(x) = 256x9 576x7+ 432x5 120x3 + 9x. želimo li potencije l, X, x2 , .. . , X9 izraziti pomoću Čebiševljevih polinoma onda lako dobivamo: 1 = To(x), x = T1 (x), XZ = Zl {To(x) + T2 (x)}, x3 = 4l {3TI (x) + T3 (X)}, x4 = gl {3To(x) + 4T2 (x) + T4 (X) } , (8) X5 = 116 { lOTI (x) + 5T3 (X) + T5 (x)}, x6 = 32l { lOTo(x) + 15Tz(x) + 6T4(X) + T6(X)}, X7 = 691 {35TI (x) + 2IT3 (x) + 7T5 (X) + T7(X)}, xS = 128l {35To(x) + 56T2 (x) + 28T4 (X) + 8T6(X) + T8(X)}' l {126T (x) + 84T3 (X) + 36Ts(x) + 9T (x) + T9(X)}, x9 = 256 1 7 Da nađemo formulu
1.4. ČEBIŠEVL1EVI POLlNOMl, MINIMAKS POUNOM
l
TELESKOPIRANJE
33
. • •
Na slici L3. vidimo grafove prva četiri Čebiševljeva polinoma. Primijetimo da Čebiševljevi polinomi na segmentu cos mp) (zbog svog porijekla imaju + ekstremnu vrijednost (sve imaju istu apsolutnu vrijednost i to naizm jence pozitivnu i negativnu. Prema tome ima različitih nultočaka, sve su realne su dane sa i nalaze se u intervalu Nu1točke od k+ . . = O, = cos
Tn (x) 1)
[ 1, 1] Tn
n l
n (- 1, 1 ) . Tn (2 l)n k 1, 2, . , n - t. Xk (9) 2n Naime, iz Tn (X ) O dobivamo zahtjev cos mp = O, što je ispunjeno za mp (2 (2k + l ) i , tj. qJ = k ;n l )n , k = O, 1, 2, . . . , n - l . Supstitucija (4) daje odmah rezultat (9). '
Sl. 1.3.
Promatrajmo sada normirani oblik Čebiševljevog polinoma
Tn ( 6)).
Qn (x)
;n�!'
2n - 1
( 10)
(što je očigledno iz rekur S vodećim koeficijentom koji iznosi tj. podijelimo skup svih normiranih polinoma -tog stupnja, tj. zivne formule Označimo sa skup svih polinoma -tog stupnja s vodećim koeficijentom jednakim Vrlo korisno svojstvo Čebiševljevih polinoma dano je sljedećim teoremom.
Pn
n
n
1.
Teorem 1 .3. Među svim 'lonniranim polinomima P , n promatranim segmentu [ l, l] , Qn ima najmanju gornju ogradu za svoju apsolutnu vrijednost. Dokaz. Kako je max I Tn (x) 1 = l u svim ekstremnim točkama to imamo da je max I Qn (x) 1 = n� 1 u svim ekstremnim točkama, kojih ima točno n + 1 . Isto ta 2 ko znamo da se maksimum i minimum pojavljuju naizmjence. Pretpostavimo da u P n postoji polinom Sn koji na [- l, l) ima manje maksimalne vrijednosti od Qn . na
Promatrajmo razliku
Xo, X I , . . . , Xn apscise ekstremnih vrijednosti od Qn . Kako je I Sn (Xk ) l � I Qn (Xk ) l , k = O, l, . , n to slijedi da razlika D(xt} = Qn (Xk ) Sn (Xk )
Neka su
..
po
pretpostavci
1. INTERPOLACIJA I APROKSIMACIJA FUNKCIJA
34
mijenja predznak za svaki sljedeći k, tj. ako je D(xo ) < 0, onda je D(xJ) > 0 , D(X 2 ) < 0 , itd., i ako je D(xo) > 0 , onda je D(xd < 0 , D(X2) > 0, itd. (Naime, ako je Xk minimum od Qn, onda je D(Xk) < 0 , rlok je D(Xk) > 0 , ako je Xk točka maksimuma od Qn .) Na taj način zaključujemo da D mijenja predznak točno puta što ima za posljedicu da D ima barem nuItočaka na [ - 1, lj. To je nemoguće zato što je D polinom stupnja � n - l (Qn i S" imaju vodeće koeficijente jednake 1) i može imati najviše ll - l nultočku. Time je teorem dokazan. II
II
I Minimaks princip I
Dobiveni rezultat možemo iskoristiti na sljedeći način. Prisjetimo se ocjene po greške prilikom aproksimacije interpolacijskim polinornom u Lagrangeovom obliku. Ista je dovedena u oblik
n+ ) I(x) - Ln(x) = l(n( +1)l(�) ,(x (11) - xo )(x - xd .. . (x-xn) . Osnovni cilj aproksimacije je postići minimalnu pogrešku. Iz građe formule (11) vi dimo da na faktor I( n+ l )( � ) možemo jako malo utjecati. Naime, ako znamo njegovu ogradu onda smo zadovoljni, prema tome, u ocjenama ga smatramo konstantom. Kako je (n + 1)' konstanta, jedini dio koji eventualno možemo minimizirati je po1inom (x - xo)(x - xd (x - xn). To je polinom (n+ 1) -og stupnja, a xo , X l ! Xn su njegove nultočke. Da ga minimiziramo moramo prema gornjem teoremu zahtijevati da taj poli nom bude jednak QII+ To drugim riječima znači, da minimiziramo pog rešku ( l l) moramo čvorove izabrati tako da to budu nultočke od QII+ l što su zapravo nultočke Čebiševljevog polinoma Tn + l , te su prema (9) dane sa Xk = COS (2k+ l )1/: k = 0, 1, 2, ( 12 ) ..
.
• . .
I'
,
,
... ,Il.
211+ 2 ' za opći segment [a, bl treba prema (3) iz 4.1. uzeti
b+a ) �k = xk (b a)+( 2 [a, bJ
(13)
interpolacijski polinom., označimo ga z a čvorove interpolacije. Odredimo l i n a sa čvorovima danim prema ( 1 3) onda dobivamo interpolacijski polinom koji sa minimizira maksimalnu pogrešku. Primjena polinoma je moguća samo onda kada imamo slobodu u odabiranju čvorova interpolacije. Srećom to je čest slučaj kod ekspe rimentalnih istraživanja. Takvo minimiziranje maksimalne pogreške interpolacijskog polinoma ponekad se zove minimaks princip.
Mn,
Mn
I Minimaks lli optimalni pollnom I
Opći problem može se ovako formulirati: za dalluftmkciju I naći polinom Pn koji minimizira maksimalnu pogrešku, tj. odrediti polinom iz zahtjeva (14) max I/(x) - P�(x)1 = minimalan. a:S;:x:S;:b Polinom P� određen zahtjevom (14) zove se minimaks polinom ili optimalni ap roksimacijski polinom. za polinom
a)
P; je jedinstven.
P� vrijedi sljedeće (dokaz izostavljamo):
1.4. ČEBIŠEVLJEVI POLINaMI, MINIMAKS POLINOM I TELESKOPIRANJE... b) Devijacija
35
D(x) = f(x) - P�(x)
(15)
postiže svoju ekstremnu vrijednost u barem n + 2 točke na [-1,1] (ili [a, b] ) koja je naizmjence pozitivna i negativna. Pretpostavka o neprekidnosti od f povlači neprekidnost devijacije pa zbog promjene predznaka ima barem n + 1 različitu nultočku. To znači da f i imaju jednake vrijednosti u barem (n + 1) -oj točki, odnosno, je stanoviti interpolacijski polinom stupnja � n. Kada je f (Il + 1) -puta diferencijabilna i f(n+I) = const., tada je interpolacijski polinom Mn, tj. s čvorovima danim prema (13), jednak minimaks polinomu . Ako je f(n+l) #-const., onda je Mn samo aproksimacija od Nala ženje , kada je f(n+l) nepoznata ili f(n+l) #-const. dosta je složeno i nećemo ovdje opisivati.
D
P�
D, P�
P�
P�
P�.
Teleskopiranje redova potencija
I
Istaknimo da su Čebiševljevi polinomi ortogonalni na [-1, l] , pa nam se nameće pitanje razvoja u Fourierov red po polinomima Tn . Ako se f razvije u Fourierov red po Čebiševljevim polinomima, tj. oo
f (x) = L CkTk(x) , k=O
(16)
onda se može pokazati da će Fourierov polinom (tj. parcijalna suma reda (16)) n
(17)
k=O
obično biti vrlo dobra aprokSimacija minimaks polinorna. Nažalost, određivanje koe ficijenata Ck je mukotrpan posao. Postoje tablice tih koeficijenata za neke funkcije kao što su: trigonometrijske, arkus, eksponencijalna, hiperbolička, area i neke druge. Kako su koeficijenti Fourierovog reda (16) dani pomoću integrala, njihove se aproksimacije mogu dobiti pomoću numeričke integracije. Ako je f polinom n -tog stupnja onda se koeficijenti Ci lako odrede pomoću formula (8). Jednostavno zamijenirno Xi sa svojim razvojem po Čebiševljevim pali nomima i sredimo izraz po polinomima 1j. Na takvu situaciju nailaziino npr. kada f aproksimiramo Taylorovim polinomom. U takvim situacijama obično možemo za nemariti neke Čebiševljeve polinome višeg reda znajući da je time učinjena pogreška malena (gornja ograda za Tn (x) na [-1,1] jednaka je 1). Tada dobiveni polinom možemo natrag srediti po potencijama od x (to općenito više nije Taylorov polinom od f )Joji je sada nižeg stupnja od polaznog Taylorovog polinorna. Takav se postupak zove Cebiševsko ekonomiziranje ili teleskopiranje reda potencija. To ilustriramo na primjeru kosinusne funkcije. Pođemo li od Taylorovog reda
x2
X4
x6
x8
xIO
x2k
( k 2 l. + . . . cosx = 1 - l" + 41 - - + 2. . 61. 81. 1. O I + . . . + -l) k i promatramo Taylorov palinom n = 2k-tog stupnja, onda je pogreška (red alternira) manja od apsolutne vrijednosti prvog zanemarenog člana. Ograničimo li se na segment -
-
L INTERPOLACIJA [ APROKSIMACIJA FUNKCIJA
36
1] n = 8 , dobivamo da je pogreška manja od 1�! = 2.7 610-7 za x E [-l, l] . x 2 X4 x 6 x 8 cosx ::::: l 2! + 4! - 6! + 8! = To - 2l! ' 2l (To + Tz) + 4l ! '8l (3To + 4T2 + T4) l l ( lOTo + 15T2 + 6T4 + T6) 6 ! . 32 + 8!l . 128l (35To + 56T2 + 28T4 + 8T6 + Ts) ·
[-l, i Imamo dakle
Sredimo li dobiveni izraz po Ćebiševljevim pol� nomima dobivamo cosx :::::
0.765l9775To - 0.22980686Tz + 0. OO49533419T4 - 4.185265· 1O-sT6 + 1.937624· 1O- 7T8. Zanemarimo li članove T6 i Ts uvodimo dodatnu pogrešku koja nije veća od 4.186 · 10-5 + 71.938 . 10-7 = 4.206 · lO-s. Dodamo li to pogrešcis Taylorovog reda 2.76· 10- vidimo da je ukupna pogreška manja od 4.2 34· lO- . Dakle, po greška te aproksimacije je manja od 5 . lO -s na segmentu [-l, 1] . Istaknimo da je
(
dobivena aproksimacija polinom četvrtog stupnja. Ocjena pogreške aproksimacije Taylorovim polinornom četvrtog stupnja cosx :::::
- �� + ��)
l]
�
�0 = 0.00179 = 139 . 107 (7)
5
28
l što je oko na [-l, iznosi ! puta veći iznos. Poslužimo li se sa možemo dobivenu aproksimaciju srediti po potencijama od x, pa imamo cosx Pretpostavimo sada da je bila zahtjevana točnost. Uvjerimo se da tu točnost ne možemo postići teleskopiranjem Taylorovog polinoma šestog stupnja što bi mogli pomisliti nakon gornjeg računa. Sam Taylorov polinom šestog stupnja zadovox2 x 4 x l ljava tom zahtjevu jer je Međutim, kada se
= 0.99995795 0 .99924045x2 + 0.03962674x4 . 5 . lO-s
6 s < 5 . 10- 5 . . l lO 2.5 + = 2! 4! 6! 8! prikaže pomoću Čebišev1jevih po1inoma dobiva se uz Ts koeficijent 4.34· lO- s što zajedno sa 2.5 · lO- s daje pogrešku 6.84· lO -s > 5 . l O- s .
U čvorovima zamišljamo da interpolacijski potinom ima vrijednosti funkcije, tj. u čvorovima je greška nula, međutim, izvan čvorova greška može biti značajna. Nadalje, . . . , n redovito su netočne, često je taj polinom nižeg vrijednosti xi , stupnja od i što je najvažnije redovito imamo i više od l točaka u kojima pozna jemo približnu vrijednost od Kako je sa (n l) -om točkom jedinstveno određen interpolacijski polinom stupnja � to je općenito nemoguće naći interpolacijski poU nom stupnja tn koristeći svih l zadanih točaka (uočite u zahtjevu striktnu
n
f( ) i = O, 1, 2, f.
n, n+
+
n+
1.5. POLINOM NAJMANJIH KVADRATA
37
nejednakost) . Stoga se prirodno nameće pitanje aproksimacije funkcije I polinomom
p (koji možda nigdje ne poprima vrijednost od I ) takvim da su njegove vrijednosti
"što je moguće bliže" vrijednostima od I . Jedan od postupaka sastoj i se u tome da zahtijevamo da u č vorovima bude minimalna suma kvadrata razlika između funkcije i polinoma. Neka je dakle dano točaka (čvorova) (1) y,, ) yd, gdje zbog kraćeg zapisivanja uvodimo yi I ( ; . Traži se po1inom (2) tako da suma kvadrata odstupanja
n+l (XO, Yo), (Xl,
... ,. (x", = x) Pm{x) =ao+ alx+ ...+ amxm "
(3)
;=0
bude minimalna. Dobiveni polinom zovemo polinom najmanjih kvadrata. Uočimo daje funkcija E polinom drugog stupnja s nepoznanicama Oo. Dakle, da , odredimo koeficijente od treba (3) parcijalno derivirati po nepoznatim koeficijen tima i parcijalne derivacije izjednačiti s nulom te riješiti dobiveni sustav linearnih jednadžbi. Te parcijalne derivacije glase " [JE O , .. , m
al
Pm
ak
• . . .
am.
k= , l
& ak =2L{Pm(Xi)-Y;}X�=0, ;=0
ili nakon dijeljenja sa 2 i prebacivanja konstantnog člana na desnu stranu imamo
" " LX�Pm(Xi) =Lx7Y;,
(4 ) k=0, l , . . Ponovimo, (4) je l inearan sustav jednadžbi koji se sastoji od + l jednadžbe sa + l nepoznanicom ao, al, ..., am' Zbog toga što je kvadratni polinom (3) ograničen ;=0
. , m.
;=0
m
m
odozdo s nulom to ima minimum iz čega zakljl,Jčujemo da sustav (4 ) ima rješenje. Primjer 1.2. za· m
tako da je
= 2 polazimo od polinoma 2. stupnja P2(x) = c+ bx+ ax2, "
E(a, b, c) = L)c+ bx;+ ax; .�
2
;=0
Parcijalnim deriviranjem po s tri nepoznanice koj i sređen glasi
(
c. b i a dobivamo linearni sustav od tri jednadžbe "
II
II
;=0
;=0
;=0
n + I)c+ (Lx;)b+ (Lx;)a=LYi
xi)b+ (I: xi)a= I:X�Yi' (I: x;)c+ (I: iO ;=0
=
i=O
;=0
l. INTERPOLACIJA I APROKSIMACIJA FUNKCIJA
38
Napišimo sada sustav (4) u razvijenom obliku tako da imamo (sve sume idu od i= O do i n , pa je indeks sumacije izostavljen) ( n + l)ao + CL:xi)al + c�::>na2 + ... + (Lx�)am=LYi (Lxi)ao + (Lxf)al + (Lxj)a2 + . . . + (Lx�+I)am=LXiYi (Lxf)ao + (Lxj)al + (Lx1)a2 + .. . + (Lx�+2)am=LxfYi (5)
(Lx7')ao + (Lx�+I)aj + (Lx�+2)a2 + . . . + (Lx;m)am=Lxry; Rješenje sustava (5) daje koeficijente ao, dl, ... , am traženog polinorna naj ma-
njih kvadrata koji u traženim točkama možemo računati pomoću Homerove sheme. U primjenama j e to gotovo redovito poli nom niskog stupnja. Do sustava možemo i ovako doći, što će nam trenutak kasnije poslužiti da izvedemo stanoviti zaključak. Napišemo li niz jednakosti (koje bi imali u slučaj u interpolacijskog polinoma):
(5)
ao + ajXO + a2x� + . . . + amr;=Yo ao + alXI + a2xi + . . . + amxT=YI
(6)
ao + alXn + a2x� + .. . + amx� =Yn Matrica tog sustava j e formata (n + l) x ( + 1 ) , dakle općenito više jednadžbi nego nl
nepoznanica i izgleda ovako:
A=
[:�: �:! : : �l' :
Xn Xn2 ... Xnm
1 što podsjeća na Vandermondeovu determinantu (vidi 1 . 1 ). Sam sustav možemo u matričnom obliku ovako zapisati
(6)
gdje su vektori
a i Y jednaki
Aa=y,
(7)
(8)
(9) (6) xo, xii,
Zamislimo sada da na sustavu provedemo sljedeći račun. Zbrojimo li sve jed nadžbe sustava dobivamo prvu j ednadžbu sustava Zatim redom pomnožirno jednadžbe sustava i to prvu s drugu s itd. i sve zbroj imo; dobivamo drugu jednadžbu sustava Sada je već jasno kako se dobije r-la j ednadžba sustava treba u sustavu prvu pomnožiti s drugu s itd. redom i izračunato zbrojiti.
(6) (6) (5). (6)
XI,
(5) .
xI
'
(5),
39
1 .5. POLINOM NAJMANJIH KVADRATA
(5)
(6),
Ako se zapitamo kako je ovim postupkom nastao sustav iz sustava onda vidi· mo da u matričnom zapisu treba (8) pomnožiti slijeva s transponiranom matricom A T matrice A . Dakle, u matričnom zapisu sustav glasi A TAa = A Ty . Gornji izvod nam služi da uvidimo sljedeće: m 11, Naime, za nz = 11 matrica A je kvadratna. Tada j e A regularna, jer je njena determinanta upravo Vandermondeova de· terminanta. Time j e regularna i njena transponirana matrica. Kako se u tom slučaju dobiva iz množenjem s regularnom matricom A T slijedi da su tada sustavi i ekvivalentni. Kako u tom slučaju odreduje interpolacijski polinom zaključujemo da je tada polinom naj manjih kvadrata jednak interpolacijskom.
(5)
A ko je ma njih kv adrata jednak interpoZ acijskom polino11l u. (6)
(10) onda je paZ inom naj· (5) (5) (6)
(6)
Primjer 1 .3. Odredimo "pravac" najmanjih kvadrata za sljedeći niz podataka
Pripad ni sustav
(5) glasi
5ao + lO a l 32.75 lOao + 30a] 93. 10 čije je rješenje ao 1.03 i a l 2.76. Dakle, jednadžba "pravca" najmanjih kvadrata glasi y 1.03 + 2.76x. U točkama x O , l, 2, 3, 4 "pravac" najmanjih kvadrata ima vrijednosti y = 1.03; 3.79 ; 6.55 ; 9.31 ; 12.07 , što više nisu vrijednosti dane gornjom tablicom. Uočimo da j e poli nom najmanjih kvadrata određen iz uvjeta (3), tj . iz zaht jeva da je suma kvadrata odstupanja u promatranim točkama minimalna. Kako je Pm{x)l = 2aa + a l x + '" + amxln linearna kombinacija linearno nezavisnih funkcija XO , X , x , , xm, to se postupak može proširiti i na linearnu kombinaciju drugih linearno nezavisnih funkcija C{) O , ({JJ C{) m , tj. možemo promatrati + ) ao X a (ll) ({J {X { l l ({JI (X) + . . . + am ({Jm{x ) i odrediti koeficijente ao , al , . . . , am iz uvjeta da suma kvadrata odstupanja (12) i=O =
=
•
.
.
,
=
• • •
,
({)o
TI
bude minimalna. Općenito se takav tip aproksimacije naziva � -aproksimacija. DalJ nji korak u poopćenju je da se pojedinim čvorovima pripiše određena težina Wi, tako da se koeficijenti aa, određuju iz uvjeta da je
a .l . . , an
TI
;=0
minimalno. Ovo zadnje se primijenjuje i na polinom naj manjih kvadrata.
(13)
2.
Numeričko integriranje
2.1. Newton-Cotesove
formule . . . . . . . . . . . . . . . . 4 1 Ponavljanje raspolavljanja i Rombergov algoritam . ... .. .... .... .50 2.3. Gaussove formule ........... .. . ..... ...54 2.4. Integriranje brzo oscilirajućih funkcija Filonova formula .. .. .. .... .. ......58 2.2.
U matematičkoj analizi smo problem nalaženja određenog integrala rješavali pomoću Leibniz-Newtonove formule
F'(x) f(x) .
lb f(x)dx
=
I: f(x)dx
F(b) - F(a) F(x) f (x)
gdje je = Kako u mnogim primjenama ne znamo , to je potrebno aproksirnirati vrijednost određenog integrala. U primjenama je često i nepoznata, tj. poznajemo njene približne vrijednosti samo u nekim točkama. Zamislimo da nam za takvu funkciju trebaj u Fourierovi koeficijenti po nekom sustavu ortogonalnih funk cija. Upravo ovih par rečenica kažu da su nam potrebne numeričke metode približnog izračunavanja određenih integrala. Opća ideja je da funkciju aproksirniramo jednostavnijom funcijom dobijemo da iz �
f(x) g(x)
f(x)
lbf(x)dx lb g(x)dx + R(f)
g(x)
=
te da izračunavanje prvog člana desne strane bude jednostavno i da po mogućnosti možemo ocijeniti pogrešku
R(f) .
2.1. NEWTON-COTESOVE FORMULE
41
2.1. Ne,!Vto11-C:oteso'W'e
Opće Newton-C
Neka je g(x) interpolacijski polinom, tj. 11
11
x -X
j �Yrr L..x- - xJ i=O i I
It j=O
I
(l) za koji znamo da vrijedi Ln(Xi) Imamo dakle
lb
Rn (f)
I(x;)
I(x ) dx
=
=
Yi,
lb
i = 0,
Ln (X )dx
j=1i }=o 1,2, . .
x.I ) .
, n.
+ Rn (f)
(2)
gdje je pogreška aproksimacije. Uvrštavanjem (l) u (2) dobivamo formulu za aproksimaciju
1 I(x)dx lb L b
n
�
11
11
;=0
n
(x -Xi ) IJ(x; -Xj ) Iti J=O (3)
gdje su
n
IJ(x -Xj ) =O } = Ai l, 2, . . , ll. dx, n II (x -Xi) IJ (Xi -Xj ) Iti j=o Da odredimo Ai primijetimo da isti ne ovise o I . Ako je dakle I polinom � stupnja, onda je Ln(x) = I(x). Uzmemo li napose I(x) = x k, = O, l,
lIJ
i 0,
(4)
.
k
.
n -tog , n, .
.
2. NUMERIČKO INTEGRIRANJE
42
Rn(xk) = O. Uvrstimo li to redom u (3) dobivamo sljedeći sustav
onda imamo da je linearnih jednadžbi
(5)
gdje je
k bk+1 -aHI ' h= lb xdx= k+ l a
k= 0, 1 , 2, . . n . .
(5)
Determinanta sustava jednažbi je različita od nule jer je to Vandermondeova determinanta čija je vrijednost jednaka
D II(Xi -Xj) # 0, i>j =
A i (5)
tako da sustav ima jedinstveno rješenje. Rješivši sustav vrijednosti uvrstiti u otkuda dobivamo
(3)
(5), možemo dobivene
Y;Ai. lb j(x)dx t i=O �
a
(6)
Uočimo da smo zaobišli efektivno nalaženje interpolacijskog polinoma i njegovo integriranje. Ako je a i kaže se da je formula zatvorenog tipa, inače otvorenog tipa. Zadržat ćemo se na zatvorenom tipu formule tj . kada je
= Xo b = Xn
Xo
=
(3) (3), Xn=b
a
uz ekvidistantnu Uednoliku) podjelu
o h b n a = Xn -X n , Xi= Xo + ih, Yi=j(Xi), i 0, l, . . . , n . =
--
=
---
Izvedimo sada eksplicitne formule za koeficijente
t= X -Xo h ' --
odnosno
A i . Uvedimo parametar
X=Xo + th.
2.1. NEWTON-COTESOVE FORMULE
Tada imamo
43
Xo = th XI = ( x - XO) - (XI - XO) = th Iz X x2 = ( x - xd - (X2 xd th - 2h x x
X Xn = th - nh. Nadalje je
Xi Xo = ih Xi XI = (Xi -XO) -(Xl -XO) Xi -Xj_1 Xi xi+l
ih - h = ( i -l) h
h -h
Xi Xn = - (n - i)h. Uvrštenjem u (4) imamo th(tlz- h) ...(th - ih) ...(th-nh) Izdt (th ih)ih(i - l) h ...h( - h) .. . ( - (n- i)h) ( ft(t - l) ...(t n) dt Al = h iren i) ! t , t(t - l) ...(t - n) i = 0, 1,2, . .. n. dt, ') ' o n l.'I (n - l. t l. f Al- =
Jo
1)n -i Jo n Xn Xo (_l)n-i l
Uvedemo li A
Hi= Xn -Xi o
_ ni
l ( l) n l!(n-i)!
preveli smo (4) u sljedeći oblik
Hi
J� �
j(x)dx �
r tet
Jo .
i
l) . .. (t-Il) dt, . t l
i = 0, 1,2, . .. , n
n n (xn - XO) L HiYi (b - a) L HiYi W
=
W
(7)
(8)
gdje su dani sa (7) jednom zauvijek i zovu se Cotesovi koticijenti, dok se formula (8) zove Newton-Cotesova formula. Cotesovi koeficijenti imaju ova dva svojstva: L = 2.
E%:o H; 1; Hj Hn-j•
2. NUMERIČKO INTEGRIRANJE
44
.1 Primjeri Newton - Cotesovih formula I 1. Osnovna trapezna formula.
Sl. 2.1.
To je slučaj
n =
' l l) --'- dt - ( t I )dt 1 --'-2: t o Io
1
I tet -
Ho H l Jr'o tdt 2:1 ' Imamo dakle sljedeću aproksimaciju lXI J(x )dx � Xl - Xo (YO + y d =
=
=
Xo
--
2
h xo+ XI l l J(x)dx - 2:h [t(xo) + J(xo + h)]. R l = J(x)dx - 2:h (Yo + y d
(9)
Sada je prema (2) pogreška aproksimacije jednaka =
Xo
J
xa
Pretpostavimo da je klase Cz. tj. da na promatranom segmentu ima neprekidnu drugu derivaciju. U dobivenoj formuli možemo varirati pa postupimo ovako. Prvo dvaput deriviramo R, po ( uočimo da se Iz nalazi na gornjoj granici integrala). Imamo dakle
h,
lt
J(xo + h) - � [t(xo) + J(xo + h)] - �!'(xo + lt) � [t(xo + h) -J(xo)] - �!'(xo + h) l (Xo + h ) - zJ l (Xo + h ) zJ h " (Xo + h ) Rl zJ h (Xo + h) , zJ R�
=
/I
'
=
'
/I
=
pri čemu je RI(O) = R�(O) = O. S ada obratno, integriramo dobiveni rezultat pa i mamo
R�
=
R�(O) +
[
Jo
h
R" dh
l [\1" (xo h )dh Jo
2
+
2.1. NEwTON-COTEsovE FORMULE
45
tako da primjenom teorema o srednjoj vrijednosti integralnog računa, koji ponovimo glasi (Ako su funkcije q1(x) i I/f(x) neprekidne na [a, bl i I/f(x) ne mijenja predznak na [a, bl, onda je
lb
gdje je a < � < b.),
dobivamo
R'[ = - �f"( � d
q1(x)l/f(x)dx
=
q1(�)
lh hdh _/�f"(�d, =
lb
I/f(x)dx
Xo < �I < Xo + h = X I .
Ponovnom integracijom i primjenom teorema o srednjoj vrijednosti imamo
Rl
=
R[(O) +
= -
lh R� dh
��J"( � ) ,
=
-� lh h2f"( �I)dlz = -�J"( � ) lh 1z2dlz
Xo < � < X l'
Dakle pogreška iznosi
( 10)
pa ako je reške
IJ"(x) 1 � M2 na [xo, xd dobivamo ovu ocjenu apsolutne vrijednosti pog ( l l)
2. Trapezna formula. To j e po dijelovima primijenjena osnovna trapezna formula. Iz
2 jX lXoXI f(x)dx + Xl f{x)dx + . + jXn-lX f{x)dx
lx" f(x)dx imamo lb f(x)dx jxnxa f(x)dx � 2'Iz [Yo + 2Y I + 2Y2 + b a ::::
xa
_
_
"
_
..
+ 2Yn -1 + Yn]
= Xo, b Xn , Iz = --, Yi = f{Xi) ' n Pogreške po segmentima moramo zbrajati, pa imamo 3 J: 1z3 J: 1z3 J: 1z RT - 12 f"( ':on ) , 12 /"( ':oI ) - 12f"( ':02 ) 3 "(J: Xi- l < J: < - '112 � L..... f ':o., ) , Neprekidnost od J" osigurava postoj anje 11, Xo < 11 < Xn , za koji vrijedi n L J" ( �i ) = nf"(11), a
=
=
• • •
':oi
;=1
i=1
Xi-
(12)
46
f" (TI)
je srednja vrijednost od f" (�i) tako da je
odnosno,
RT
Analogno je
RT
=
.
=
_
h3 - 12 nj" ( TI ) ,
( b - a) 3jlf ( n ) 'I
l 2n 2
I RT I �
To je slučaj n 2, pa imamo
Xo < TI < xn, Xo < TI < Xn ·
,
( b - a)3
3. Osnovna Simpsonova formula.
2. NUMERiČKO INTEGRIRANJE
1 2n 2
( 1 3) ( 14)
M2 •
Sl. 2.2.
=
Ho
ili
l l 1 12 (t 1 )(t - 2)dt == -6' .2 2 o 2 l . 1 12 t(t - 2)dt = 2 l 3'
== -
2r ot(t
Imamo dakle sljedeću aproksimaciju
lx2 j(x )dx xa
H2
�
(X 2
=
l l 2' J 2 o xo )
-
l )dt
=
6l '
l 2 l + 3YI + 6Y2] [6YO
=
2h 6 [Yo +
4Yl + Y2]
Provodeći analogan postupak kao u l . primjeru, s time da bi tražili treću deriva ciju i potom natrag integrirali dobiva se uz pretpostavku da j ima neprekidnu četvrtu derivacij u (f E ('4) ova formula ( 1 5)
R2
= -
/ZS f'V)(�) 90
Xo <
� < X2'
( 1 6)
2.1. NEWTON-COTESOVE FORMULE
47
h
Treba uočiti da je eksponent od porastao za 2 . Stoga je osnovna Simpsono va formula točnija, a kako račun nije složen isto je razlog da je jedna od najčešće korištenih. Ako je bila polinom � (uočimo � = O. onda je
f
4. Simpsonova formula.
3
3! )
R2
To je po dijelovima primijenjena osnovna Simpsonova formula. Istaknimo da za njenu primjenu broj n mora biti paran.
a xo, b Xn , h b - a =
=
= -n
i
n =
2m (paran) .
1�t" f(x)dx 1:2 f(x)dx + 1:4 f(x)dx + . . . + 1:� f(x)dx 2
Tada iz
=
Pogreška je jednaka
m h5 Lf Rs - 90 (/ V)( �d X2k- 2 < � < X2k, tako da služeći se neprekidnošću od fl V ) nalazimo Xo < 1) < Xn srednja vrijednost od f( �d tj. f(l V)(1) ) m� t f(/V)( �d , =
k
k=1
=
pa imamo
(18) za koji je f( 1) )
k=l
( 19) odnosno
4 IRs l � (b -180a )h M4 gdje je If ( l V) (x) I � M4 na [xo, xn] . 5. Druga osnovna Simpsonova formula. Ta se formula dobiva za 3. jX) f(x)dx 3h [yo + 3Y I + 3Y2 + Y3] S Xo R3 3h805 f(l V) ( � ) n =
�
= -
(20) (21)
2.
48
NUMERiČKO INTEGRIRANJE
f
Sl. 2.3.
4.
Osnovna formula za n
(4 1xo
f(x)dx
�
2h [7yo + 32YI + 1 2Y2 + 32Y3 + 7Y4] 45
(22)
Ako se primijeni po dijelovima, onda n mora biti oblika n = 3m . R4 =
-
:::J'Vl)(�)
(23)
Osnovna formula za n = 5 .
(24)
Osnovna formula za n =
(25 ) 6. (26)
Formule višeg reda imaju teorijski bolju točnost, računski nisu spretne jer su Cotesovi koeficijenti veliki, pa se računske pogreške akumuliraju. Stoga najčešće koristi Simpsonova formula ( 17). Promatrane formule za aproksimaciju integrala imaju sljedeći oblik (27)
se
lb f(x)dx 'tAJ(xi) + R gdje su dani čvorovi, a koeficijente Ai moramo izračunati i je pogreška. a
Xi
=
i=l
R
2.1. NEWTON-COTESOVE FORMULE
49
Različite formule imaju različitu točnost. Uzmimo da promatramo ekvidistantne čvorove, s istim brojem čvorova Simpsonove formule. Imamo
n,
tj .
h = b-a II
.
Usporedimo pogreške trapezne i
RT = _ b 12- a h2l'(1/) - a h4iIV) ( 1/). Rs = _ b180 Usporedimo li potencije od h imamo h2 odnosno h4 , pa formulu smatramo točnijom
što je viša potencija od lt , prema čemu je Simpsonova formula točnija, što dolazi do izražaja pri dovoljno malom ll . Istaknimo da pri fiksiranom broju čvorova točnost bitno ovisi o rasporedu čvorova pa i manje točna formula može dati točniji rezultat.
h = 1 trapezna formula daje 1 l 2/( - 1) + 1(0) + 2/(1 ) = 6 - 8 + 6 4
12
Za
IT
=
(točan rezultat), dok Simpsonova daje ls
� [j(
1 ) + 4/(0) + /(I)J 1 3' (12 - 32 + 12) 8
pa niti ne osigurava predznak integrala.
-8 Sl. 2.4.
2. NUMERIČKO INTEGRIRANJE
50
Uočimo da pri lošem rasporedu čvorova možemo dobiti potpuno krive rezultate što ilustriramo slikom.
Sl. 2.5.
Za funkciju na slici je J�' > O , no i trapezna i Simpsonova formula će dati negativne vrijednosti jer su u tim formulama su � O. � O , a koeficijenti Pojavu s gornje slike imamo kada podintegralna funkcija i ma puno nultočaka, ili kada i ma puno ekstrema (tada prva derivacija ima puno nula) što povećava vrijednosti viših derivacija čime se smanjuje točnost aproksimacije. Stoga treba birati tako da je znatno manji od razmaka susjednih nu1točaka funkcije i razmaka susjednih nultočaka njene derivacije
J (x)dx J (Xi )
Ai
h
J '.
2.2. Ponavljanje raspolavljanja i Rombergov . algQ�m
: , � '<�'�. >?;', <�,<, t�;.<;H;f1i*S61X;#it*iff;.:?*t?��%�8::;��J�,;*�rr?'��{:�f���,,�lr Vratimo se trapeznoj formuli
_(f;.;�d,,��Si<;�;t��;.;i1�Y�Y ���;'
f.:<>®'_
i ij! tu in':.
lb J (x)dx = /.X" J (x)dx h-[yo + 2Yl + . . . + 2Yn + Yn] - (b - a)3 f" (tJ ) · -1 1 2n2 Xo Kako je pogreška proporcionalna s � , to raspolavljanjem očekujemo njeno smanjenje (J " ( tJ ) je općenito različito za različite tJ ). Pretpostavimo da smo proveli račun za n n l i n n2 , nl =I n2 . Tada je I In, + Rn, In2 + Rn2 ( l) gdje su Ini aproksimacije trapeznom formulom, a Rni pogreške, i 1 , 2 . Sada je ( ) 3 !"( tJ2) - b l;n� Rn2 tJ l , tJ2 ( b). ) ( Rn b ( , l;n� 3 f" tJd' Pretpostavivši da s u !"( tJ d i !"( tJ 2 ) jednake imamo =
7
=
a
=
=
=
=
_
E
a,
2.2. PONAVLJANJE RASPOLAVLJANJA I ROMBERGOV ALGORITAM
51
pa supstitucijom u drugu jednakost od ( l ) imamo
Ini +
Rf/l = In2 + C : fRnl
Rnl ( 1 - C:f) = Inl
ili
InI '
Uvrstimo li dobiveno u prvu jednakost od ( l ) dobivamo
I
- In l + 1 1"2 - Ini 2 ' �
Ako je nadalje n2 = 211 1 dobivamo
(2)
- e:)
4
l
I � jIn2 - jIn, .
(3)
Prisjetimo se da smo u računu pretpostavili t'( 11 1 ) = t'( 11 2 ) pa stoga očekujemo da je
poboljšana aproksimacija integrala I . To zovemo Richardsonova ekstrapolacija. b a a broj čvorova Kod raspolavljanja segmenta [a, b] korak ima oblik Krenuvši od [a, bJ provedirno rekurzivno raspolavljanje. Uvedemo li iznosi + prikladne oznake kao
h
2N l .
To, I =
b
2N
,
� a { � lf(a) + f(b)] }
{ � lf(a) + f( b)J + f (a + b 2 a ) } � { To, + ( b a )f (a + b ; a ) } 3 b-a b-a l T2,1 = -- { lf ( a ) + f(b)] + L f ( a + --i) } 4 2 4 i=l
TI,I = =
b
a
l
(4)
2. NUMERIĆKO INTEGRIRANJE
52
b-a 1 b-a T3 , I = -S- { 2: [t(a) + f(b)l + Lf (a + -S-i) } i=1 1 b --a i) } (b - a) � = 2: { T2, ] + � f (a + S 4 i=l" 7
l'J.i=2
1{
T4,I = 2: T3 ,I
b-a. + (b -S a) � � f (a + ---u;- l) } i=1 l'J.i=2
dobivamo rekurzivni zapis pripadnih trapeznih formula. Tako je To, l trapezna formula za segment TI, ] je trapezna formula kada raspolovirno itd .. = ispod znaka sume znači da indeks sumacije skače za npr. u T4,I poprima vrijednosti jer su pribrojnici s indeksima 4 , ujedno pribrojnici od T3 ,I . Izvedite sami formule za TI,I i T2,1 ' Induktivno vrijedi 2N_ I T , I = 2: TN - I, ] -I � i=] l'J.i=2 s pogreškom
di 2
[a, bl ,
[a, bl
2,
1, 3, 5, 7, 9, 1 1, 13, 15
N
2, 6, S , 10, 12, 14
b-a )} + b2N- a " f (a + �i
l{
(5)
N
Primijenimo li Richardsonovu ekstrapolaciju na par T , ] i TN+ I , I nadamo se poboljšanoj aproksimaciji. Označimo tu aproksimaciju s TN,2 , tako da imamo
,
TN 2 = Npr. To,2 =
4T] , ]
4 TN+] , 1 - TN,]
----'c...:.-'-':.: _-'--'-'-
3
; To, l = b � a {f(a) + 4f ( a ; b ) + f(b)}
što je elementarna Simpsonova formula. Greška te formule je proporcionalna s � o čemu treba voditi računa kod ponovljene Richardsonove ekstrapolacije. Nastavimo li niz dobivamo Simpsonovu formulu za II =
2N nakon što smo N puta raspolovili segment
[a, bl . Time je Iz = �;+� pa je pogreška aproksimacije jednaka b a) RTN2 - 2(SS0- . 245N f (1]) . _
-
(IV)
2.2. PONAVLJANJE RASPOLAVLJANJA I ROM BERGOV ALGORITAM
53
Sada ponovo možemo primijeniti Richardsonovu ekstrapolaciju na par susjednih članova niza To, 2 ' TI , 2 , T3, 2 , . . . dobivši novi niz aproksimacija To,3 , TI,3 , T2, 3 , T3, 3 , . . . , TN,3 ' Zbog toga što je sadašnja pogreška proporcionalna s � i mamo sljedeću formulu 1 6TN+1,2 - TN,2 TN, 3 =
15
možemo pokazati da j e TN, 3 po dijelovima primijenje Sagradimo l i niz To,3 , TI, 3 , na elementarna Newton - Cotesova osnovna formula za n = 4 , pa je pogreška takve aproksimacije oblika (b - a ? ( VI) (TI) · .
.
•
1935360 . 26N f
Ponovimo li opet Richardsonovu ekstrapolaciju na nizu To, 3 , TI , 3 , . . . dobivamo 64TN+ I,3 - TN,3 TN,4 _ 63 Induktivno imamo opću ekstrapolacijsku formulu oblika ', 4' l TN+ l j- 1 - TN•i- 1 TNJ _ (6 ) 4i- 1 koja se pripisuje Rombergu. Vidimo da TNj ima dva indeksa pa navedimo što se do gađa kada jedan od njih teži u beskonačno. Jasno nam je da bi povećanjem N trebali kao limes dobiti pravu vrijednost i ntegrala. To se može dokazati, tako da vrijedi
1
lim T j N -oo N Nadalje, niz
=
lb f(x)dx. fl
To, ., To,2, To,3 , . . .
također konvergira k pravoj vrijednosti integrala, tj . .\ i m To.;
J - OO
lb f(x)dx.
Početno razmatranje u konstrukciji'Rombergovih nizova može dati krivu sugestiju da su nizovi TNJ po dijelovima primijenjene Newton Cotesove aproksimacije. To je istina za j t:; dok za j > to nije slučaj . Rombergove nizove možemo složiti u jednostavnu tablicu u kojoj je N indeks retka, a j indeks stupca. TOJ To ,4 To,s To,3 TO,2 To, 1 Tl ,4 TI ,s Tl ,3 Tl ,2 Tl , 1 T2, 3 T2,2 Tl,!
3
3,
TN-l, 1 TN- l , J TN, l
TN -2, l TN- I , 2
TN -2,3 Rombergova tablica
2. NUMERIČKO INTEGRIRANJE
54
U praktičnoj primjeni ove tehnike prvo izračunamo elemente prvog stupca pomo ću formula (4) i Zatim popunimo trokutnu tablicu služeći se formulom (6). Kako svaki stupac i redak konvergira prema vrijednosti integral a to na dijagonali trokutne tablice dobivamo seriju aproksimacija. Što se tiče pogreške koja odgovara aproksimaciji
(5).
lb f{x)dx ::::; TNj
može se pokazati (u što se ne upuštamo) da je jednaka
RNJ' 2k2jUN) fUj) ( tJ) ' a < t} < b gdje je kU) konstanta koja ovisi o a, b i j, a ne ovisi o N .
[a, bl )
Ekvidistantnost čvorova Uednolika podjela segmenta bitan su uvjet New ton - Cotesovih formula. Dopustimo sada nejedno1iku podjelu i upoznajmo tzv. Gaussove formule za numeričku integraciju. Da to provedemo moramo se prisjetiti tzv. Legendreovih poIinoma. To su polinomi oblika
2 ln Pn (x) 2nln! � dxn (X - ) ,
n
=
O 1, 2 ,
J
-J
-J Sl. 2.6.
Prvih pet polinoma glasi
Po(x) l P 1 (x) = x P2 (x) � (3x2 - l ) =
=
, . . .
2.3. GAUSSOVE FORMULE
ss
P3 (X) = 21 :(5x3 - 3x) P4'(x) gl (35x4 - 30x2 + 3) Te smo poli nome sreli kod Fourierovih redova kao primjer niza ortogonalnih funkcija na tj. vrijedi
[-l, 1] ,
n :/=
m,
ali vrijedi i više, naime vrijedi da je
11 Pn (x)Qk(x)dx = O k < n,
Qk
gdje je proizvoljan poli nom stupnja nižeg Legendreovih polinorna:
od n, tj. k <
(l) Il .
Daljnja svojstva
Pn (1) = 1 , Pn( - l ) lt n = O, l, . . . , pn ima na ( 1 l) n jednostrukih korijena. Označimo nezavisnu varijablu s t i provedi mo razmatranje na [-l, l] . ( Kasnije ćemo sve transformirati na [a, bl . ) Postavimo si zadatak da nađemo čvorove . , tn i koeficijente A l , A 2 , , An tako da formula za aproksimaciju integrala izgleda ovako -
.
.
•
•
,
t l , t2 ,
•
(2) i da daje točne vrijednosti za sve polinome do odgovarajućeg mogućeg stupnja N , koji ćemo odmah odrediti. Kako u zadatku treba odrediti v rijednosti tj i što je ukup vrijednosti no vrijednosti, a poli nom -og stupnja je određen s koeficijenata to zaključujemo da je u općem slučaj u- N . Dovoljno je ograničiti se na polinome
n n A, 2n i ( 2n 1) = 2n- l (3) f(t) = l, t, t2 , t 2n- l jer su ostali polinomi stupnja :( 2n - 1 njihove linearne kombinacije. Time za prave vrijednosti polinoma u (3) i mamo da vrijedi (4) k = O, 1, 2, . . . ) 2n 1. 2n
•
Kako je
{
.
.
,
I tkdt = _1_-....:.{_-....;1)_k+_1 = k +2 l k+ l J -l
k O ako je k neparan ako je paran
(5)
2. NUMERIČKO INTEGRIRANJE
56
ti i Ai n i=n 1 L Aiti = O
to dobivamo ovakav sustav jednadžbi u
;=1
� � AitiZn-2
_
(6)
2
l i=n 1 "' A,. tiZn- I - O· � ;=1 -
211 -
-
što je nelinearan sustav jednadžbi. Svedimo problem rješavanja sustava (6) na rje šavanje linearnog sustava u nepoznanice posluživši se Legendreovim polinomom
Pn(x)
Ai
.
Promatrajmo polinome
Qn+k (t) = tkPn(t)
k = O, 1, 2, . . . , n - l
(7)
Pn(t) Legendreov polinom n -tog stupnja. Stupanj polinoma u (7) nije veći od 2n l , pa za njih u (2) vrijedi jednakost, tj. imamo n -J II Qn+k (t)dt = J-II tkPn (t)dt � A;r7Pn(ti ), k = O, l, . . . , n - L
gdje je -
=
(l) koje kaže da je J-II tkPIl (t)dt = O za k < 11, tj. za k = O, l, . . . , n - l tako da uvrštavanjem u (2) imamo Sada se poslužimo svojstvom
n
( 8)
;=1
Pn (t;) = O slijedi da su jednadžbe ( 8) zadovoljene za proizvoljne vrijednosti A;. (9) Pn (t;) = O, i = 1, 2, . kaže da su t; nul točke (korijeni ) Legendreovog polinoma n -tog stupnja koje su razli čite, realne i nalaze se unutar ( - l, l ) . Uvrstivši tako odredene t; u prvih n jednadžbi sustava (6), dobivamo ovaj linearan sustav jednadžbi s nepoznanicama A; n i=1n L t;A; = O Iz Ali
.
i=1
.
, II
2.3 . GAUSSOVE FORMULE
57
n I.>iAi = 0 i=1
{
k paran k neparan
2 n-l A t = L , n n
;=1
j
n
O
( 10)
k neparan k paran.
Determinanta podsustava od prvih jednadžbi je Vandermondeova determinanta pa rješenjem sustava ( 10) dobivamo Gaussove formule za numeričku i ntegraciju koje glase
(ll) Ai
gdje su rješenja sustava ( 10) u kome su čvorovi n -tog stupnja. Linearna transformacija
ti
korijeni Lagrangeovog polinoma
b + a + --1 b a ( 1 2) x -2 2 prevodi [-l, l] na [a, b] , pa imamo b l f(x)dx b 2 a flJ ( b ; a + b ; a t) dl tako da dobivamo [b b a Ln f(x; )A ; (13) (x) f dx � n 2 J d· . b+a + b -a t;, I. = 1 , 2, . . . , n, a tj su konJem g �e Je Xi = . . . ( nu l e ) Legendreovog 2 2 1= 1
polinoma II -tog stupnja. Pogreška aproksimacije se može dovesti u ovaj oblik
a)2n+ 1(n! )4Jl2n) ( � ) . ( 14) Rn = (b -[(2n ) !J3(2n + l) Nedostatak Gaussovih formula je iracionalnost korijena tj , dok se s druge strane ističu visokom točnošću.
2. NUMERIČKO INTEGRIRANJE
58 Primjer 2.2.
Tada je
n
=3
.
čije su nultočke
t2 = O 13 = VfI . s
( 10) ima ovaj obli k Al + A2+ A3 2 -fsAl+ fsA3 O S3 Al+ S3 A3 = 32 čije rješenje glasi AI = A3 = � , A2 � . Imamo dakle formulu l {3 (3 Lt/ (t)d t r:::; g [5/ ( -V S)+ 8/(0)+ 5/ ( V S)] '
pa za
·
II
3 sustav
��j��f:�Y:1?I� �s��_��i_l�'I�)��"!'��'f�3�;��j,� , "��·1;
2�4. lntegrlranJe brzo oscjJlra!ućih funkciJa. .filonova
�iI!t,�);; �jP��_
fc)l'muta
Provedi mo prvo jedno opće razmatranje. Neka j e potrebno izračunati
t I(x)dx
lb I(x)p(x)dx .
(l) p(x)
(l)
Mislimo l i na = No, u produktu možemo imamo da j e u aproksimirati jedan faktor i time očekivati da smo aproksimirali produkt. U takvom postupku funkcija se zove težinska funkcija. Kao što smo kod Gaussovih formula proveli razmatranje na l] i zatim sve transformirali na , sa
p(x) [a b]
l.
[ - l,
a b--t a --+ x b+ 2 2
(2)
tako to možemo i sada učiniti. Pokazat će se na kraju da smo kod Gaussovih formula imali Legendreov polinom kao težinsku funkciju. l Neka su E l ] točke koje odgovaraju točkama po transformaciji (2). Aproksimirajmo na , s Ln koj i prolazi E čvorovima Xi , = O, . . , n . Dakle, na , j e Ln ) r:::;
to, t\ , t2 , . . ., tn [- l, .. ., Xn [a, bJ 1 i [a b] ,. (x I(x),
I
[a bJ
Xo , x , X2 ,
2.4 . INTEGRIRANJE BRZO OSCILIRAJUĆIH FUNKCIJA. FILONOVA FORMULA
59
pa imamo
(3) Pogreška iznosi
l f(x)p(x)dx l (x)p(x)dx = l p(x) [r(x) - (x)] x b
R� =
-
b
Ln
Ln
d .
f(x) - Ln (x) n � f(x) - Ln (x) = f(n ++ (l ) !) (x - xo)(x - x d · . . (x - x n )
Kako znamo ocijeniti razliku
(
to dobivamo
b
Rn =
r Jo
b
,
I)
(n l)
p(x) f(n ++ (I),� ) (x - xo)(x - xd . . . (x - xn )dx
iz čega imamo ovakvu ocjenu apsolutne vrijednosti pogreške
n I Rn i :%; max If H) ( � ) .tE lo,b]
b I Jr I p(x) ll (x -(nxo)+ l).. . ; (x a
-
xn ) 1
,
,
dx .
(4) (5)
I (b + a b - a ) p(x)(x xo) (x x ) x . . . _/ (n + J 2- + -2- t Ja b + . C t to ) . . . (t - tn) ( 2 ar 2dt, b - a t. b a t ,) = -b - a (t - t ) . dx = --d b + a + -b - a t - ( b + a + -Jer Je x -x' 1 2 2 2 2 2 2 1 Provedemo l i supstituciju ( 2) u formuli za pogrešku dobivamo b . l 1 ' r nd = 1)! !
-
--
Označimo li sa
imamo ovaj oblik apsolutne vrijednosti pogreške
n l I Ril i :%; D t , t h , , " tll ) lf + ) ( � ) 1
(o
U Lagrangeovom obliku Lli glasi
l
( b 2 a r+2 ·
l
(6)
2. NUMERiČKO INTEGRIRANJE
60 Supstitucijom (2) u integral ( 3 ) imamo
b
JI p ( ;
l p(x)L,,(x)dx
b
-I
a
+
b
a
a
(t
tj)
(t 2 /:fl --
- t} )
"
1=0
'-o }-
--
; ) L f(x; ) rr �--a-t
I
t f(Xi) J I ( b +2 a + b -2 a t ) IT tj -- ttjj dt . � 2 , _I
1=0
Dakle
t
P
j=O
/:fi
"
b ;.a � f(XI)Di p(x)L (x)dx = ,, lb a
gdje je
b
"
Di = j
l
-I
+a b-a + -- t 2 2
P
(7)
i=O
n
) rr tit -- tjt , dt, --
}
j=O
/:fi
i = 0, 1, 2, . . "
n.
(8)
Time dobivamo aproksimaciju integrala u obliku
lb f(x)p(x)dx a
b T �f(Xi)Di ' n
�
Spomenimo bez dokaza sljedeće: Ako je parna obzirom na polovište od [a, bl i ako su čvorovi raspoređeni oko polovi šta, odnosno tj -tn -I , onda vrijedi
p
(9)
;=0
Xi
'simetrično
Dj Dn-i .
Neka je potrebno izračunati integral (Fourierova transformacija)
b
l f(x)eiWXdx,
pri čemu je w eb - a)
»
eiw
x
cos
WX + i sin wx
( 10)
l ( mnogo veći od) i f glatka funkcija. Sada funkcije Re (f(x )eiWx ) f(x) cos wx Im (f(x)eiWX ) f(x) sin wx b
imaju na [a, b] puno nula, naime w ( n-a) je broj nula na [a, b] , pa ako je w eb - a) » dijeljenje s Tr neće to bitno smanj iti. za uz uvjet w eb - a) » kažemo da je brzo oscilirajuća na [a, bl . Kako polinom n -tog stupnja ima naj više II različitih nula to se takva funkcija može dobro aproksimirati polinomom 'l -tOg stupnja samo ako je web --'a) II
f(x)eiWX
» --'-Tr
,
l,
l,
2.4. INTEGRIRANJE BRZO OSCILlRAJUĆlH FUNKCIJA. F1LONOVA FORMULA
61
Da to izbjegnemo možemo postupiti tako da funkciju ei(J)x shvatimo kao težinsku funkciju. Prema i mamo
(7)b
l Ln (x )ei(J)x dx = b L f(Xi )D; 2 /=0 n 2 'W ( !!±!! b-" t ) J I 2 + e Di = l ' n tj tj a
a
II
I
j=O j=fi
lb f(x )eI.WXdx :::::: b
pa gornja aproksimacija poprima oblik
a
2
n
a
Lf(Xi )Ai (P ) ,
I n t - t·j dt, A i (P) J_ I eipl n -t tj j=o i
gdje je
j=fi
Pogreška je dana s
l
i=O
l) I Rni � D(to, tj , . . . , tn ) J'n+ ( � )
b-a p = w2-·
1 ( b ; ) n+ 2 a
(11)
( 12)
( 13 )
= 1 , D(to, t h . . . , tn )I poprima oblik ( 14) D(to, t! , . . . , t" ) -_ J I (t to ) (t(n +tdl)· .'· · (t - t,, ) l dt. l . Pripadna U primjenama se susreće algoritam za = 2, to - 1 . t l = O, t2 formula se zove Filonova formula. U tu svrhu možemo izračunati I i (t - 'O )(t - l) I ) o( p A = _ I e pl ( - 1 - 0) ( - 1 - 1 ) dt = 21 1_1 eiPI (t2 t)dt I 1 ) 1 ) (t (t + J A I (p) = 1 1 e/Pl (0 + 1l ) (0 -- 1 ) dt = - I eipl (t2 - Odt I (t + l ) (t O) l J I J A2 (P) = - l eipl ( l + 1 ) ( 1 -- O) dt 2 _ iPI (t2 + t)dt. 1 Da to izračunamo trebamo redom: 1-1I eipl dt = t:p [eiP e -iP] l[. .] l [ . 1 1 e/.Pl tdt = . e/P + e-lP + P e'P gdje zbog l eiwx l
-I
11
-l
=
-I
�
2:
2. NUMERIĆKO INTEGRIRANJE
62
22 ) [eiP ;. = (l p l P J-l Uvrstimo li te rezultate imamo Ao= � {ill eip1t2dt- ill eipttdt} 1 1 2 IP -1P 2 'P+e-I>PJ - ip1 [e'P" +e-'P" J - p12 [e'P-e-'P . ' J} 2: { ip ( 1 - p2 ) [e > - e > J + p2 [e > 2 2 } 21 { l:p ( 1 - p2 ) 2iSinp+ P22 cosp-;'2COS lp P -�2iSinp P =� [2 CO; P + ( 1 -:2 ) SinpJ+i� [COS P-�i;P J =E+iF, Al =-{ Ltl e'Plt2dt- Llt eiptdt} = - L� ( 1 - : ) [eiP _e-iP] + :2 [eiP +e-iPJ i� [e'P _e -iP] } = - ; { - i� [eiP _e -iP] + [t!P+e-ipJ } = -:2 { -� sinp+2 cosp } = - 4 { cosp- Si;P } = - p4- F' A2= �{ill eip1t2dt+ ill eiP1tdt} = 21 { ip1 ( 1 - p22 ) [e1P" -e-1P' J + p22 [e1.P+e-1P' J + ip1 [e1>P +e -1P] + l =� L � (l-:J2iSinp+ :22COS P+ i�2COS P+ �2iSinp} = � [2 co; P + ( 1 -:2 ) SinpJ - i� [cos p- Si; P J =E-iF, Uvršteno u (ll) daje a+b b a [ lb f(x)e'Wxdx :::::: -2 e 2 f(a)Ao + f ( -2- ) A l + f(b)A2J . U vrstl.mo l'I = b + a Imamo eia = cos + l SlO tako da Je. t eip1t2dt
2
>
>
a
a
W
-
,
.
'w
lli
a
.
,
a
2.4. INTEGRIRANJE BRZO OSCILIRAJUĆIH FUNKCIJA. FILONOVA FORMULA
lb f(x)e1WXdx . �b --[eos a a + isin a] [f(a)(E + iF) 2 a
a +-b ) 4 F + f(b)(E - iF) - f(2 p ] a b b a = ; { (i(a)Eeos a + f(b)Eeos a f( ; ) � Feos a - f(a)Fsin a + f(b)Fsin a) + i (i(a)E sin a + f(b)Esin a - f ( a ; b ) � Fsin a + f(a)Feos a - f(b)Feos a) } b --a {f(a)[Eeos a - Fsin a] + f(b)[Eeos a + Fsin a] =2 f( a ; b ) � Feos a} + i b ; a {f(a)[Esin a + Feos a] + f(b)[Esin a - Feos a] - f ( a-+2-b ) p4 Fsm. a } _
_
gdje je
E = � [2 eo; p + ( 1 - :2 ) sin p] , Sinp ] , F = p1 [eosp - p a+b a = w-2 ' b a p - w-2 ' Rastavimo li na realni i imaginarni dio imamo b l f(x) eos wxdx � b ; a {f(a)[Eeos ' a - Fsin a] + f(b)[Eeos a + Fsin a] - f ( a-+2 -b ) p4 Feos a } lb f(x) sin wxdx � b --a {f(a)[E sin a + Feos a] + f(b)[Esin a - Feos a] 2 a +-b ) 4 Fsm. a } - f (2 p a
a
63
2. NUMERiČKO INTEGRIRANJE
64
ili
lb I(x) cos wxdx fl
lb I(x) sin wxdx fl
�
b -2 a { [j(a) + l(b)]Ecos a + [j(b) - l(a)]Fsin a
--
- I ( a +2-b ) l4 / cos a } b -2 a {[j(a) + l(b)JEsin a + [j(a) - l(b)JFcosa -
�
- I ( a +2 -b ) p4 Fsm. a } . U primjenama se susrećemo i s formulama za n = 4 , = O , t3 0.5 , = l -
t2
=
t4
.
.
to
=
-
l
,
tl
= - 0.5 ,
3.
Sustavi l inearnih jednadžbi
3. 1 .
3.2.
Direktne metode . . . Iteracijske metode . . .
. . . . . .
. . . . . . . .
, . . . . . , . . . . . . .
. . . 66 . . . 85
Promatramo opći sustav linearnih jednadžbi
tj.
m
a ll x ! + a l2x2 + . . . + a!nxn bl a2 1xl + a22x2 + . . . + a2nxn b2 am l X l + an12x2 + . . . + amnXn b""
(1)
jednadžbi sa n nepoznanica. Matrični zapis istog glasi
Ax = b
(2) gdje j e A x n )-matrica, je Il -komponentni vektor i je m -komponentni vektor. Opća teorija egzistencije rješenj a sustava linearnih jednadžbi kaže da pored matlice A treba promatrati proširenu matricu sustava, u oznaci koja se dobiva iz matrice A dodavanjem vektora kao (Il + l ) -vog stupca, dakle izgleda ovako:
= raul (ul
b
B=
[
x
a l l a 12 ' " a ln a21 a22 . . . a2n ami am2 . . . amn
bl b2 bm
]
b B, B
(3)
te da treba usporediti njihove rangove. Krajnji rezultat glasi: l ) Ako je rang A =f. rang onda sustav nema rješenje; 2) Ako je rang A rang onda sustav ima rješenje i to: 2a) ako je rang A = rang = II = broj nepoznanica, onda sustav ima jedin stveno rješenje; 2b) ako je rang A rang r < ll , onda sustav ima beskonačno rješenja, naime, stanovitih II r nepoznanica možemo zadati nakon čega je ostalih r određeno. Tada se obično govori o (ll - r) -parametarskom rješenju sustava.
B, B,
B B=
3. SUSTAVI LINEARNIH JEDNADŽBI
66
Nama su važna oba ova slučaja. Na prvi slučaj redovito nailazimo kada imamo sustav od jednadžbi sa nepoznanica za koji je determinanta matrice A različita od nule, detA =ft O, dok na drugi slučaj nailazimo kod linearnog optimiziranja. U ovom poglavlju se zadržavamo na sustavu od jednadžbi sa nepoznanica Ax = b za koji je detA =ft O. Tada je (4 ) x = A - lb rješenje sustava koje zahtijeva računanje inverzne matrice. Direktno računanje A-I zahtijeva mnogo vremena pa se formula (4) rijetko koristi. Nalaženje rješenja sustava (l) pomoću Cramerovog pravila (5) = detA; det A ' = I , 2, . gdjeje II
11
II
[alla21 ala222 . . . ala21;_1- 1 blb2 all+la21+1 .. .. .. alna2n ] i
Xi
A; =
II
.
.
.
. . .
.
•
.
.
,
.
. .
.
. .
.
.
�
.
.
.
, II
.
.
.
. .
.
ani an2 . . . ani-l bn an i+ ! . . . ann
(6)
ima istu manu kao i nalaženje inverzne matrice jer treba računati vrijednosti determi nanata visokog reda. Stoga su razvijene različite metode rješavanja sustava linearnih jednadžbi koje su računski jednostavnije i zahtijevaju manje vremena. Neke od tih metoda su direktne (nekada govorimo točne), a druge su iteracijske koje daju aprok simaciju rješenju. Ponovimo ovdje još sljedeće. Ako sustav pomnožimo s regularnom matricom C ( det C =ft O ), onda je novodobiveni sustav CAx Cb ekvivalentan polaznom. Ako usporedimo novi sustav s polaznim, onda je novi sustav dobiven iz polaznog linearnim kombiniranjem jednadžbi polaznog. Ako npr. želimo zamijeniti -tu jednadžbu sa tom, onda to možemo postići množenjem sa matricom Irs koja se dobiva iz jedinične matrice I zamjenom -tog i -tog retka. Prvo ćemo proučiti neke direktne metode, a zatim neke iteracijske. r
r
s
s
Prvo ćemo opisati tzv. Gaussovu metodu eliminacije čiju smo varijantu koristili još u srednjoj školi pod imenom metoda eliminacije. Obično je to bila tzv. Gauss Jordanova metoda koju također opisujemo.
3.1. DIREKTNE METODE
67
Gaussova metoda eliminacije
I
Najraširenija direktna metoda ili algoritam je postupak postupnog eliminiranja nepoznanica. Radi lakšeg praćenja opisat ćemo to na sustavu 4 jednadžbe sa 4 nepoznanice. a llx l + a l Zxz + a 1 3x3 + a l 4x4 = a l 5 aZl x l + aZZxz + aZ3x3 + a24X4 = aZ5 ( l) a3 1 x I + a3ZxZ + a33x3 + a34x4 = a35 a41 x I + a4ZXZ + a43x3 + a44X4 = a45 Neka je a ll =I O . Podijelimo li prvu jednadžbu s a ll dobivamo (2) X I + b12xz + b1 3X3 + bl4X4 = b1 5, gdje je a lj , j > l. bIj - a ll Koristeći jednadžbu (2) lako eliminiramo X I iz ostalih jednadžbi sustava (l). jednadžbe sustava (l). zatim Treba jednadžbu (2) pomnožiti s aZ I i odbiti od druge jednadžbu (2) množimo s a3 1 i odbijemo od treće jednadžbe sustava (l). i tako redom. Time dobivamo sustav s jednom jednadžbom i jednom nepoznanicom manje: azz( I )Xz + aZ(I)3 X3 + a24(I)X4 = aZ( I5) (3) a3(I)Z Xz + a(33I )X3 + a3(I)4 X4 = a(35I ) a42(I)Xz + a4(I)3 X3 + a44( I )X4 = a4(l)5 gdje se koeficijenti aU ) ( i, j � 2 ) računaju prema formuli a�l) = au - ajI bIj (i. j � 2). Sada ponovimo postupak na sustavu (3) i eliminiramo nepoznanicu Xz . tj. podi jelimo prvu jednadžbu sustava (3) s a��) (koji naravno treba biti =I O ) i dobivamo _
(4)
gdje je Eliminirajući X2 iz druge i treće jednadžbe sustava (4) dobivamo sljedeći sustav a33( Z)X3 + a3(24) X4 = a(3Z5) (5) a4( Z3)X3 + a44( Z) X4 a4( Z5) gdje je aj(jZ) - au( I ) ai(2I ) bZj(l) ' (i,j � 3). Ako sada prvu jednadžbu sustava (5) podij elimo sa a�;) (koji naravno treba biti =I O ). dobivamo (6) =
_
_
gdje je
3.
68
SUSTAVI LINEARNIH JEDNADŽBI
Eliminirajući X3 iz drugejednadžbe sustava (5) dobivamo
gdje je
Iz (7) slijedi
(
al 3 } a( 2) - a(32} b3(2 } lj
=
lj
l
Y 1
a4( 35) X4 = (3) a44
l,. j. >r
4)
(7) .
Ostale nepoznanice sada nalazimo postupno iz jednadžbi (6), (4) i (2), pa imamo b(435) '
X3 b(352) - b(324)X4 X2 b2Il)5 - b24(l)X4 b2Il)3 X3 XI = b l5 - b l 4X4 - b l3X3 - b 12X 2 · =
Promatramo li apstraktno opisani postupak, vidimo da isti prevodi polazni sustav b u njemu ekvival e ntan A"x bil pri čemu je All gornje trokutasta matrica oblika
Ax
=
O O O 1 bn = An l n :'2l ) ln-2) bnn+1 OO O l bn-In i n- l ) O 1 O O O bnn+l Provedemo li sljedeću supstituciju u sustavu jednadžbi � x + e , gdje je dobiv.� l
b l2 bJ 3 ' " l 1 bi 3) . . . 2
=
e
[j l
b in+! b{2 l)11+1 (2) b3n+1
b1n - 1 b In I) b2( 11_1 bZJ!i l ) 2) b(3n2 ) b(311-1
=
'
ili A� b + Ae b', što je novi sustav jednadžbi. Komponente rješenja {�i} novog sustava razlikuju se za 1 od komponenata rješenja {X } polaznog sustava, a koeficijenti desne strane su sume svih koeficijenata odgovarajuće polaznejednadžbe. Taj sustav obično rješavamo paralelno radi kontrole. A ( � - e)
b,
=
i
3. 1 . DIREKTNE METODE
69
Ocjena pogreške zbog netočnosti A i b. Ponekad treba ocijeniti pogrešku � rješenja x linearnog sustava ako su poznate pogreške M i M matrice A i vektora b. Imamo: (A + M)(x + �) b + M Ax + A� + (M)x + (M)(�) = b + M. Zanemarivši član M� dobivamo linearni sustav u � (8) A� t1b - (M)x, koji onda treba riješiti u � . Usporedimo li sustav (8) s polaznim, vidimo da ima promijenjenu samo desnu stranu. =
=
Izračunavanje determinante Gaussovom metodom.
Izračunavanje vrijednosti determinante prema definiciji njene vrijednosti računs ki gledano je posao koji traži puno vremena. Stoga se redovito koriste postupci koji smanjuju broj računskih operacija. Gaussova se metoda može primijeniti i na izračunavanje vrijednosti determinan te. Neka je det(A) determinanta matrice A . Gledamo li homogen sustav pridružen matrici A , imamo Ax = O, koji po Gaussovoj metodi zamjenjujerno sa ekvivalentnim Ax=O n
Pogledamo li koje su operacije vršene, onda. vidimo da smo vrijednost det(A). redom d··Ije1·1·l l sa a l l , a22 . . . , ann , pa dakle vrIje. d· detAn � l = a a( ldetA ) (n-l) l 1 22 . . . ann odnosno, det A - a l l a(22l ) . . . anll . (9) (Prisjetimo se dviju činjenica upotrebljenih pri gornjem računu. Te su da se determi nanta množi brojem da joj se jedan stupac ili jedan redak pomnoži tim brojem i da je vrijednost trokutne determinante jednaka produktu dijagonalnih elemenata.) (l)
'
(II-I)
l
-
( n -I )
Nalaženje inverzne matrice Gaussovom metodom
Gaussova se metoda može primijeniti i na izračunavanje inverzne matrice. Neka je A = [aij] . Elemente inverzne matrice od A označimo sa xij , tj. A - l '= [ ] Xii .
3. SUSTAVI LINEARNIH JEDNADŽBI
70
Tada imamo AA - I = I . Množenjem dobivamo sustav linearnih jednadžbi sa n2 nepoznanica, koji se raspada na n sustava sa po n nepoznanica. To su ovi sustavi L aikXkj oij, U,j . . . , rz), =1 k gdje je i =j, i =f; j. Rješenjem tih sustava dobivamo elemente inverzne matrice. Uskoro ćemo vidjeti da je Gauss - Jordanova metoda prikladnija za nalaženje inverzne matrice. Primjer 3.1 . Da na konkretnom primjeru ponovimo postupak riješimo sustav 2x1 - 7X2 + 4X = Xl + 9X2 = XI + 8X2 + čije rješenje lako nađemo: Xl = 4 , X 2 l , X3 Postupak ćemo pratiti na pripadnim proširenim matricama. Imamo -7 4 : 9 B [A, bl l 9 -6 : l 8 Eliminacij a nepoznanice X I prevodi B u II
=
-
B2
=
=
=
B,
Eliminiramo li X2 dobivamo
m35X33
91 6 2. 3 [2 5 ] -3 : 6 [� 28 : J ] [ �1 O I; :I rs1 ] =
=
(10)
1, 2, 3,
7
=
-2 '2
-�
-�l
=
- :
25
II
- 25
ft5 :
� 5
Konačno dijeljenjem zadnjeg retka sa � završavamo postupak eliminacije i dobivamo
[� ! � ! -U Iz čitamo odmah X3 2. Da nađemo X2 treba u X2 - 2165 x3 275 5 UVrstIti. . X3 2 tako da .Imamo X2 275 2165 ' 2 225 Konacno IZ X l - 72'X2 2x3 92' Izra . čunavamo Xl kao 72' 1 2 2 2'9 B,
B3
=
=
=
v
'
+
=
+
=
=
l
.
Xl =
.
. +
=
4.
3 . 1. DIREKTNE METODE
71
Vrijednost detA iznosi prema (9) 25 5 47 = 5 · 47 235. detA al l a22(I)a33(2 ) = 2 · 2 Da Gaussovom metodom odredimo A - l potrebno je riješiti ova tri linearna sustava 2x Il - 7X2 1 + 4X31 = l X I I + 9X2 1 - 6X31 = O i = 1, 2, 3; j = l , - 3X ll + 8X21 + 5X31 O 2X1 2 - 7X22 + 4X32 O 1, 2, 3; j 2, XJ2 + 9X22 - 6X32 l - 3xJ2 + 8X22 + 5X32 O 2x 13 - 7X23 + 4X33 O Xn + 9X23 - 6X33 O 1, 2,.3; j 3 . - 3x l 3 + 8X23 + 5X33 l Njihovim rješenjem dobivamo 93 67 6 A - l 235 13 22 16 . 35 5 25 =
} } }
=
=
=
=
=
l[
Gauss-Jordanova metoda eliminacije
.
I
=
=
]
Pod tim nazivom se obično razumijeva modificirana Gaussova metoda, u smis lu da se kod ove metode ne moramo vraćati natrag da nađemo Xn - I , Xn- 2 , . . . , X l (prati opis Gaussove metode). Prvi korak je isti kao kod Gaussove metode. Drugi korak provodimo gotovo kao i prije s time da X2 eliminiramo i iz prve, te ovih dalj njih jednadžbi. Zatim se analogno X3 eliminira iz prve, druge, četvrte i svih daljnjih jednadžbi. Nastavljanjem tog postupka dobivamo na kraju rješenje. Ako algebarski mislimo, onda je efekt primjene Gauss-Jordanove metode množenje s A - J , tj. dobili smo bez iznalaženja A -l Nalaženje inverzne matrice Gauss-Jordanovom metodom. Nakon uočenog algebarskog efekta Gauss-Jordanove metode nameće se ovakav postupak nalaženja inverzne matrice. Zamislimo da je •
M
=
[��� ��� : . : :
:� .
� ? :::
.
. gl']
=
[A lj
ali l Qn2 . alln O O . . . matrica sustava jednadžbi (nepoznanice nisu zapisane kao ni konstantni članovi desne strane). To je matrica formata x 2n koja se u blok zapisu sastoji od matrice A i jedinične matrice l . Provedemo li na M Gauss-Jordanov postupak, koji provodimo isključivo nad prvih stupaca, bit će M pomnožena s A- l . No, pomnoženo po blokovima to daje A - I M = [A - l A A - l l] = [l A l ] dakle u drugih stupaca dobivamo elemente od A - l . .
n
12
-
II
72
3. SUSTAVI LINEARNIH JEDNADŽBI
Gauss-Jordanova i Gaussova metoda s izborom vodećeg elementa
Pretpostavka pod kojom smo proveli Gaussovu i Gauss-lordanovu metodu je da su svi elementi al!- l ) =j:. O , jer smo s njima dijelili pripadnu jednadžbu i provodili eliminaciju nepoznanice Xk ' U slučaju da u nekom koraku naiđemo na nulu onda mo žemo ispremještati daljnje jednadžbe ili nepoznanice tako da u taj položaj dovedemo koeficijent različit od nule. Pri tome naravno treba voditi računa o nastaloj permutaciji. Daljnji ozbiljni nedostatak vođenja postupka na opisani način leži u tome da, iako je al�- I ) =j:. O isti može po apsolutnoj vrijednosti biti malen (blizu nule). Kako se s al�- l ) dijeli, to u daljnjem računu može izazvati znatno nagomilavanje pogreške. Da se to izbjegne uvodi se algoritam kod kojega u k-tom koraku ne eliminiramo Xk nego neku drugu nepoznanicu Xj , j =j:. k . To se najčešće ostvaruje izborom vodećeg (glavnog) elementa, pa se taj algoritam naziva Gauss-Jordanova, odnosno Gaussova metoda s izborom vodećeg (glavnog) elementa. Osnovna ideja metode sastoji se u tome da u sljedećem koraku ne eliminiramo nepoznanicu sa sljedećim indeksom nego onu nepoz nanicu koja ima po apsolutnoj vrijednosti najveći koeficijent. Takav se element naziva vodeći, glavni ili pivot element. Na taj način izbjegavamo dijeljenje s brojem koji je u usporedbi s ostalima malen i smanjujemo pogrešku. To se može raditi na različite načine. Prva ideja koja se nameće je da u matrici A potražimo element s najvećom apsolutnom vrijednošću i eliminiramo njegovu nepoznanicu iz preostalih jednadžbi, te da na novodobivenom sustavu ponovimo postupak s nekom daljnjom nepoznanicom. Na Gauss-lordanovoj metodi to izgleda ovako. Ako je akj vodeći element od A, tj. l akil ima najveću apsolutnu vrijednost, onda pomoću k -te jednadžbe eliminiramo nepoznanicu Xi iz svih ostalih jednadžbi. Da nastavimo postupak, moramo odrediti novi vodeći (glavni) element u novonastaloj matrici sustava. Taj tražimo izvan k-tog retka i j -tog stupca, tj. treba precrtati k -ti redak i j -ti stupac novonastale matrice i među preostalim elementima naći onaj koji ima najveću apsolutnu vrijednost. lasno je da u trećem izboru treba precrtati dva retka i dva stupca u novonastaloj matrici, tj. one koji su korišteni u prvom i drugom koraku, i među preostalim elementima naći vo deći element. Time korak po korak dolazimo do dvoredne podrnatrice u predzadnjem koraku i jednoredne podrnatrice u zadnjem koraku. Krajnje dobivena matrica će biti ispermutirana jedinična matrica (stupci su ispermutirani), o čemu treba voditi računa kod očitavanja komponenata nađenog rješenja. Druge dvije jednostavne varijante izbora vodećeg elementa su po recima, odnosno stupcima, koje su razumljive nakon gornjeg opisa izbora vodećeg elementa. Ilustrirajmo Gauss-lordanovu metodu s vodećim elementom (po gore opisanom izboru) na jednostavnom primjeru. Primjer 3.2. Rij ešimo ovaj sustav jednadžbi Gauss-lordanovom metodom izbora vodećeg elementa. -3Xl + 8X2 + 5X3 6 2.x1 7x2 + 4X3 = 9 XI + 9xz 6X3 = 1 . Račun provedimo tablično na proširenoj matrici B . Imamo -3 8 5 : 6 B = 2 -7 4 : 9 1 (2) -6 : l =
-
[
-
]
3. 1. DIREKTNE METODE
73
Vidimo da je a32 = 9 vodeći element matrice A . Time eliminiramo X2 iz sustava, pa nova proširena matrica sustava glasi Bl
=
[ OO ll : �] � -t : � -� 9 ii
3
9
l -3 I 9
Vodeći element nove matrice B l tražimo izvan drugog stupca i trećeg retka. Nalazimo da je novi vodeći element 2f koji se nalazi u poziciji prvog retka i trećeg stupca. Time eliminiramo nepoznanicu X3 , pa nova proširena matrica glasi
[ OO O 46] O Kod izbora trećeg vodećeg elementa smo upućeni na prvi stupac drugi redak, dakle . Pomoću njega eliminiramo iz prve i treće jednadžbe. Nova proširena matrica gfasi [O OO O 2 ] O O Ponovimo da prva tri stupca predstavlj aju permutirane stupce jedinične matrice, dok I 3 l I 9} I 9 235 I 93 940 3 _ ll l ±! Il 93 93
5 - 9}
B2 =
�;
Xl
B3
=
l
j
l : : 4 . l : l
četvrti stupac sadrži rješenje kole nije u prirodnom poretku, jer nismo u tom poretku provodili eliminaciju varijabli. Citamo li četvrti stupac odozgo prema dolje nailazimo prvo na element 2 što predstavlja vrijednost od X3 traženog rješenja, dakle X = 2 . Zatim nailazimo na 4 što predstavlja vrijednost od Xl traženog rješenja, X l 3= 4 , i konačno nailazimo na l što je vrijednost od X2 rješenja polaznog sustava. Konačno zapisano imamo Xl 4 , X2 = l , X3 = 2 ili x
[!j
Opišimo ukratko Gaussovu metodu s izborom vodećeg elementa, s time da je vodeći element onaj koji ima najveću apsolutnu vrijednost. Prvi korak je isti kao kod Gauss-Jordanove metode. Naime, nađemo element matrice A s najvećom apsolutnom vrijednošću. Ako je to bio akj , onda pomoću k -te jednadžbe eliminiramo Xj iz svih ostalih jednadžbi. U drugom koraku nađemo vodeći element novodobivene matrice izvan k -tog retka i j -tog stupca. Neka je to a�; ) . Sada r -tu jednadžbu koristimo za eliminaciju s -te nepoznanice iz svih jednadžbi osim k -te koja je korištena u prvom koraku. U novonastaloj matrici nađemo opet vodeći element izvan k -tog i r -tog retka i izvan j-tog i s-tog stupca i eliminiramo pripadnu nepoznanicu iz svih jednadžbi koje prethodno nisu korištene u ovom postupku, tj. iz svih jednadžbi osim k -te i r-te. Uočimo da u nekom koraku eliminiramo nepoznanicu dobivenu izborom vodećeg ele menta iz svih jednadžbi koje nisu korištene u prethodnim koracima eliminacije. Korak po korak dolazimo do jednoredne podrnatrice, tj. do jednog elementa. pa dijeljenjem s njime njegovejednadžbe završavamo postupak. Uočimo da iz dobivenog treba postup no naći rješenje. što sve zajedno ijustriramo jednostavnim primjerom. Naime, zadnju nepoznanicu očitavamo direktno dok prethodne treba izračunati.
3 . SUSTAVI LINEARNIH JEDNADŽBI
74 Primjer 3.3.
elementa:
Riješimo ovaj sustav jednadžbi Gaussovom metodom izbora vodećeg XI 2x I 4x I 2x 1
12 [12 2 -1-1 2: 12] 2 ...!2
+ 2X2 - X3 + 2X4 + 3X2 - X3 + 4X4 + 5X2 - 3X3 + 8X4 + 3X2 - 2x3 + 3X4
=4 = = =
6
6. Kao i u prethodnom primjeru račun ćemo provesti tablično nad proširenom mat ricom sustava B . 4 3 4 : 6 B = [A , bl = 4 5 -3 ®: 3 3 : 6 Element a34 = 8 ima najveću apsolutnu vrijednost, pa pomoću treće jednadžbe elimi niramo X4 iz prve, druge i četvrte. Time dobivamo novu proširenu matricu
O4 O�
O: �O:O
l -! 4
BI =
3 1 " -3 2
! 2 �8 - 8
KD- � O : �
Novi vodeći element tražimo sada izvan trećeg retka i četvrog stupca. Vidimo da � ima najveću apsolutnu vrijednost i da je to element četvrtog retka i drugog stupca. To znači da ćemo se poslužiti četvrtom jednadžbom i eliminirati iz prve i druge jednadžbe, treću preskačemo jer je korištena u prethodnom koraku. Time dobivamo X2
B2 =
3"
2
-9 l 2: 8
2.
1
O I O: O O CD o : 2 ,, 3 5 3 _ 2 O ', 4
I - 3"
±9
8 9
- 3" 2:
3
sljedećem koraku treba precrtati i 4. redak te 3. i 4. stupac. Vidimo daje � sljedeći vodeći element pomoću koga eliminiramo X3 iz prve jednadžbe. To daje
U
8) O O O :
B3 =
1O :', [_l �1 � �O1 i,' =!l : O
I -4 I 2:
3
5
O : -�
�
8 -8
±9
_2 9
Zadnji korak je da prvu jednadžbu podijelimo s B4 =
�
t2 �
3
� 8 -8
-�
4
�
3"
što daje 3 .
2:
�
75
3 . 1 . DIREKTNE METODE
1
1
Koraci natrag su sada sljedeći. Zadnje eliminirana varijabla se nalazi prva, predzadnje eliminirana druga i tako redom. U našem primjeru čitamo da je XI = - l . Iz druge jednadžbe dobivamo X3 kao 3 3 X3 = - + XI , X3 = - - - - = -l. 4 4 4 4 Sljedeća nepoznanica koju računamo je X2 , a računamo ju iz četvrte jednadžbe kao 4 4 7 X 2 = "3 - x I + X3 , X2 = 1 . 9 9 Konačno, iz treće jednadžbe nalazimo X4 , 3 3 5 X4 = - X I - X 2 + X3' g g 2" 2" Prema tome rješenje glasi XI = - l , X2 = l , X3 = -l , X4 = l ili
1
LU (LR) faktorizacija, Choleskyjeva šema
Polazimo od nezavisnog sustava (detA i- O) s n nepoznanica Ax = b. Za potrebe ovog razmatranja označimo komponente vektora b ovako
[:�:��: l . [ . l � � � [1 l
(ll)
b=
an , n + 1
Osnovna misao je da matricu A faktoriziramo A Be i da pri tome izaberemo prik ladno građene matrice B i e . Gaussov algoritam sugerira trokutaste matrice. Stoga pretpostavimo da su B i C oblika bl l O . . . O b2 1 b22 . . O ( 1 2) B= . . . , b 1 b 2 .. : . b n C l 2 Cl 3 . . . Cin O ( 1 3) C = .: l: C2: 3 . . . C2.: n . O O O ... l Dakle B je donje (engl. lower) ili lijevo (engl. left) trokutasta matrica, a e je gornje (engl. upper) ili desno (engl. right) trokutasta matrica, otkuda i potječu pokrate LU (LR) u oznaci faktorizacije. Korist takve faktorizacije je sljedeća. Uvrstimo li A BC u (ll) dobivamo B(Cx) = b =
.
.
.
" o .
=
3. SUSTAVI LINEARNIH JEDNADŽBI
76
pri čemu smo ex stavili u zagradu što smijemo zbog asocijativnosti matričnog mno ženja. Supstitucij om
y = ex By = b
dobivamo sustav
no kako je B donje trokutasta, to lako izračunamo y , koji zatim uvrstimo u ex
= y.
Kako je e gornje trokutasta lako riješimo i taj sustav što je onda rješenje polazno� sustava. Preostaje dakle odrediti elemente matrica B i e . Radi se o ukupno nepoznatih elemenata. Sustav jednadžbi u elemente od B i e dobivamo iz jednakosti A = BC, što po elementima daje n
n aij = Lb ikCkJ> =l k
i = 1 , 2,
. . . , n,
j = 1 , 2,
.
.
.
, n.
( 14)
Vidimo da se radi o kvadratnom sustavu jednadžbi, međutim, sistematskim ispisiva njem tih jednadžbi nameće se šema rješavanja tog sustava koja se naziva Choleskyjeva šema. Prirodno pitanje u ovom trenutku je postojanje rješenja sustava ( 14). Na kraju ćemo navesti teorem koji osigurava postojanje i jedinstvenost rješenja. Napomenimo da postoje i neke druge faktorizacije u što se ovdje ne upuštamo. Uvažimo li nule iz B i e dobivamo ovaj eksplicitni zapis sustava ( 14):
bil = ail , j-l bij = aij - L bikCkj, i � j > 1 , k=l ( 1 5) al j Clj = b , i-l Cij = : (aij - Ll bikCkj), 1 < i < j. = k Vidimo da se prvi stupac od B podudara s prvim stupcem od A . Nakon toga se lako II
..
II
nađe prvi redak od e . Kada imamo prvi redak od e možemo naći drugi stupac od B bi2 = ai2 - bil C12 i = 2, 3, . . Našavši drugi stupac od B možemo izračunati elemente drugog retka od e , tj. .
1 C2j = b22 (a2j - b2lClj ) j = 3, 4,
.
.
.
Zatim nalazimo treći stupac od B, a nakon toga treći redak od e i tako redom. Kako su B i e trokutaste matrice, to kao u Gaussovoj metodi nalazimo
al,n+l y l = -bl l
( 1 6)
77
3. 1 . DIREKTNE METODE
odnosno
Xn = Yn n ( 17) Xi = Yi - L CikXk i n . k=i+ 1 Da iskažemo dovoljan uvjet koji osigurava egzistenciju rješenja sustava ( 14) neka nam Dk označava k rednu determinantu a l l a l2 a lk k = 1, 2, . . . , n ak! an ak koju dobivamo iz matrice A tako da uzmemo elemente na križanju prvih k redaka i prvih k stupaca. Vrijedi: Teorem 3.1 . Neka je A kvadratna matrica reda n i neka je Dk :j:: O za k = 1, 2, . . . , n. Tada matrica A ima jedinstvenu LUJaktorizaciju. Ilustrirajmo postupak sljedećim jednostavnim primjerom. <
k
Primjer 3.4.
3X I + X2 - X 3 + 2X4 = 6 -5X I + Xz + 3X3 - 4X4 = - 12 2x I + X3 - X4 = l XI 5xz + 3X3 - 3X4 = 3. Nađimo elemente matrica B i C koje na kraju glase:
[ -� i g g ]
[� t -t].
2 - :3 2 ,O ' C = O O -tl 1 - !f 6 � OO O i Prvi stupac matrice B podudara se s prvim stupcem matrice A . Zatim redom računamo elemente prvog retka matrice C: 1 2 = 3 ' c l3 - 3 ' Cl4 = 3 ' Slj edeći korak daje drugi stupac od B , tako da imamo bZ2 = b21Cl2 = l - ( - 5 �) �, b32 = a32 - b31 C 1 2 = O 2 � = �, b42 = a42 - b41 Cl2 = - 5 - 31 163 B=
cn
a'!.2
-
_
=
2.
3. SUSTAVI LINEARNIH JEDNADŽBI
78
Sada možemo izračunati drugi redak od e, pa imamo C23 = b: ( a23 bzJc! 3 ) = � (3 - (-5) ( - � )) 2 C24 = b: (a24 b21C14 ) = � ((-4 ) - (-5) Đ 2 Nakon ovoga prelazimo na treći stupac od B . 2 b33 a33 - L b3k Ck3 = 2, b43 = a43 U e
- L= 1 b4k.Ck3 = 6. k
je još preostao element C34 koji iznosi C34 =
Konačno
5 4 - L b3k Ck4 ) = ( a3 b33 4 k=1
Rješenje sustava By rješenje sustava ex X3 = 2 , X4 = 3 .
2
l
b44 = a44
I
k= 1 2
- L=1 b4k Ck4 3
k
5 2
b glasi Y I = 2 , Y 2 = - � , Y 3 Y je rješenje polaznog sustava i
Bunemanova metoda
t , Y4 =
iznosi X I
I
3 . Konačno,
= 1 , X2
=
1,
Pri rješavanju nekih važnih problema nailazimo na "velike sustave" (s velikim brojem nepoznanica, na stotine) linearnih jednadžbi koji su posebno građeni. Iako se ne radi o općim sustavima isti u primjenama predstavlj aju važne slučajeve. U novije vrijeme nađene su izvjesne direktne metode za posebno građene sustave i što je naj važnije u tim su slučajevima te metode superiorne iteracij skim metodama. Jedna od prvih takovih metoda je Bunemanov algoritam iz 1 969. godine. Istaknimo da je zad njih 20-tak godina razvijeno više algoritama (metoda) rješavanja tzv. "velikih sustava" kod kojih je matrica sustava "rijetka" (engl. sparse), tj. ima relativno malo elemenata različitih od nule. Ovdje ukratko opisujemo početni dio Bunemanovog algoritma. Matricu A nazivamo tridijagonalna ako ima oblik O O a a O O O a �: a �� a Z3 A= O " , " . ", O O O . . . O an- l,n-2 an-l,n- l an-I,n O O . . . O an,n-l ann Isto tako zovemo matricu tridijagonalnom ako takav oblik ima u nekom blok zapisu, što ćemo uskoro vidjeti u opisu Bunemanove metode, Takvese matrice pojavljuju kod rješavanja mnogih važnih tehničkih problema.
[
l
3.1. DIREKTNE METODE
79
Radi opće informacije i navikavanja na nešto općenitija razmatranja zarrus1imo da u ovom slučaju promatramo linearan sustav jednadžbi s kompleksnim nepoznanicama. Prema tome, elementi matrice sustava su kompleksni brojevi, komponente vektora su kompleksni brojevi i nepoznanice su kompleksne varijable. Bunemanov algoritam je primjenjiv na linearan sustav jednadžbi Mz = b
koji u blok zapisu izgleda ovako M=
A l O I A I o I A
O I O
O O O ...
O O O
O
( 1 8)
z=
I A I O I A
ln lH b=
( 19)
gdje je I (p x p) jedinična matrica, dok je A (p x p) hermitska (u slučaju realnih elemenata simetrična) tridijagonalna matrica. Time se M sastoji od q blokova po recima i po stupcima (format matrice M je qp x qp), Zi i bi su p-komponentni vektori (podvektori od Z i b koji su qp-komponentni). Građu od M koristimo tako da rekurzivno reduciramo broj nepoznanica, pri čemu dobivamo slično građen sustav s manje nepoznanica. Raspišemo li sustav ( 1 9) po blokovima imamo A ZI + Z2
Zj- l + A zj+zj+ l
Iz triju uzastopnih jednadžbi
= bl = bj Zq- l + A Zq= bq .
j = 2, 3, , q - l .
.
.
Zj-2 + A Zj- 1 + Zj Zj- l + Az} + Zj+ 1 Zj + AZ}+ I + Zj+ 2 = bj+1 , = 2 , 4, . Zj - l Zj+ J '
(20)
(2 1
)
možemo za sve parne j , eliminirati varijable i To provodimo tako da u (21 ) zbrojimo prvu j treću jednadžbu i od njihovog zbroja odbijemo s A pomnoženu drugu jednadžbu. Imamo dakle odbijanje sljedećih jednadžbi .
što daje
.
Zj- 2 + A Zj_ 1 + 2�zj + AZj+ l + zJ+ z = bj- l + bj+ 1 A Zj- J + A 2 zj + A Zj+ J = Abj ,
Prema tome za neparan q sustav ( 19 ) se reducira na 2/-A2 I O I 2/-Az l O I O O O
O O
O O O
(22)
u kome se nalaze samo nepoznanice (podvektori) s parnim indeksom kojih ukupno ima � . Prebacirno li u svakoj drugoj jednadžbi sustava (20) sve parne nepoznanice
3. SUSTAVI LINEARNIH JEDNADŽBI
80
na desnu stranu dobivamo sustav jednadžbi u neparne nepoznanice (kojih ukupno ima ) :
bl
Z2
= b3 - Z 2 = bs Z4
ili u blok zapisu
AZq = bq
[1 ·� fl m O
koji se opet raspada na
(qi 1 )
O podsustava oblika
Z4 Z6
[� ] Zq - I
b l -Z2 b l - 2 -Z4
(23)
bq- zq - 1
k 0, l, . . . , 2l (q - l ) . (24) Uočimo da podsustavi (24) imaju različite desne strane, dok su im lijeve strane jed nake. Prema tome, rješavanje sustava ( 1 9) je svedeno na rješavanje sustava (22) s "polovicom" nepoznanica, a potom sustava (23), odnosno podsustava (24). Nadalje, sustav (22) je građen kao i sustav ( 1 9), umjesto matrice A nalazi se matrica 21 A 2 , tako da sustav (22) možemo ovako zapisati (25) gdje je
[
b l +b3 -A b2 b3+b'j-Ab4
�
bq_2+b -Abq _1
l
'
pa ako je i 'l.:jl neparan, onda se redukcija broja nepoznanica može primijeniti i na (25). Ako je polazni q , označimo ga sada s qo , oblika qo 2k+ 1 - l 2 · 2k - l , onda postupak redukcije možemo ponoviti, jer je broj blokova u (25) jednak 2"+1; 2k l , dakle neparan. U tom slučaju se redukcija može nastaviti dok u (23) ne dođemo do jednog bloka. Polazeći od qo 2k+ 1 - l to se ostvaruje u (k - l) -oj redukcij i. Naime, nakon prve redukcije (23) ima 2k blokova, nakon druge =
l-l
_
=
=
3 . 1 . DIREKTNE METODE
81
redukcije ima 2k- 1 blokova, tako da ćemo nakon n-te redukcije u (23 ) imati 2k-n - 1 blokova, otkuda iz k - n - l O slijedi daje zadnja redukcija bila (k - 1 ) -va. Prema tome nastavljajući opisanu redukcij u dobivamo niz matrica A (r) i vektora blr) prema sljedećem postupku. Oznacv I·mo A ( O) A · b(O) bj , . 1 , 2 , . . . , qo , qO 2k+1 - 1 . Sada za O, 1 , 2, . . . , k - l označimo (i) A (r+l ) 21 - (A (r) ? , (II. . ) bj(r+ l ) -- b2jlr)- 1 + b2j(r+J 1 A (r) b2(r)j . - 1 , 2, . . . , 2k-r - l - qr+1 . Time za svaki r + l , r O, 1 , 2, . . . , k - l dobivamo sustav linearnih jednadžbi =
=
r =
'
J =
=
J
=
=
_
=
,J -
M (r+l ) z (r+l )
=
koji u blok raspisanom obliku glasi A (r+l ) I I A (r+l ) O O O
O I
O O O I A (r+ l ) I O I A (r+ l J
b(r+l )
+ Z (rI l ) +l Z2(r )
(26) ( ,"+I ) bqr+1
l[ l
Rješenje z (r+ l ) tog sustava odmah daje podvektore s parnim indeksima rješenja z ( r) odgovarajućeg sustava jednadžbi M (r) z (r) blr) u r-tom koraku, tj. imamo
[
(J Z2r J Z4(r . ( ;) 1 Zq,_
.
]
=
( +l) Z Ir ( +l Z2r ) , . (r+ 1 ) Zq,+1
_
(27)
dok podvektore s neparnim indeksima od z(r) možemo dobiti rješavanjem sustava A (r) O . . . O O A (r) . . O O A r)
.
g
.� ?
blIr) -Z 2(r) b3lr) -Z2(r) - Z4(r)
() Zq,r
(28)
lr) -.Z (r) bq, q, _ 1
Našavši niz matrica A (r) i vektora bY) , r O, l, . . . , k - l možemo natraške naći konačno rješenje Z zlO) polaznog sustava ( 1 9). Taj postupak izgleda ovako. U početnom koraku određujemo Z (k) zil ) rješenjem sustava jednadžbi (to je sustav (28) redukcijom sveden najedan blok) =
=
=
A ( k) Z (k ) = b(k) = bik) . - 2, . . . , O : +l . - 2k - r - , Z 2j(r) - Zj(r ) , J - , 2 , . . . , qr+ 1 1 , 3, 5 , . . . z ') (r) _ (r) (r) A ( r) Zj(r) bJlr) Zj_ ( Zo( r) = Zq,+1 1 Zj+ P Z = z lO )
Sada za r k - l, k a) uvrstavamo b) za j =
l. l , qr izračunamo vektor j rješavanjem sustava O) . Na kraju imamo rješenje polaznog sustava kao . v
=
_
_
_
_
=
3. SUSTAVI LINEARNIH JEDNADŽBI
82
To je taj početni dio Bunemanove metode, koji nam daje ideju kako izgleda neki moderan algoritam rješavanja specijalnog sustava jednadžbi. Iako opisani al goritam lijepo izgleda2 on ima računske mane. U prvom redu eksplicitno računanje A ( ,+ 1 ) 21 (A (,) ) je vrlo skupo, jer povećanjem r od tridijagonalne matrice A ( O ) A dobivamo ubrzo "gustu" matricu A ( r) koja je "trakasta", a širina njene trake iznosi 2' + l . Trakasta matrica ima oblik *
*
A ==
*
O O ..
,
O
III
O ... O O O O
aij = O za
*
*
li
ji ;;;: III
*
i se zove širina trake. Nadalje, povećanjem r 'postaje skupo i rješavanje sustava b), tj . sustava lr r
Zj - bj ) Zj_( ) l Zj(+r)I '
A ( r) (r)
_
_
_
Sve se te mane mogu otkloniti na način da se izbjegne eksplicitno računanje od A ( rl is koristivši stanoviti prikaz od A kao produkta tridijagonalnih matrica. Taj dio metode izostavljamo,jer smo početnim elementarnim trikovima htjeli pokazati kako u principu izgleda neki moderan algoritam. Onaj tko to zatreba neka se posluži specijaliziranom literaturom. (r)
o upotrebljivosti izračunatog rješenja
Poslužimo li se bilo kojom od prikazanih metoda da nađemo rješenje sustava linearnih jednadžbi Ax b , onda je u većini slučajeva ono što izračunamo stanovita aproksimacij a x točnog rješenja x . Postavlja se pitanje kako ocijeniti točnost od x , tj . kako ocijeniti pogrešku x x . Da bi mjerili pogrešku moramo imati način mjerenja "veličine" vektora. Za to nam služi norma vektora, u oznaci x ll , koja predstavlja poopćenje poznatog pojma apsolutne vrijednosti vektora (drugi Ilkorijen iz sume kvad rata komponenata). Drugim riječima formule koje daju ograde za veličinu Ilx x i i su formule za ocjenu pogreške. Te formule izostavljamo jer zahtij evaju određeno znanje o inverznoj .matrici A.� l ma�rice A . Sad� ćemo prikazati jednu korisnu ocjenu, novijeg datuma, kOJa ne zahtIjeva mkakvo znanje o A Nekaje A (aik ) matrica. S IAI = ( ai I) označavamo matricu čiji su elementi apsolutne vrijednosti elemenata matrice A I. kAnalogno, ako je b = (b l , b2, bn f vektor, onda j b l označava vektor čije su komponente apsolutne vrijednosti kompo nenata od b , tj. Ib l = ( Ib l l, I b21, . , Ibni f . Znak A ::::; B među matricama (ili vektorima) znači da po elementima (komponentama) vrijedi ai ::::; bij . Naravno da ima neuporedivih matrica i vektora, dovoljno je da je nejednakost} narušena na jednom paru elemenata. Promatrajmo sustav linearnih jednadžbi =
-
-
.
=
.
•
"
. .
AoX bo. Ao bo
(29)
primjenama su, iz različitih razloga. i netočni, npr. zbog pogrešaka mjere nja. Prema tome, razumno je prihvatiti približno rješenje x sustava AoX bo kao "ispravno" ako je točno rješenje nekog "okolinski bliskog" sustava jednadžbi U
x
=
Ax
b,
(30)
3.1. DIREKTNE METODE
83
pri čemu to znači da A i b pripadaju skupovima A , odnosno B , definiranim ovako: A E A = {A : lA - Ao I :::;; M}, (3 1 ) b E B = {b : l b - bo l :::;; .:lb}. (3 1 ) znači da A (odnosno b), pripada maloj okolini od Ao (odnosno bo ) u prostoru matrica (odnosno vektora). U tom smislu dokažimo da je istinit sljedeći teorem, nakon čega ćemo komentirati njegovu korist. Teorem 3.2. Neka je M � O i Llb � O te A i B neka su definiralli prema (3J). Pođimo od sustava AoX = bo. Tada su svakom približnom rješenju i sustava AoX = bo pridruženi matrica A E A i vektor b E B za koje vrijedi (32) Ai = b ako i samo akoje (33) I r(i) 1 :::;; M li l + .:lb, gdjeje rei) = bo - Aoi, ostatak za i. Dokaz. Pretpostavimo prvo (32 ), tj. da za neki A E A i b E B vrijedi Ai = b. Tada je A = Ao + oA, pri čemuje l oA I :::;; M b = bo + ob, pri čemu je otkuda slijedi da je I r(i) 1 = I bo - A oi l = l b ob (A - oA)i l = 1 - ob + (oA)i l � l obi + l oA lli l :::;; M li l + I Llb I · Obratno, neka vrijedi (33), tj. I r(i) 1 :::;; M li l + Llb, treba odrediti A i b . Označimo ovako komponente promatranih objekata: rei) = (Pl , P2 , . . . , Pn ) T .:lb + M li l ( f i primijetimo da su svi � O . Nadalje, označimo s oA (obI, ob2 , . · . , obnV , i = ( �I ' �2, . . �n f i definirajmo 0' 1 , 0'2, . ' "
aj
all
"
(34 ) pri čemu, ako je O , onda definiramo da je Pi = O . Iz (33) slijedi da je Pi = O ako je O i daje (35) l p; ! :::;; odnosno I � I :::;; 1, i = 1, 2, ai =
ai
ai
ai,
. . . , 11 .
3. SUSTAVI LINEARNIH JEDNADŽBI
84
Dokažimo da vrijedi
A Ao + SA E A
i
b = bo + Sb E B.
Naime, pogledamo li komponente od
lA Aol = IAo + SA - Aol = I SA I
i
l b bol I Sbl
vidimo da zbog (35) vrijedi
I Sbil = ! : I Abi � Abi' Još je ostalo da provjerimo jednakost A x = b, tj . da je x točno rješenje sustava od 1 , 2, . . . ređenog s A = Ao + SA i b = bo + Sb. Pođimo od Pi = (li Pi , i (Ii I S aiji
! : ! &Iij � &Iij
i
=
Ispišimo ovako lijevu i desnu stranu tih jednakosti n n ai} �j &Ii} l �j l
Pi bi I: Jod
= (Ab; + I: }= 1
�' Abi + I: : &IiJ (sign�jg} j I
Prema tome za
i
n
, n.
) :'l
l
=1 n
-Sbi + I: Saij�j .
=
l , 2,
otkuda dobivamo
...
}= I vrijedi
, n
bi - I: aij�j = -8bi + I: Sai}�j , n
n
}=I
j =1
n
I: (aij + Saijgj = bi + 8b" }= I
tj . vrijedi (32)
Ax b
što je i trebalo dokazati. Istaknimo korisnost dokazanog teorema. On omogućava da dođemo do zak ljučka o prihvatljivosti rješenja iz malešnosti njegovog ostatka. Na primjer, ako sve komponente od i i maju istu relativnu točnost tj . ako je
Ao bo
AA
=
E, !lb = Elbo L
EIAol
onda je uvjet teorema ispunjen ako je
(36) I r (x )1 = I bo Aoil � E(lbol + IA ol lx !), pa iz (36) možemo izračunati najmanji za koji se x može prihvatiti kao upotrebljivo rješenje. Uočimo da je za poznate AA i Ab, te nađeni x , računanje desne strane E
nejednakosti (33) jednostavan posao.
3.2. ITERAClJSKE METODE
Opća linearna iteracija
85
I
Kod iteracijskih metoda polazimo od linearnog sustava jednadžbi Ax = b, det(A ) =fi i nekog početnog vektora x(O) tako da iteracijom oblika
x(k+ 1 ) generiramo niz vektora
=
(X{k) ) ,
°
(1)
k = 0, 1 , 2, . . .
(2)
od koga tražimo da konvergira rješenju sustava (3) x A - l b = lim X(k) . k -+oo Naravno da proizvoljna funkcija
...
k
(5)
Svaki izbor prelaza sa ( l ) na (4) potencijalno daje linearno iteracijsku metodu. Na dalje kažemo daje iteracijska metoda konvergentna ako za svaki početni vektor x(O ) pripadni niz vektora {X(k) } konvergira prema točnom rješenj u sustava x A b . Opišimo jedan dosta općenit prelaz s ( l ) na (4) kojim ćemo se služiti u više daljnjih iteracijskih metoda. Neka je B regularna matrica. Dodavanjem Bx - Bx = jednadžbi ( l ) imamo ekvivalentan s.ustav Bx + (A - B)x = b . Pomnožimo sada s B - l . To daje ekvivalentan sustav oblika (8) x (! - B - IA )x + B - l b,
-I
(6)
°
(7)
(7)
pa uvrstivši
a
=l
(5)
B -lA,
{3
dobivamo (4), odnosno, prema niz vektora X (k+I ) = (! - B -1 A )x + B - l b,
= B- l b
k = 0, 1 , 2, . . .
(9)
( 1 0) Svaki izbor regularne matrice B potencijalno daje, naravno pod određenim uvjetima, konvergentnu iteracijsku metodu. Primijetimo da općenito vrijedi:
3. SUSTAVI LINEARNIH JEDNADŽBI
86
Teorem 3.3. Ako niz {x( k)} dobiven iteracijom (5J konvergira, onda je njegov limes rješenje polaznog sustava (J J. Dokaz. Iz
-oo x(") + (3 -oo (ax(k) + (3) a klim -cc> x(k+ I ) klim klim i lim x(k ) -oo x (k+ I ) = x , slijedi x ax + (3 , tj. x "klim -oo x(k) je rješenje sustava k(4),-ooa kako je kistilim ekvivalentan sustavu (l) to je x lim x( ) rješenje polaznog sustava -oo k (l), tj. x A I b. Prema tome, članovi konvergentnog iteracijskog niza x(O) , x( 1 ) , x(k ) . . . su aproksimacije točnog rješenja sustava ( 1 ) . Ponovimo što znači d a niz vektora {x( k )} konvergira. Neka su Xi( k ) komponente vektora x(k ) , 1 , 2, . . X(k) = [x(Ik) x(k) , . . . , xn(k) ] T Konvergencija niza vektora definira se pomoću konvergencije njihovih komponenata. Dakle vektor x [X I X:! . . . xn] T je limes niza vektora {x( k)} ako i samo ako je lim x(k ) 1 , 2, . . , n. l k -oo Analogno se definira i konvergencija niza matrica {A ( k ) } , Alk ) ( a�k ) ) k 1 , 2, . Tada je matrica A = (aU) limes niza matrica {A ( k )} ako i samo ako je aij kl-.oo i m au , i, } 1 , 2, . . , n. ' =
=
=
=
=
. • . ,
,
,
.
, II
'
•
I =
•
2
=
x =
l
.
,
=
=
.
(k)
,
. o o
=
.
U ovom ponavljanj u smo se ograničiti na kvadratne matrice jer u ovim paragrafima isključivo radimo s kvadratnim matricama. Da naslutimo kada je neka linearna iteracijska metoda (5) konvergentna prove dimo ovako kratko razmatranje. Označimo ovako pogrešku aproksimacije u -tom koraku
k
Pk x(k) - x gdje je s x označeno točno rješenje i za njega vrijedi (4). Imamo dakle ove jednakosti : xlk) ax(k- il + (3 , x ax + (3. Oduzimanjem tih dviju jednakosti dobivamo rekurziju među susjednim pogreškama Pk = x(k) x a[x(k - I ) - xJ apk- h =
iz koje korak po korak nalazimo
{ l l} Pk a"po, k 0, 1, 2, . . . Naravno, X l k ) x ako i samo ako Pk O . Na desnoj strani formule ( l l ) imamo produkt a kpo , pri čemu je PO x(O ) - x zapravo proizvoljan vektor jer je točno rješe nje x danog sustava konstantan vektor x dok x(Ol kod konvergentne metode možemo =
-+
uzeti po volji. Naslućujemo da vrijedi:
-+
3.2. ITERACIJSKE METODE Teorem 3.4.
lim a k = O. k -oo
87
Linearno iteracijska metoda je konvergentlla ako i samo ako je
Dokaz.
U vjet je dovoljan, jer lim a k O povlači prema ( l l ) da je lim Pk = O , k -+ oo k -H.X) dakle x(k ) ---> x = A - \ Pretpostavimo sada obratno da je lim Pk = O za svaki izbor k -oo x ( O) . Iz ( l l ) dobivamo da je O = ( lim ak ) PO i to za svaki Po . Dakle, lim ak je k -+oo k ---t oo operator koji se poništava na svakom vektoru PO kakav je jedino O. Teorem 3.4 nam nije od posebne direktne koristi, no taj teorem kaže, ako znamo kriterij za koje matrice kod te metode vrijedi a k ---> dobili smo kriterij konvergencije metode. Taj ćemo rezultat koristiti u sljedećem paragrafu.
b.
O
Konvergentnost metode i ocjena pogreške
Da izrečemo stanovite teoreme o konvergentnim metodama potrebno je ponoviti nekoliko pojmova. Pođimo od n -redne kvadratne matrice A = Vektor O zovemo svojstvenim vektorom matrice (operatora) A ako postoj i skalar takav da vrijedi ( 12) A =
(aij) . A v ::j:.
v AV.
A
Skalar zovemo svojstvena vrijednost matrice A koja odgovara svojstvenom vek toru Znamo da su svoj stvene vrijednosti korijeni algebarske j ednadžbe det(A / - A) = ( 13) koja se zove karakteristična jednadžba matrice A . U razvijenom zapisu determi nante ( 1 3) izgleda ovako
v.
O
A l , . . . , Am
A -al l -a l 2 - a2 1 A-a22 - an I -a,,2
-a l il -a2n A -allli
= 0.
( 1 4)
Neka su (naj više II različitih) svojstvene vrijednosti od A , tj. korijeni jednadžbe ( 13 ) . Spektralni radijus matrice A se definira kao p(A ) ( l 5) tj. jednak j e najvećoj apsolutnoj vrijednosti svoj stvenih vrijednosti matrice A . Da dokažemo sljedeći teorem potrebno je računati potencije matrice, dakle mat ričnu funkciju I(A) Ak . gdjeje prirodan broj. Kod takvog računanja se služimo Jordanovom formom matrice. To je dijagonaina blok-matrica kojoj se na dijagonali nalaze Jordanovi blokovi koji odgovaraju pojedinim svojstvenim vrijednostima, dakle blok-matrica oblika O ... O J (A2 ) , . . O ( 16) J= ,
nlax{ I AI I, I A21 , . . . , I Am l } ,
[
k
O .
leAd O
O
,'
: : Jm (�m )
l
a svaki Jordanov blok se sastoji od elementarnih Jordanovih klijetki. Naime, svaki Jordanov blok gledan odvojeno je opet dijagonajna blok-matrica, čiji se dijagonaini
88
3, SUSTAVI LINEARNIH J EDNADŽBI
[
blokovi zovu elementarne Jordanove klijetke, Dakle, pojedini Jordanov blok je ovako građen
J( Ai )
pri čemu je Jr(Ai) ili matrica oblika
Jr (Ai )
O O
JJ ( Ai ) O O J2(Ai )
6
6
.-: , J)A, ) '
O Ai O Ai l
O O O O
O O O O O
O Ai O Ai
=
l
,
( 17 )
tj, n a dijagonali ima svojstvenu vrijednost Ai , a n a sporednoj dijagonali jedinice, ili j e to dijagonaina matrica kojoj s e Aj nalazi n a dijagonali , tj, oblika J, (A, )
=
[� �:: ::l.
( 18 )
Osnovni rezultat matrične algebre kaže da j e matrica slična svojoj Jordanovoj formi, tj. postoji regularna matrica T takva da vrijedi ( 1 9) otkuda slijedi da su i cjelobrojne potencije od J , tj, vrijedi
A slične cjelobrojnim potencijama od (20)
pa se računanje potencije Ak svodi na računanje Jk i naknadno množenje s T- I i T , Kako j e J dijagonaina blok-matrica njene cjelobrojne potencije s u opet blok matrice s cjelobrojnim potencijama njenih blokova, tj. vrijedi
[
JI (Adk O O J2 ( Az)k
O
O
J.
Ll
(21 )
tako da trebamo samo znati kako se računaj u cjelobrojne potencije elementarnih Jor danovih klijetki. Ako je klijetka dijagonalan blok, onda znamo da je potencija opet dijagonaina čija se dijagonala sastoji od potencija dijagonalnih elemenata. Kako je s potencijom klijetke koja na gornjoj sporednoj dijagonali ima jedinice? Ovdje ćemo napisati gotov rezultat koji ovako izgleda. Neka je Jr(Aj) II -redna i želimo ispisati
3.2. ITERACIJSKE M ETODE Jr ()..; )k
za
89
k � ll . Tada je
n 2) k (k- I ) ... (k-n + A'k-( - l ) (n- l ) ! k(k- I ) ... (k-n+ 3 ) k - (n-Z) A' (n-l) !
k k- I ) k- 2 A, A,k U,k - I ( Z! kk U, I A,
O
O O O O
O O
U,k - l A,k
A,k
O
k
(22)
drugim riječima, duž dijagonale imamo -te potencije, a na sporednim gornjim dijago k-(n- l ) nalama imamo jednake članove sa sve nižim potencijama, dok ne dođemo do A; u poziciji Kako ć e na!f1a trebati samo limes takvih potencija kada -+ oo to smo ispustili potencije < Citatelj može pogledati i neku drugu knjigu ako mu treba detaljnija informacija. Isto tako čitatelj može pokušati potencirati 3-rednu Jordanovu klijetku, pa će ubrzo osjetiti kako se računaju elementi iznad dijagonale. Nas zanima kada će limes pojedinih elemenata biti nula, tj . kada je lim Jr(A; )k =
(1 , n) .
k
n.
k
O.
� oo
Za ilustraciju pogledajmo kada je · - l)
. . . (k - n + 2) O (Il - l ) ! ' tj. limes člana u poziciji (l, n) . Faktor k(k - 1) . . . (k - n + 2) raste neograničeno kada k Da bi limes bio nula nužno je da O za k No, to je onda i samo onda ako je < l . Taj je uvjet i dovoljan da bude . k(k l ) . . . (k - n + 2) O hm (n - l ) ! jer se prvi faktor ponaša kao (Il - l ) -va potencija od k dok je drugi faktor eksponen I lm k�oo
-+ oo .
k(k
1 k-(n - I ) A· -
A/ -+
lAd
-+ oo .
1 k- in- l ) A;
-
_
k � oo
,
cijaina funkcija. Tako smo ovim razmatranjem dokazali ovaj teorem. Teorem 3.5. Niz matrica {A k } kOllvergira p(A) < l (p(A ) je spektralni radijus od A ).
k nul matrici ako i salllo ako je
U teoremu 3.4 smo vidjeli da � linearno iteracijska metoda
f3
( ) ) X k+ l = ax(k + lim a k = Povežemo k - oo
O.
konvergentna ako i samo ako je li to s prethodnim teoremom dobivamo nuždan i dovoljan uvjet konvergencije linearno iteracijske metode koji onda glasi : Teorem 3.6.
Linearno iteracijska metoda
) k) X(k+ l = ax(
je konvergentna ako i samo ako je p(
a)
< l.
+
f3
Do sada smo se sreli s pojmom duljine ili norme vektora koja je bila drugi kori jen iz sume kvadrata njegovih komponenata. Taj ćemo pojam poopćiti i dalje kratko zvati norma vektora, a poslužit će nam u formulaciji dovoljnog uvjeta konvergencije linearno iteracijske metode.
90
3. SUSTAVI LINEARNIH JEDNADŽBI
Il v ll
Definicija 3.1 . Norma vektora je nenegativna realna funkcija na vektorskom prostoru koja zadovoljava sljedeće uvjete: a) O za svaki =I- O , (pozitivnost) b) , gdjeje apsolutna vrijednost skalara (homogenost) = nakost a). c) + (nejed trokut + �
v l v ii > lA I I A v l1 l A III v ii u l u v ii Il ll Il v ll '
A,
v
Evo nekoliko uobičajenih normi vektora. Neka je = [V l V2 ' " vnf . = max Maksimum norma:
Il v l l oo
Apsolutna norma:
(23)
Il v l h = L i v; ! n
•
Euklidska norma:
n
I v; !
l
(24)
;=1
1 /2 II v l12 = (L I v; ! 2 )
( = L Iv !P n
lp norma: Il v li p ; ) ;=1 Iz (26) dobivamo (24) i (25) za p = l , odnosno p = 2 . daje (23) što pojašnjava oznaku maksimum norme. Za svaku normu vrijedi
(25)
;= 1
l /p
Ako
(26)
p
---> oo ,
onda (26)
li u - v ii � I ll u l l - ll v ll l
(27) gdje vanjske vertikalne crte znače uobičajenu apsolutnu vrijednost (modul) realnog broja. Iz zapisa u uvjetu b) i nejednakosti (27) je jasno zašto se za oznaku norme uvodi znak s dvije vertikalne crte Lako se uvjerimo u točnost nejednakosti (27). Naime iz c) imamo + = + � pa je prema tome
II . Il u ll II (u - v) u li li u - v ii Il v ll , li u - v ii � Il u ll - ll v ll· Zamijenirno l i uloge od u i v i upotrijebimo b ) imamo li u - v ii = li v - u li � Il v l l - ll u ll , pa iz dobivenih dviju nejednakosti slijedi (27) . Među normama vektora I I . II I , II . 112 i I I . 1100 vrijede ove nejednakosti Il v ll oo � Il v iii � n ll v ll oo Il v lloo � II v l 12 � vnll v ll oo l Il v ii i � I Iv l1 2 � li v ii i ' ;;: vn
(28) (29)
(30)
Označimo sa M(n, n) skup n -rednih kvadratnih matrica. Kako svaku n x n matricu možemo shvatiti kao -komponentni vektor to vidimo da se pojam norme vektora može proširiti i na matrice, no uzet ćemo u obzir i množenje matrica pa imamo sljedeću definiciju.
n2
3.Z. ITERACIJSKE METODE
91
Definicija 3.2. Norma matrice je nenegativna realna funkcija na M(n, n) koja zadovoljava sljedeće uvjete: a) I lA I I > O za svaku A f. O ( pozitivnost) b) I I ).A I I = 1). I I IA I I , gdjeje 1). 1 apsolutna vrijednost skalara ). (homogenost) c) I lA + Bi l � I IA I I + I IBI I (nejednakost trokuta) d ) I lA B I l � l IA I I I IB I l (submu 1tiplikativnost)
U općim razmatranjima se I I . I I koja zadovoljava samo a), b) i c) zove opća norma matrice, a norma koja zadovoljava i d) zove submultiplikativna norma matrice. (Ako u d) vrijedi jednakost, onda se zove multiplikativna norma matrice.) Mi trebamo submultiplikativne norme matrica. Navodimo nekoliko uobičajenih normi matrica Redna nonna:
I IA l l r = maI x
2: laij l n
2: laij l n
l IA I I, = max
Stupčana nonna:
J
Euklidska norma:
I IA I 1 2 =
Maksimum norma:
(31)
j=1
;=1
(3Z)
1/2 2: laij f) (2: j= l i=1
(33)
= max lau l
(34)
I IA I LXl
n
n
lJ
Istaknimo da maksimum norma (34) nije submu1tiplikativna. ne zadovoljava uvjet d), pa j e time primjer opće norme matrice. Nadalje, norma (33) se u nekim knjigama zove Seh urova norma, a u nekim Schmidtova norma.
.
[ ]
I O i mamo: Primjer 3.5. Za A = I IA l l r = max { 1 , 4} = 4 ; I IA I I, Z z max {3, 2 } 3 ; I IA I I2 = v1 + 4 + 4 3 ; i lA 1 100 = max { 0, 1 , 2 } = 2 . Sada kada smo ponovili pojmove norme vektora i norme matrica, možemo ekvi valentno pomoću norme opisati konvergenciju niza vektora, odnosno, matrica. (U 2. 1 smo opisali konvergencije pomoću komponenata vektora, odnosno, elemenata matri ea.) Kažemo da niz vektora X( k ) konvergira vektoru a ako i samo ako I lx( k ) - a l l O kada oo . Slično, niz matrica A ( k) konvergira matrici A ako i samo ako oo . I IA (k ) - A I I - O kada Dokažimo sada sljedeći jednostavan i za nas koristan teorem.
k-
-
k-
3. SUSTAVI LINEARNIH JEDNADŽBI
92
Teorem 3.7. Ako je bilo koja submultiplikativna nonna matrice A manja odjedi nice, onda niz potencija {Ak} konvergira k nul matrici ( lim k -co Ak = O ). Dokaz. Kako vrijedi IlAk - 01 1 = IIAk ll = IIAAk-111 � IIA II IIAk - 1 11 � . . . � IIA W i kako je po pretpostavci I lA II < l to imamo da IlA k II O za k Iz konvergen
IlAk II
Ak
-+
-+ oo .
cije niza normi zaključujemo da niz konvergira, a iz toga da je limes niza normi nula zaključujemo da je limes nul matrica (uvjet a) definicije norme matrice), dakle lim O.
_co Ak3.7= zajedno s teorernom 3.4 daje nam dovoljan uvjet konvergencije line kTeorem
arno iteracijske metode što izričemo kao sljedeći teorem. . Teorem 3.B.
Lineamo iteracijska metoda
x(k+ 1 ) = ax(k) + f3
je konvergentna ako je bilo koja submultiplikativna norma matrice a manja od 1. Teoremi 3.5 i 3.7 nam omogućavaju da povežemo submultiplikativne norme ma trica s njeni m spektraInim radijusom. Vrijedi sljedeći teorem, koji u kombinaciji s teoremom 3.6 daje teorem 3.8. Teorem 3.9. Spektralni radijus p(A ) matrice A nije. veći od bilo koje njene sub multiplikativne nonne.
Dokaz. Neka je E > O . i II . II proizvoljna submultiplikativna norma matrice, i matricu B ovako: A neka matrica. Pomoću A definirajmo B = IIA IIl + E A . Sada je prema uvjetu b) definicije 3.2 II B II = I IIA l t+ E I IIA l i = IIA l t+ E I lA li iz čega slijedi da je II B II < l . Teorem 3.7 stoga povlači da j e lim Bk = O . Iz k-oc> teorema 3.5 zaključujemo da je p(B) < l , tj . apsolutna vrijednost svake svojstvene vrijednosti od B je manja od 1. Ako je Ai svojstvena vrijednost matrice A , onda Je " Afr+E svojstvena vrijednost matrice B, jer iz det(A;I - A ) = O slijedi da je ( služeći se Binet-Cauchyjevim teoremom) det ( IIA l t+ /(A;l - A ) ) = O, l jer je det ( " , t / ) = (lI II E r =j:. O . Nakon množenja imamo A+ A+ ( Ai / - l E A ) = det ( Ai - B) = 0. det IIA II + IIA II + IIA II + /
3.2. ITERACIJS KE M ETODE
93
I I AliH I
l,
I Ail I IA II +
Prema rečenom vrijedi < f i to za svaki E > O , pa < odnosno je dakle � Da ocijenirno pogrešku linearno iteracijske metode uvest ćemo dodatni uvjet na konzistentna normu matrice. Kažemo da je submultiplikativna norma matrice ( suglasna) s normom vektora ako vrijedi za sve i � Npr. redna norma matrice j e konzistentna s maksimum normom vektora, stupčana norma matrice s apsolutnom normom vektora i euklidska norma matrice s euklidskom normom vektora. Provedi mo sada ovakvo opće razmatranje. Pođimo od dviju susjednih aproksi i macija � l , dobivenih linearnom iteracijom (J . Tada za � možemo pisati
p (A) IIA I I .
II . l iv lIAx l Iv ! lA II ! Ix l iv
II . I I
x
A.
X(k- I ) X(k) k ,
X(k) ax(k- I) + p l p k x( + ) X(k) (X(k+ l ) X (k) ) + (X( k+2) X(k+ l» ) + . . . + (x1k+p) _ X(k+P- l» ) tako da višestrukom primjenom nejednakosti trokuta vrijedi Ilx (k+p ) _x(k) 1 1 � Ilx(k+ I ) _x(k) 1 1 + Ilx(k+2) x( k+ ' ) 1 1 + . . . + Ilx( k+p) _x( k+p - I ) I I . (35) _
=
Nadalje vrijedi
x {m+ l ) _ x( m) ( ax(m) + (J) ( ax(m- I ) + (J ) a (x( m) _ x( m- l l ), =
=
tako da za konzistentne norme matrica i vektora dobivamo sljedeću nejednakost (kori stimo istu oznaku za obje norme)
(36) I Ix(m+l ) _ x(m) II IIa (x(m) _ x( m- l l ) 1 I � lIal l llx(m) - x( m - I ) II. Iteriramo li (36) dobivamo za > k � l (37) ! lx( m+ l ) x(m )!! Ilall m- k l lx(k+ l ) _ X {k) !!. Time nejednakost (35) poprima ovaj oblik I Ix (p+k) -x(k) 11 � I Ix(k+ ' ) -x(k)!!+ ! ! a !! IIx(k+ l ) -x(k) ! ! + . . . +!! a W- 1 !!X ( k+ l ) _x(kl!! l ( l + lIall + . . . + IlaW- 1 ) lIx ( k+ ) - x(k ) 1 1 l Ila W I Ix (k+ I ) x(k) lI . l - Ila !! (38) Pretpostavimo l i ! ! all < l dobivamo sljedeću nej ednakost (39) Ilx(P+k) - X (k) !! �'" 1 - l!! all I Ix (k+ ') _ X(k) I I . Ako onda X(p+k ) x točnom rješenju, tako da smo dobili ovu ocjenu pogreške: l k+ l a ! !X ( ) m
=
=
P --+ oo ,
ili konačno
--+
(40)
94
3. SUSTAVI LINEARNIH JEDNADŽBI
Ako je
Ilall 2l ' <
Ilall l - Ilall , pa (40) poprima jednostavan oblik Ilx _ x(k) 1 1 � Ilx( k) _ x( k- l ) 11 što j e jednostavno građena formula, jer ocjenu pogreške računamo iz posljednjih dviju aproksimacija. To znači, ako je (uz Ilall � ! ) I lx (k) - x(k- l ) 11 E , onda je i pogreška manja od E , tj. vrijedi I lx - x(k) 11 < E . onda je
<
<
Iz (40) čitamo sljedeće. Ako ustanovimo da vrijedi
Ilx( k) _ x(k- I)11 � onda je
l
��II� " E'
Ilall
<
l,
I lx _ x(k) 11 = E.
Iz formule (40) dobivamo postupno sljedeću nejednakost
W Ilx ( l ) - x(O) II . Ilx - x(k) 11 � l Ila - Ilal l Napose, ako smo uzeli x( O ) = 13 onda je x( i ) = af3 + 13 , tako da je Ilx ( l ) - x(O) 11 = Ilaf3 + 13 - 13 11 = Ilaf3ll � Ilall llf3ll· U tom slučaju ocjena pogreške (40) poprima ovaj oblik ! Ilx - x( k) 1 1 � lIla- W+ llall 1 113 1 1 .
(41 )
,
(42)
Iz (42) možemo izračunati broj koraka potrebnih da postignemo zadanu točnost. Naime iz
Ila W+ l llf3ll � E l - llall
slijedi
Ilall k+ 1 � 11; 11 (1 - llall ) otkuda možemo ocijeniti najmanji k za koji vrijedi (42). Vratimo se sada lineamoj iteraciji uvedenoj formulom (10) i pitajmo se koji iz bori matrice B daju korisniju metodu. Općenito možemo reći da korisniju metodu dobivamo ako B bolje udovoljava ovim uvjetima: (i) da se sustav Bx( k+ l ) + (A - B)x( k ) = b lako riješi u x( k+ l ) ; (ii) da su svojstvene vrijednosti od a = I - B -lA po apsolutnoj vrijednosti (modulu) što je moguće manje.
3.2. ITERACIJSKE METODE
95
Na kraju ovog paragrafa navedimo sljedeći standardni sustav matrice A , sustava jednadžbi Ax = b kojim ćemo se poslužiti pri izboru matrice B u sljedećih nekoliko paragrafa. Napišimo A kao A = D- E-F gdje su a, a, D=
[� � �] O ann ... O ... O
O
��
F= i pretpostavimo da je
_
]
(44)
(45) (46)
i = 1 , 2, . . . , n .
a ;; i- O,
Jacobijeva metoda iteracije
�
a �l O a 1 2 . . . a ln O O ann O O O
(43)
I
Polazimo od sustava Ax = b, det A i- O, a;; i- O, i = 1 , 2, . . , n . Ako u rastavu izaberemo B = D dobivamo Jacobijevu metodu iteracije. Sada je .
(43)
(47)
(48)
Kako je D dijagonaIna i a;; i- O , i = 1 , 2, . . . , n , to je D regularna i njena inverzna 1 . matrica je također dijagonaIna čiji su elementi - , tj . a;;
D- l =
al 1 O
O
O
O O
a 22
(49)
O
ann tako da lako izračunamo elemente matrice a i komponente vektora f3 . Uzmimo da je i- j i pomnoži mo u mislima i -ti redak od D - l s j -tim stupcem od A . Odbivši to od j) -tog elementa od I dobivamo a aij = O - -aij = - -'!.. , i i- j. a;; a;;
i (i,
l
(50)
3. SUSTAVI LINEARNIH JEDNADŽBI
96
j,
i
i
Ako je i = onda rezultat množenja -tog retka od D - l s -tim stupcem od A odbijanja od jedinice iz I daje
l - au = O. au tJ Komponente vektora su očigledno jednake l
. R /J I
_ -
bi
(5 1 )
(52)
•
au Prema tome, Jacobijeva iteracija izgleda ovako x (k + l ) ax (k) + tJ,
k
=
O, 1 , 2, . . . gdje su elementi od a i tJ dani sa (50), (5 1 ) i (52). U razvijenom obliku to izgleda ovako i = 1 , 2, . .
.
(53)
, n.
(54)
i
Drugi put izvoda formula (54) bi bio da iz -te jednadžbe sustava (47 ) direktno izračunamo nepoznanicu Xi što bi dalo
Xi
bi
i
=
1 , 2, . . . , II
(55)
iz čega direktno dobivamo (54 ) . Što s e tiče početnog vektora xW) uobičajeno je uzeti x (O) tJ , jer ga jednostavno već znamo. Da bi niz (53) konvergirao nužno je i dovoljno prema teoremu 3.6 iz 2.2 da je spektralni radijus matrice a manji od 1 . Dovoljan uvjet konvergencije je prema teoremu 3.8 da je bilo koja submultiplikativna norma matrice a manja od 1 . Primjeri sustava za koje konvergira Jacobijeva metoda iteracije s u tzv. dijagonalno dominantni sustavi. Sustav (47) Ax = b je dijagonalno dominantan ako vrijedi
n
l au l
> L l au l , i j= l jii
=
1 , 2, . . . ) II
(56)
Da u tim slučajevima dokažemo konvergenciju Jacobijeve metode pokažimo da je redna norma pripadne matrice a manj a od L Prema (50) i (5 1 ) imamo all O
za za
i =f:-j j
3.2. lTERACl1SKE METODE
97
pa je pripadna redna norma jednaka n
max '" lalj l , L..J j=1
n
n
= ma, x L..J "'I aalj 1 II
i= 1
Ni
l m x l alj l < l t l au l L: }=Ii N
(56). Teorem 3.8 povlači konvergentnost Jaco (47) provedemo supstituciju = Cjzj, Cj ::f 0, i = 1, . (57)
pri čemu zadnja nejednakost slijedi iz bijeve metode u tom slučaju. Primijetimo sljedeće. Ako u sustavu xi dobit ćemo sustav
. . , n
(58) gdje je a:j = a ijCj . Sada vidimo da vrijedi sljedeće. Promatrana metoda za sustav (47) konvergira ako i samo ako konvergira za sustav (58). Ta tvrdnja slijedi direktno iz ' (k) zi ako . samo ako (k) • l 2 (57) , Jer A'z
Zj
---';
Xj
1
b,
---'; ejZj , J
. . . , II .
"
OVU primjedbu ćemo iskoristiti ovako. Za gore uvedeni pojam dijagonalno do minantnog sustava mogli bi reći da je dijagonalno dominantan po recima. Što ako vrijedi n
i 1, 2,
lajj I > L: l a lj\, i=l ih
. .
.
(59)
, n,
(59)
da li i tada konvergira Jacobijeva metoda? Za sustav koji zadovoljava mogli bi reći da j e dijagonalno dominantan po stupcima. Pokažimo sljedeće: Jacobijeva metoda konvergira za sustav dijagonalno dominantan po stupcima. Poslužit ćemo se supstitucijom u kojoj odabiremo
(57) l i = 1, 2, Elementi matrice A ' pripadnog sustava (58) s u sada jednaki a lj , =, i,i = 1, 2, ajj . . . , n.
ai}
. . . , n.
Pređemo li na Jacobijevu iteraciju za taj novi sustav dobivamo
z = a 'z + f)'
gdje je
a; �
{
_
� aJ]
1
O
za za
i ::f i i =j
(60) (61 ) (62) (63)
Izračunamo li stupčanu normu od a' dobivamo zbog (59)
3. SUSTAVI LINEARNIH JEDNADŽBI
98
čime smo dokaz proveli. Dakle, Jacobijeva metoda iteracije je konvergent1Ul I l a / l is = L I a;; I j=1 ji;
nantne bilo po retcima bilo po stupcima.
za
sustave dijagonalno domi
Polazimo ponovo od sustava jednadžbi Ax b, detA =I O i u standardnom rastavu A = D - E F izabiremo B = D - E. Sada je prema (9) Gauss - Seidelova metoda iteracije
I
(65)
(64)
(66)
a pripadni se iteracij ski postupak (67) X( k+ I ) = (D - E) - I FX(k) + (D - E) - I b zove Gauss - Seidelova metoda iteracije. Da nađemo zapis Gauss Seidelove iteracije u razvijenom obliku postupimo ovako. Nećemo računati (D - E) - l nego ćemo se poslužiti sa (7) tj . polazimo od Bx(k+l ) + (A B)X(k) = b (68) što uvrštavanjem B D E poprima oblik (D - E)X(k+l ) FX(k) = b ili (D E)X(k+l ) = FX(k) + b. (69) Matrica D - E je donja trokutasta i jednaka je al l O . . . O a21 a22 O D E= : " . . an : . : : an� pa (69) lako raspišemo i taj zapis glasi ; n (70) L a;jxj*+l) = - L a i;xj *l + bi, i = 1, 2, j=i+ 1 }= I Zapišemo li prvo zadnji pribrojnik lijeve strane imamo a =I fJ
B - lA = I (D - E) - I b, -
CD - E)- I (D
[
E - F) = (D
]
E)-l F,
)
. . . , ll.
i- I aiix;k+l) + L aijxjk+IJ .i= 1
n L a;;xy' + b;, . i = l , 2, j=i+ 1
. . .
, II
99
3.2. ITERAClJSKE METODE
što nakon prenošenja drugog pribrojnika na desnu stranu i dijeljenja s aii daje ovaj krajnji zapis
i- I n a aij (k+ I ) - L bi ij (k) Xi(k+ I ) - -· · - L -X a/I· j , a/I j= 1 a/I j j=i+ 1 -X _
Ako
i = 1 , 2, . . . , n.
(71 )
(71) raspišemo po indeksu i dobivamo
(72) xn(k+ I ) = � ann
_
n- I
"" �
anj x (k+ I ) ann j= 1 J
•
Usporedimo li Gauss - Seidelovu iteraciju s Jacobijevom možemo reći da je na stala iz Jacobijeve tako da prilikom računanja nove aproksimacije nepoznanice Xi u iteracijski korak uvrstimo nove aproksimacije prethodnih nepoznanica XI , X2 , . . . , Xi- I , dok za daljnje nepoznanice Xi+1 , Xi+2 , . . . , Xn uvrštavamo prethodne aproksi macije. Još se ponekad kaže da je Jacobijeva metoda totalno koračna dok se za Gauss - Seidel ovu kaže da je jedno koračna. Prirodno je pitanje usporedba Jacobijeve i Gauss - Seidel ove metode. Obično Gauss - Seidel ova metoda ubrzava konvergenciju iako vodi na opsežnije računanje. Isto tako, ako jedna metoda konvergira ne znači da i druga i obratno, čak su mogući slučajevi da Gauss - Seidelova iteracija konvergira sporije od Jacobijeve. Dok smo kod Jacobijeve metode veoma lako utvrdili da konvergira za po recima dijagonalno dominantne sustave to je za Gauss - Seidelovu metodu nešto složenije no ipak vrijedi:
Ako je sustav Ax = b dijagoIlalno dominantan po recima, tj. ako vrijedi ' n i L a l d> l aijl 1 = j i N
i = 1, 2, . . . , n,
ondaje Gauss - Seidelova metoda konvergentna.
Drugi važan slučaj sustava za koje konvergira Gauss - Seidelova iteracija su tzv. pozitivno definitni sustavi. Za sustav
Ax = b
3. SUSTAVI LINEARNIH JEDNADŽBI
100
kažemo da je pozitivno definitan ako je A simetrična matrica, A == A T (transponirana matrica), i ako je matrici A pridružena kvadratna forma (polinom 2. stupnja)
.
U(Xh . . , xn )
==
x TAx = a ll xi + a22X � + . . . + annX;
U(X l '
+ 2al2X 1X2 + 2a1 3X1X3 + . . . + 2an- l ,nXn- IXn
pozitivno definitna. Daje . . . , xn ) pozitivno definitna znači daje U(X l ' . . . , xn ) > O osim za Xl = Xz = . , . = Xn O kada poprima vrijednost nula. Navedimo neke činjenice o pozitivno definitnim matricama. za kvadratnu matricu A imamo uvijek definirane glavne podmatrice reda 2, . kao
Ai
[�:: :1: • �:: } , . .
ai! aa . . . aji
1, . . , n 1, n
i
=
l , 2, . . .
, n.
Glavne minore su subdeterminante kod kojih j e dijagonala sastavljena od elemenata dijagonale od A . Npr. jednoredne glavne minore su dijagonaIni elementi matrice A . Kriterij pozitivne definitnosti glasi ovako:
Teorem 3.1 0.
A je pozitivIlo definitna ako i samo ako je det(A;) > O za i = l , 2, . . . , n
Navedimo i ova svojstva pozitivno definitnih matrica. (i) Ako je A pozitivno definitna onda postoji A- l koja je također pozitivno definitna. (ii) Sve glavne podmatrice su pozitivno definitne. (iii) Sve glavne minore su pozitivne. Iz (iii) vidimo da su svi dijagonaIni elementi pozitivno definitne matrice pozitivni. Dakle, za pozitivno definitne sustave vrijedi: Ax = b
Ako je sustav definitan onda za njega konvergira Gauss - SeMelova metoda iteracije.
pozitivno
Ta tvrdnja je poseban slučaj Teorema 3. 1 1 . Na prvi pogled može izgledati da je gornja tvrdnja o konvergenciji Gauss-Sei delove metode za pozitivno definitne sustave ograničenog dometa. Međutim, svaki sustav Ax = b, det A -:/ O ekvivalentan je sustavu (73) koj i je pozitivno definitan. Da j e sustav (73) pozitivno definitan dosta se lako dokazuje. Iz
(A TA) T
A TA
3.2. ITERACIJSKE METODE
101
čitamo odmah da je matrica sustava (73) simetrična. Ispišemo li pripadnu kvadratnu formu za A TA imamo
(
U X I ' X 2 , . . . , xn
)=
=
2: 2: 2: n
n
n
i=1
j=1
k=1
n
n
n
2: 2: 2: k=1
akiX iakjXj
i= 1 j=1
2: ( 2: 2: ) n
=
aki akjXiXj
n
n
akiX i
k=1
akjxj
.
j=1
i= 1
Kako vrijednost sume ne ovisi o oznaci indeksa sumacije to imamo U (X 1 , X2, . · . , Xn )
= 2: (2: n
k= 1
n
akix i
i=1
)
2
�O
jer je suma kvadrata nenegativna. No, suma kvadrata je nula ako i samo ako su svi pribrojnici nula, tj.
2: n
i=1
što u matričnom zapisu daje
akiXi
= O, k = 1 , 2,
. . . , II
Ax = O.
Vidimo da smo dobili homogen sustav pridružen sustavu Ax = b. Zbog det A =I- O homogen sustav ima samo trivijalno rješenje iz čega slijedi da je kvadratn:yforma sustava (73) pozitivno definitna, odnosno, da je sustav (73) pozitivno defini tan. Spomenimo da će za pozitivno definitne sustave konvergirati SGR metoda čiji je poseban slučaj Gauss-Seidelova metoda. S druge strane opet vidimo da se, teorijski gledano, svaki sustav može rješavati Gauss-Seidelovom metodom prelaskom na sustav (73) koji ima isto rješenje. Taj prelaz svakako uključuje množenje s A T što je dodatno računanje. Rješavanje sustava linearnih jednadžbi iteracijskim metodama kao što su Jaco bijeva i Gauss-Seidelova metoda ponekad se zove relaksacija. Smisao tog naziva dolazi odatle što se pogreška početne aproksimacije postupno smanjuje ili relaksira nastavkom računanja. Gauss-Seidelova metoda i SGR metoda uvelike se koriste pri likom aproksimacije rješenja parcijalnih diferencijainih jednadžbi metodom konačnih diferencija i u drugim problemima. U sljedećem paragrafu je prikazana jedna vrlo jednostavna metoda relaksacije. Metoda relaksacije
I
Promatramo ponovo sustav linearnih jednadžbi Ax = b, det A =I- O i prevedirno ga u oblik 0 = -Ax + b.
(74) (75)
3. SUSTAVI LINEARNIH JEDNADŽBI
102
Ako u (75) uvrstimo neku aproksimaciju x(k ) točnog rješenja x lijevoj strani nećemo dobiti O nego neki ostatak ,(k ) , tj. imamo
= A - l b , onda na
,(k ) = -Ax(k ) + b,
(76)
koji ostatak možemo smatrati mjerom koliko dobro X(k ) zadovoljava sustav jednadžbi (74). Ako su komponente od ,( k ) malene, onda x(k ) gotovo da zadovoljava sustav jednadžbi (74). Metoda relaksacije se sastoji u tome da postupno smanjujemo kom ponente od ,(k ) Primijetimo sljedeće. Pomnožirno Ii (76) s A - I slijeva dobivamo •
(77) Kako je A - l b točno rješenje sustava (74), to desna strana jednakosti (77) preds tavlja pogrešku aproksimacije, jer je to razlika između točnog rješenja x = A - I b i aproksimacije x( k ) . Promatramo li lijevu stranu od (77) vidimo da je ona produkt A- I ,(k ) koji može imati velike komponente iako ,( k ) ima male komponente. Pokušajmo to ilustrirati grafički. Zamislimo da rješavamo sustav dvije jednadžbe s dvije nepoznanice. Grafič ki gledano tražimo koordinate sjecišta dvaju pravaca. Zamislimo situaciju ilustriranu sljedećom slikom: •
Sl. 3.1.
Na slici je x njihovo sjecište, dakle točno rješenje sustava. Ako je X (k ) aproksi macija kao na slici, onda će x(k ) gotovo zadovoljavati obje jednadžbe, jer je X(k ) blizu i jednog i drugog pravca, tj. komponente od ,( k) su malene. Međutim, pogreška je velika jer je predstavljena vektorom (crtkano) koji spaja x i X(k ) . Kada bi kut između tih pravaca bio veći uz isto sjecište za istu aproksimaciju X(k ) bi ,( k ) imao veće komponente i smatrali bi ga slabom aproksimacijom. Vidimo da to ovisi o proma tranom sustavu jednadžbi = b ili kratko rečeno o matrici A . Pojava koju smo ilustrirali gornjom slikom događa se kod tzv. nestabilnih ili slabo uvjetovanih sustava (engl. a to su oni kod kojih je detA malena u usporedbi s elementima au matrice A . Tada male promjene elemenata (npr. izazvane zaokruživa njem) mogu izazvati velike promjene rješenja. Iako je tako, relaksacijske metode se , pa se tako koriste zbog jednostavnog računanja. Često se koriste da se poboljša poboljšana početna aproksimacija iskoristi u drugoj metodi.
x,
Ax ill-conditioned systems),
x(O)
3.2. ITERACJJSKE M ETODE
103
Ovdje opisujemo jedan jednostavan postupak relaksacije. Prevedi mo sustav u oblik odnosno
x = ax + /3
,
- x + ax + /3
O
gdje su kao i kod Jacobijeve metode
a, = f.I. _ JJ I -
{bi
a ;;
U razvijenom obliku sustav
O
za
::
za
i f:. j, i j, i,j = 1, 2, . . 1, 2, . .
.
.
(74) (78)
, n
, n.
(78) izgleda ovako:
+ al2x2 + a l3x3 + . . . + al nXn + /31 = O -X I + a23X3 + . . . + a2nXn + /32 = O -X2 + a2l X I
(79)
+ /3 = O. n
Neka j e dobivamo
X(O) = [x\O)xiO) . , . x�O)J T početna aproksimacija. Uvrstimo li X{O) u (78)
ili u razvijenom obliku
n
,�O) -x\O) + L aljxjO) + /31 F= I n
;
, 0)
,(0)
n
-x;O) + L aSjx;O > + /3s j=1 n
= _Xn(O) + � L....,. anj.Xj(O ) + j= l
xiO)
(80)
fl JJn
ox�O) ,
(80) i f:.
Ako sada aproksimaciji s -te komponente dodamo prirast onda iz vidimo da će se odgovarajući ,1°) smanjiti za dok će se svi ostali ,)0) s, povećati za Prema tome, da postignemo ,� l ) O , dovoljno je izabrati prirast
aisox�O)
jer iz
(80) slijedi
ox�O)
,
•
l1x(O)
u
s
=
,(0) .'ti
n
0 = -(x(O) + ,(OJ ) + � L....,. aSjx(jO ) + s
s
(8l )
'
j=1
fl JJs ,
104
3. SUSTAVI LINEARNIH JEDNADŽBI
rf\ ) promijeniti i iznositi (82) d l ) = dO) + riO) , i "# s. Jasno je sada da smo poništavanjem r;O) zadovoljili s -tu jednadžbu i da poništava njem svih ri dobivamo rješenje sustava jer su tada sve jednadžbe zadovoljene. Ako se pitamo kako sada izgleda nova aproksimacija x( l ) onda po komponentama imamo x( l ) = xjO) za j "# s x�O) + r.�O) za j = s. tj . nova aproksimacija x( l ) ima promijenjenu samo s -tu komponentu. (Geometrijski gledano x( I ) je točka koja se nalazi na s -toj hiperravnini i u sljedećem će koraku preći dok će se svi ostali
ais
J
{
na neku drugu hiperravninu, itd.) . U najjednostavnijem obliku metoda relaksacije se sastoji u tome da u k -tom koraku poništimo ovaj koji ima najveću apsolutnu vrijednost. Postupak zaus tavljamo kada su svi po apsolutnoj vrijednosti manji od zadanih brojeva. Istaknimo na kraju da je ta metoda konvergentna.
ri
rV- I )
SOR metoda ili metoda sukcesivne nadrelaksacije
Promatrajmo sustav linearnih jednadžbi (83) = det O i prisjetimo se kako je na početku uvedena linearna iteracija pomoću regularne matrice Sustavu (83) smo dodali = O i dobili + = te množenjem s izračunali kao
B.
B- I
Ax b, A "# Bx - Bx Bx (A - B)x b x x = B - l b + B -I (B - A)x
(84)
otkuda smo dobili iteracijski postupak Uz pokrate
a
=
l
-
x(k+ l ) B- l b + (J - B-I A)x( k) . B- l A i f3 = B - l b imali smo zapis
(85)
=
(86) U formulama (35)-(38) smo uveli rastav matrice = D E F , pa smo zatim uzeli da je = D i dobili Jacobijevu metodu, dok smo uzevši = D E dobili Gauss-Seidelovu metodu. Uvedimo sada SOR metodu ili metodu sukcesivne na drelaksacije (SaR dolazi od engleskog Kod te metode koristimo sljedeću familiju matrica w ) : l (87) ( w = - (D wE) w pn cemu se w zove relaksacijski parametar. Odmah vidimo da izbor w = l daje Gauss - Seidelovu metodu, tako da se w < l zove podrelaksacijski parametar, a w > l nadrelaksacijski parametar. Da osiguramo konvergenciju metode nužno je i dovoljno da spektralni radijus matrice (88)
A
B
B( B )
-
-
B successive over-relaxation). -
-
3.2. ITERACIJS KE METODE
105
bude manji od l, tj . da vrijedi (89 ) p(a(w)) < l. Pokazat ćemo da za p(a(w)) vrijedi (90) p(a(w)) � Iw - 1 1Kombiniramo li (89) i (90) dobivamo ove granice za w (91 ) 0 < w < 2. Dakle, w E (0, 2 ) može dati konvergentnu metodu. Dokažimo nejednakost (90). U prvom redu zapišimo B(w) na ovaj način B(w) = �w (D - wE) = �w D(J - wD-1E) (92) i izračunajmo 1 B(w) - A = -D(J w - wD-1E) - D + E + F l (93) = -D[/ w - wD-1E - wl + wD-1E + wD-1F] 1 = -D[(I - w)1 + wD-IF]. w Pomnožimo li (93) s B-I(w) dobivamo ovakav zapis od a(w) 1 a(w) = 1 - B-1(w)A = -B-1(w)D[(1 w)1 + wD-1F] w = !1 [! D(J - WD-1E)] ID[(l w)/ + wD-IF] (94) l = -w(J - wD-IE)- D-1D[(1 - w)1 + wD-1F] w = (J - wD-IE)-I [(l w)1 + wD-1Fj . Prisjetimo se Binet -Cauchyjeva teorema koji kaže da je determinanta produkta dviju matrica jednaka produktu determinanti. Uočimo nadalje daje matrica (95) 1 - wD-1E donje trokutasta i da su njeni dijagonalni elementi jedinice koje dolaze od pribrojni ka I jer je wDE donje trokutasta s dijagonainim elementima jednakim nuli. Dakle, neovisno o w vrijedi (96) det(J - wD-1E) l . Da ocijenimo p( ( w)) . Promatrajmo karakteristični poli nom od a(w) , tj . ip(A) det(Al a(w)). Zbog (96) i Binet -Cauchyjeva teorema vrijedi ip(A) = det(Al - a(w)) = det((l wD-1E)(Al a(w))) = det«(J - wD-1E)[A l - (J wD-1E)-1 [(1 - w)1 + wD-1F]]) (97) = det(A(J - wD-1E) - (l - w)1 wD-1F) = det« A + w 1)1 AwD-1E wD-1F). a
3. SUSTAVI LINEARNIH JEDNADŽBI
106
Kakoje vodeći koeficijent karakterističnog polinoma l, to je konstantni član
-
.
-
I
=
,
i- I
, . . . , l. -
,
n
( ( """' L.. aijXjk+ l ) a . x-i( k+I ) -- b . """' L.. aUx} k ) . j=i+ l j=1 II
j
-
(99)
Možemo očekivati da ćemo pobolj šati (k + l ) -vu aproksimaciju od Xi ako za nju uzmemo težinsku aritmetičku sredinu xlk ) (prethodne aproksimacije od Xi ) i xjk+ l ) koju daje (99). Prema toj zamisli bi poboljšana aproksimacija od Xi bila dana sa
- W )X;k J + wx lk+ l ) = x lk) + W(X;k+ l ) - xlk) ). ( 100) Da nađemo poboljšanu aproksimaciju Xj*+ I ) treba iz ( 100) eliminirati X)k+ l ) i smisleno odabrati težinu w . Pomnožimo ( 1 00) s au i u dobiveni rezultat uvrstimo aiixlk+ l ) : i- I n aiix;k+ I) = aiixlk ) +w [b;- L aijxj"+ I ) - L aijx(k) -aux}k) ] i = 1 , 2, k � O, j=I+ l j=1 (l
xjk+ ll
. . . , n
( 1 OI
otkuda možemo prepoznati (87). Dijeljenjem ( 101 ) s w i prebacivanjem na lijevu) stranu prve sume imamo
� auxlk+ 1 ) - L-I ( _aij)xY+ l ) = �aiixlk) I
/=1
i = 1 , 2,
Iz ( 1 02 ) čitamo ovaj matrični zapis
. . . , n
n
L.. (_ a · )x (k) + b · a ··x ( k) + """' }=I+ l II
l
lj
k � O,
.!. DX (k+ l ) - EX (k+ l ) = .!. Dx(k ) Dx!k ) + Fx(k ) + b. w w
J
l
( 1 02) ( 103)
3.2. ITERAClJSKE METODE
107
Iz ( 1 03) lako izračunamo
( � D - E) x(k+l) = ( � D - D + F)X(k) + b = [(�D - E) - (D - E - F)] x(k) + b = [( � D - E) - A] x k + b ( )
ili
Označimo li sa
( 104)
B(w) = -l D - E = -l (D - w E) w
w
dobivamo (85), pa možemo reći da su SOR iteracije nastale u nastojanju da se pobolj ša Gauss-Seidelova iteracija. Dokažimo sljedeći teorem.
Teorem 3.1 1 . za pozitivno definime susta ve i svaki E (0, 2) kOllvergira SOR metoda. Dokaz. Da dokažemo konvergenciju dovoljno je (a i nužno) da dokažemo da je spektralni radij us (vidi teorem 3.6) p( a ( w ) ) = p(I B ( ) I A ) < 1 za E (0, 2). Kao i u dokazu (90) služit ćemo se osnovnim činjenicama i spretnim raču nanjem. Kako jenejednakosti A pozitivno definitna, to je A simetrična s pozitivnim dijagonaInim w
W -
w
elementima, pa zbog simetrije vrijedi F = ET . Promatrajmo matrice 1 B = -D
E 1 ET - (D - E - F) A !D E+ -DT 1 1 F D+E+F E+ -D -D w w (� I ) D, w
( 105)
W
w
( 106)
-
gdje pišemo kraće B umjesto B( ) . Sada E (O, 2) ima za posljedicu da je � - l > O , pa su obje te matrice pozitivno definitne, jer je B donje trokutasta s pozitivnim elementima na dijagonali, a druga je dijagonaIna s isto tako pozitivnim elementima na dijagonali. Kao prvo dokažimo da su svojstvene vrijednosti A matrice A-1 (2B A) ( 107) pozitivne. Naime, ako je x svojstveni vektor za A onda vrijedi w
A -1 (2B A)x
w
,
AX
3.
108
SUSTAVI LINEARNIH JEDNADŽBI
ili množenjem s A ( 1 08) (2B - A)x = AAx. Pomnožirno li ( 108) s xT slijeva dobivamo ( 1 09) xT(2B - A)x = AXTAx , otkuda čitamo da je faktor od A upravo pridružena kvadratna forma matrice A . Tran sponiranjem ( 109) imamo ( l IO) pa zbrajanjem ( 1 09) i ( 1 10) dobivamo ( I l l) xT(B + BT - A)x = AxTAx. Kako smo vidjeli B + BT - A je pozitivno definitna, pa je lijeva strana od (Ill) pridružena kvadratna forma matrice B + BT A dakle za x =I- O je pozitivna. Kako je i xTAx pozitivna za x =I- O slijedi da je A > O . Time smo dokazali da matrica ( 1 07) ima pozitivne svojstvene vrij ednosti. Sljedeći trik kojim ćemo se poslužiti je spretan zapis matrice ( ) Označimo s Q matricu (Il2) za koju vrijede ove jednakosti ( 1 1 3) Q I 2A-IB - 21 ( 1 14) Q + I = 2A-1B ( 1 I5) (Q + 1)- 1 = �B-IA. Pomnožirno li međusobno prvu i treću jednakost dobivamo (Q I)(Q + I)- I = (2A-I B 2I)�B-IA ( 1 I6) 2 = I - B- IA ( ) Kako je B regularna trokutasta matrica to postoji B-I , pa iz ( 1 1 5 ) slijedi da postoji i (Q + 1)- 1 � B-IA . Označimo sa jJ. svojstvenu vrijednost od a ( ) i s x pripadni svojstveni vektor. Tada iz ( 1 I 7) (Q I)(Q + I)-Ix = ( ) = jJ.X slijedi da za vektor ( 1 I 8) x = (Q + I)y vrijedi (Q - l)y = jJ.(Q + I)y ili ( 1 1 9) (1 - jJ.)Qy = (1 + jJ.)y . Kako je y t= O , slijedi da mora biti jJ. =I- l , tako da dobivamo + jJ. = ll -Y' Qy - jJ. ,
a oo .
a oo .
oo
a oo x
109
3.2. ITERAC[]SKE METODE
tj . il. = 11 +- J1J1 je svojstvena vrijednost od Q = A - I (2B - A) što smo tražili. Izraču namo li J1 dobivamo J1 =
il. -
1
iI. + l ' il. > O p( a ( OJ)) < OJ =
pri čemu smo već prije vidjeli da je za svaki O OJ 2 , pa smo zapravo dobili da je 1 J1 1 1 , odnosno da je 1 . Time je dokaz kompletiran. Kako se Gauss-Seidelova iteracija dobiva za 1 , to smo dobili spomenuti rezultat o konvergenciji Gauss-Seidelove iteracije za pozitivno definitne matrice. <
<
<
4.
Svojstvene vrijednosti i svojstveni vektori matrice
. . . . . . . . . . I IS . . . . . . . . . . . 1 17 . . . . . . . . . . . 1 24
4. 1 . Metoda neodređenih koeficijenata . 4.2. Danilevskijeva metoda
.
.
. . .
. . . . . . .
4.3. Krilovljeva metoda .
4.4. Nalaženje karakterističnog polinoma
Leverrierovom metodom . . . . . .
4.5. Misesova metoda potencija
radijus matrice
spektralni
. . . . . . . .
. . .
.
. . . . . 1 27
. .
..
. . 1 29
Neka je A = [a u] kvadratna matrica i l = [ou] jedinična matrica istog reda. Uz svaku kvadratnu matricu (linearni operator) A vezan je poseban skup vektora koje zovemo svojstveni vektori matrice A i poseban skup skalara koje zovemo svojstvene vrijednosti matrice A . Skalar A je svojstvena vrijednost od A ako postoji ne-nul vektor '# O za koje vrijedi = AX.
x
(1)
Ax
Sam vektor X se zove svojstveni vektor matrice A koji pripada svojstvenoj vrijed nosti A . Jednakost ( l ) možemo pomnožiti skalarom '# O što daje
(].lx)
(].lx)
].l
A A iz čega čitamo da je svaki vektor kolinearan sa svojstvenim vektorom i sam svojstveni vektor, odnosno, svojstveni vektor je određen do na skalar '# O . Jednakost možemo zapisati u obliku O (2) (A l
].l
(1)
A)x
ili
(3) što je homogen linearan sustav jednadžbi u Kako homogen sustav i ma netrivijal nih rješenja '# O ako i samo ako je determinanta sustava nula, to dobivamo da su svojstvene vrijednosti od A korijeni aJgebarske jednadžbe (4) D(A ) det(M - A) = O (A
x
M)x = O
x.
4. SVOJSTVENE VRIJEDNOSTI I SVOJSTVENI VEKTORI M ATRICE
111
ili (5) Dl (A ) = det(A - AI) = O. n Kako je D(A ) = ( _ l ) Dl (A ) to algebarske jednadžbe (4) i (5) imaju iste korij ene. Ovo ističemo zbog toga što se u pojedinim knjigama= (4) zove karakterističnajednadžba matrice A , dok se u drugim tako zove (5). D(A) O i Dl (A ) = O su iste jednadžbe, međutim, D(A ) i Dl (A ) nisu isti polinomi. Nekada je spretno raditi s D(A ) , a nekada s Dl (A ) . Mi ćemo zvati D(A) =
A - a ll -a l 2 -a2l A -a22
(6)
- an i -an2 . . . A - ann = A n + P 1 A n- l + P2A n - 2 + . . . + Pn
karakteristični polinom matrice A . Očigledno je da je to polinom -tog stupnja, jer se u razvoju determinante pojavljuje pribrojnik (A - a ll )(A - a22) . . . (A - ann ) . Razvije li se determinanta (6) i rezultat sredi po potencijama od A , dobit će se koeficijenti P Taj rezultat glasi da je do na predznak koeficijent Pi jednak sumi svih dijagonalnihi ' minora i -tog reda determinante a l l al 2 . . . a l n det(A) = a21 a22 . . . a2n ani an2 . . . ann Točno vrijedi n n
P l = - L aii i= l aii aij P2 = '""' � i<j a -- a aii P3 = - L aji i<j
I
Pn = ( - l t
JI
JJ
I aij aik ajj ajk akj au
det(A).
(7)
druge strane Vieteov teorem daje D(A) = (A - Ad (A - A2 ) . . . (A - An ) gdje su A rješenja karakteristične jednadžbe D(A ) = O , tj. svojstvene vrijednosti matrice A i, pa imamo D(O) = ( - 1 )nAJA2 . . . An = Pn = ( - l t det(A) odnosno (8) Dakle, Pn je do na predznak jednak det(A) koja je s druge strane jednaka produk tu svojstvenih vrijednosti. Iz (8) slijedi da nula nije svojstvena vrijednost regularne S
4. SVOJSTVENE VRIJEDNOSTI I S VOJSTVENI VEKTORI M ATRICE
112
matrice i da je nula barem jedna svojstvena (kratnost!) vrijednost svake singularne matrice. Istaknimo da je broj dijagonalnih minora k -tog reda jednak
(�)
fl(n - l ) "
kin - k + 1 )
pa da prema (7) izračunamo koeficijente karakterističnog polinoma potrebno je ukupno izračunati determinanta različitog reda. To je računski pozamašan posao, pa su nam potrebne druge računski spretnije metode. Ponovimo još neke činjenice iz linearne a1gebre vezane za svojstvene vrijednosti i svojstvene vektore: 1 . Ako je A regularna i lt njena svojstvena vrij ednost, onda je ljit svojstvena vrijednost njene inverzne matrice A - I . 2. Ako je f(A ) poli nom od A U(A) je opet jedna matrica), onda su f(Ad svojstvene vrijednosti od f{A ) , gdje su Ai svojstvene vrijednosti matrice A . 3 . Ako A ima različitih svojstvenih vrijednosti, onda A ima n linearno nezavisnih svojstvenih vektora. 4. Ako A ima višestruke svojstvene vrijednosti, onda A može imati manje od svojstvenih vektora. Međutim, ako je A hermitska ili realna simetrična, onda A ima linearno nezavisnih svojstvenih vektora. Nadalje, svojstvene vrijednosti hermitskih ili realnih simetričnih su realni brojevi. 5. Ako je Aj svojstvena vrijednost od A , onda je Ai (konjugirano kompleksna vrijednost) svojstvena vrijednost njoj adjungirane matrice A* . 6. Svaka matrica zadovoljava svoju karakterističnu jednadžbu (Hamilton Caylejev teorem), tj. vrijedi fl
fl
II
An + PIAn- 1 + . . . + P J n
O.
7. Slične matrice imaju jednake karakteristične poli nome, pa prema tome i jed nake svojstvene vrijednosti. Prisjetimo se da su A i B slične, ako postoji regularna matrica T za koju vrijedi Matrica T je općenito kompleksna i kada polazimo od realne matrice A . Prisjetimo se i elementarnih transformacija matrica: I. Zamjena dvaju redaka ili dvaju stupaca. II. Množenje retka (stupca) brojem različitim od nule. III. Pribrajanje elementa j ednog retka (stupca) odgovarajućim elementima nekog drugog retka (stupca) pomnoženih brojem različitim od nule. Za matrice kažemo da su ekvivalentne ako se jedna dobiva iz druge pomoću kona čno elementarnih transformacija. Osnovno svojstvo ekvivalentnih matrica je da imaju isti rang. Lako se uvjerimo da se svaka elementarna transformacija može realizirati pomoću množenja matrica i to tako daJ matricu A pomnožimo s regulamom matricom koja se dobiva iz jedinične matrice na ovaj način:
4. SVOJSTVENE VRIJEDNOSTI I SVOJSTVENI VEKTORI M ATRICE
1 13
Ako se elementarna transformacija provodi na retcima (stupcima) od A, onda tricu A treba pomnožiti slijeva (zdesna) matricom koja se dobiva izjedinične matrice I tako da se na I provede ista elementarna transfonnacija. ma
Tako npr. da u matrici
[l l]
zamijenimo drugi i treći redak treba A pomnožiti slijeva s O O
E= O O
O l O
što daje
2 [l 2l ]
Da drugom stupcu od A pribrojimo prvi pomnožen s treba A pomnožiti zdesna s O O O O l
E= O
što daje
Nama će odmah zatrebati i inverzna matrica ovako transformirane jedinične ma trice. Tako, ako je E nastala iz I zamjenom dvaju redakal (stupaca), onda se E- l dobiva iz I zamjenom istoimenih redaka (stupaca), tj . E- = E . Ako je E dobivena iz I množenjem retka (stupca) s c -:f; O , onda se E-I dobiva iz I množenjem istoi menog retka (stupca) s � . Ako je E dobivena iz I zbrajanjem i-tog retka (stupca) pomnoženog s A -:f; O k -tom retku (stupcu) onda se E-I dobiva tako da se i -ti redak (stupac) pomnoži s -A i probroji k -tom retku (stupcu). Tako npr. ako je redom: onda je E- l = E
[ 06 �1 0� ] ; [ 1 0 0] onda je [ 1 -2 0]l onda je Da nađemo svojstvene vrijednosti matrice treba riješiti algebarsku jednadžbu E
E=
[60 �1 0�], [ 6 � g] , [ 6 i g] , O O 3 O O l
E-I = O l O ; O O
E-l = O O
l 3
l O . O
(4). Za matrice reda � 4 to možemo riješiti i direktno. Ako želimo računati svojstvene vrijednosti za n � 5 , onda su nam na vidiku dva načina napada tog problema. Prvi bi bio da nađemo D(A ) te nađemo rješenja algebarske jednadžbe nekom iteracijskom
4. SVOJSTVENE V RIJEDNOSTI l SVOJSTVENI VEKTORI M ATRICE
114
metodom. Drugi bi bio da se poslužimo nekom metodom koja iteracijskim postupkom transformira matricu tako da na limesu dobijemo oblik iz kojeg možemo pročitati njene svojstvene vrijednosti. Samo nalaženje svojstvenih vektora svodi se općenito na nalaženje netrivijalnih rješenja homogenog sustava lineamih jednadžbi (A l - A)x = O.
IJustrirajmo važnost svojstvenih vrijednosti i svojstvenih vektora na primjeru su stava lineamih diferencijaInih jednadžbi. dY I a l YI + a 2Y2 + . . . + a Y l ln n l dt = aZIYI + a22Y2 + . . . + a2nYn
dt =
(9)
ddt Yn = anlYI + anZY2 + . . . + annYn '
Pređimo prvo na matrični zapis. Označimo li s A
y=
poprima ovaj matrični zapis Y = Ay. Ako se pitamo da 1i rješenje ima oblik (9)
Y = titX,
dYI ddtY2 dt ( 10)
x =f. O
gdje je x neki ne-nul vektor, onda uvrštavanje u ( 10) daje
(11)
Ae).lx = AtI'x til (Ax) pa dijeljenjem s eAt dobivamo da su A i x podvrgnuti uvjetu ( 1 2) AX Ax. Pročitamo li uvjet ( 12) vidimo daje A svojstvena vrijednost matrice A i x svojstveni vektor pripada svojstvenoj vrijednosti A Ako pročitamo taj izvod natraške, onda vidimokoji da ako pođemo od svojstvene vrijednosti A i svojstvenog vektora x koji pri pada toj svojstvenoj vrijednosti, da je vektor Y = eAtx rješenje sustava ( 10). Dobili smo dakle ovaj rezultat: = eA tx je rješenje sustava y Ay ako i samo ako je A svojstvena vrijednost od A Yi svojstveni vektor koji njoj =pripada. Sljedeći korak je naći opće rješenje sustava ( 1 0). Navedimo slučaj da su Al , A2 , An različite svojstvene vrijednosti od A i da su X l , X2 , . . . , Xn njima pripadni .
x
.
.
• ,
4. 1 . METODA NEODREĐENIH KOEFICIJENATA svojstveni vektori. Tada je
1 15
n
Y = L CjXje).jl j=l
opće rješenje sustava (9), gdje su Cl , C2 ,
Xj =
i
[] •
•
•
( 1 3)
, Cn proizvoljne konstante. Ako je
X lj X 2j .
Xnj
onda je -ta komponenta od
y
dana s
n
Yi (t) = L CjXije).jl . j=l
Ako svojstvene vrijednosti nisu jednostruke, onda je opće rješenje složenije građeno. U idućih pet paragrafa obrađene su opće metode predviđene programom. Na njima se najlakše stiču osnovna znanja iz te problematike. Navedimo nazive nekih metoda, koje ovdje nisu obrađene, od kojih su neke primjenjive na određene klase matrica: Jaco bijeva metoda za simetrične matrice, Rutishauserova metoda (QR algoritam), metoda tridijagonalizacije, Givenova metoda, Housholderova metoda, Lanczosov algoritam.
4.1 . Metoda neodređenih
Pođimo od, moglo bi se reći za učenje najjednostavnije, metode nalaženja karak terističnog polinoma (1) D(;" ) = det(M - ) = ;., n + P l ;., n - l + P2;., n - 2 + . . . + Pn . . Da nađemo svoj stvene vrijednosti i vektore treba naći korijene algebarske jednadžbe D(;" ) = O , što je posebna problematika, a potom naći svojstvene vektore koji pripadaju tim svojstveni m vrijednostima. Metoda neodređenih koeficijenata se sastoji u tome da u ( 1 ), u lijevu i desnu stranu uvrstimo n posebnih vrijednosti od ;., i sastavimo sus tav linearnih jednadžbi s nepoznatim koeficijentima P l , P2 , . . . , Pn . Dakle, uvrstimo u ( 1 ) redom ;" = O , 1 , 2, . . . , n - l . Time dobivamo ovaj linearni sustav jednadžbi
A
Pn = D(O) 2 l n l n + P l l n - + P2 1 - + . . . + Pn = D( l ) 2n + P1 2n - 1 + P2 2n -2 + . . . + Pn = D(2) 2 (n - I r + P l ( n - I r- 1 + P2(n _ l )n - + . . . + Pn = D ( n - l).
(2)
4. SVOJSTVENE VRIJEDNOSTI l S VOJSTVENI VEKTORI MATRICE
1 16
Kako je Pn D(O) = det( -A) ( _ I )n det(A) taj koeficijent znamo izračunati, pa prebacivanjem konstantnih članova na desnu stranu sustav (2) prelazi u ==
P l + P2 + . + pn - l = D( 1 ) - D(O) - l 2 1 2n - p l + 2n - P2 + . . . + 2pn - l = D(2) D(O) 2n .
.
U matričnom zapisu sustav (3) izgleda ovako CnP = d gdje su Cn =
d=
Iz (4) slijedi da je
[
1 2n - 1 3n - 1
(4)
JJ
2n - 2 3n - 2
�
(n _ ) n - l (n- I ) n - 2 D( I ) - D(O) - l n D(2) -D(0)-2n D(3) - D(0)-3n
PI P2 P3
P=
Pn - l
D(n- I ) -D(0)-(n- 1 ) n (5)
Istaknimo da C ovisi samo o n , pa se za fiksni može C;;- l odrediti. Dakle, za fiksni po ovojnmetodi treba izračunati n -rednih determinanata k O, 1 , 2, D(k) = det(k1 A), -1 i riješiti linearni sustav jednadžbi (3). Spomenimo i ovo. Uvrštavanje posebnih vrijednosti u izračunavanje vrijed nosti od D u tim točkama podsjeća na interpolacij u. Kako(1)je iD(A ) polinom n-tog stupnja, to zadavši A = O , l , n - l , n i izračunavši D(O) , D( I ) D(n - I ) , D(n) , formule za interpojacijski polinom daju ispis karakterističnog polinoma D(A ) , jer je po1inom n-tog stupnja odreden sa svojih + l točaka. Takve formule postoje, u što se nećemo upuštati. Ne zaboravimo da one uključuju izračunavanje determi nanata D(O) , D( l ) , interpolacij ski poli nom. D(n) , a zatim računanje koeficijenata prema formuli za Nalaženje pripadnih svojstvenih vektora svodi se na nalaženje netrivij alnih rješe nja homogenog sustava linearnih jednadžbi Ax = Ax, za izračunatu svojstvenu vrijednost A . II
II
II
.
. .
_ ,
. _ ,
.
, II
•
II
.
_
.
_
_ ,
4.2. DANILEVSKIJEVA METODA
1 17
Nalaženje karakterističnog polinoma Danilevskijevom metodom
Bit Danilevskij eve metode je u tome da polaznoj matrici A nađemo njoj sličnu matricu P čij i je karakteristični polinom u tzv. normalnom Frobeniusovom obliku koji izgleda ovako 0'1 -,1. 0'2 0'3 0'4 -A O O l O l -A O O O 1 -A
D] (A )
O
O
O
O'n - I O O O
O'n O O O
l
-A
O
(1)
Jasno da je D(A ) = ( - 1 )"DI (A ) karakteristični polinom ove matrice 0'] 1 O O
P=
0'2 0 l O
0'3 0 O l
0',,-1 O O O
0'" O O O
l
O
O O O
(2)
samo treba vidjeti da su elementi prvog retka od P sa - 1 pomnoženi koeficijenti karakterističnog polinoma matrice P . Da se u to uvjerimo razvijemo determinantu ( l ) po prvom retku. Taj razvoj izgleda ovako; D 1 (A )
=
-A O O . . . O O l -A O . . . O O ( O'I - A ) O l -A . . . O O O
+
O
O
1 -A : O O l : O
... O O ... 0 O 0'3 o- -o-i--=-i -.�� -o O I I
O O : O + ... +
... l O ( - 1 ),, - 1 0'" O
l O O ... O O O -A O . . . O O 0'2 O l -A . . . O O O O
l -A
l -A
l -A O : . . . O O O 1 -A : . . . O O l : ... O O - 0'4 O O "I
O O
l -A -A O . . . O O l -A . . . O O O l ... O O
O O
O
0 ... 0 1
I
. •
• •
O : . . . 1 -A
1 18
4. SVOJSTVENE VRIJEDNOSTI I SVOJSTVENI VEKTORI MATRICE
pri čemu su crtkano determinante razbijene u blokove, da lakše uočimo donje jli gornje trokutaste subdeterminante, tako da čitamo D I (A. ) = ( al - A. ) ( - A. t - I - a2 ( -A. t - 2 + a3 ( -A. r- 3 - a4 ( -A. ) n - 4 + . . . + ( - l t- I an n n n = ( -A. t + al ( -A. ) - l _ a2 ( - A. ) - 2 + a3 ( - A. t- 3 - a4 ( - A. t - 4 + . . . + ( _ 1 ) - I an n n l = ( - 1 r (A. - al A. n - _ a2 A. n - 2 _ a3 A. - 3 - a4A. n - 4 - . . . - an ) .
(3)
Kako vrijedi D (A. ) = ( _ I )n D I (A. ) ( vidi uvodni tekst), to karakteristični polinom D ( A. ) matrice P glasi D (A. ) = A. n - al A. n- l a2A. n - 2 - a3 A. n - 3 - a4A. n - 4 . . . - an ' Iz zapisa (6) uvoda n n = A. + P A. - I + . . . + Pn D (A.) det(M I čitamo da su Pi = - ai , 1 , 2, , n . Ako dakle pođemo od neke matrice i uspijemo naći regularnu matricu S takvu da vrijedi (sličnost) (4)
A)
i
. . .
A
A
i daje P oblika (2), onda smo našli karakteristični potinom matrice jer slične matrice imaju jednake karakteristične po1inome. Nađemo li nadalje korijene karakterističnog polinoma našli smo svojstvene vrijednosti matrice Nalaženje korijena polinoma je problem za sebe i spada u poglavlje o nelinearnimjednadžbama. Opiši mo sada Danilevskijevu metodu, tj. postupak kako se iz izgradi P . To po stižemo pomoću (ll l ) -dne transformacije sličnosti i to postepeni m transformiranjem redaka matrice Počinjemo sa zadnjim retkom matrice
A.
A
A.
A
koji prevodimo u oblik
oo
.
.
.
1 0.
Pretpostavimo da je ann- l f:. O . Tada treba elemente (n ann nakon čega II -ti redak poprima oblik -I
l ) -og stupca podijeliti s
Da dobijemo nule na ostalim mjestima ll -tog retka treba transformirani (Il 1) -vi stupac redom množiti s an I , an2 , . . . , ann 2 , ann i redom oduzeti od l-og, 2-og, , ( 11 - 2) -og, n -tog stupca. Time dobivamo-matricu čiji je n -ti redak jednak n -tom ret ku matrice P . Spomenute transformacije na stupcima su elementarne transformacije provedene na stupcima od Ako te transformacije provedemo na jediničnoj matrici, onda dobivamo matricu O O O l Mn - = I m ' , ' mn l,2 . . . mn l,n- I m , " O O. . .
A.
[ "�
"� l
119
4.2. DANILEVSKIJEVA METODA
u kojoj su
mn-lj = annanj-I mn-In-I ann- I
za j -:/:
- -
=
-
l,
(5)
-- o
Opisane elementarne transformacije realiziramo tako da što daje
AMn _ 1 = B =
n
A pomnožirno zdesna s Mn- I ,
bn -Il n-I bn-In bn-ll bn-12 O O O
1
Iz opisa postupka i množenja matrica čitamo da su
bij = aij + ain-Imn- Ij za l i n; j -:/: n - l (6 ) n. bin -I = ain-Imn- I n- I za Međutim, matrica B = A Mn _ 1 nije nužno slična matrici A . Da bi osigurali sličnost moramo B pomnožiti slijeva s M;� I što daje (7) C = M;� I B = M;� I A Mn _ l' �
�
� i�
Prema rečenom u uvodu pripadna inverzna matrica glasi
Mn--II -
O 1
[a!, an2 O
M;� I
(n
Uočimo da se razlikuje od jedinične samo u - l ) -om retku, zbog čega su elementi matrice C jednaki elementima matrice B u svim recima osim u - l ) -om, tj. C ima oblik
C=
(n
C21Cll CCl222 ClnC2n-I- 1 CIC2nli CnO- ll CnO- 1 2 Cn-In-I Cn-In l O
gdje je prema rečenom
n za l n 2, i n (8) za l j n. j Cn-Ij = L ankbk k= 1 Na taj način, množenje matrice B slijeva s M;;.!. I mijenja samo (n - l ) -vi redak od B, čiji se elementi računaju po formuli (8). To je prvi korak Danilevskijeve metode. �
i
�
-
�
=
�
120
4. SVOJSTVENE VRIJEDNOSTI I S VOJSTVENI VEKTORI MATRICE
Da nastavimo pretpostavimo da je Cn-ln - 2 ::f. O tako da na e ponovimo analogne transformacije nad ( - l) -im retkom pomoću ( 2) -og stupca. Uočimo da pri tome ne narušavamo već postignuto u -tom retku. Time dobivamo matricu (9) koja je slična matrici A i ima zadnja dva retka u željenom obliku. Nastavivši postupak dalje dobivamo Frobeniusovu matricu ( 10) = M� I M:; 1 . . . M;;�2 M;;� I AMn-l M"- 2 . " M2Ml iz koje prema (3) dobivamo Dl (A) = ( _ l)n (A n - Cil A I -l Ci2 /\,, n-2 - . . . - Cin ) . Ovakav postupak je provodiv uz pretpostavku da je u k -tom koraku dn-k+ I,n -k ::f. O, što ne mora biti ispunjeno u svakom koraku. Pretpostavimo da smo došli do matrice ovog oblika n
IZ
II
p
d dd2Il1 dd22)' }. dd2Uk-I-I dd2Uk . . . dd2In-I n-1 d2nIn D = dOk ! dOk2 OO d1kk dkn-O I dOkn O
O
O
O
O
O
O
O
O
O
1
O
u kojoj je dk,k - l = O . Tada mogu nastupiti 2 slučaja. l . Na lij evo od dk,k -I imamo element dkl ::f. O , l k - l . Tada zamijenirno (k - 1 ) -vi i l-ti stupac i istovremeno zamijenirno (k - l ) -vi i l-ti redak da bi zadržali sličnost sa A i potom nastavimo postupak. 2. Na lij evo od dk•k - l su same nule, tj . D ima oblik <
dIl dk-I l D= O O
O
I I
d1k-1 du . . . d1n-1 din dk-Ik-I : dk-lk - - - -d-k-1n-1 - - - - -d-k-In O dkk dkn-I d-kn O O O l I I
O
. . •
O
l
O
-
[ Dl DLz ] . O
Tada je det(D - AJ) = det(Dl - AI) . det(D2 AJ) pri čemu je D2 već u normalnom Frobeniusovom obliku pa se postupak nastavi na Dl '
4.2. DANILEVSKIJEVA METODA
121
Nalaženje svojstvenih vektora Danilevskijevom metodom
Danilevskijeva metoda se može iskoristiti za nalaženje svojstvenih vektora ma trice ako su nam poznate njene svojstvene vrijednosti. Tako, neka je svoj stvena vrijednost matrice Time je svojstvena vrijednost i njene Frobeniusove matrice p (sličnost). Imamo dakle (P - )y = O ili
[
i\.
i\.
A.
ll ]
i\.I -P l-i\. �i2 -t3 .. .. .. -Pnl -pn Yl O O Y2 O O O l -i\. . . . .. . .. O O O -i\. Yl1 · · ·
. . .
. .
(ll)
( l l ) predstavlja matrični zapis ovog homogenog sustava l inearnih jednadžbi s nepoz nanicama
YI , Y2 , . . . , Yn , ( -Pl - i\. )Y l - P2Y2 - P3Y3 - . . . - Pl1 -IYn-1 - pnYn = O =0 YI - i\. Y2 =0
( 1 2)
Yn -I - i\.Yn = O. Zbog det(P - i\. I) = O sustav ( 1 2) ima netrivijalnih rješenja. Sustav možemo do na koeficijent proporcionalnosti ovako riješiti. Izaberimo Yn = l . Tada korak po korak imamo Yn = l Yn-I = i\. Yn-2 = i\. 2 YI = /\,1 n-1 , pa je na taj način vektor
y=
� :=� l
( 1 3)
i\. l
i\.
svojstveni vektor matrice P koji pripada svojstvenoj vrijednosti Da nađemo svoj stveni vektor matrice koji pripada svoj stvenoj vrijednosti prisjetimo se kako smo dobili matricu P iz matrice Imali smo formulu ( 1 0) u prethodnom paragrafu koja je glasila ( 14 )
A
A.
i\. ,
.
Kako je Py = Ay to uvrštavanjem dobivamo 122
4. SVOJSTVENE VRIJEDNOSTI I SVOJSTVENI VEKTORI MATRICE
što množenjem slijeva redom s
daje
( 15) Iz ( 15) čitamo daje = Mn-I " . M I Y ( 16) svojstveni vektor matrice A koji pripada svojstvenoj vrijednosti A . Dakle, da nađemo moramo zapamtiti sve matrice Mi , i l , 2, . . l . Primijetimo i sljedeće Ml I . . . M;!tAMn - 1 . . . M I y = Ay M t , Mz , . . . , Mn _ 1 A(Mn _ I . . . MIy) A (Mn _I . . . MI Y ) · x
x
[T
l
l
ml2 . . . ml" ...
o
]n
.
, fl
-
n
2: mikA n -k
n
k=1
2: maYk
k= 1
Yz
Y2
A n- 23 A n-
l iz čega vidimo da MI mijenja samo prvu komponentu vektora y . Analogno M2 mijenja samo drugu komponentu vektora y , itd. Time korak po korak nalazimo svojstveni vektor matrice A , pri čemu jeMlčitav račun, osim rješavanja algebarske jednadžbe DI (A ) = O, vrlo jednostavan. MIy =
o
· · ·
. . .
Yn
=
A
Yn
x
Primjer 4.1 .
Neka je
[ 23l 22l 21 42] '
4 3W I Vidimo da je a43 = 2. Da u tom položaju dobijemojedinicu treba treći stupac podijeliti s 2, što povlači daje element matrice M3 u položaju (3, 3 ) jednak ! tj. m33 ! Da u A poništimo ostale elemente četvrtog retka treba s 2 podijeljeni treći stupac redom pomnožiti s 4, 3 i l te redom oduzeti od l-og, 2-og i 4-og stupca. To sve treba provesti na jediničnoj matrici tako da dobivamo 3
A=
3
;
pa matrica B = AM3 glasi B=
=
.
4.2. DANILEVSKIJEVA METODA
Pripadna inverzna matrica MJ I glasi
M3- I tako da je e = MJ I
B jednaka
123
[l l ] l O O O O 1 0 0 4 3 2 O O O
5l ! ] l 3
2
15 O
�
19 . O
Time j e proveden prvi korak Danilevskijeve metode. Za drugi korak trebamo C32 f. O . Kako je Cn = - 1 5 , to M2 glasi
i pripadna inverzna
[ -2! l l ] [ l l ] [ 2. ] [ l ] ] [-ll l -±l ] = [ l l ] l l l =6 ] [6 l ] l l M2- I -
_
Matrica
O O O -24 - 1 5 I I 1 9 O O O O 0 0 1 O O O 1 5 I I 19 O f O O O
O O
O O O 1 5 I I 19 O O . O O
-5 J. 2. -2 -2 i 2 -24 - 1 5 I I 1 9 O 0 1 0 _
1
1 O i
il
O O
_
_
1
l Jo
_
1 O O
O O O
- fi - f- fl f! O O i O 0
0 0 1 2 l -1
(ID �
O O O
31 21 O
O O
je slična matrici A . Time je obavljen drugi korak Danilevskijeve metode. Kako je A četvrtog reda, to teorijski preostaj e još jedan korak. Kako je d2 1 f. O to nalazimo M
-4 O 1 0 ' O
b
odnosno
M1- I _
5 34 24 O O O 0 0 1 0 O O O
4. SVOJSTVENE VRIJEDNOSTI ] S VOJSTVENI VEKTORI M ATRICE
124
p
[ l l l ] [-l l l � l [1. -[ - [� i 6 6l ] i b �l b]
M I l DM I =
Otkuda čitamo
6 5 34 24 o O O O O O O O O 3 2
.!. - .!. 6 � 3 4 24 O O O O O O
0 0 1 0 O O O
0 1 0 0 O O O
B
O O
3 D(). ) = ( - 1 )4D I (). ) = ). 4 - 4). - 40). 2 - 56),
20,
Nalaženje karakterističnog polinoma Krilovljevom metodom
(l)
u ovoj metodi ćemo problem nalaženja koeficijenata karakterističnog polinoma svesti na rješavanje sustava linearnih jednadžbi. Neka j e D(). ) = det().I - A) = ). " + P I ). n - 1 + . . . + p"
karakteristični potinom. Prema Hamilton-Cayleyevom teoremu matrica A poništava (zadovoljava) svoj karakteristični pojinom, tj. vrijedi (2) O. An + P lAn - I + ' " + O) y O ( ) Neka je O #: y = vektor različit od nul vektora. Pomnožimo li (2) zdesna s (O) y" y (O ) dobivamo (3)
[;]
Označimo Ji s
p,,1
y (k) = Aky ( O) ,
k
1 , 2, . . . , II
(4)
j ednakost ( 3 ) će poprimiti oblik y (n) + Ply (n - I ) + . . . + PnY (O) = O što je linearan sustav jednadžbi s nepoznanicama P I , P2 , možemo i ovako zapisati (n) (n I (11 2 ) (O) PI YI - ) YI - . . . YI YI 2 (,,- I ) P2 y2(n- ) . . . Y2(O) y 2(n) Y2
[
" .
. .
.. �
(n� l ) ( "� 2 ) (O) . . . Yn Yn Yn
l[ ]. .. .
Pn
_
.
_
.
. •
[l � .
.(n) Yn
.
pn
·
(5) Iednakost (5)
(6)
4.3. KRILOVLJEVA METODA
125
[l
y (k) označene ovako Y �k) y�I k l , y(k) k 0, 1 , 2, ynlk)
pri čemu su komponente od
=
=
.
.
. , n.
Pojedina jednadžba sustava (5) glasi
yj(n- I) PI + Yj(n- 2)P2 + . . . + Yj(O) Pn - -Yj( n) ' _
• -
J-
l
,
2, . . . , n .
(7)
Rješavanjem tog sustava nalazimo nepoznanice P I , P2 , . . . , Pn , tj. koeficijente karak terističnog polinoma ( l ). Time j e problem nalaženj a karakterističnog polinoma sveden na rješavanje sustava linearnih jednadžbi. Vektore y (k) nalazimo postupno (iterativno) prema (4), jer je
y (k) Aky (O) A (Ak- ly (Ol ) Ay lk- I ) , tako da za komponente vektora y{k) , k l , 2, nalazimo ove formule n Y ( I ) - ""a" � !jYj(O) j=1 n "" ) ( 2 Yi � a··yj( l ) }:= l =
=
=
=
. . . , n
i
lj
-
(8)
n
(n- I Yi(nl - "" � aijYj ) . _
j== 1
Uočimo da su komponente početnog vektora y (O) bile proizvoljne. Spomenimo da mo žemo naići na sustav (5) koji nema jedinstveno rješenje. Tada se preporuča promijeniti početni vektor y(O ) . Nalaženje svojstvenih vektora .Krilovijevom metodom
Krilovljeva se metoda može iskoristiti i za nalaženje svojstvenih vektora matrice. Opišimo taj postupak uz pretpostavku da znamo D ( A ) i njegove korijene (9) D ( A ) det(M A ) A n + P I A n - I + " ' + Pn ' Neka su ti korijeni Al , A2 , . . . , An različiti. Označimo s , . . . , xln ) pripadne svojstvene vektore. Poslužimo se s prethodno korištenim vektori ma iz 2.1
x( l ) , x(!)
n a sljedeći način. Rastavimo y (O) p o svojstvenim vektorima teorije znamo da su linearno nezavisni. Imamo dakle
X(i)
( 10 ) ,
z a koje i z opće (ll)
126
4. SVOJSTVENE VRIJEDNOSTI I SVOJSTVENI VEKTORI M ATRICE
gdje su Ci koeficijenti tog rastava. Kako je AX( i) = AiX ( i) to množenjem slijeva s A dobivamo redom A 2x(i) = AA/X !i) = AiAx( i) A3x(i) = A,3x( i)
=
AiAix(i)
=
A?x(i) ( 12)
Uvrštavanjem ( 1 2) u y( I ) , y( 2 ) , . . . , y( n- I ) dobivamo y(O) = C I X ( I ) + C2X( 2 ) + . . . + cnx( n) y ( l ) = C I A I X( I ) + c2 A2x( 2 ) + . . . + cnA nx( n) y (2 ) = C I A?X( I ) + c2Aix( 2 ) + . . . + cnA;x( n) y( n- I )
=
( 1 3)
C I Af - 1 x( 1 ) + c2A ; - l x( 2) + . . . + C nA; - l x( n) .
U dobivenom sustavu jednadžbi ( 13 ) su nam nepoznati svojstveni vektori xl i) i koe ficijenti C ' tako da isti nije linearan. Usredotočimo li se na svoj stvene vrijednosti Ai i vidimo da je svaka jednakost, formalno gledano, "linearna" kombinacija istih potencija svojstvenih vrijednosti Ai , pa možemo provesti ovakvo razmatranje (dosjetka). Neka je proizvoljnih
i
II
1 , 2, . . . , n
=
polinoma (Il - l ) -og stupnja. Iskoristimo koeficijente polinoma i =
1 , 2, . .
.
( 14)
, n
i pomoću njih načinimo linearnu kombinaciju vektora y( n- l ) , y( n- 2 ) , . . . , y( l ) , y(O) . Dobivamo y( n- I ) + Q l iy( n- 2 ) + . . . + Q n_ iy(OT l = l (c I A; - l x (l ) + . . . + C A�'- l x ( n» ) n + Q I i ( C1 A ;- 2X( 1 ) + . . . + c A; - 2x( n» ) n ( 1 5)
i
=
1, 2, . . . , n,
pri čemu smo u zadnjem koraku sumu sredili po vektori ma x(i) . U ovom razmatranju su polinomi fPi bili proizvoljni, pa sada možemo izvršiti njihov izbor. Uzmimo da j e fPi
=
D(A )
I-:r. =
AI
-'--_-'-'--'----:----c --:-_-'---_--'- .
i
=
l , 2,
..
. , n.
( 1 6)
4.4. NALA:LENJE KARAKTERISTIČNOG POLlNOMA LEVERRIEROVOM METODOM Uz taj izbor vidimo da vrijedi
=
O
ako je
127
i :F j
=
fl
fl
=
=
, . . . , n.
=
=
=
=
.
=
, n
=
.
.
Nalaženl�. karakterističnog polin0tna Leverrierovom metodom
� ���fliil�� «l.j]!IM!ljli.iiH.�;I';�U�.tliliirlt �� l
im_a j .a+���
Ovdje prikazujemo još jedan postupak nalaženja karakterističnog polinoma pri čemu ćemo se poslužiti sumom potencija korijena karakteristične jednadžbe. Pođimo od (l)
A l , A2 , A3 , . . . , An 1 k + 11.1 k + . . . + II.1 k , Sk = 11.1 2 n
i neka su svi korijeni karakteristične jednadžbe, tj. u tom popisu se svaki korijen pojavljuje onoliko puta kolika mu je kratnost. Označimo s'
k = O, 1 , 2, . . . , n sumu k -tih potencija korijena. Za takve sume i koeficijente polinoma vrijede tzv. Newtonove formule koje glase (2) k = 1 , 2, 3, . . . , n .
Iz (2) lako redom izračunamo
4. SVOJSTVENE VRIJEDNOSTI I SVOJSTVENI VEKTORI MATRICE
128
Pl
=
-SI l
pz = - (S2 + PIS. ) Z
P3
l
=
3 (S3
+ PI S2 + P2S. )
(3)
samo nam trebaju SI , S2 , . . . , Sn . Međutim, te ,se veličine mogu izračunati služeći se činjenicom da su At , Af , . . . , At svojstvene vrij ednosti matrice Ak i što znamo da je Pn
=
l
- -fl (Sn + PISn-l + . . . + Pn-ISI )
trag matrice A ) . Kako su Aik svojstvene vrijednosti od Ak to onda vrijedi TI
S I = AI + A2 + . . . + An
L aii 1=1
Sp (A )
pa smo problem reducirali na računanje traga od Ak , k = 2 , dijagonaIni elementi od A 2 su dani s ( Sp (A)
Sk
.
=
tako daje
=
Prema tome, označimo li S2
TI
"' aik aki, L...-
a;p
n L all) ;=1
. .
. . . ,
11 .
,n
n L L aikaki' i=1 k=1 TI
elemente od Ak imamo daje
Al + Ai + . . . + A; s
1 , 2, .
k=1
Za k = 2 (4 )
Sp(Ak ) ,
At + Af + . . . + A;
aII(2)
,
=
Iz izvedenog vidimo da Leverrierova metoda zahtijeva računanje potencija matrice A što može biti mukotrpno ako je red matrice A visok. Nalaženje svojstvenih vektora svodi se i sada na nalaženje netrivijalnih rješenja homogenog sustava linearnih jednadžbi ( A l A)x = O za danu svojstvenu vrijednost A . Sk
At + Af + . . . + A;
n L a;;) i=l
=
TI
TI
L L aikai;-I ) . i=l k=1
4.5. MISESOVA METODA POTENCIJA - SPEKTRALNI RADIJUS M ATRICE
129
Wil1��%'i:ll�I{1W�••;W*0jA�'���?fl,�__
A I , A2 , . . . , An svojstvene vrijednosti matrice A , tj. korijeni algebarske (1) D(A) = det(A J A) = o. Svojstvene vrijednosti s u općenito kompleksni brojevi i skup {A I , A2 , . . . , An } se zove spektar matrice A dok se (2) = max l A; ! zove spektralni radijus matrice A . Indeksirajmo svoj stvene vrijednosti tako da vrijedi I AI I � IA21 � . . . � l An i , pa kada je I A I I > I A21 ili l Ad = I A2 1 . . = lAd i I A I I > I AiH I , uobičajeno je A I zvati dominantna svojstvena vrijednost. Tadaje = I A I I · U različitim problemima je potrebno ocijeniti vrijednost spektrainog radijusa Misesova metoda potencija Neka su jednadžbe
-
p
I
=
.
p
p.
je jedna iteracijska metoda izračunavanja dominantne svojstvene vrijednosti, ili po apsolutnoj vrijednosti najveće svoj stvene vrijednosti, bez nalaženja karakterističnog polinoma. Neka svojstvenim vrijednostima pripadaju linearno nezavisni svojstveni vektori 1 . Slučaj. Neka je (3)
A I , A2 , . . . , An X( I ) , X(2) , . . . , x(n) . A
AI
D(A) A2 = I I I A I I =
Ako su elementi od realni, onda je realan. Naime, tada je polinom s realnim koeficijentima, pa se kompleksni korijeni javljaju u parovima konjugirano kompleksnih vrijednosti. Kada bi bio kompleksan, onda bi i IA2 1 , što se protivi pretpostavci slučaja. Pođimo od proizvoljnog vektora i rastavimo ga po svojstvenim vektorima mat rice tj. napišimo (4) +...+ +
L
A,
AI
y
y = CI X ( I ) C2X(2)
c lx(n ) gdje su Cj koeficijenti tog rastava. Pomnoži mo (4) s A . Time dobivamo n n (5) Ay = L CjAxU) = L CjAjXU) j=1 j= l jer je xU) svojstveni vektor koj i pripada svojstvenoj vrijednosti Aj . Dobiveni vektor Ay zovemo iteracija vektora y . No to možemo nastaviti tako da i mamo drugu iteraciju vektora y jednaku n n A(Ay) = A2y = L CjAjAxU) = L CjA}xU) j= 1 j=1 i tako redom, -ta iteracija glasi n m m (6) y( ) = A y = L CjAtxU). j=1 m
Neka je el , e2
baza vektorskog prostora. Neka je
4. SVOJSTVENE VRIJEDNOSTI I SVOJSTVENI VEKTORI M ATRICE
130
•
.
. .
,
en
y (m )
[�!=: l
gdje su yim) ( i l , 2, . . . , n ) komponente od y(m) u bazi el , e2 , . . . , en . S druge strane neka su komponente svojstvenih vektora u toj bazi Xij , tj . neka je :=
Uvrstimo li (7) u (6) dobivamo
XU)
( ynm )
n
:=
L Xijel. j=1
(7)
(8)
n n n n ( m y ) = L C;At L Xjjej = L ei (L CjXijAt) . j=l j= l 1=1 1=1 ( m ej , y ) n l y j( m - "" � CjXjjA1jm . j= l l y(m + ) n l +I yjm+ ) L CjXijAt , j= 1
Dakle, i -ta komponenta od
je faktor od tj .
Analogno je i -ta komponenta od
_
Podijelimo li ( 10) s (9) dobivamo
(9)
jednaka
( 10)
=
Pretpostavimo da je t O i Xii t O, To nije ograničenje jer to možemo postići promjenom početnog vektora y i baze el , ez , . . . , en . Transformirajmo ( 1 1 ) u ovaj oblik ( +l Yi m ) yi m ) CI
_
+ + CIXi l A1 Im+ 1 C2X i2 A' 2m+ 1 ' + + CiXilAf C2Xi2A!{' ' , .
CnXinA' nm+1 + CnXinA::' +
(11)
• •
Iz ( 1 2) zaključujemo da prelaskom na limes za dobivamo (zbog AA; l za i � 2 ) sljedeći rezultat ( +l ( 13) l'm -oo lm YI-mi(-ml-) O AI Y Iz ( 1 3) dobivamo u l. slučaju sljedeću aproksimaciju dominantne svojstvene vrijed nosti ( 12 )
m -t
oo
<
1
i = 1, 2, . .
.
, n.
( 1 4)
4.5. MISESOVA METODA POTENCIJA - SPEKTRALNI RADIJUS MATRICE
131
Ako smo uzeli dovoljno veliki korak iteracije, tj. dovoljno visoku potenciju m može mo prema ( 14) postići traženu točnost. Da ubrzamo konvergenciju iteracije spretno je promatrati iteracije koje su potencije broja 2, tj. m 2k . U tom slučaju imamo kvadriranje matrica, tj. gledamo potencije
= A, A2 = A · A, A4 = A2 · A2, A8 = A4 · A\ . . . , Az' = A 2*-1 . A i-1 = Am . Izračunamo li još y(m) = A my i y(m+ l) = Ay(m) dobivamo +l AI yi(mi ) i = 1, 2, . . . , n . � �,
Y
Dobivši aproksimaciju od A I možemo naći i aproksimaciju svojstvenog vektora koji pripada svojstvenoj vrijednosti A I . Naime,
vektor
y(m) = . Amy ( 15 ) je aproksimacija svojstvenog vektora od A koji pripada svojstvenoj vrijednosti A l . Evo kako to vidimo. Iz formule (6) imamo n
Amy = CI A{"X( I ) +LCjAFxU) .i=2 gdje je x U) svojstveni vektor koji pripada Aj . Izlučimo li CIA;" dobivamo Amy = CI A{" {X( l ) + �=2 cCJI ( AA1l ) mxU) } . ( 16) j A m O za Kako ( � ) i j � 2 , to za dovoljno velike dobivamo A Amy Cl A{"x ) ( 1 7) I I tj. Amy aproksimira vektor CIAf1x( ) koji se do na koeficijent razlikuje od x( ) pa je dakle i sam svojstveni vektor od A koji pripada svojstvenoj vrijednosti Al . Napomena. Kako obično ne znamo da li smo u slučaju l , to nas formalna prim jena opisanog postupka može kod neprikladnog izbora vektora y dovesti u situaciju da formula ( 1 3) ne daje korijen polinoma D(A ) ili da ( 1 3) nema limes. Tada treba primijeniti početni vektor y . �
--t
m
11l --t oo
�
(\
2. Slučaj je komplementaran prvom, a taj je kada apsulutna vrijednost dominantne svojstvene vrijednosti ima kratnost, tj. vrijedi > s+l .. = ( 1 8) Tada do formule ( l l ) možemo ponoviti izvod. Sljedeći korak izvoda sada glasi m+! CI Xil + . . . + csXis + Cs+! Xis+ l +...+ y l m+! )
I AI 1 = IA21 = . lA., I I A l·
m+ ! X (� � i C ( ) ) n n = Al Hl ) m + . . . + CnXin ( An ) m y,( m ) CI Xi\ + . . . + CsXis + Cs+IXi.,+! ( A� Al m O za k > s, pa ako je još i I sada i mamo da za vrijedi (�:) CI Xi l + . . . + CsXis =f. O (time izbjegavamo pojavu neodređenog oblika � ), onda nz --t oo
--t
132
4. SVOJSTVENE VRIJEDNOSTI I SVOJSTVENI VEKTORI MATRICE
ponovo zaključujemo da j e
i i analogno j e
=
1 , 2, . . . , II
y(m) Amy =
aproksimacija svojstvenog vektora koji pripada svojstvenoj vrijednosti AI . Kao i u prvom slučaju i ovdje možemo ubrzati iteracijski postupak da računamo za m = 2k , tj. da gledamo potencije
Am
A A2 A4 A8
..., . Izvedimo još jednu formul u za aproksimacjju apsolutne vrijednosti dominantne svojstvene vrijednosti (ili spektrainog radijusa) matrice i to zbog jednostavnosti samo za prvi slučaj. Znamo da je trag matrice jednak sumi njenih svojstvenih vrijednosti ,
,
,
Al'
,
A,
Sp(A)
;=1
Kako su At svojstvene vrijednosti od Am , to imamo n
i=1
Am .
m Računanje tragova se pojednostavnjuje ako računamo samo potencije onda za potencije broja 2 imamo Naime, označimo l i s a;F ) elemente od
Am ,
=
2k .
n
Sp(A) L aii i=l =
n
1/
;=1 k=1 n
n
( 19)
Sp(A4 ) = L L aji)af;) ;=1 k=1 Sada u
l.
;=1 k=1
slučaj u imamo
[ (�:r + . . . + (�:r] Sp(Am ) .
A:n + Ai + . . . + A:' = A:n l + Vađenje
m -tog
=
korijena iz (20) daje
{ (��) m + .
IA I I l +
. .
+
(�:) m] }
!
=
y'Sp(Am) ,
(20)
4.5. MISESOVA METODA POTENCIJA - SPEKTRALNI RADIJUS MATRICE tako da za
nz
-+ oo
i za dovoljno velik
postižemo m
III
(22)
-tog korijena
�----�--------�- =
ili
A;
)
Am+1 AmA , što je još jedno A �+ I + A;'+I + . . . + A;:,+ I Sp(Am+ l ) A{" + A;' + . . . + Ar:" Sp(Am) A2 m+ 1 + . . . + ( ,-An ) m+ 1 1+ ( ) /\.1 m A I I""IA2 m A 1 + ( ) + . . . + ( n) AI AI
Sljedeća dosjetka eliminira vađenje množenje matrica. Tada je
A
(21
�oo m pripadnu aproksimaciju l Ad y'Sp(Am ) . �
Kako je
133
<
1 , to za dovoljno velike
III
���
dobivamo aproksimaciju
m+ l ) A I SpSp(A(Am) �
=
(23)
5.
Nelinearne jednadžbe S.l. S.2. S.3.
Jednadžbe s jednom nepoznanicom Algebarske jednadžbe . . . . . . . . Sustavi nelineamih jednadžbi . . . .
.
. . . .
. .
. .
1 34
.
.
. . . .
. .
. .
148
.
. . . . . . . . . . 164
Prisjetimo se osnovnih činjenica. Neka je dana jednadžba (1) f( ) O. Riješiti jednadžbu ( 1-) znači naći one za koje vrijedi jednakost ( 1 ). Svi takvi čine skup rješenja jednadžbe ( 1 ). Uobičajena podjela jednadžbi je na: 1. Algebarske koje su oblika ( 2) 2. Transcendentne, tj . one koje nisu algebarske. Prisjetimo se da je rješenje algebarskih jednadžbi uobičajeno zvati korijeni jed nadžbe. Ponovimo i neke osnovne činjenice o algebarskim jednadžbama s realnim koeficijentima E R . al) Kompleksna rješenja korijeni) se javlj aju u parovima konjugirano komplek snih brojeva. Ako + ib ima (kratnost onda i ib ima kratnost a2) Ako je stupanj algebarske jednadžbe neparan, onda ona ima barem jedno realno rj ešenje (korijen). a3) AIgebarskajednadžba ima rješenja uračunavši njihove kratnosti. a4) Iz poznavanja svih rješenja algebarske jednadžbe možemo naći algebarsku jednadžbu u normiranom obliku koji glasi ) O )( ( ) ( gdje su općenito kompleksni brojevi. aS ) O je rješenje algebarske jednadžbe onda i samo onda ako je O. x
x
x
ak
a
s,
a -
s.
II
X - XI
X
X2 "
' X - xn
Xk
x
an
=
5. 1. JEDNADŽBE S JEDNOM NEPOZNANICOM
135
a6) Ako je an i= O , onda su rješenja Xk algebarske jednadžbe u kompleksnoj ravnini unutar kružnog vijenca (3) IXk l R.
r<
<
r
lednajednostavna, ali gruba ocjena veličina i R izgleda ovako. Označimo sa = max{ l a l l , l a 2 1 , · · · , l a i } , n gdje su ak koeficijenti jednadžbe (2). Tada vrijedi
A
IXk l
A = R. <1+�
(4)
Označimo sa Tada vrijedi
IXk l >
1 1+
B
-
=
r.
(5)
l a,, 1
a7) Algebarske jednadžbe do uključivo četvrtog stupnja, n :::; 4 , možemo riješiti direktno, kao npr. kvadratne jednadžbe. Ta rješenja su dana formulama, koje se zbog složenosti rijetko koriste, a rješenja se izračunavaju pomoću koeficijenata jednadžbe i realnih brojeva. Te formule sadrže u sebi zbrajanje, odbijanje, množenje, dijeljenje, po tenciranje i korijenovanje. Za opće jednadžbe stupnja n � 5 to je neizvedivo, što znači da ne možemo napisati formulu s konačno spomenutih operacija nad koeficijentima jednadžbe i realnim brojevima. To ne znači da se neke specijalne algebarske jednadž be stupnja � 5 ne mogu točno riješiti. Tako npr. znamo naći rješenja algebarske jednadžbe = O, X7 a to su O i svi šesti korijeni jedinice. Stoga i kod rješavanja algebarskih jednadžbi trebamo metode kojima aproksimiramo rješenja. Navedimo i nekoliko činjenica potrebnih kod aproksimativnog rješavanja bilo algebarskih bilo transcendentnih jednadžbi koje su nam manje ili više poznate iz dife rencijalnog računa: b l ) Osnovna pretpostavka je da jednadžba ima samo izolirana rješenja. (To je kod algebarskih jednadžbi u vijek ispunjeno.) b2) Postupak aproksimativnog rješavanja sastoji se iz dva koraka. b2. l ) Odjeljivanje rješenja, tj. iznalaženje što je moguće kraćih intervala [a, unutar kojih imamo samo jedno rješenje jednadžbe. Za odjeljivanje rješenja često je praktički dovoljno provoditi proces raspolavljanja koji se sastoji u tome da dani seg ment [a, raspolovirno, zatim podijelimo na 4, 8, dijelova i odredimo predznak funkcijskih vrijednosti na krajevima pojedinih segmenata. b2.2) Iznalaženje rješenja do tražene točnosti. b3) Ako je neprekidna i na krajevima segmenta [a, prima vrijednosti s pro tivnim predznacima, tj. O , onda unutar segmenta [a, postoji barem jedno rješenje jednadžbe = O. b4) Ako derivacija !' na [a, ima isti predznak i vrijedi O , onda je rješenje jedinstveno je strogo monotona na [a,
-x
bl
bl
.
j
(j
j(a)j(b) < j(x) bl
.
.
bl
bl )
.
bl j(a)j(b) <
5. NELlNEARNE JEDNADŽBE
136
b5) Ako je J(a)J(b) > O i J ima neprekidnu drugu derivaciju r na [a, bl , koja na [a, bl ne mijenja predznak ( f je konveksna ili konkavna) , onda unutar [a, bl nastupa jedna od tri mogućnosti (vidi sliku): b5. 1 ) J(x) = O ima dva rješenja; b5.2) J(x) = O ima jedno dvostruko rješenje; b5.3) J(x) = O nema rješenja. I I I
A
a
, I
1
xJ = x2
a
b
Sl. 5.1.
b
Spomenimo bez dokaza ovaj dovoljan uvjet kada smo u slučaju b5.3). Neka dodatno P' nema nultočku na [a, bl . Ako vrijedi J( b ) J( a ) b a P(b) p (a) onda J(x) = O nema rješenja. Za ocjenu pogreške aproksimacije lako se pomoću teorema o srednjoj vrijednosti dokaže sljedeća činjenica: b6) Neka je � točna, a x aproksimativna vrijednost rješenja jednadžbe J(x) = O koja pripada segmentu [a, b] na kojem je IJ'(x) I > O . Tada vrijedi sljedeće ocjena
�
�m
(6) Metoda raspolavijanja
I
Promatrajmo jednadžbu
[
J(x)
]
O
]
gdje je J neprekidna funkcija na [a, b] i J(a )J( b) < O . Raspolovirno [a, bl na a+b . +b ' . . . od nJI" h J InIJenja d va pod segmenta a , -- I .. . b I provjerimo na koJemu 2 2 predznak. Taj podsegment ponovo raspolovirno i potražimo na kojem dijelu J mijenja predznak. Nastavimo li postupak raspolavljanja dobivamo niz segmenata [a / , b d, [a2 , b2] , , [an , bn] , jedan unutar drugog za koje vrijedi J(an )J( bn ) < O, n = 1, 2, . . .
bn
an
=
l
• • •
( b - a) , 2n
5 . 1 . JEDNADŽBE S JEDNOM NEPOZNANICOM tako da je rješenje � jednako
a
lim n--oo n dok su an i n aproksimacije od � . �
=
b
137
=
b
lim , n --oo n
I Metoda iteracije I
Ovo je jedan od najvažnijih postupaka za numeričko rješavanje jednadžbi. Neka je dana jednadžba (7) f(x) = 0,
i neka je za početak f neprekidna funkcija. Dodavanjem x na lijevu i desnu stranu jednadžbe (7) dobivamo x + f(x) = x, što prelazi u
cp(x) = x ,
(8)
(8)
gdje je cp (x) = x + f(x) . Jasno je da su jednadžbe (7) i ekvivalentne. Na jednadžbu možemo primijeniti sljedeći postupak. Izaberimo na bilo koji način aproksimativnu vrijednost Xo rješenja jednadžbe Uvrstimo li Xo u lijevu stranu od dobivamo X l = cp (xo) ·
(8)
(8).
(8)
(8)
Uvrstimo li sada X l u lijevu stranu od dobivamo X2 = CP(X l ). Nastavimo li postupak dobivamo = 1 , 2, . . . ) . Xn = cp (xn - d , Ako dobiveni niz { xn } konvergira, onda graničnim prelazom dobivamo lim Xn = cp( lim xn- d = cp(� ) , � = n--oo n--oo odnosno f(� ) = 0 ,
(n
(9) ( 10)
pa smo time našli rješenje polazne jednadžbe. Sljedeći teorem kaže pod kojim uvjetima postupak konvergira. Teorem 5.1 . Neka je cp [a, bl [a, bl di/erencijabilna Ila [a, bl . (Uočite da je kodomena od cp jed1laka domeni.) Ako je I cp ' (x ) 1 � q < l za a < X < b, onda postupak iteracije Xn CP (Xn- I ), n 1 , 2, . . kOllvergira i to neovisno o početnoj vrijednosti Xo E [a, bl, a -+
:
=
=
�
=
lim X n�oo n
je jedinstveno rješenje jednadžbe (8) na segmentu [a, bl .
.
Dokaz. Promatrajmo aproksimacije Xn i Xn+ ! koje zbog pretpostavki teorema imaju smisla. Sada je Xn+l Xn
5. NELINEARNE JEDNADŽBE
Promatrajmo red Xo + (X I - XO) + (X 2 - xd + . . . + (xn - xn- d + . . . , čij aje (n + l) -va parcijalna suma jednaka Sn+ l Xn· Promatrani red je konvergentan, jer mu je, zbog q l , majoranta konvergentan geometrijski red, pa niz Sn+! Xn konvergira i lim xn � E [a, bl · je rješenje, tj . vrijedi =
<
=
Treba još dokazati jedinstvenost rješenja. Neka je � E [a, bJ neko drugo rješenje, onda je
i prema torne
ili
- �)[l -
�- �
(�
� )
e E (� , �),
=
=
- oo, oo
Ixn +p - xn l
=
� �
=
<
- oo, oo .
Ixn+p - Xn+p-l + Xn+p- l + . . . + Xn+l xn l Ixn +p - xn+p- d + I Xn+p- l - xn+p-2 1 + . . . + I Xn+1 - xn l +p+p 2 if I lx l xo l + if - IxI xol + . . . + q1! l x I - xo l l if I X l - Xo I (I + q + q2 + . . . + qP- ) .
5 . 1 . JEDNADŽBE S JEDNOM NEPOZNANICOM
139
Dakle <
p-OCJ xn+p = � dobivamo
Iz lim
ct
( 12)
l - q lx I - xo l·
--
( 13 )
q
pa je postupak iteracije tim bolji što je manji. Za ocjenu pogreške aproksimacije i mamo i drugu formulu. Pođemo l i od
g(x) x q>(x)
imamo
g( � ) = O to imamo IXn - q>(xn ) 1 = Ig(xn ) - g( � ) 1 = IXn �11g'(xn ) 1 � ( I q) lxn gdje je Xn E (Xn' � ) i prema tome Kako je
-
,
-
n
odnosno što kombiniraj ući s ( l l ) daj e
I� - xnl � l - q IXn xn- I I·
( 1 4)
Ta formula omogućava ocijeniti pogrešku aproksimacije iz razlike uzastopnih aprok simativnih rješenja. Ako je zadana točnost E > O , postupak iteracije treba voditi dok ne bude < E, l iz čega slijedi da postupak treba voditi dok ne bude 1 ( 15 ) Ii <
q xn - xn l l --I -q IXn --. Xn-
q
Najjednostavniji i najefikasniji način je da se iterativni postupak provodi dok ne pos tignemo 16) gdje je E zadana točnost. Istaknimo odmah sljedeće. Prelaz s jednadžbe =O na ekvivalentnu jednadžbu
(
j(x) X = q>(x)
nije jedinstven. Stoga treba uvijek paziti da uvjet teorema b < l za a < bude osiguran. To ilustriramo primjerom jedne kubne jednadžbe.
1 q>'(x) 1 � q
X<
5. NELINEARNE JEDNADŽBE
140 Primjer 5.1 . Promatrajmo kubnu jednadžbu
x3 - 4x2 + x - l O = O. Lako provjeravamo da na segmentu [4, 6] postoji rješenje jednadžbe. Jasno je da tu jednadžbu možemo prevesti u oblik x = q> (x) na više načina. Odmah se name će oblik x = 1 0 + 4x2 - x3 no taj izbor nije dobar jer nemamo potrebnu ogradu za 1 q>'(x) 1 = 1 8x - 3x2 1 , pa nemamo garanciju da u tom slučaju postupak iteracije konvergira. Međutim, izračunamo li x iz prvog člana, tj. napišemo li ,
x=
4x2 - x + 10
imamo
pa vidimo da na [4, 6] vrijedi 1 q>'(x) 1 n
O l 2
3
<
Xn 4 4.4 4.29 4.3 1
l . Odabravši Xo = 4 dobivamo n
Xn 4.3063 4.3070 4.3069 4.3069
4 5
6 7
Newtonova metoda (metoda tangente)
I
Neka je � rješenje jednadžbe J(x) = O na segmentu [a, b] i neka su J' i f" neprekidne funkcije koje ne mijenjaju predznak na [a , b] . Ako je Xn aproksimacija rješenja, onda možemo naći bolju aproksimaciju tako da uočimo da je � = Xn + !tn i da pokušamo ocijeniti !tn . Prema Taylorovoj formuli imamo odnosno
Odatle nalazimo novu aproksimaciju n
= O, 1 2 , . . ,
.
Geometrijski gledano, gornji postupak se sastoji u sljedećem ( v. sl. 5 .2).
( 17)
5 . 1 . JEDNADŽBE S JEDNOM NEPOZNAN ICOM
141
/ All
Sl. 5.2.
Jednadžba tangente u točki An (xn, j(xn ) ) glasi y j(xn) j' (xn ) (x - xn ), a njeno sjecište s x -osi je dano s
što nam predstavlja novu aproksimaciju od � . Iz ovog opisaje jasno otkuda dolazi ime metoda tangente. Taj se postupak još zove Newtonov iteracijski postupak ili New tonova metoda, a ponekad i Newton - Raphsonova metoda. U sljedećem teoremu su dani dovoljni uvjeti pod kojima postupak konvergira. Teorem 5.2. Neka je j(a )j( b) < O, neka su j' i f" različite od nule i ne mije njaju predZIlak na [a, bl . Ako pođemo od neke toc"ke Xo E [a, bl za koju vrijedi j(xo)j" (xo) > ° i računamo j(Xn)
Xn+ ! = Xn -
j' (xn ) '
O, 1 , 2, . .
"
onda lIiz {xn} konvergira kjedillsrvenom rješenju � jednadžbe j(x) = O . Dokaz. Neka j e npr. j(a ) < ' O , j(b) > 0 , j'(x) > 0 , f" (x) > O za a � X � b (ostali slučajevi se razmatraju analogno), za Xo možemo odabrati b jer je j(b)f"( b ) > O . Pokažimo prvo da sada za sve aproksimacije vrijedi Xn > � ( n = O, l " , . ) i prema tome j(xn ) > O . U prvom redu je Xo > � . Indukcijom, neka
je Xn > � Stavimo � .
gdje j e � imamo odnosno
= Xn + (� - xn ) Prema Taylorovoj formuli imamo .
° = j(� ) = j(xn ) + j'(xn) (� - xn) + � f" (Cn )(� - xn) 2 < Cn < Xn ' Kako j e f" (x) > O , to odbacivanjem pozitivnog pribrojnika ( 18)
5. NELINEARNE JEDNADŽBE
142
i prema tome
{xn } je ograđen, a iz ( 17) i činjenice da je J(xn } > O slijedi ( 1 9) Xn+ l < Xn pa zaključujemo da je niz {xn } konvergentan. Postoji dakle � = n-oo lim Xn . (20) Sada još treba dokazati da je � = � . Međutim, zbog neprekidnosti od J , J' f' (x) ::j:. O dobivamo iz ( 17) graničnim prijelazom -� = -� - J(�) JI (�) ili J(�) = O. Monotonost od J povlači da je � = � pa je time teorem dokazan. Za ocjenu pogreške -te aproksimacije možemo se poslužiti formulom (6) (21) ! � xn ! � IJ(xn ) ! , gdje je m � !f '(X} I za x E [a, b] . Izvedi mo jednu drugu formulu za ocjenu pogreške. Iz Taylorove formule imamo J(xn ) = J[Xn - l + (xn - xn-d] ( 22) = J(xn-d + !, (xn-d(xn - xn-d + �!,I ( �n-d (Xn xn _ d 2 , gdje je �n-l E (Xn- h Xn ). Prema ( l7) imamo Xn- I - JJ'(X(Xn-n-lI')) ' Dakle, niz
,
n
_
tn
.
pa dobivamo
što uvršteno u (22) daje
Dakle,
IJ(xn ) ! � � M(xn - xn_d2 gdje je M ;;;:: 1f"(X) I na [a, b] . Uvrstimo li dobiveno u ( 2 1 ) postižemo ovu formulu za ocjenu pogreške (23)
5. 1 . JEDNADŽBE S JEDNOM NEPOZNANICOM
143
Ocjena ( 23) omogućava sljedeće razmatranje. Kada provodimo konvergentan po stupak, tada Xn - Xn - l --+ O , pa za dovoljno veliki i svaki n > imamo M lxn - xn- l l < 2m , tako da vrijedi ( 24) I � - xn l IXn - xn - d . Istaknimo da I Xn - xn- l l < E ne garantira pogrešku aproksimacije manju od E , pa u tom poslu treba biti oprezan. (Naime, možda još nismo premašili da vrijedi ( 24).) Izvedimo još i formulu koja povezuje apsolutne pogreške uzastopnih aproksima cija. Iz Taylorove formule
N
N
�
N
�
O = j(� ) = j(xn) + !, (xn ) (� - xn) + j" ( Cn )(� - Xn ? , imamo
Cn E (Xn ' � )
odnosno
iz čega dobivamo ovu ocjenu
I � - xn+l l
� 2Mm (� - Xn)2 .
( 25)
Ta formula uspoređuje apsolutne pogreške dviju uzastopnih aproksimacija. Ona ujed no govori o brzoj konvergenciji Newtonovog postupka ako se početni Xa odabere takav da vrijedi M l � xa l q < 1 . 2m M l i I � - xn l < lO- k onda iz te formule slijedi Posebno, ako je JJ. = 2m I � - xlI+1 1 < 1O- 2k , pa ako je aproksimacija bila točna na prvih k decimalnih mjesta, onda sljedeća aproksimacija ima točno prvih 2k decimalnih mjesta. Kraće rečeno, za JJ. l Newtonova metoda udvostručava u svakom koraku broj točnih decimalnih mje sta. Takav tip konvergencije iteracij.skog postupka zove se kvadratična konvergencija. U mnogim slučajevima dovoljno je samo pet ili šest iteracija da dobijemo � točno na osam i više decimalnih mjesta. Kod konkretnog računa obično vodimo postupak dok ne postignemo j(xn ) = h < E, ( 26) I Xn+1 - xn l = j'(xn )
�
�
�
I
I
gdje je E zadana točnost. Međutim, bolje je ako se možemo poslužiti npr. ocjenom pogreške ( 2 1 ). Primjer 5.2. Riješite jednadžbu e' = 1 0 - X na 4 decimalna mjesta. Sada imamo j(x) = e' + x - lO , j' (x) = e' + l i e'n + Xn - 1 0 Xn+l = Xn en + l
5. NELINEARNE JEDNADŽBE
144
Lako ocjenimo da je J(O) < O , J( I ) < O . J( 2) < O , ali J(3) > O . Time znamo da = 2 dobivamo sljedeće aproksimacije: je rješenje između 2 i 3. Izborom
Xo
II
O l
Xn
2 2.073
n
2 3
Xn
2.071 2.07 1
Potpunosti radi spomenimo sljedeće. Zamislimo da smo na početku proveli ap roksimaciju sa uključivo kvadratnim članom Taylorove formule, tj . da smo gledali
(27) J(xn + !Zn} J(Xn ) + hn!, (xn ) + �J" (Xn)h�. Tada se iznalaženje nove aproksimacije X n+ svodi na rješavanje kvadratne jednadžbe što se može provesti, ali izostavljamo. 0=
�
Metoda sekante (regula falsi)
l
I
Promatrajmo ponovo isti problem i neka j e npr. J(a)
<
O i J(b) > O (v. sl. 5. 3).
B
A
Sl. 5.3.
Jednadžba sekante kroz krajnje točke luka
X
AB glasi
a y - J(a) b a J(b) J(a) ' Za y = O dobivamo sjecište sekante s X -osi J(a} a (b - a). J(b} - J(a) Ponovimo sada postupak na segmentu bl e [a, bl kao što je ilustrirano na sl. 5.3. Taj postupak možemo nastaviti pri čemu općenito niz može divergirati. Da osi guramo konvergenciju postupka pretpostavimo da J" ne mijenja predznak na a , bl · Time je J konveksna funkcija na a , bJ pa sekanta siječe graf od J nad a , bl samo u kraj njim točkama Neka j e npr. < O svodi > O na a , bl . Slučaj se na rješavanje jednadžbe -J(x) = O . Uz > O nastupaj u dva podslučaja.
[x \,
A , B.
[
J"(x) rex) [
{x,}
J"(x)[
[
5 . 1 . JEDNADŽBE S JEDNOM NEPOZNANICOM l) Za
145
f(a) > O ( v. sl . 5.4) uzimamo Xo X n+ 1
=
Xn -
b za prvu aproksimaciju. Tada imamo
=
f(xn ) (Xn - a), (x n f ) f(a) _
n =
(28)
O, 1 , 2, . . .
što zbog konveksnosti od f daje jedan ograđen monotono padajući niz aproksimacija {xn } pa prema tome niz {xn } konvergira k nekom � = lim Xn . n -oo A
, , , ,
,
, , ,
a
,
, ,
, ,
"
'"
,
' xlI+J
� "
Sl. 5.4.
2) Za f(a)
,
x,,:,
X"
XII ,
/
, ,
,
/
, ,
,
,
,
, ,
, ,
,
,
B
Sl. 5.5.
< O ( v. sl. 5.5) uzimamo Xo
=
a . Tada imamo II
=
O, 1 , 2, . . .
( 29 )
Zbog konveksnosti od f dobivamo ograđen monotono rastući niz aproksimacija {xn } koji konvergira k nekom � = lim Xn . n -oo Kako je � = lim Xn+ 1 = lim Xn , to iz (28) dobivamo n - oo n -oo
f (� ) (� - a) f (� ) - f(a) O, tj . � je rješenje jednadžbe. Analogno razmatranje imamo u slučaju �
=
�-
što daje f ( �) = 2). Usporedimo li metodu sekante s Newtonovom metodom, onda je njena prednost u tome što ne zahtijeva izračunavanje derivacije f' , međutim sporije konvergira od Newtonove metode. za ocjenu pogreške aproksimacije može nam poslužiti iz uvoda poznata formula
(30) gdje je
III
� 1J' (x) l ,
a
� X � b.
Međutim, računski je zanimljiva formula koja daje ocjenu pogreške pomoću izračuna tih susjednih aproksimacija Xn- I i Xn . Neka je J' ograđena na [a, tj, /Il
� If'(x) I � M,
X E [a,
bJ.
bJ ,
(3 1 )
146
5. NELINEARNE JEDNADŽBE
Razmotrimo samo slučaj l ) , tj. kada je u postupku Xo ( 28) lako dobivamo
pa dodavanjem j( � )
=
b (analogno u slučaj u 2) ) . Iz
O imamo
j(� ) -
I(Xn-l) I(xXn n--dl Ia ( a) (xn - xn- d .
(32)
=
Po teoremu o srednjoj vrijednosti primijenjenom na obje strane jednakosti ( 32) dobivamo (33) �n - l E (Xn-h � ) , E UmetarJ.iem O = xn - Xn u prvi faktor lijeve strane od (33) lako dobivamo If' (xn - d f'(�n - d l lXn - Xn -I I l ."j:: - Xn I If'(�n - d l M-m (34 ) n- d 1J ( �n _ d l x l
Xn-l (a, xn-d ·
n x � / � M m 'n l n xn - d . Ako je nadalje duljina segmenta [a, bJ dovoljno malena da smo postigli M � 2 m , onda iz (34) dobivamo ( 35) I � xn l � IXn - xn - d , ___
x
pa u takvoj situaciji vodimo postupak dok ne bude IXn - xn - d točnost.
< f,
gdje je
f
dana
Primjer 5.3. Riješimo jednadžbu .r = lO na 3 decimalna mjesta. Logaritmira
njem imamo
Uzmemo li j(x)
=
X In x - ln 10 = O . x ln x - ln 1 0 , onda vidimo da je f' (x)
ln x + l iz čega zaklju-
( � ) i raste na ( � , ) . U točki X � ima očito minimum. oo
čujemo da j pada na O,
ln 10 , to vidimo da postoj i samo jedno rješenje � l promatrane j ednadžbe za koje vrijedi � > - . Bolj u ocjenu intervala unutar kojega Kako za X
+ 0 , j(x)
-t
e
se nalazi � nalazimo uočavanjem da je j(2)
b
=
3 . Iz f"(x)
=
!
X
<
O i 1(3) > O . Odabiremo
a
=
2,
vidimo da je j konveksna na (O, oo ) . Prema ( 29) imamo n
O l 2
Xn 2 2.4798 2.5049
n
3 4 5
Xn 2.5061 2.506 1 2 . 5061
I
[a,
U dosadašnjem opisu metode sekante držali smo jedan kraj segmenta bl čvrs tim. Postoji i modifikacija metode sekante kod koje mijenjamo oba kraj a sekante. To je ilustrirano na slici 5 .6.
147
5 . 1 . JEDNADŽBE S JEDNOM NEPOZNANICOM
Sl.
5.6.
X,,-l
Sada se polazi od dviju aproksimacija i x" (pretpostavljamo konveksnost od f na promatranoj okolini od � ) koje su npr. obje veće od � . Iz jednadžbe sekante kroz i - f(x,, - d - f(x,, ) x x" ) y - f(x" ) - x" dobivamo x,,- d(x,,) - x"f (x,, - d (36) f(x,, ) - f(x,,- d Izvedimo još i ocjenu pogreške tipa (34). Iz (36) imamo f(x - f(x,, ) x" ) ,, - d -f(x" ) - x" tako da dodavanjem I(� ) O imamo ) - f (X,, -l ) - f (x,, ) x" . f( ':>�) - f(x" ) -
P,, - l P"
(
X" - l
.
�+ l =
=
_
(X"+ l
_
X,,- l
Xn- l - Xn (X"+ l Primjenom teorema srednje vrijednosti na obje strane dobivamo _J' (xn-d (Xn- l - xn ) (Xn+l Xn ) ( ':>� Xn )f' ( ':>�n ) Xn-l - Xn gdj e je �n E ( � , Xn ) Xn - l E (Xn ' xn - d , tako da vrijedi ':>� - Xn = ff' ('Xn(�-n )l ) (Xn+l - Xn ) . _
_
_
'
(37)
Iz (37) dobivamo ocjenu
(38) Sa stanovišta interpolacijskog polinoma mi smo kod metode sekante iterativno aproksimirali f s linearnim interpolacijskim polinornom čije nu1točke konvergiraju rješenju jednadžbe. To se može provesti i s kvadratnim interpolacijskim polinornom (Mullerova metoda) . Isto se tako metode mogu kombinirati iz koraka u korak što ovdje izostavljamo.
148
5. NELINEARNE JEDNADŽBE
Neka daljnja svojstva pofinoma
I
U ovom paragrafu ćemo se ukratko baviti problematikom algebarskih j ednadžbi koje se vrlo često poj avljuj u u primjenama. Tako je npr. karakterističnajednadžba line arne diferencijalne j ednadžbe algebarska jednadžba čija rješenj a (realna i kompleksna) treba znati da bi ispisali opće rješenje linearne diferencijalne jednadžbe. Promatrat ćemo algebarske j ednadžbe s realnim koeficijentima. Neka je n (l) P(x) = aoxn + a txn - I + . . . + an - IX + an = ajXn - i
L poJinom ll -tog stupnj a s realnim koeficijentima, tj. ao =1= o , al , . . . , an brojevi. Pripadna algebarska jednadžba glasi aQXn + al�- l + . . . + an - IX + an = O i=O
Su realni (2)
koja dijeljenjem s ao prelazi u normirani oblik
i
=
O, 1 , 2,
. . . , n.
(3)
Kao što znamo, svaki se polinom ( I ) može analitički proširiti na cijelu komplek snu ravninu. To proširenje dobivamo tako da u ( 1 ) umjesto X pišemo kompleksnu varijablu = X + pa imamo (4) = aozn + a t Zn - 1 + . . . + an - I Z + čije n ultočke zovemo rješenja algebarske jednadžbe (2). Na (4) možemo primijeniti teoriju analitičkih funkcija unutar koje lako dokazu jemo niz rezultata o polinomima kao npr. osnovni teorem algebre itd. Prisjetimo se da nam teorem o argumentu primijenjen na polinome daje broj nultočaka koje se nalaze unutar konture r . Ta formula glasi l 6r arg p 2n gdje 6r arg P označava promjenu argumenta od P kada j ednom obiđemo konturu r u pozitivnom smjeru. Prisjetimo se također RoucMovog teorema koji se lako dokazuje pomoću teorema o argumentu i kaže:
y i,
z
an
P(z)
N
N
Neka su J i g analitic"ke funkcije na području G, a r G komura čije je nutamje područje sadrža1lo u G. Ako za toc"ke konture r vrijedi nejednakost IJ(z) I > Ig (z)1, Z E r olldafullkcije J i J + g imaju unutar r isti broj nu/točaka. Prema osnovnom teoremu algebre znamo da poli nom (4) ima točno nultočaka, što za nas znači da j ednadžba (2) ima točno n rješenja (korijena), realnih i komplek e
II
snih, pod uvjetom da svako rješenje uzmemo sa svojom kratnošću. Znamo da je �
s -kratno rješenje od (2) (ili s -struka nultočka od (4) ) ako vrijedi
O
P(� )
PI(� )
=
.
.
.
= p(5- 1 ) ( � )
i
p(5) ( � )
=1= O.
5.2. ALGEBARSKE JEDNADŽBE
149
Prisjetimo se nadalje da se kompleksna rješenja algebarske jednadžbe s realnim ko eficijentima javljaju u parovima konjugirano kompleksnih brojeva, te ako je +
a tJi s -kratno, ondaje i a -tJi s -kratno rješenje. (Ako u jednadžbi (4) dopustimo komplek
sne koeficijente, onda vrijedi sljedeće: Konjugirano kompleksne vrijednosti rješenja jednadžbe (4) su rješenja jednadžbe koj a se iz (4) dobiva tako da joj se koeficijenti zamijene s konjugirano kompleksnim vrijednostima. Naravno, kratnosti se čuvaju.) Označimo s (5) rješenja j ednadžbe (2) ( Xj realan ili kompleksan). Tada
P možemo pisati u obliku
n
(6)
iz čega izjednačavanjem koeficijenata uz iste potencije dobivamo sljedeće formule
(7)
2:: XjXjXk
i�j#
koje se zovu Vieta-ove formule. Nadalje, ako su Xi nuItočke od (2), onda su nultočke polinoma
?*(X)
n
ao + alx +
. . .
+ anxn = 2:: a xi . ;=0
i
Uzmemo li u obzir kratnost Si , nultočke Xi , onda (6) prelazi u P(x) = (x X l )'t (x - X2)'2 . . . (x - xm ) 'm gdje su X I , . , . , Xm različite nultočke od i vrijedi S I + Sz + . . . + m = ll.
ao
Xi
P
(8)
(9)
s
Granice rješenja algebarskih jednadžbi
Ocijenimo u prvom redu apsolutne vrijednosti rješenja jednadžbe (2). Vrijedi sljedeći teorem. Teorem 5.3.
Neka je
A ma { la ! l all , · · · , lan i } . Tada apsolutne vrijednosti lXi i rješenja jednadžbe (2) vrijedi sljedeća nejednakost A R ( 1 0) I X; ! < 1 + lao l tj. sva se rješenja (realna i kompleksna) nalaze u kompleksnoj ravnini unutar kruga radijusa R 1 + I I =
x
J ,
za
=
=
�'
5. NELINEARNE JEDNADŽBE
150
Dokaz. Promatrajmo sljedeće analitičke funkcije I(z) = aozf/ g(z) = a tzn - I + a2z,,-2 + . . . + af/- I Z + an koje zbrojene daju poti nom (4). Sada za I z l > l vrijedi Ig(z) 1 � l a l llz l n - 1 + . . . + I an- I l iz i + lan i � A ( lz l n - , + . . . + I z l + 1) n A I Izlz l - ll n < A Iz l ' IžIl
Da primijenimo gore spomenuti Roucheov teorem moramo naći konturu na kojoj vri jedi Lako određujemo kružnicu za koju to vrijedi. Naime, iz zahtjeva
I/(z) \ > Ig(z)\ .
dobivamo da mora biti
laol lz l n > A � Iz l - l
Prema Roucheovom teoremu funkcije 1 i 1 +
g = P imaju isti broj nuJtočaka unutar kruga radijusa R l + � . Kako 1 ima u z = O nultočku kratnosti n , to I I znači da smo tom kružnicom obuhvatili sve nultočke od P, pa je time teorem dokazan. Odmah imamo sljedeću posljedicu. Korolar 5.4.
Neka je an i= O i
x{ lao l , la l I, . . . , lan-l l } .
B = ma
Tada sva rješenjajedlladžbe (2) zadovoljavaju nejednakost Ixd > l B = r. l+�
Dokaz. Uvjet an i= O povlači da ishodište nije rješenje jednadžbe (2). l prema (8) Xj rješenja jednadžbe anxn + an_ I Xn - 1 + . . . + ao O
tako da primjenom teorema 5.3 na ( 1 2 ) dobivamo
iz čega slijedi ( l l ) .
I�IXi < l + L lan i
(ll)
Sada su
( 12)
5.2. ALGEBARSKE JEDNADŽBE Imamo li dakle vijenca
151
an :f. O , onda se sva rješenja jednadžbe (2) nalaze unutar kružnog
l A ( 13) T = ----;:B-- < Ixd < l + -Iao-I R 1+l ani gdjeje A ma { l ad l azi , . . . , l ani } , B = max { l ao l , l a d, · · · , l an - d} . Ograničimo li se na realna rješenja, onda su T i R donja i gornja ograda za pozitivna rješenja, a -R i - T za negativna rješenja. Što se liče nalaženja granica realnib rješenja algebarske jednadžbe dovoljno je naći granice za pozitivna rješenja, jer supstitucijom umjesto x dobivamo jed nadžbu P{ -x) = O čija se rješenja razlikuju samo u predznaku od rješenja jednadžbe P( ) = O . Sljedeći teorem daje jednostavnu ocjenu gornje ograde pozitivnih rješenja =
x
,
-x
x
algebarske jednadžbe.
Teorem 5.5. (LagTange) Neka je ao > O i a ( m � l ) prvi u nizu ao. a l , a negativni koeficijent polinoma P. Tada su smva pozitivna Tješenja jednadžbe (2) omeđena sa R 1 + mE Y ao gdje je a najveća apsolutna vrijednost negativnih koeficijenata od P. Dokaz. Neka je x > 1 . Ako pozitivne koeficijente a l , . . . u P zamijeni rno nulom, a sve preostale a , am + l , . . . , an s -a , onda x > l vrijedi P(x) = aoxn + a - 1 + . . . + an aoxn a(xn- m + + ' " + x + 1) -l x l n-m + ! a x-- {Q Xm- 1 (x - 1) - a } . O X l Prema tome, ako je x � l + m r.!!: , onda je prvi faktor pozitivan, a za drugi vrijedi Y ao -I aQXm - l (x l ) - a � ao ( l + {fr {f - a = ao ( E + . . . + � ) a > o, ao Y ao što povlači P(x) > O , čime je dokaz proveden. .
.
. •
n
m
=
n
za
tX
n-m+ 1 x
x
n-m+1
x -
, am l -
n m 1 x - -
l
m
S pomenimo da donju ogradu možemo naći kao reciproč nu vrijednost gornje og rade jednadžbe ( 8) kao što smo to učunili u dokazu korolara 5 .4. Ocjena gornje ograde koju daje teorem 5.5 može biti dosta gruba.
5. NELINEARNE JEDNADŽBE
152 Primjer 5.4. za jednadžbu
X4 - 35x3 + 380x2 - 1 350x + 1000 = O
a
ao
imamo = 1 350 , = 1 , m = 1 , pa iz teorema 5.5 slijedi da su sva pozitivna rješenja manja od 135 1 . Za iznalaženje donje ograde treba gledati jednadžbu
1 - 35x + 380x 2 - 1 350x3 + 1000x4 = O za koju je
2350 za gor1000 = 0.425 donja ograda pozitivnih
ao = 1000 , a = 1 350 i m = 1 , tako da teorem 5.5 daje.
����
nju ogradu njenih pozitivnih rješenja, pa je rješenja polazne jednadžbe. Nalaženje ograde probanjem. Kako se u -nalaženju ograde često služimo pro banjem, to navodimo ovaj jednostavan postupak. Pretpostavimo > O (u protivnom pomnožimo jednadžbu s - 1 ) i rastavimo promatrani polinom P na zbroj
ao
P (x) = Q(x) + R(x)
( 14)
gdje je Q polinom koji se sastoji od svih vodećih članova s pozitivnim koeficijentima i svih negativnih članova polinoma P (to znači da Q nalazimo tako da u nizu potražimo prvi negativni član te zbrojimo sve članove do tog mjesta i sve negativne članove), a R je polinom sastavljen od svih preostalih članova. Za svaki x ;:: O vrijedi R(x) ;:: O . Polinom Q je građen ovako
ao ,
a l , . . . , an
(
) (I am 1x + . . . ) ) _ l a lx + . . . } +...+
Q(X ) - aoxn + . . . + am- I xn-m+l _
- X n-m+
_
l
{ (aox
m- I
n-m
n-m
m
am - I
x
n -m+ I
iz čega čitamo da su za x > O obje okrugle zagrade pozitivne i da prva raste, a druga pada kada x raste. Vrijedi dakle: a >O ( 14) Q( a) ;:: O , x>a P (x) > O , a P(x) = O . U gore promatranom primjeru
Ako nađemo takav daje u rastavu ondaje za svaki tj. nađeni je gomja ograda pozitivnih rješenja jednadžbe
Q (x) = X4 - 35x3 - 1 350x, R(x) = 380x 2 + 1 000 . Očito je da 35 nije gornja ograda. Pokušamo li 37 dobivamo Q(37) > O , pa je dakle 37 gornja ograda pozitivnih rješenja. Da nađemo donju ogradu promatramo P* (x) = 1000x4 - 1 350x3 + 380x2 - 35x + 1 koji zapisujemo u obliku P* (x) = Q* (x) + R* (x) , gdje je
Q* (x)
=
1000x4 - 1 350x3 - 35x,
R* (x) = 380x 2 + 1 .
Iz zapisa Q* (x) = x{x2( 1000x - 1 350 ) - 35 } lako uočavamo da je Q* ( l , 3) < O . Međutim, Q* ( 1 , 4) > O pa je dakle 1 .4 gornja ograda rješenja jednadžbe P* (x) = O , 1 a __ ::::: 0.7 14 donja ograda za rješenja polazne algebarske jednadžbe. Time smo 1 .4 utvrdili da se pozitivna rješenja jednadžbe X4 - 35x3 + 380x2 - 1 350x + 1000 = O nalaze unutar segmenta [0.7 14, 37] .
153
5.2. ALGEBARSKE JEDNADŽBE
Newtonov test. Pogledajmo kako nam Taylorova formula može korisno poslužiti. Taj postupak se zove Newtonov test. Razvijemo P po potencijama od x - a . Imamo
P" (a) p( n )(a) P(x) = P(a) + P'(a)(x - a) + -,- (x - a? + . . . + (x - a t .
n!
2.
Iz ( 15 ) čitamo sljedeće:
Nađemo li a > O takav da vrijedi
P(a) � O, P' (a) � O, . . . , p(n ) (a) � O x > a , tj. a
ondaje P(x) > O za svaki pozitivnih rješenja jednadžbe (2).
Ocjena broja realnih rješenja
(15)
( 1 6)
svaki koji zadovoljava (J6)je gomja ograda
I
Nakon utvrđivanja ograda za kompleksna i realna rješenja algebarske jednadžbe postavlja se znatno teže pitanje koliko realnih rješenja ima dana algebarskajednadžba. Promatramo li polinom P na segmentu [a, b] lako uočavamo ova dva svojstva: 1 ) Ako je P( )P( < O , onda P na ima neparan broj rješenja uzetih s njihovim kratnostima. 2) Ako je P( )P( ) > O , onda P na ili nema rješenja ili ih ima paran broj. Upoznajmo se prvo s tzv. Descartesovim pravilom koje daje ocjenu broja pozi tivnih rješenja, a dokazat ćemo ga nakon teorema 5.7.
a b) a b
(a, b) (a, b)
(Descartesovo pravilo) Broj pozitivnih rješenja Np jednadžbe ao > O aoxn + a l Xn - 1 + . . . + an = O, računatih sa svojUn kratnostima, manji je ili jed1lak broju promje1la predznaka N u nizu (koeficijente koji su nula ne uračunavamo) Teorem 5.S.
tj.
Np � N. Nadalje, akoje Np N, ondaje razlika N - Np paran broj.
(17)
<
Primijenimo li Descartesova pravilo na primjer 5.4 imamo niz
1, -35; 380, - 1 350, 1000 za koji je = 4 . Dakle u intervalu (0.7 14, 37) ima � 4 rješenja. Iz P(O) > O i P(37) > O slijedi da unutar [0.7 14, 37] imamo 0, 2 ili 4 rješenja. Kako je očigled no P( l ) < O to unutar [ 1 , 37] imamo neparan broj rješenja, pa vidimo da i unutar [0.7 14, 1] postoji neparan broj rješenja jer ih ukupno na [0.7 14, 37] ima paran broj, koji zbog uočenog ne može biti O. Dakle P ima 2 ili 4 pozitivna rješenja. Lako provjeravamo daje P( 10) > O i P( 15) < O . Iz ta dva podatka zaključujemo da unutar [0.7 14, 10] i [10, 37] imamo po dva rješenja. Kako unutar [15, 37] imamo neparan broj rješenja zaključujemo da unutar [10, 37] imamo dva jednostruka rješenja. Ana logno, zbog P( 1 ) < O zaključujemo da unutar [0.7 14, 10] imamo dva jednostruka
N
rješenja. Time smo zaključili da su sva rješenja jednadžbe 35x3 + 380x2 - 1 350x + 1000 = O realna i to pozitivna i jednostruka.
X4 -
5. NELINEARNE JEDNADŽBE
154
Dokažimo sada općenitiji teorem čija je posljedica Descartesovo pravilo. U tu se svrhu promatra niz polinoma sastavljen od promatranog polinoma i njegovih derivacija, tj. niz P, P" , , p( /I) .
P',
n
.
( 18)
. .
(1) jednaka (x) aon!
Prisjetimo s e d a j e -ta derivacija polinoma
p{n )
dakle konstanta.
Teorem 5.7. (Budan-Fourier) Neka je P(a)P(b) =/: O . za broj nultočaka N(a, b) od P unutar [a, bJ , računatilt sa svojim krat1lostima vrijedi sljedeća ocjena (19) N(a, b) :::;; V(a} - V(b) gdjeje V(a), odnosno V(b) broj varijacija (promjena) predz1Uika u nizu (18) u toc1d a, odnosno b. Akoje N(a, b) V(a) - V(b), olldaje i razlika V(a) V(b) - N(a, b) paran broj. Dokaz. Ako (18) uvrstimo c , a � � b i promatramo niz vrijednosti (20 ) P(c), P'(c), . , p{n ) (c) i zamislimo da c raste od a d o b, onda ć e u (20) doći d o eventualne varijacije predz naka samo kada prođemo kroz nultočku nekog od članova niza (18). Kako za svaki c između a i b vrijedi V(a) - V(b) = [V(a) V(c)] + [V(c) V(b)] vidimo da razmatranje možemo vršiti po podsegmentima od [a, b] . Nadalje, na [a, bJ se nalazi konačno nultočaka od P, P' , . . , p(n - I ) , pa je dovoljno promatrati male pod segmente koji sadrže jednu takvu nultočku, jer na podsegmentu na kojemu P, p' . . . , p(/I- I ) , p(/I) ne mijenjaj u predznak, broj varijacija predznaka na početku i na kraju segmenta je isti. Istaknimo odmah da c E [a, b] može biti zajednička nu1točka više nesusjednih članova niza (18). Npr. za polinom P(x) x3 - 3x2 +4x 2 vrijedi: P( I ) = O ; pl ( l ) = l pil ( 1 ) = O ; pili (l) = 6 . Neka je a r -struka nultočka od p . Tada j e po Taylorovoj formuli (15) p n ) (a) p(r) (a) P{x) - ,r. -(x a )r + . . . + { n., (x - a )n . Neka je E > O takav d a E -okolina o d a n e sadrži drugih nu1točaka niza (18) i neka je E odabran dovoljno malen tako da za svaki x iz E -okoline od a , tj. za koji vrijedi lx - a I E , imamo P(x) ::::; p{r)r!( a ) (x - a y, p(x) ::::; (rp( r-) (a)l)! (x a y- I , . , p{r) (x) ::::; p{r) (a). <
U
c
. .
.
,
;
_
<
. .
(Takav E je moguće odabrati jer se za male argumente polinom ponaša kao član najnižeg stupnja, a za velike argumente kao član najvišeg stupnja.) Tada za = a E i mamo
x
P(a E) ::::;
-
p(r) ( a ) p( r) (a) , ( -EY, P'(a - E) ::::; _ (
r.
1 r 1) ,(-13)'- , .
.
. , p{r) ( a - E) ::::; p{r) (a), .
5.2. ALGEBARSKE JEDNADŽBE pa u podnizu
155
lo ) , . . , pt rl (a - 10) . niza ( 1 8) promatranog u točki a - lO predznak alternira, tako da imamo ukupno varijacija (promjena) predznaka. S druge strane, za x = a + 10 imamo """., P(a + lo ) ....
P(a - 10), pl (a
p(rl (a) f r."
r
p(rl ( a ) f - I r , . , p(r) (a + lo) """ p(r) ( a ) r pl (a + lo ) """ ....., ( r l ) .' . . '"
otkuda vidimo da se u podnizu
P(a + lo), pl (a + lo), . . . , p( rl (a + lo )
predznak ne mijenja. Vidimo dakle, da prolaskom kroz r -struku nultočku od P samo u podnizu P , P' , . . . , pIr) niza ( 1 8) gubimo r varijacija predznaka. Vrijedi dakle V (a - E)
V (a + E) �
r.
Promatramo li redom sve nultočke od P unutar [a, bl dobivamo da je N(a, b) � V (a ) - V(b)
pri čemu smo nuItočke od P računali s njihovim kratnostima. Iz gornjeg razmatranja vidimo da ako na [a, bl imamo samo nultočke od P , onda u ( 19) vrijedi jednakost. Nejednakost u ( 1 9) može nastupiti kada na [a, bl imamo nultočku nekog daljnjeg člana iz ( 1 9) ili nu1točku od P koja je ujedno i nultočka neke derivacije višeg reda od kratnosti nu1točke od p . Taj dio dokaza izostavljamo, iako je analogan prethodnom. Vratimo se Descartesovom pravilu. Ako u Budan-Fourierovom teoremu uzmemo a = O i b dovoljno velik tako da P i sve njegove derivacije budu u b pozitivni (to je moguće jer je za velike argumente ponašanje polinoma određeno najvišom po tencijom), onda i mamo V(b) O , pa je N � VeO) . Kako koeficijenti od P imaju predznake od P(O) , P'(O) , p( n ) (o) , to je VeO) jednako broju varijacija predznaka koeficijenata od p . Time srno dokazali Descartesovo pravilo. •
.
.
.
Primjer 5.5. Promatrajmo poli nom P(x) = X4 - l na [-2, 2] i sastavimo sljedeću tablicu predznaka P
pl
+
O +
+
pil + O +
p'" O +
P
+ + +
Vidimo da vrijedi : V( -2) VeO) = 3 ; VeO) - V(2) = 1 ; V( -2) V(2) = 4 . Iz dobivenog je sigurno da P na [O, 2] ima jednu nuItočku, da izvan segmenta nema nu1točaka, te da na segmentu [- 2, O] ima l ili 3 nultočke. Uočimo da je O trostruka nu1točka od P' . Sturmov niz. Točan broj različitih nultočaka polinoma P na segmentu [a , bl može se naći pomoću tzv. Sturmovog niza. Dajemo samo postupak kako se izgrađuje Sturmov niz za dani poli nom p . To je niz polinoma
(21)
5. NELINEARNE JEDNADŽBE
156
Po Po P I Po(x) = P1(X)Ql (X) + Rl (X)
P, Po(x) Pl (x) P'(x) . (22)
koji dobivamo ovako. Početni član niza jednak je danom polinomu tj. Član jednak je derivaciji pl danog polinorna, tj. vrijedi Potinom uzet s protivnim predznakom, tj. iz je ostatak dijeljenja s
P(x) .
P2
Pl
nalazimo
P2 ,
Pi+ !
Dalje postupamo kao u traženju polinoma tj. po1inom je ostatak dijeljenja polinoma s uzet s protivnim predznakom. Ispišemo li opisani postupak imamo redom = = = = =
Pi- 1 Pi
P(x) Po(x) P I (X)QI (x) - P2 (x) PI(x) P I (x) P2 (X)Q2{X) P3 (x) P2 (x) P3 (X)Q3 (X) P4(x)
(23)
što nije ništa drugo nego, do na promjenu predznaka ostatka, Euk1idov algoritam traže nja naj veće zajedničke mjere od i p' Dakle, je ili nula ili poli nom nižeg stupnja od Time u konačno koraka dolazimo do koji je konstanta, pa nastupaju ova dva slučaja: Ako je i= O , onda i pl nemaju zajedničkog djelitelja iz čega zaključu jemo da i ma samo jednostruke nultočke. Ako je = O , onda je najveća zajednička mjera od i pl , iz čega
Pi- l ' 1) P 2)
P
.
Pi Pm
Pm P Pm Pm- I P zaključujemo da P i ma višestrukih nultočaka. U tom slučaju polinom Q = � ima Pm - l jednostruke nultočke koje se podudaraju s nultočkama od P.
Prema tome, slučaj kada imamo višestruke nultočke svodi se na slučaj jedno strukih, pa se zbog toga sljedeći teorem i izriče samo za polinome s jednostrukim
2) umjesto P možemo promatrati Q = PmP I . Jasno je da bilo kojem koraku Pi može pomnoži ti s pozitivnim brojem čime možemo pojednos nultočkama jer prema
se U
tavniti računsko razmatranje. Sljedeći teorem navodimo bez dokaza.
Teorem 5.S. (Stuml) Ako polinom P imajednostruke nultočke i P(a)P(b) i= O , ondaje broj realnih nultočaka N(a, b) na intervalu (a, b) jednak (24) N(a, b) yea) - V(b), gdje je V(a) , odnosno V(b), broj promjena (varijacija) predznaka u StumlOvom nizu (21 ) uzetom u locKi a, odnOSilO b. Promatramo li po1inom i z primjera 5.4 imamo Po(x) = X4 35x3 + 380x2 - 1350x + 1000 P l (x) 4x3 105x2 + 760x - 1350.
5.2. ALGEBARSKE JEDNADŽBE
157
3 1 250 635 2 10 400 tako da mnox + �x - � Po s PI dobivamo ostatak - 16 16 zenjem sa "5 mozemo za P2 uzeti P2 (x) = 1 27x2 - 2080x + 6250. 9 569 600 1 348 160 pa množenjem sa Dijeljenjem PI s P2 dobivamo ostatak + x 1 27 2 1 27 2 Dijeljenjem v
.
v
•
1 272 dobivamo 320
P3 (x) = 42 1 3x - 29 905. Daljnjim računom nalazimo P4 = 1 , i z čega odmah zaključujemo da P ima jednostruke nultočke. Kako s u vodeći koefi cijenti od Po , PI , P2 , P3 i P4 pozitivni, to za dovoljno veliki b imamo V(b) = O . Uzmemo li a O vidimo odmah da je VeO) = 4 . Kombiniramo li to sa prethodno dobivenim ogradama za pozitivna rješenja vidimo da P ima četiri nultočke unutar =
[0.7 14, 37] .
Dakle rješenja jednadžbe 1 350x + 1000 = X4 35x3 + su sva realna i jednostruka i nalaze se unutar segmenta [0.7 14, 37] . Ako na pitanje određivanja broja rješenja algebarske jednadžbe na gle damo čisto teorijski, onda nam Sturmov teorem daje potpun odgovor. Međutim, u praksi on zahtijeva mnogo računanja, pa ga stoga nismo dokazali, već smo dokazali B udan-Fourierov koji je u primjenama korisniji. Dokažimo još sljedeću posljedicu teorema 5.7 koja govori o postojanju komplek snih rješenja algebarske jednadžbe.
-
380x2 -
O
[a, b]
Nekaje P(a)P(b) t= O. Ako P ima unutar [a, b] k nultočaka i ako V(a) - V(b) k + 21, olZda P ima barem 21 kompleksnilnlUltočaka. Dokaz. Neka P ima kl realnih nultočaka unutar (-oo, a] i k2 realnih nultočaka unutar [b, oo) . Po teoremu 5.7 imamo V( - oo) - V(a) = k l + 211 , V(b) - V(oo) = k2 + 212 , pa je time k + kl + k2 + 21 + 211 + 212 � n. Korolar 5.9.
u (19) vrijedi
=
Napišemo li dobivenu nejednakost ovako + + � 21 + 211 + 21 � 21 II vidimo da ima barem 21 kompleksnih nultočaka, jer je + kompleksnih nultočaka.
P
- (k kl k2 )
2
n - (k kl + k2 ) točan broj
5. NELINEARNE JEDNADŽBE
158
Izoliranje kompleksnih rješenja algebarske jednadžbe
Izoliranje pojedinih realnih rješenja algebarske jednadžbe obično se napada tako da se nađu donja i gornja ograda i zatim se taj segment dijeli na manje podsegmen te, redovito jednake duljine, dok u pojedinim podsegmentima ne izoliramo po jedno rješenje. Možemo se pitati da li unaprijed znamo odrediti duljinu tih podsegmenata. Spomenimo daje poznata formula koja daje ocjenu te duljine, međutim, ta formula uk ljučuje mnogo računanja i osim toga redovito daje nisku vrijednost pa to izostavljamo. Isto tako postoji npr. Fourierova metoda za odjeljivanje realnih rješenja algebarske jednadžbe koja se služi Budan-Fourierovim teoremom u prethodnom potparagrafu. U ovom potparagrafu ćemo se baviti izoliranjem kompleksnih rješenja koje pokri va i izoliranje realnih rješenja. Ono se svodi na iznalaženje pravokutnika u kompleksnoj ravnini unutar kojega se nalazi jedna nultočka polinoma
+...+ Z2 )
+
an P(z) = ll{}Zn a l Zn - 1 ( 25) = ll{}(z - zd(z . . (z - Zn ) · Evoj ednog postupka koji vodi cilju. Promatrajmo u kompleksnoj ravnini e vertikalni pravac Re z = a na kome P nema nultočku. .
Yi
Sl.
a je apscisa u kojoj pravac siječe ovako opisati z=a
Uvrstimo li ( 26 ) u P imamo gdj e j e
P(a
+ it,
5. 7. x
-os. Točke pravca možemo parametarski
-oo
t
< <
( 26 )
oo .
+ it) = Q(t) + iR(t) JQ2(t) + R2(t)ei'l' (t) tg
R{t) .
Kako je po pretpostavci P =f. O u točkama pravca Re z = a , to j e za svaki
Q2 (t) + RZ (t) =f. O. Nadalje, {QZ(t) + R2 (t)} 1 /2 i
( 27 ) ( 28 )
t
( 29)
-oo, oo ) . Uvedimo sada pojam indeksa polinoma, u oznaci /p( Re z = a ) = lp , s obzirom na vertikalni
159
5.2. ALGEBARSKE JEDNADŽBE
pravac Re z = a . lp definiramo kao promjenu argumenta od P duž pravca Re z = a podijeljenu s 'Ir , tj. l (30) lp =
-{q>(+oo) - q>(-oo)}. 'Ir
q>( + (0) q>( - oo)
i Veličine određujemo pomoću (28). Ako mislimo na "potpunu kompleksnu ravninu" C, tj . na kompleksnu ravninu s dodanom "beskonačno dalekom točkom onda (30) predstavlja promjenu ar gumenta od P , podijeljenu s 'Ir , duž konture koju pravac Re z = a predstavlja u C. Iz eksponencijalnog zapisa u (27 ) očitavamo odmah sljedeće svojstvo indeksa polinoma s obzirom na pravac. P(z) = PI (Z)P2(z)
oo ",
Akoje
ondaje
Ip(Re z = a) = IpJ Re z = a)
+ Ip2 ( Re z = a).
(31 )
Taj ćemo rezultat primijeniti na faktorizaciju P(z) =
ao (z - Z I ) (z - Z2) . . . (z - Zn )
ao )
i iz koje vidimo da je dovoljno izračunati indeks konstantnog polinoma (faktor indeks linearnog polinoma (faktori z - Zi ) i onda te indekse zbroj iti. Indeks konstantnog polinoma s obzirom na bilo koji vertikalni pravac je nula. (Za Po =
ao je PO(a + it) = aoeio , pa je Ipa = .!. (O - O) = O .) 'Ir
Indeks linearnog polinoma PI (z) = z - ZI možemo ovako izračunati. Neka je ZI = XI Y I . Uvrštavanjem imamo - YI) = ( a - xd PI ( a otkuda je - YI ( 32) tg ( ) = a - XI
+i
+ i(t
+ it)
t
q> t
-- o
Sada nastupaju dvije mogućnosti: a - XI > O ili a - XI < O . Ako je a - xI > O , onda se (Pfomjenom od tg q>(t) neprekidno do 'Ir 'Ir do tako da u mijenja od pa se neprekidno mijenja od - 2" do tom slučaju dobivamo
- oo
+00 ,
t - oo +(0 )
q>(t)
Ip, (Re z = a > X I )
=
� { � - (-�) }
=
+ 2" '
l.
Uočimo da se u tom slučaju nultočka Z I nalazi lijevo (XI < a ) od pravca Re z = a . Ako je a - XI < O , onda se nultočka ZI nalazi desno od pravca Re z = a i 'Ir tg neprekidno mijenja od 2" se neprekidno mijenja od do - oo , pa se
q>(t)
do -
� što uvršteno u (30) daje
q>(t)
+00
lp, (Re z = a < xd =
.!.{-�2 - �} = -1. 2 'Ir
5. NELINEARNE JEDNADŽBE
160
Spojimo li to zajedno izračunali smo
{
ako je X I < a (33) ako je X I > a . Na taj način Ip, (Re z = a ) kaže da li je Z I (a to je jedina nultočka polinoma p l (z) Z Z l ) lijevo (rezultat + 1 ) ili desno (rezultat - 1 ) od pravca Re Z a . Primij enimo li (3 1 ) na P(z) = ao(z Z I )(z - zz) . . . (z Zn ) dobivamo ovu formulu za lp : Ip(Re Z = a ) = k - l (34) gdje je k broj nultočaka polinoma P lijevo od pravca Re Z = a , a l broj nultočaka od P desno od tog istog pravca. Time smo pokazali da indeks lp daje razliku između broja rješenja jednadžbe P(z) = O lijevo od pravca i broja rješenja desno od pravca na kome nema rješenja. Sada jednakosti (34) možemo priključiti jednakosti koja slijedi iz osnovnog teorema algebre n = k+l (35) tako da iz (34) i (35) nalazimo ove formule fl n + lp (Re z = a) Ip(Re z = a ) 1= (36) k= lp, (Re Z = a ) =
+1 -1
-
-
2
2
Istaknimo da su u (36) uračunate kratnosti pojedinih rješenja jer smo formulu ( 3 1 ) pri mijenili na svaki faktor rastava P(z) = ao(z - ZI )(z z z ) . · · (z Zn ) . Uzmemo li sada dva vertikalna pravca Re z = a l i Re z = az i neka je al < az , onda pomoću (36 ) možemo naći broj korijena jednadžbe P(z) = O , uračunavši njihove kratnosti unutar vertikalne trake a l < Re z < a2 . Da dođemo do pravokutnika moramo provesti analogno razmatranje za horizontalan pravac. Promatrajmo sada horizontalan pravac na kojemu P nema nultočaka. Točke takvog pravca su parametarski dane sa (37 ) z = t + i{3 . Analogno imamo P( t + i(3) = Q l ( t ) + iRI (t) =
tg I/I( t )
!Qr(t) + Rr(t)eiljl(l)
RI (t)
' Ql ( t ) Indeks polinoma P s obzirom na horizontalni pravac definiramo kao
Ip(Imz
(3 ) =
1
ff
{ I/I(+oo)
I/I(-oo)},
( 38 ) ( 39 )
(40)
tako da razmatranje slično gornjem za vertikalan pravac daje Ip(Im z (3 ) p q (4 1 ) gdje p označava broj nultočaka od P iznad horizontalnog pravca, a q broj nul točaka od P ispod horizontalnog pravca uzetih s njihovim kratnostima. Kako je p + q = fl to slijede pripadne formule za p i q ' n + Ip(Im z (3 ) p = ----'--'-:::-----'- -'q (42 )
2
161
S.2. ALGEBARSKE JEDNADŽBE
Nađemo li dakle vertikalan Re z = a i horizontalan Re z = (3 na kojima P nema nultočaka onda oni dijele kompleksnu ravninu na 4 kvadranta. Iz pripadnih dvaju indeksa možemo izračunati broj nultočaka u svakom od tih kvadranata. Ako je ni broj nultočaka u i -tom kvadrantu, i = l , 2, 3, 4, onda treba riješiti ovaj sustav linearnih jednadžbi n l + 112 =P + n4 = q
nl
n2 + n3
=
113 + n4 =
(43)
k
l.
Ako znamo granice područja koje sadrži sva rješenja jednadžbe P(z) = O , onda postupnom primjenom gornje metode možemo izolirati realna i kompleksna rješenja algebarske jednadžbe. Da to provedemo treba izračunati odgovarajuće indekse što nije uvije jednostavno. Računanje indeksa polinoma s obzirom na pravac
Izvedimo jedan postupak računanja indeksa. Zadržimo se samo na vertikalnom pravcu Re z = a , s parametrizacijom z = a + it (44) (4S) P(a + it) = Q(t) + iR(t) R(t) tg q>(t) = ' (46) Q(t) Kako su Q i R polinorni, to je tg q>(t) racionalna funkcija. Neka je n stupanj od P . Ako je II paran onda i Q ima stupanj n dok R ima stupanj � n l . Ako je II neparan, onda R ima stupanj n , a Q stupanj � n - l . Kako P po pretpos tavci nema na pravcu nultočaka, to Q i R nemaju na pravcu zajedničkih nultočaka. Funkcija q> (t) = arg P(a + it) je neprekidna pri promjeni t od -oo do +00 , me đutim, tg q>(t) = R(t)/Q(t) ima diskontinuitete u realnim nultočkama ti od Q(t) . Diskontinuiteti od R(t)/Q(t) mogu imati jedan od sljedećih oblika: R(t) = +00; l ) hm t -;, ti=!'O Q ( t ) R(t) = - oo ', 2) lim t -H O Q(t) R(t) 3) hm = ± oo ; t - ti=!'O Q ( t ) R(t) = =j=00. 4) hm t -ti=!'O Q( t ) Da pojasnimo oznake, pogledajmo slučaj 3), koji znači sljedeće: ako se točki ti pri bližavamo slijeva, onda R(t)/Q(t) -+ + 00 ; a ako joj se približavamo zdesna, onda 3n n R(t)/Q(t) -+ - oo . Funkcija tangens ima diskontinuitete u točkama ± 2 ± ' T' -
·
·
·
±
s; , . . . i svi su diskontinuiteti tipa 3).
. -
-
162
5. NELINEARNE JEDNADŽBE
-oo
Dakle, da bi našli prirast od rp ( t ) pri promjeni t od do +00 moramo naći sve realne nuItočke polinoma Q : i promatrati < tj < t2 < . . . < tk < pripadne intervale
-oo
oo
(47) Na svakom od intervala (t;, tHd funkcija tg rp ( t ) je neprekidna, a vrijednosti argu menta rp ( t ) se nalaze u intervalu
(� 17:' 2k;2+ 1 17:) 2
(
1 17:
2k; 2k; + (48) 2 2 ' gdje je ki nenegativan cijeli broj. Promatrajmo stoga prolaz parametra t kroz t;+ I ' R u t =:. tl+ l , vrijednost od rp ( t ) će ili ostati u intervalu Ovisno o tipu singulariteta od ili
Q
_
•
(48) ili će iz njega izići. Ako se radi o singularitetu tipa l ) ili 2), onda vrijednost od rp (t ) ostaje u tom intervalu. Ako se radi o singularitetu tipa 3), onda vrijednost od rp(t) izlazi iz intervala (48) i raste, dok u slučaju singulariteta tipa 4) izlazi iz (48) i pada. Da to zorno predočirno mi slimo na graf funkcije arc tg i njegove grane. Istaknimo da se prelazom s jedne grane na drugu rp (t ) mijenja za (što je period funkcije tg ). Vidimo da prolazom kroz singularne točke t l , . . . , tk , vrijednost rp ( t ) poraste za 17: ili padne za ovisno o tome da li smo prošli kroz singularnu točku ti tipa 3 ) ili tipa 4) pa je promjena jednaka razlici između brojeva takvih točaka puta 17: . Ostali su još krajevi Promatramo li konturu r u e u koju prelazi pravac (44), onda je oo jedna singularna točka na toj konturi i ima neki od gornjih tipova l ) - 4).
17:
17:
=roo .
r
e---....--� � _ _
---
.oo
t
cc
-oo
kontura II e nastala od arif
Sl. 5.8.
oo .
Na slici smo nacrtali jednu takvu konturu s točkom Na desno od te točke nalaze se točke intervala t J ) , a na lijevo točke intervala (tk , +00) . Prema to me lim rp ( t ) = lim rp ( t ) , tj. limes u -oo je desni limes u točki E r dok je
(-oo,
I - - ex)
f - CX)+O lim rp ( t ) = lim rp ( t ) t--+OCl ( ..... 00-0 ,..·
oo E r . Prolazom kroz točku oo tj. ako g ima u oo singularitet tipa 3) onda ako je u oo singularitet tipa 4). Tako smo došli
lijevi limes u točki
imamo istu pojavu kao i kroz točku
17: ,
oo
tH I ,
rp( t ) poraste za dok se smanji za 17: do sljedećeg pravila za izračunavanje indeksa Ip(Re z = a ) . Pravilo za izračunavanje indeksa. Indeks lp polinoma P , s obzirom na pravac Re z = a (ili Im z = /3 ), na kome p nema nultočaka, jednak je razlici broja singu-
lariteta tipa 3 ) i broja singulariteta tipa 4) od singularitet u točki
oo ,
R
Q
(odnosno
ako je isti tipa 3) ili tipa 4).
RJ
Ql
) u što treba Ubrojati i
5.2. ALGEBARSKE JEDNADŽBE
163
Primjer S.6. Promatrajmo jednadžbu
x5 4X4 + 6x3 - 3x2 + 2x + l =. O za koju lako vidimo da ima samo jedno realno rješenje i to u intervalu (-0.5; 0) . Izolirat ćemo grubo kompleksna rješenja i vidjeti da se u svakom kvadrantu nalazi po jedno. Sva se rješenja nalaze unutar prstena _
l
'1 < I Zi l < 7
što lako dobivamo primjenom teorema 5.3 i koroJara 5.4. Pogotovo su sva rješenja unutar kvadrata - 7 � x � 7 , -7 � Y � 7 . Stoga razmotrimo imaginarnu os tj. pravac z = o + it
i ustanovimo koliko rješenja imamo u lijevoj i desnoj poluravnini. Kako se rješenja pojavljuj u u parovima konjugirano kompleksnih brojeva to su u kompleksnoj ravnini simetrično raspoređena s obzirom na x -os. Izračunajmo P(t) = (-4t4 + 3t2 + l ) + (t 5 - 6t3 + 2t)i dakle
R(t) ::; t (t4 - 6t2 + 2) Q(t) ::::: -4t4 + 3t2 + l
R(t) t4 - 6t2 + 2 = _� . 4 t4 _ Jt2 _ 1 Q(t) 4 4 Lako nalazimo da su realna rješenja jednadžbe Q(t) ::; O (bikvadratna jednadžba) tl = - 1 , t2 = Iz zapisa R( t) _ t t4 - 6(2 + 2 - 4 Q(t) t4 tg ",(t) ::;
lako ustanovimo da u točkama t l dok u točki
oo
•
l l i t2
=
l.
funkcija
ima singularitet tipa 4 ) jer j e
R(t) R(t) . - oo i hm I - - co Q( t ) Q(t) Dakle, indeks od P , s obzirom na y -os je jednak lim
H+OO
lp
otkuda i mamo
R
Q
=
ima singularitet tipa 3 ) ,
+ 00 .
+1
k k+l 5 tako da dobivamo k = 3 i = 2 . Znači na lijevo od y -osi i mamo 3 rješenja Uedno je realno), a na desno dva rješenja. Nadalje je jasno da se u svakom kvadrantu nalazi
l
5. NEUNEARNE JEDNADŽBE
164
eo jedno kompleksno rješenje i to unutar gore spomenutog prstena, odnosno kvadrata. Zelimo li bolje izolirati rješenja moramo gledati indekse s obzirom na pravce koji će promatrani kvadrat subdivirati.
5.3. Sustavi nelinearnih jednadžbi
.;'�::l41l_'�� .
U ovom poglavlju prelazimo odmah na iteracijske metode za razliku od sustava linearnih jednadžbi kada smo prvo obradili direktne metode. Razlog je j ednostavan, nemamo direktne metode za opći sustav nelinearnih j ednadžbi. To ne znači da poje dine tipove sustava ne znamo direktno riješiti. Prisjetimo se Choleskijeve sheme koja predstavlja direktnu metodu nalaženja elemenata matrice kod LU faktorizacije. Kako j e lakše pratiti metode na sustavima dviju j ednadžbi, to ćemo prvo razviti Newtonovu metodu za takve sustave nakon čega je lakše sve pratiti na općim sustavima. S dru ge strane sustavi dviju jednadžbi su od interesa i kod traženja kompleksnih korijena aJgebarskih jednadžbi, a i inače. Newtonova metoda za sustav dviju jednadžbi
Neka je x
=
� iY
= t}
rješenje sustava dviju jednadžbi
I(x, y ) g (x, y )
=
O O.
(l)
Pretpostavimo da I i g imaju neprekidne parcijalne derivacije. Stavljajući dobivamo
I(xn + hn' Yn + kn ) g (xn + Izn' Yn + kn )
O O.
(2)
Primjenom Taylorove formule (za funkcije dviju varijabli), pri čemu se ograniča vamo samo na linearne članove i izjednačavanjem istih s nulom dobivamo
I(xn, Yn ) + hnl; (xn , Yn ) + krJ;� (xn ' Yn ) = O g(Xn ' Yn ) + Izng�(x n' Yn ) + kng� (xn' Yn ) = O , što je linearan sustav jednadžbi s nepoznanicama hn i kn . Ako j e lakobijan / (Xn' Yn ) t;, (XII, Yn ) f O J= � , gx (xn , Yn ) gy (xn , Yn ) onda linearni sustav (3) ima jedinstveno rješenje koje glasi I(xn, Yn ) I; (xm Yn ) lln J g (xn, Yn ) g� (Xn , Yn ) 1 � «x"' Y" ) 1«Xn, Yn ) kn J gx Xn , Y/! ) g Xn , Yn )
1
II 1
(3)
I
I I
(4)
165
5.3. SUSTAVI NELINEARNIH JEDNADŽBI
tako da za sljedeću aproksimaciju od � i 1) možemo uzeti
Xn+! = Xn + hn (5) Yn+! = Yn + kn gdje su /Zn i kn izračunati prema (4) . Početnu aproksimaciju (xo, Yo) treba odrediti grubo promatranjem sustava ( 1 ). Ako je � = lim xn , 1) = limYn i neka su sve točke (xn , Yn ) unutar pravokutnika oko (�, 1) ) na kojemu su ispunjene pretpostavke o neprekidnosti, onda je (�, 1) ) rje šenje sustava ( 1 ) . Naime, iz Xn --+ � i Yn --+ 1) i (5) slijedi da lin --+ O i kn --+ O . Iz pretpostavke o neprekidnosti parcijalnih derivacija imamo da su iste ograničene na pravokutniku, pa iz (3) slijedi lim f(xn , Yn ) = f(�, 1)) = O
n-oo
tj. (�, 1) ) je rješenje sustava ( 1 ) . Dakle, konvergentan postupak vodi ka rješenju sustava. Primjer 5.7. Promatrajmo sustav jednadžbi
l
. 1
2.x = SIn 2 (x - y ) 2y = cos 2 (x + y). Sada možemo pisati
l
�
f(x, y) = 2x - sin (x - y) g (x, y )
=
2y - cos 2 (x + y),
==
2-
fy' (x, y)
=
2 cos 2 (x - y),
g� (x, y)
=
tako da imamo
f;(x , y)
l l
� cos � (x - y),
� sin � (x + y),
g� (x, y) = 2 +
� sin � (x + y).
Postupak ćemo voditi tako da ćemo aproksimativne vrijednosti uvrštavati u (3) i ra čunati redom (hn , kn ) . Pođemo li od početne vrijednosti (xo, Yo ) = (-0. 1 6, 0.49) dobivamo sustav linearnih jednadžbi
1 .5262ho + 0.4738ko = 0.0007 0.082 1ho + 2.0821ko = 0.0064
166
5. NELINEARNE JEDNADŽBE
(ho,
(X I ,
otkuda slijedi ko) y= (-0.0005, 0.003 1 ) . Sljedeća aproksimacija iznosi yd = ( -0. 1 605, 0.493 1 ) . Zelimo li poboljšati aproksimaciju moramo točnije računati tri gonometrijske funkcije, pa zatim odrediti točnije vrijednosti od i . Tako uz
hl kl
sin 0.3268 sin O. 1663
možemo izračunati
0.32 lO14, 0 . 1 65535,
cos 0.3268 cos O . 1 663
0.947074 0.986204
hl, kl na 6 decimalnih mjesta što daje (X2' Y2 ) = (-0. 1 605 1 0, 0.493 1 02 ).
Newtonova metoda za kompleksna rješenja (nultočke)
Promatrajmo jednadžbu
j j(
jeZ) = O
(6)
U Zn U
pri čemu neka je analitička funkcij a na krugu oko jednostruke nu1točke , � + , tj. vrijedi ') = O i 1'( ' ) =1= O . Neka je E aproksimacija od , . Da poboljšamo aproksimaciju postupimo analogno kao u realnom slučaju. Pišemo li
il}
Zn Ilzn
,= + imamo prema Taylorovoj formuli za funkcije kompleksne varijable 0 = j( ')
�
jez,,) + Ilznj'(Zn),
pri čemu smo članove drugog i višeg stupnja zanemarili. Izjednačavanjem desne strane s nulom dobivamo
Na taj način smo dobili Newtonov iteracijski postupak za kompleksnu varijablu
)' Z,,+l = Zn - Pjez,, (Zn)
n = O, 1 , 2, . . .
{Zn}
(7)
Odmah je vidljivo što takav postupak daje ako niz konvergira. Pretposta vimo li imamo zbog neprekidnosti od i E ( ll = 1 , 2, . . . ) i , = lim
l'
što daje
odnosno
Zn U,
n-oo Zn,
lim Zn+l = lim Zn n-oo n-oo
j
167
5.3. SUSTAVI NELINEARNIH JEDNADŽBI
[+
l (�;f+ ( �;r _ [+ �;) l
tj. , je rješenje jednadžbe (6). Odredimo li u (7) realni i imaginarni dio od J, tj. napišemo J(z) = u(x, y) + iv(x, y) , onda (7) poprima oblik xn+l - xn
_
Yn+ 1 - Yn
au au v - -u ay ax
au au - v - -u ay ay
X�Xn Y""YN
(8)
( \ (�;r _
.l-Xn Y=Yn
gdje je u derivaciji J' ( z) =
�: + i�: imaginarni dio zamijenjen s
au prema ay
Cauchy-Riemannovim jednakosti ma. U posebnom slučaj u ako je (7) algebarskajednadžba n n an - I Z + an O aoz + al z - 1 + s realnim koeficijentima, onda nam opisana metoda služi za aproksimaciju komp leksnih rješenja koja se javljaju u parovima konjugiranih vrijednosti. Prema tome aproksimiramo li � i1/ ujedno smo aproksimirali i � i1/ . U tom slučaju su nam u i v polinomi u dvije varijable. Ocijenimo pogrešku aproksimacije. Promatrajmo w J(z) i pretpostavimo ( 9) II' (z) 1 � tn > O za z E U. . , .
+
+
Tada je J na nekom krugu, radijusa R , oko ' bijekcija (ta se činjenica dokazuje u teoriji funkcija kompleksne varijable), tako da je na nekoj okolini ishodišta I w\ < p definirana inverzna koja je analitička i vrijedi
, l l
z ::::= -- = -----,-- -:----c-c /'(z) /, (J-l (W) ) ' Pretpostavimo li da je IJ (zn ) 1 < p imamo Zn
, = J- I (J(Zn )) - J- I (J( O ) d -J- I (t) dt = dt
lJ(r;,(<") ,) [ J
]
gdje je za put integracije uzeta spojnica točaka J( O = O i J(Z n) , V. st.
( 1 0)
(ll)
168
5. NELINEARNE JEDNADŽBE
v
y
J u
x
Zbog Itl <
p
SI. 5. 9.
vrijedi 1/ - I ( t ) 1 < R i prema (9)
1!, (f - I ( t ) ) 1 � Sada iz ( l l ) dobivamo sljedeću ocjenu greške I Zn
_
'I �
f( l zn) o
m.
f( ) l zn � _ I/(zn ) 1
Idt l . � o 1/' (f- I ( I ) ) 1
m
-
III
(12)
'
što je analogon formule (6) iz uvodnog dijela ovog poglavlja. Spomenimo da postoje teoremi koji daju dovoljne uvjete pod kojima je Newtonov postupak za kompleksnu varijablu konvergentan, no u to se ovdje nećemo upuštati.
Primjer 5.8. Promatrajmo jednadžbu eZ
-
0.2z + l
=
O
i odredimo aproksimativnu vrijednost rješenja koje ima najmanj i modul. Istaknimo da promatrana jednadžba nema realnih rješenja. Naime, ako uvrstimo z = imamo et koja + l = O , iz čega dobivamo jednakost et + l = očigledno nije ispunjena ni zajedno (Također se lako provjeri da nema imaginarnih rješenja.) Promatramo dakle
x
0 . 2x
0.2x ,
x.
I(z)
= eZ -
0.2z + l ,
!' ( z )
0.2 ,
= eZ
-
0.2.
0.2 2kni
Izjednačimo li I' (z ) = O dobivamo eZ = odnosno, Zk = ln + � - 1 79 + = O, l, . . . Kako te točke nisu nultočke od 1 to su sva rješenja gornje jednadžbe jednostruka. Da lociramo rješenja poslužimo se ovim uspo ređivanjem. Promatramo li q> (z ) = e + l (dakle izostavirno član - z ) vidimo da je I( z ) - q> (z ) = z tj. 1 i q> se malo razlikuju u okolini ishodišta. Nultočke od q> su 'k = + l) = O, l, . . . pri tome je 'o = najbliža ishodištu u čijoj okolini možemo očekivati nultočku od I . To nam daje razlog da za početnu .
2kni, k
± ±2 , .
0 .2 , (2k ni, k
0.2
± ±2 ,
ni
5.3. SUSTAVI NELINEARNIH JEDNADŽBI
169
aproksimaciju traženog rješenja uzmemo Zo
ZI
=
1T.l. - 0.2i
1T. i
1 .
'6 1T.l
=
=
\;'0
=
1T.i . Tada je
5 .
'6 1T.l
1.2 0. 1 32 0.024i = 0 . 069 + 2 . 624 l' Z2 = 1 .868 + 0.5i -0.061 + 0.009i = 0. 109 + 2.646i Z3 = 0.069 + 2.624i 1 .230 + 0.54 1 i 0 + 0.006i = 0. 1 07 + 2.650 ; Z4 = 0. 109 + 2.646i L 178 + 0 . 535; -0.002 - 0.005i = 0.107 + 2.646i. Z5 = 0. 1 07 + 2.650; L 1 8 1 + 0 . 525i Izračunamo li J(Z5 ) = 0.002 + 0.004; vidimo da j e 51T.i 6
_
!J( Z5 ) ! = V4 . 10 - 6 + 1 6 · 10 - 6 = v'20 · 10-6 � 0 . 0044 pa očekujemo da je Z5 već dosta dobra aproksimacija traženog rješenja. Pokušajmo oci jeniti grešku. Promatrani niz aproksimacija nalazi se unutar pravokutnika O � x � 0.2 , � y � 1T. . Izračunamo li (z) ! imamo zbog e"+ iy e" (cos y + i sin y )
;
1J' ( zW
= =
lj' eh cos2 y O.4et cos y + 0.04 + eh sin2 y eh - O.4et cos y + 0.04
-
et(et - O.4 cosy ) + 0.04 > e"( e" 0.4 cos y)
=
iz čega čitamo da na promatranom pravokutniku !1' ( Z ) 1 ima veću vrijednost od vri1T. jednosti u lijevom donjem uglu, tj. u točki '21 gdje imamo
Prema ( 1 2) imamo
1J' (� i) 1 = v'1 + 0.04 � 1 .02
m.
IJ( z5 ) ! � 0 . 0044 � 0 . 0043 I Z5 - \;,1 � 111
1 .02
iz čega zaključujemo da se Z5 nalazi unutar kruga oko \;' radijusa < 0.043 . U svakom slučaju i realni i imaginarni dio od \;' znamo točno na tri decimalna mjesta. Lako provjeravamo da vrijedi J( z) = J(z ) , pa je prema tome i konjugirano kompleksna vrijednost <: rješenje promatrane jednadžbe, čija aproksimacija je onda =
0.107
2.646i .
Newtonova metoda za opći sustav nelineamih jednadžbi
Promatrajmo sada opći sustav nelinearnih j ednadžbi. Polazimo od
n
jednadžbi s
170 n
nepoznanica
5. NELINEARNE JEDNADŽBE
fl (XJ , X2, " " Xn ) = 0 Jz (X J , X2, . . . , xn) :::: O
( 1 3)
J" (X I , X2, . . . , Xn ) = O gdje su j; realne funkcije od n varijabli koje i maju neprekidne parcijalne deriva cije. Kao i uvijek promatramo izolirana rješenja sustava ( 1 3). To znači sljedeće: (�J , �2 ' . . . , �n) je izolirano rješenje ako ima okolinu u kojoj nema drugih rješe nja. Okolina od ( � I ' �2' . . . ' �n) može biti otvorena kugla u Rn , tj. skup točaka (x\ , Xl . . . , Xn) E Rn za koje vrijedi (X I - � d 2 + (X2 - �2 ) 2 + . + (xn - �n) 2 < rz. ( 14) .
.
Sustav ( 1 3) možemo vektorski kraće zapisati što nam j e često pregJedniji zapis. Da kle, varijable X I , X2 , . . . , Xn i funkcije fI , Jz , . . . , fn shvatimo kao komponente n -dimenzionalnih vektora
tako da uz oznaKu j;(x J , X2 . . . , xn ) = j;(x) imamo ovaj vektorski zapis ( 1 5) f(x) = O. Do same metode dolazimo na isti način kao u slučaju sustava dviju jednadžbi. Pođemo li od neke aproksimacije Xl X X(k) =
[ (�(kk)) ] ( k) Xn
i rješenj a
onda je gdje j e
( 16)
5.3. SUSTAVI NELINEARNIH JEDNADŽBI
prirast do točnog rješenja kojemu ne znamo komponente, ali znamo da vrijedi ( 17) O J(� ) J(X(k) + f(kl ) . I sada primijenimo Taylorovu formulu uzevši u račun samo prva dva člana i to izjedna čimo s nulom ( za dovoljno malenu okolinu to je približno nUla). U vektorskomzapisu Taylorova formula s prva dva člana izgleda ovako: J(x (k) + f (k) ) J (x (k) ) + f(x (k) ) e (k) , ( 18) gdje je f(x(k ) ) Jacobijeva matrica i zapis f(X(k) )f(k) je množenje matrice i vektora stupca f(k) . Dakle u drugoj oznaci i u razvijenom obliku je 171
=
=
J' (X (k ) )
=
J (X{k) )
aj! ah aXn ajn
aj! alt aaXIh aaXJ22 aXI aX2 aj;, aj;, aXI aX2
aXn
što znači da elemente matrice treba izračunati za x X{k) i zatim izvršiti naznačeno množenje u ( 18). Uvrstimo li taj rezultat u ( 17) dobivamo J(x (k) ) + J (X( k))f (k l O ( 19) što je linearan sustav jednadžbi s nepoznanicama fik) , fy l , . . . , f�"l . U razvijenom obliku sustav ( 19) izgleda ovako: aJI ) fl + ( aJI ) f2 + . + ( aJI ) fn -_ O JI (X (lk l , x2(k) Xn(kj ) + ( UXI UX2 uXn aXn
x=xlt l
=
,
(X (k l , X 2(k l ,
h I
•
•
•
�
,
.
•
,
. .
•
,
a Xn(k ) ) + ( h ) U �
Xl
xl kl
�
a fJ + ( h ) �
UX2
.
xl k l .
f2 +
�
.
. .
xltl
a + ( h) u
xl';
( aJnXn )
xlt)
�
Xn
- o fn -
( 20)
O koji kada riješimo u fi" ) , f�kl , . . . , f!k) daje približnu vrijednost prirasta tako da se nadamo daje ( 21 ) nova i to bolj a aproksimacij a rješenja ( �l' �2' . . . , �n ) ' Rješenje sustava ( 19) u matri čnom zapisu izgleda ovako ( 22) što uvršteno u (21) daje ovaj krajnji matrični zapis iteracijskog koraka Newtonove metode (postupka) I X {H ) x (k) _ r l (X (k) )J(X (k) ) , k O, l, 2, . . . ( 23) l l J" (X (k I ' X (k 2 ,
.
Xn(k)) +
=
xlt)
aJ,, ) . fl + ( aJ,, ) (X2 aXI xl';
[)
-
xl'l
xlk)
.
f2 + . . . +
[}
-
fn -
172
5. NELlNEARNE J EDNADŽBE
gdje naravno početnu aproksimaciju x(O) moramo odabrati. Jasno je sljedeće. Ako j e niz aproksimacija konvergentan, tj . � = lim x (k ), k �oo onda je pod gornjim pretpostavkama na Ji , taj limes rješenje polaznog sustava ( 1 3) . Zaključivanje je analogno onom z a slučaj dviju jednadžbi. Ako pokušamo primijeniti Newtonovu metodu na sustav linearnih jednadžbi, onda ne dobivamo ništa novo. Naime, za
f (x) = A x b imamo 1'(x) A , pa (23) prelazi u l X (k+lj = X(k) - A - I (A x(k) - b) = X(k) , - X(k ) + A - l b A - b, što je direktno rješenje sustava već u prvom koraku. To direktno rješenje je dobiveno izračunavanjem inverzne matrice. Međutim, formula (23) to traži u svakom koraku ako sustav nije linearan, što je osnovna poteškoća tog iteracijskog postupka. U svezi s Newtonovom iteracijskom metodom postavlja se više pitanja, a) Pod kojim uvjetima konvergira? b) Koja je brzina konvergencije? c) Jedinstvenost rješenja sustava? d) Stabilnost postupka obzirom na promjenu početne aproksimacije? Za takva razmatranja potrebno je opširnije proučavati funkcije iz Rn u Rn f : Rn -+ Rn ,
tj . između euklidskih prostora. Takva funkcija je dana s n realnih funkcija od varijabli. Za tu svrhu je vektorski zapis kraći. Ponovimo oznake. Neka je
f(x )
n
[j� �� j.
fn (x ) Ako sve funkcije (komponente) f, imaj u neprekidne parcijalne derivacije, onda se pod derivacijom l' (x) razumijeva Jacobijeva matrica !, (x)
Unatoč sve složenosti na gornja pitanja se mogu dati odgovori. Izreći ćemo jedan teorem koji odgovara na a), b), c ) i d), ali ga nećemo dokazivati. Teoremje formuliran za rednu normu koju smo upoznali u §3 . 2 i bila je za matrice definirano ovako
I IA I I a za vektore
] Ix l l
I IA l lr
mrx L I aij i, j
I Ix l lr = maI x Ixd ·
173
5.3. SUSTAVI NELINEARNIH JEDNADŽBI Teorem 5.1 0.
Nekaje
[
O, realan nelinearan sustav jednadžbi pri čemu je IW =
I (x ) =
/l (X h X 2, . . . , XII ) fz (X j , X2 , . . . , XII ) .. .
f,. (X l l X2,
•
.
.
, XII )
][ ] =
!I (X) fz (x) . . .
III (x)
neprekidna zajedno s neprekidnim prvim i drugim parcijalnim derivacijama na pod ručju Q . Neka je x(O) Q toeKa čija je zatvorena R -kugla (u r -normi) sadržana u 0., tj. E
(24)
i neka su ispunjeni sljedeći uvjeti: J) Jacobijeva matrica J(x(O) ) = [�h] vrijedi
UXj x=x(Oj
je regularna, tj. ima inverVlu za koju ( 25 )
2)
(26) 3)
� � k=1
I {){)X2h{)(x)X I � C J
k
'"
za
.
.- 1 , 2,
l,}
"
' ) II
.
l
X E UR (X(O ) ) .,
Konstante A , B, C zadovoljavaju sljedeću nejednakost tJ 2nA B C � l , gdje je n broj nepoznanica. a) Tada Newtonov iteracijski postupak X (k + I ) = X(k) J(x(k) ) - I /(x (k ) ), k = 0, 1 , 2, . . konvergira za gornju početnu vrijednost x{O) i
(27)
4)
( 28)
,
� = lim x(k l k �oo
je rješenje polavwg susta va za koje vrijedi b) Vrijedi sljedeća ocjena c) Unutar kugle
I I�
I I�
-
x(O ) 1 1 �
x(k ) 1 1 �
nalazi sejedno jedino rješenje sustava;
G
2B � R; ) k- l tJ2t - 1 B;
(29) ( 30 )
(31 )
5. NELlNEARNE JEDNADŽBE
174
d) Ako je
2 -B � R,
( 32 )
II
onda Newtonov iteracijski postupak konvergira unutar kugle (3J) pri proizvoljnoj pro mjeni početne aproksimacije x'(O) unutar kugle I lx'(O ) _ x (O) I I � l
Pojednostavljena Newtonova metoda.
�Il B.
(33)
Već smo istaknuli da se prema ( 23 ) u svakom koraku računa inverzna matrica Jacobijeve matrice. To je bitna računska poteškoća te metode. Isto smo vidjeli na što se svodi u slučaju linearnih sustava jednadžbi. Sljedeće razmišljanje ne možemo općenito osigurati, ali je dobro da ga uočimo. Ako je r ' (x) neprekidna u okolini rješenja sustava � i ako je početna aprok simacija x (O) dovoljno bliza rješenju sustava � , onda će se j- ' (x(OI ) malo mijenjati prelaskom u x(k ) pa približno vrijedi ,
r l (x(k) )
�
r ' (x(OI )
što vodi na pojednostavljen iteracijski postupak
(34) X( k ) - r ' (x(O) )f(x( k ) ) . Jasno da je x( isti onaj koji dobivamo iz ( 23 ) dok se ostale aproksimacije mijenjaju.
I)
x ( k+ ' )
=
Ono što posebno želimo istaći je da i pojednostavljena iteracija konvergira k rješenju pod uvjetima l ) - 4 ) gornjeg teorema za danu početnu aproksimaciju x(O) . Metoda iteracije za sustav dviju jednadžbi
Promatrajmo sustav dviju jednadžbi
f(x, y) g (x, y)
=
O (35) = O za koji pretpostavljamo kao i do sada da dopušta samo izolirana realna rješenja. Istak nimo ponovo da je rješenje sustava (35) par brojeva ( � , tj) koji zadovoljava sustav. Neka je (xo, Yo) aproksimativno rješenje sustava ( 35), koje smo našli nekom gru bom ocjenom ili grafički. Da dođemo do iteracijskog postupka prevedirno sustav (35) u oblik
x y
ili vektorski
= =
cp (x, y) ", (x, y)
( 36)
( 37 ) Iteracijski postupak provodimo kao i u slučaju jedne jednadžbe, tj . formiramo niz aproksimacija y , = ", (xo, Yo) , x , = cp (xo, Yo) ; = Xz cp (x " y d ; Y2 = ", (x " Y I ) ' (38)
x
=
q,(x).
5.3. SUSTAVI N ELINEARNIH JEDNADŽBI
175
Ako iteracijski postupak konvergira. tj. ako postoje limesi 11 = lim Yn n-oo i ako su cp i lJ! neprekidne funkcije dviju varijabli onda j e ( � , 11) rješenj e sustava (35) što uviđamo na isti način kao i u slučaj u jednadžbe s jednom nepoznanicom. Prema tome. za dovoljno veliki n , (xn , Yn ) predstavlja aproksimaciju rješenja ( � , 11 ) . Sada navodimo teorem (bez dokaza) koji daje dovoljne uvjete pod kojima iteracijski postupak (38) konvergira. e :::;;
Teorem 5.1 1 . Neka sustav (35) ima ua pravokutniku P (v. sl. 5. 10), a :::;; x :::;;
Y :::;; d samo jedno rješenje ( � , 11) ' Ako
a) funkcije cp i lJ! imaju neprekidne parcijalne derivacije; b) počef1la aproksimacija (xo, Yo ) i sve daljnje (xn ' Yn) , tl pravokutniku P ; e) u P vrijede nejednakosti
=
l , 2,
b,
. . . pripadaju
I��I + I��I :::;; ql < l , I�;I + I��l :::;; < l , q2
onda iteracijski postupak (38) kOllvergira.
d
a
Sl.
.'UO.
b
Istaknimo da uvjet c) kaže da je na pravokutniku P stupčana norma Jacobijeve matrice preslikavanja danog s (36) manja od tj. na P se traži da je norma derivacije od q, manj a od l , ili u oznaci 1 1q, ' (x) l l s I I J (x) l l.f :::;; q < 1 . Postupak iteracije može se ovako modificirati
1.
Xn+ l (XIII Yn) (39) Yn+ l (Xn+l l Yn) u kojem ( n + l ) -vu aproksimaciju prve varijable koristimo za izračunavanje (tl + l ) -ve aproksimacije druge varijable. Tako modificirana iteracija zove se Seidelova iteracija.
5 . NELINEARNE JEDNADŽBE
176
Rij ešimo sustav jednadžbi 2x = sin �(x 2 - y) 2y = cos 2"1 (x + y) . Provjerimo da postupak iteracije konvergira za ovaj izbor od rp i 1/1 : x = � sin �(x - y) = rp(x, y) l + y) I/I(x, y). y = 2"l cos 2"(x Imamo 1 cos 2"(x l orp 1 cos 2"(x l -y), - y), 4" ay 4 l l l . l sin 2" 2" (x + y ) , 1/1 0ay 4 (x + y), 4 tako da vrij edi orp 1/1 l + l 2"l l , I orpax I + I 0ax I � 4"l 4l l < I oy I + 101oy/1 I � 4 + 4 = 2" < 1 za svaki (x, y) pa prema tome postupak iteracije konvergira na po volji velikom pra vokutniku. Sada treba locirati rješenje. Najjednostavniji put je da nacrtamo krivulje definirane jednadžbama, ako je to moguće, i da očitano sjecište uzmemo za početnu aproksimaciju (xo, yo) . To je u ovom slučaju lako provedivo. Iz prve jednadžbe mo žemo izračunati y, dok iz druge možemo izračunati x tako da jednadžbe poprimaju oblik y = x - 2 arc sin 2x x 2 arc cos 2y y . Načinimo li tablice imamo za prvu jednadžbu ovo interesantno područje L x I -0. 3 I -0.2 -0.1 I O I 0. 1 I 0.2 I I y I 0 .9 8 I 0.62 0 . 3 I O I -0 .3 I -0 . 62 I dok za drugu dobivamo I y I 0 . 4 0.42 I 0.44 0.46 I 0.48 I 0.5 I x I 0 .88 I 0 . 72 I 0.54 I 0 .34 I 0 .08 I -0.5 Nacrtamo li to na milimetarskom papiru dobivamo sljedeću sliku (sl. 5.1 1) iz koje očitavamo sjecište u točki (-0.16, 0.49) . Time za početnu aproksimacij u uzimamo Primjer 5.9.
SlO
1
=
5.3. SUSTAVI NELINEARNIH JEDNADŽBI
177
Xo = -0. 1 6 , Yo = 0.49 . Služeći se Seidel ovom iteracijom dobivamo XI X2 X3 X4
= = = =
= 0 . 4932 Y2 = 0 . 493 1 Y3 = 0.493 1
-0. 1 597, -0. 1603, -0. 1 605, -0. 1 605.
YI
Sl. .' U l .
Kako nam se daljnje iteracije ponavljaju to ćemo postupak zaustaviti. To ponav ljanje ujedno indicira da smo pronašli rješenje na 4 decimalna mjesta. Početna aproksimacija. U promatranom primjeru smo mogli nacrtati krivulje /(x, y) = O i g(x, y) = O izračunavši iz prve jednadžbe y kao funkciju od x , a iz druge X kao funkciju od y i time naći početnu aproksimaciju. To nije uvijek moguće. Općenito se možemo poslužiti ovakvim grafičkim postupkom prema kojemu grubo skiciramo krivulje /(x, y) = O , g(x, y) = O . Pišemo u
= /(x, y)
v = g(x, y)
i na koordinatnoj mreži (x, y) označimo pripadne vrijednosti od ll , odnosno v. (Naj bolje je nacrtati dvije posebne mreže. ) Prva krivulja je ona koja spaja točke II � O , dok druga spaja točke v � O , tako da dobivamo približno grafove. U našem primjeru bi imali
l
. 1 1l = 2x - sm - (x - y) 2 v = 2y - cos 2 (x + y).
5. NELINEARNE JEDNADŽBE
178
.0.25 r
.0. 1 0
l r5 rl
. , 0.05
Na sL 5.12 su u (x, y) mrežu upisane vrijednosti od u i približno skiciranakrivulja dana prvom jednadžbom. Nacrta li se analogna slika za v i te dvije poklope jedna na drugu dobiva se slika poput sl. 5.1 1 s koje očitavamo početnu aproksimacij u (xo yo) . Neposrednu korist takvog postupka nalaženja početne aproksimacije imamo, kod traženja kompleksnih rješenja jednadžbe Jez ) = O. (40) Naime, rastavimo li Jez) na realni i imaginarni dio dobivamo sustav dviju jednadžbi Re j(z ) = u(x , y) = O (41) Im j(z ) v(x, y) O koji je ekvivalentanjednadžbi (40). Sl. 5.12.
=
=
Nakon opisa metode iteracije za sustav dviju jednadžbijasno je da sustavjednadžbi j(x ) O (42) prevodimo u ekvivalentan oblik x (f) (x ) (43) koji u razvijenom obliku glasi Metoda iteracije za opći nelinearni sustav
=
Xl X2
= =
(f)1(XJ, X2, . ' . , X,, ) (f)2(X I , X2, . . . , Xn )
te da na njemu provodimo analogan postupak s varijabli. Polazimo dakle od početne aproksimacije x (O) i računamo k 0, 1, 2, . . . x (k +l ) = (f) (x ( k ) , (45) Xn
(f)n(Xj, X2, . . . , Xn) n
=
(44)
5.3. SUSTAVI NELINEARNIH JEDNADŽBI
179
Također je jasno da možemo provoditi Seidelov iteracijski postupak i u ovom slučaju. Isto je tako jasno, ako je dobiveni niz X(k ) konvergentan i ako su funkcije ({Ji neprekidne da je onda rješenje sustava (43), odnosno (42). Uvjet koji osigurava konvergenciju iteracijskog postupka je onaj koji smo imali za dvije jednadžbe prenešen na n dimenzionalni slučaj . Prije nego navedemo takav teorem razmotrimo koristan poseban slučaj kada je ({J kontrakcija. Evo kako možemo interpretirati (43) . Označimo sa YI = ({JI (x" Xz, . . . , xn ) Yz ({Jz (x" xz, . . . , Xn ) (46)
=
ili kraće
Y = ({J (x) .
(47)
Dakle, ({J je preslikavanje iz Rn u Rn , a riješiti sustav (43) znači naći točku x E Rn koju ({J preslikava u samu sebe. Takve točke se zovu fiksne točke. Među presl ika vanj ima ({J : Rn -+ Rn posebno su istaknuta preslikavanja koja recimo "podjednako" smanjuju normu (udaljenost). Evo što to znači. Neka j e O < q < l , realan broj. Kažemo da je ({J kontrakcija ria području Q ako preslikava Q u Q i ako za svake dvije točke XI , Xz E Q njihove slike Y I = ({J (X I ) , Yz = ((J (xz) zadovoljavaju (48) 0 < q < 1. 1 1 ({J (x I ) - ({J (xz) I I � ql lx l - xz l l , Ako je ({J kontrakcija, onda iteracijski niz {X(k ) } konvergira k fiksnoj točki, tj. rješenju sustava (43), što je posljedica jednog znatno općenitijeg teorema. Vratimo se općem slučaj u tj. kad ({J ne mora biti kontrakcija i navedimo bez dokaza ovaj teorem. Teorem 5.1 2. Neka su ({J i ({J' 11ep rekid1l e na ograničenom području Q tla kojemu vrijedi (49) 1 1 ({J ' (x) l lr � tj < l , za svaki x E Q . Ako etanovi 1Iiza
k = O , 1 , 2, . . .
pripadaju u Q , onda iteracijski postupak konvergira i
; = lim x ( k ) k ->oo
je jedi1lstveno rješenje sustava (42) u Q. Nadalje, za ocjenu pogreške vrijedi
I I ; - x ( k ) l lr �
q* I x( l ) - x (O) I I " l -q l
-
k
= O, l, . . . .
(50)
Teorem smo iskazali za rednu normu, no vrijedi i za bilo koju drugu submultipli kativnu normu koja je konzistentna s promatranom normom vektora.
6.
Aproksimacija rješenja običnih diferencijainih jednadžbi
6. 1 . Metoda sukcesivne aproksimacije . . . . . . 6.2. Eulerova metoda . . . . . . . . . . . . . .
6.3. Runge-Kuttini postupci . . . . . . . . .
. . . . 181
. . . . . . 1 85 . . . . . . 1 89
Promatraj mo za početak diferencijalnu jednadžbu
y i = I(x, y).
( 1)
Osnovni problem vezan za ( 1 ) je rješenje Cauchyjeva problema tj . treba odrediti rješenje diferencijalne jednadžbe ( l ) koje zadovoljava dani početni uvjet y yo za x = xo , drugim riječima treba naći integralnu krivulju koja prolazi zadanom točkom Mo (xo , yo) . Kao što znamo, prema Picardovom teoremu, takvo rješenje postoj i i nada lje ono je jedinstveno, ako je I neprekidna na pravokutniku lx - X o I � a , Iy - yo I � b i ako I zadovoljava Lipschitzov uvjet s obzirom na varijablu y (tj . postoj i L > O takav da za svaki x , lx - xo l < a i svake dvije vrij ednosti Y I i Y2 , I Y I - Yo l < b , IY2 - Yo l < b , I Y2 - Yo l < b vrijedi I/ (x , Y2 ) I(x , yd l � LIY2 Y I I .) Ako se prisjetimo dokaza Picardova teorema onda vidimo da nam dokaz daj e i postupak ap roksimacije rješenja Cauchyjevog problema. Taj postupak zovemo metoda sukcesivne aproksimacije.
6 . 1 . METODA SUKCESIVNE APROKSIMACIJE
181
6.1 . Metoda . f5L1kcesivne �proksirnacije
,-�;.������;�:�Ufti:'}l@!Iill�K@"t;� ]c1;:�::� �� ��f� � � ��0��:'�\��:��� �g:::YH�t-t; 1i��i1"i�?:�§j11�,,�\:�::5t1Ftf;?z;::;ttt��;?;:�����
Pođimo od gore opisanog Cauchyevog problema (1) y i I(x, y) , y (xo ) = Yo . Potražiti ćemo rješenje za x � Xo . dok je za x � Xo situacija potpuno analogna. Integracijom lijeve i desne strane od ( l ) u granicama od Xo do x dobivamo y(x)
x
J I[x, y (x)]dx
y(xo) =
Xo
ili zbog početnog uvjeta y (x)
Yo +
x
J I[x, y(x)]dx.
(2)
XO
Kako se tražena funkcija x -+ y(x ) nalazi pod znakom integrala to je (2) integralna jednadžba čije rješenje očigledno zadovoljava promatrani Cauchyjev problem ( l ) . Metoda sukcesivne aproksimacije sastoji se sada u sljedećem. U (2) zamijenirno nepoznanicu y sa zadanom vrijednošću Yo na koji način postižemo prvu aproksimaciju koja glasi x
J I(x, yo)dx .
Yl (X ) = yo +
(3)
Xo
Ako postupak ponovimo, tj. ako u (2) uvrstimo nađenu aproksimaciju (3) dobivamo drugu aproksimaciju Y 2 (X) = yo +
x
J I[x, YI (x)]dx.
(4)
Xo
Nastavivši postupak sa novodobiverrim aproksimacijama i mamo induktivno sljedeću formulu za n -tu aproksimaciju Yn (x) = Yo +
x
J I[x, YIl- l (x)]dx,
n
1, 2, . , .
(5)
XO
Geometrijski interpretirano, niz (5) predstavlja niz krivulja u ravnini koje prolaze kroz zajedničku točku Mo (xo, Yo ) . U dokazu Picardovog teorema se pokazuje da na nekom segmentu [xo. Xo + hl niz (5) uniformno konvergira funkciji (6) y(x) = lim Yn(x) n-oo
koja predstavlja jedinstveno rješenje Cauchyjevog problema ( l ) . Taj dokaz izostav ljamo i prihvaćamo rezultat kao poznat. Ako je M ograda za II I na promatranom
6. APROKSIMACIJA RJEŠENJA OBIeNIH DIFERENCIJALNI H JEDNADŽBI
pravokutniku lx - xo l < a, Iy - yol 182
b,
onda vrijedi
što ima za posljedicu da se integralna krivulja rješenja y(x) za Xo � x � Xo + II nalazi unutar sektora omeđenog pravcima <
{ !},
h = ntin a,
(7)
Y - Yo = M(x - xo )
Ocijenirno sada pogrešku ll-te aproksimacije en(X) dobivamo yo
Y
odnosno,
y(x) - Yn (X) =
- M (x
=
xo) .
=
IY(X) - Yn (x)l .
Iz ( 2) i ( 5)
x
/ [{(x, y(x »
lex, Yn_ l (x ) )] dx
x
a zbog Lipschitzovog uvjeta imamo I!(x, y(x » !(x, Yn_ l (x » 1 � L IY(x) Prema tome nalazimo en (X )
IY(x) - Yn (x ) 1
�
/ I!(x, y(x ) )
!(X, Yn_ l (x ) ) ldx
Xa
Yn-l (x) 1
X
� Len_ I (X) .
1, 2, . . .
( 8)
pri čemu za eo uzimamo (9) eo(X) = IY (X) - Yo l · Primjenom teorema o srednjoj vrijednosti na eo dobivamo za Xo � x � X o + II eo (x) IY(x) y{xo ) 1 = (x - xo) ly ' (� ) I , Xo < � x + ll. Kako za y' vrijedi l y l ( � ) 1 I! (�, Y (� » I � M to postižemo eo {x) � M (x xo) . Koristeći ( 8) imamo sada en(x)
�
/ Len_ I (x)dx,
II =
xa
<
=
=
/ eo(x)dx � ML /(x Xo )dx ML (x -2!xO )2 ', . 2 · (x _ Xo)2 dx e2 (X) � L / el (x)dx � ML / 2! •
e\ (X)
�L
..lo
Xo
x
..lo
Xo
=
6.1.
METODA SUKCESIVNE APROKSIMACIJE
183
itd., tako da za ocjenu pogreške n -te aproksimacije vrijedi
n+ 1 ( 10) En (X) � MLn (x(l1-+xo)l ) ! n = O, 1 , 2, . O za i to uniformno na segmentu [Xo, Xo + hl . Iz ( 10) čitamo da (X) Primjetirno da za početnu aproksimaciju ne moramo uzeti konstantu Yo već bilo '
-+
En
n
, ,
-+ oo
koju funkciju koja je dovoljno blizu traženom rješenj u i zadovoljava početni uvjet. Tako se često za početnu aproksimaciju uzima odsječak Taylorovog reda traženog rješenja. Kako desna strana od ne mora biti analitička funkcija, što ima za posljedicu da ni rj ešenje nije analitička funkcija (tj . ne može se razviti u red potencija) to vidimo da se metoda sukcesivne aproksimacije može primijeniti i u toj situaciji.
( l)
y
Primjer 6.1 . Metodom sukcesivne aproksimacije riješite diferencijalnu j ednadžbu
y' = x - y uz početni uvjet y(O) = 1 . Prema gore izloženom uzimamo Yo(x) = l , što daje
X 2 Y I (x) = l + J (x - l )dx = 1 - x + X2 , o
Analogno imamo
Y2 (X) = l + j (x - l + x - x; )dx o 3 I _ X + X2 - x-' 3 4 Y3(X) l - x + x-, x"3 + X24 ; 3 4 x5 Y4 (X) = l - x + x- - x"3 + 12X - 120 ' -
>
itd.
,
6'
Y4 , lx i � a, Iy - I I � b,
Pokušamo li ocijeniti pogrešku četvrte aproksimacije onda nas to vodi na sljedeće razmatranje. Promatramo li J na pravokutniku vidimo da je na njemu diferencijabilna a time i neprekidna. Kako je J dife rencijabilna na cijeloj ravnini to i mogu biti proizvoljni pozitivni brojevi. Ogradu za J lako dobivamo iz
f(x, y) x y
a b If(x, y) 1 lx YI � Ix l + IYI = Ix l + ly 1 + 1 1 � Ix l + ly - I I + I � a + b + l = M, b tako da za odabrane a = 1 i Ako je a � l onda Ir min {a !!... } M +a+ 1 b = l i mamo II � Iz I (x - Y2 ) - (x - y d l = IY2 - YI I vidimo da možemo uzeti ,
.
=
,
= l (Lipschitzova konstanta). Na taj način imamo x5 4 x5 f4(X) = IY(x) - Y4(x ) 1 � 3 . 1 5 1 40 ' odnosno l 1 l na [O, . = f4 = max I f4 (X ) 1 � 4 . 0 243 3 9720 Spomenimo odmah da se metoda sukcesivne aproksimacije može primijeniti i na sustav diferencijainih jednadžbi (11) Y' = f(x, y) , y (xo) = y (O ) , 184
6. APROKSIMACIJA RJEŠENJA OBIČNIH DIFERENCIJALNIH JEDNADŽBI
L
gdjeje y (x) =
Yn(x) l [����j ' .
. .
( )=
,y x
.. , y y� (x) l [�����
[=
.
.
( )=
y xo (O,
fl (x, Y J . . . . , Yn ) h(x, YJ , . . . , Yn)
l
[;�����l Yn(XO ) .
. .
Naime, postupak se primijenjuje po komponentama, tj. ako su Ji komponente od f , onda imamo f(x, y )
fn (x, Y J , . . . , Yn)
.
x
J fl (X, y (x ) )dx
Xo
dokje niz aproksimacij a y(p ) (p = 1 , 2, . . . ) određen sa ( 12) y (p) = y ( O) + J f (x, y (p- I ) ) dx, y (O) y(xo ) . Ta je metoda primijenjiva i na diferencijalne jednadžbe ll-tOg reda n I ' . n y ( ) = f(x , y , y , . . , y - ) ) (13) n y(XO } = yo , l (xo) = y�, . . . , y (n - I ) (xo) = y� - I ) . Ako ( 1 3 ) prevedemo u normalni ksustav pridružen diferencijalnoj jednadžbi ( 1 3), koji supstitucijom Y I = Y i Yk+ l = y ( ) glasi y; = y 2 x
J fn(x, y (x ) )dx
Xo
Xo
x
=
Xo
y; I
=
=
y3
Yn- I Yn y� f(x, Y J , Y2, . . . , Yn ),
( 1 4)
6. 2. EULEROVA METODA
185
onda primjenom gore opisanog postupka na sustav ( 14) dobivamo aproksimaciju rje šenja diferencijalne jednadžbe ( 1 3) . Naime, prva komponenta rješenja sustava ( 14 ) predstavlja traženo rješenje, dok ostale komponente predstavljaju redom prvu i više derivacije tog rješenja.
YI
Primjer 6.2. Odredite prve dvije sukcesivne aproksimacije rješenja sustava
yY�2 xX2+-YYlY2I2 Yl(O) l, Y2(0) O. [ P[yYr; )) ] [ Ol ] + [ J:X(x+2 -[yY;P-IP)Y-�IP)P_l))dxdx 1 o ; [ [ y[Y2(;IJ) ] -_ [Ol ] + J((xx2+-Ol))ddxx 1 - [ -lx+ x; l . ox x [ Ol ] [Jo [x [+2(l ; ) (2-x +X4 ; dx 1 _- [ l + X4 +x5X6 l Jo x - (l + x + -) dx -x + I
= =
koje zadovoljava ove početne uvjete
=
=
Prema ( 1 2) i mamo
=
Time dobivamo redom prvu i drugu sukcesivnu aproksimaciju x
+
+
;
' "� ;'t,.< ,
+
x
)]
4
' ,� "'�'::8.:;:�!:::�\0;�I» 'X'�9P:/·:: t7
]
3
� 3
'
24
36
W
::'::t":?!��':.>'\'. ' : ,\ :'''�
6.2. Eulerova metoda
y' /(x, y), y(xo) YI Y, oYz ,. . , Yn Xl , X(l)2 , .[xk.,,xXkn.+d (xk, yd (Xk+I , Yk+I ) . [Xk, Xk+d l x - Xk ) (Yk+1 -Yk ) x k ) + y( h( Y O, Xk+l - Xk.Y Y(x) [Xk' xk+y(d.x) Xk,
Promatrajmo ponovo Cauchyjev problem = = i pokušajmo izračunati aproksimativne vrijednosti U točkama Neka je ji po dijelovima linearna funkcija čiji je graf nad svakim segmentom dano sa spoj nica točaka i To da je ji na �
h
=
gdje je u točkama k = Ako dobro aproksimira = 1 , 2, . . . , Il i ako su diobene točke odabrane dovoljno gusto, onda će zbog neprekid nosti ji aproksimirati na svakom podsegmentu Prema tome treba nam
6. APROKSIMACIJA RJEŠENJA OBIČNIH DIFERENCIJALNIH JEDNADŽBI
186
postupak kojim dobivamo po dijelovima linearnu aproksimaciju. Zbog jednostavnosti redovito promatramo jednoliku podjelu, = k;; , pri čemu smatramo da je J definirana na pravokutniku :::;; a , :::;; b kao i u prethodnom paragrafu. te da je Jedino što znamo o funkciji je da zadovoljava diferencijalnu jednadžbu što moramo iskoristiti kada računamo aproksimativnu vrijednost u toč = ki IL . Zatim ćemo upotrijebiti Y I da izračunamo aproksimativnu vrijednost u točki ll . Da to dobijemo poslužit ćemo se Taylorovim redom koji daje =
x" Xo + l x -xol I Yol Y ( 1YI) yYz(xXIo) XYooX2+, Xl + Y Y(Xk + Y(Xk) + hy'(xd + �>I!(XkX) + .Xi<. XXk Xk +f(xkY, y(x,,) Y. yI!(Xk) [�� + �] (x", y(xt}), Jz) =
(2)
Prema tome poznavaj ući i njene derivacije u točki = možemo izračunati vrijednost u točki = il . Kako zadovoljava Cauchyjev problem to je deri Izračunamo li drugu i više deri vac ije (pomoću j ednaka vacija u točki pravila za deriviranje složenih funkcija) dobivamo
(l)
=
J
tako da (2) poprima oblik
(3)
Y(Xk+l ) y(xd YoYI Yoy(x+o)hf(xo, Yo) Yz YI + hf(x], yd (1)
Najjednostavniju aproksimaciju od dobivamo ako upotrijebimo samo pr va dva člana Taylorovog reda (3) i u njima zamijenirno sa aproksimacijom To redom daj e
Yi< .
=
(4)
Postupak aproksimacije rješenj a Cauchyjeva problema opisan formulom (4) zove se Eulerova metoda. To je vrlo jednostavan postupak. Rezultati nemaj u naročitu točnost jer smo aproksimira\i samo sa prva dva člana Taylorovog reda. Međutim, može dobro poslužiti kao uvod u razumijevanje kompliciranijih postupaka.
Y
Primjer 6.3. Izračunajte pomoću Eulerove metode aproksimativne vrijednosti rje šenj a sljedećeg Cauchyjevog problema
y ' (x ) ] y (O ) Yk+1 Yk + h[1 +(Yk- xk)2],
promatranog na segmentu [O,
l
l
= :2
. Formula (4) daje
k = O, l ,
. . .
,n
l,
6.2. EULEROVA METODA i h ::::: !n , uz Xo
i Yo !2 . Za n = 10 dobivamo sljedeću tablicu x x Y Y O 0.6 1.29810 0.1 0.5 0.625 0, 7 1.44684 0.2 0.75256 0, 8 1.60261 0.3 0.88309 0, 9 1.76703 0.4 1.0 1709 1 1.94220 0.5 1.15517 Druga dobra strana Eulerove metodeje da se dosta lako ocjenjuje pogreška. Prema Taylorovoj formuli (uz ostatak u Lagrangeovomobliku) imamo OI ] h 2 [ OI (5) y(xk+d = Y(Xk ) + hl (xk, y(xk ) ) + l 2 ox + I {)y ( gb y(gk ) ) gdje je gk E (Xk , Xk+ l ) ' Odbijemo li (4) od (5), dobivamo =
O
187
=
y(xk+d - Yk+l
+ [ + 2! + ]
Y (Xk ) Yk h[j(xk. Y(Xk ) ) I(x* , Yk )] OI h2 OI I (g y(�d ) · ox oY b Y
Primjenom teorema o srednjoj vrijednosti s obzirom na varij ablu dobivamo za razliku u uglatoj zagradi . =
gdje je TJk između Y (Xk ) i Yk . Prema tome imamo I(xk , y(xk ) ) - l (xk, Y,.;) =
a/(xk, TJk ) (Y(Xk ) - Yk) oY
+ h l ol(Xk,ay TJd I IY(Xk ) + h22l 1 [ aalx + I oaIy ] (�k, y( gd ) I .
(6) Kao što znamo iz dokaza Picardovog teorema (usporedi prethodni paragraf i sI.2.) točke ( �k ' y (�k ) ) leže u pravokutniku određenom sa lx - xol � ri1i n { ! } , tY - Yo l b, gdje je M ograda za III . Međutim, i točke (x*, yI.: ) leže u tom pravokutniku što se može dokazati indukcijom, tako da i točke (x* , TJd leže u pravokutniku Ako su L i D ograde za I :� I i I :� + I :� I onda iz (6) dobivamo . Dh 2 (7) ly (xk+l ) - Yk+ t ! � IY(x�.) - Yk t + hL ly(xk) - Yk l + 2 ' Označimo li sa (8) fk Iy(xk) - Yk l , k O, 1, pogrešku koju činimo aproksimirajući Y (Xk ) na YA- , onda iz (7) dobivamo Dh2 � (1 + hL )fk + 2' k O, 1, . - 1. (9) Iy(xk+d - Yk+ t I
� Iy(xk) - Ykl
P
<
a,
P.
=
fh!
. . . , II
=
=
. .
, II
188
6. APROKSIMACIJA RJEŠENJA OBItNIH DIFERENCIJALNIH JEDNADŽBI
co
Nadalje, = O jer je nejednakosti
Y (XO ) Yo =
.
na taj način pogreške
Co . Cl , . . . , cn zadovoljavaju ( 10)
A l + hL , B D ""2h2 . Sada bi trebali ocijeniti pogrešku Ck ako znamo da pogreške zadovoljavaju nejed nakost ( 10), gdje su A i B pozitivni brojevi. Imamo dakle Ck � ACk-1 + B � A(Ack-2 + B) + B = A2 ck_ 2 + AB + B � A 2 (Ack_ 3 + B) + AB + B A3ck_ 3 + A 2B + AB + B � A 3 (Ack_4 + B) + A 2B + AB + B A�Ck-4 + A 3B + A 2B + AB + B �... . gd·Je Je
=
=
=
=
Sukcesivnim uvrštavanjem dobivamo očigledno
Ck � Akco + Ak-l B + . . . +A 2B + AB + B.
( l l) Zbog O preostali pribrojnici desne strane od ( l l ) čine 11 -tu parcijalnu sumu geometrijskog reda, tako da imamo
co
=
Dh [( 1 + hL)k - l ] . Ck � A B- l (Ak - l ) = 2L
( 1 2)
--
Kao daljnji korak naći ćemo ocjenu pogreške koja ne ovisi o k iz čega će ujedno slijediti konvergencij a. Uoči l i se da vrijedi l hL
+ � ehL (što lako uvidimo iz reda za eksponencijalnu funkciju), onda zamjenom u ( 1 2) imamo Ck � DhL [( hL )k l ] DhL [ khL l ] .
Kako je kh <
b
M
e
2
-
=
2
e
-
dobivamo
[ bL l ] � Dh Ck � Dh 2L 2L eM
-
bL
eM ,
( 1 3)
k = l , . . . , 11 .
( 1 3) kaže da je pogreška proporcionalna za h te nadalje da Ck O kada hNejednakost O . Jasno je kako se Eulerova metoda prenosi na sustav diferencijalnih jednadžbi yi f(x, y) , y (xo ) Yo. ( 14) ----
----
=
=
Treba postupak primijeniti po komponentama. Eulerovu metodu smo dobili iz (2) tako da smo kao aproksimaciju uzeli prva dva člana Taylorova reda. Izvrši li se aproksimacija sa prva tri člana Taylorova reda dobivamo
Yk
+
l Yk + hf(xk, yd + ""2h2 [ Oofx + f Oofy ] (Xk Yk ) =
,
,
k = O, l , . . . , II - 1 .
(15)
To se ponekad zove metoda sa tri člana Taylorova reda, koja j e preciznija od Eule rove.
6.3. RUNGE-KuTTINI POSTUPCI
6.3.
189
Runge-Kuttini postupci
Y (Xk+ l )
Već smo istakli da smo Eulerovu metodu dobili tako da smo aproksimi rali s prva dva člana Taylorovog reda. Bolja aproksimacija pomoću Taylorovog reda zahtijeva izračunavanje derivacija višeg reda što je u većini slučajeva komplicirano. Zato izvršimo slijedeće razmatranje. Pođemo li od
Yk+ l = Yk + hf(Xk, Yk ) Xk = f(x,
Yk
onda smo, gledano geometrijski, u točki uzeli aproksimaciju i gradijent smjera yd koji diferencijalna jednadžba yi Time y) propisuje u točki linearnom interpolacijom dobivamo graf aproksimacije y . Drugim riječima, u točki smo uzeli za aproksimaciju derivacije rješenja. Točna vrijednost derivacije u toj točki iznosi , pa se nameće pitanje izbora neke druge aproksimacije od , što u krajnjoj liniji vodi na prikladan izbor aproksimacije od y) na segmentu � � . Takva interpretacija nas vodi na opći algoritam
f(Xk ,
(Xk ' Yk ) .
Xk f(Xk , Yk ) f(X , Y (X )) f(xk , Y (Xk )) k k f(x, Xk x Xk+1 Yk+1 = Yk + /zCl>(Xk , Yk, h) (1) gdje je (Xk ' Yk , ll ) neka odabrana aproksimacija od f(Xk , Y (Xk )) . To otvara široke mogućnosti izbora , a ovdje ćemo prikazati vrlo korisnu meto du koju su razvili matematičari Runge i Kutta oko 1900. godine. Kako možemo vršiti različite izbore aproksimacije to imamo čitavu seriju Runge-Kuttinih postupaka
(algoritama). Najlakše dolazimo do Runge-Kuttinog postupka (algoritma) drugog reda, čiji izvod nam daje put kako se dobivaju ostali. U tom slučaju promatramo težinsku aritmetičku sredinu dviju aproksimacija derivacije yi na segmentu � � , tj. uzimamo (2)
t l , t2
Xk x Xk+ 1
= at I + bt2. rt l + st2 ) . (Težinska aritmetička sredina brojeva t l i težinama r i s jednaka je ----'--r+s Time prema (l) imamo Yk+ 1 = Yk + h(atl + bt2)' (3) f2 S
Neka je
(4 )
tj. aproksimacija od yi kao kod Eulčrove metode. Tada za aproksimaciju uzeti
t2 možemo
t2 = f(Xk + ph, Yk + qhf(xk , Yk )) (5) = f(Xk + ph, Yk + qhtl) tj . analogno računatu aproksimaciju u nekoj međutočki na [Xk ' xk+ d gdje su p i q konstante koje ćemo naknadno odrediti . Razvijmo prvo t2 kao funkciju dviju varijabli p i q u Taylorov red oko točke p = O , q = O . Time imamo t2 = f(Xk + ph, Yk + qhf(Xk , Yk )) (6) = f(Xb Yk ) + phfx (Xb yd + qhf(Xk , ydh (Xb yd + . Iz (6), (5), (4) i (3) dobivamo Yk+1 = Yk + h[af(xk , yd + bf(xk , Yk )] + h2 [bpfx (Xk , yd + bqf(xk, ydh (xb Yk )] + (7) '
.
.
.
.
.
190
6. APROKSIMACIJA RJEŠENJA OBIČNIH DIFERENCIJALNIH JEDNADŽBI
Nadalje, razvijmo traženo rješenje Y u Taylorov red oko Xk ' Imamo h2 Y (Xk+ I ) = Y (Xk + h ) = Y (Xk ) + h/(xk , Y (Xk » ) + 2/ (Xk, Y (Xk ) )
+
�>/I(�, y(� » ,
E
�
(xk , xk +d.
(8)
Po teoremu za deriviranje složenih funkcija imamo
I (Xk , y (xd ) = f� (Xb Y (Xk » + h, (Xk , Y (Xk » /(Xk , y (xt } ) , pa uz iste potencije od Iz imamo u (7) i (8) ove koeficijente: Potencije od IL Razvoj od Y Runge-Kuttin algoritam o y� ) � b) ( a ( l ) ) ( + /(Xk, Yk ) / Xk, Y Xk bpfx ( Xk, Yk ) 2 Hfx(Xk , Y (Xk ) ) +/y (Xk , Y (Xk ) )/(Xk , Y (Xk » J + bq/y (Xk' Yk )/(Xt , Yk ) . Pretpostavimo li d a j e Yk = y (xt} i izjednačimo li koeficijente u z Iz i h 2 imamo a+b l
1
bp
l bq = 2
2'
tako da iz
a
l-b
dobivamo
l 2b Sada još ostaje izbor od b . Dva uobičajena izbora su
Slučaj b =
p
q=
b �2
i
� . Tada je a �
YHI = Yk + što se može pisati i ovako
,
b = 1.
p = q = l pa dobivamo algoritam ,
h [t(x*, Yk ) + /(Xk + h, Yk + h/(Xb Yk ) )] 2 (9)
gdje je Postupak koji daju (9) i
metoda . Čitamo li (9) i
)lk+l
Yk + h/(Xk, yd·
(10)
(10) zove se još poboljšana Eulerova metoda ili Beunova (10) detaljno, onda vidimo da smo u biti dvaput upotrebljavali
Eulerovu metodu. Prvo imamo )lHI kao aproksimaciju od Y (Xk+ I ) . U drugom koraku poboljšavamo aproksimaciju koju računamo iz (9).
191
6.3. RUNGE-KuTTINI POSTUPCI
Slučaj
gdje je
b = 1 . Tada je a O, = = � , tako da dobivamo algoritam Yk+1 Yk + hl (xk + �'Yk+I /2) P
q
( l l) ( 1 2)
što se još zove i modificirana Eulerova metoda. Runge-Kuttini algoritmi višeg reda dobivaju se analogno. U slučaj u trećeg reda imamo
( 13)
t) , tz, t aproksimacije derivacije, odnosno I , u različitim točkama segmenta [Xk , Xk+ d . U tom3 slučaju uzimamo tl = I(x", y,, ) t2 = I(x" + ph, YIe + phtl ) , t3 = I(x" + rh, YIe + sht2 + (r - S)htl)' tako da Runge-Kuttin algoritam trećeg reda glasi Yk+I = y" + h(atl + bt2 + et3 )' ( 1 4) Da odredimo konstante a , b , e, p , r, s, razvijemo t2 i t3 kao funkcije dviju varijabli u Taylorov red oko (X" , y,,) . Traženu funkcij u Y razvijemo u Taylorov red (8) kao i prije. Zatim se izjednače koeficijenti uz iste potencije od Iz do potencije 3, što je u biti gdje su
isti izvod kao i prije. Opet dobivamo manje jednadžbi nego nepoznanica koje glase: 1, + + 1 +
a b e= bp er 2 ' bp2 + er� = -31 ' eps = 61 ' �
Odabiranjem dviju konstanti ostale su određene. Jedan izbor konstanti, koj i je izvršio Kutta, daje sljedeći algoritam trećeg reda
(Ako I ovisi samo o
Yk+1 = YIe + 6h (t l + 4t2 + t3 ) t l = I(x", yd , t2 = I(x" + 2l h, y" + 2l htt ), t3 = I(x" + h, y" + 2ht2 - htd·
x
onda dobivamo Simpsonovu formulu.)
( 1 5)
6. APROKSIMACIJA RJEŠENJA OBIČNIH DIFERENCIJALNIH JEDNADŽBI
192
Svi algoritmi četvrtog reda polaze od
Yk+l = Yk + h(atl + bt2 + Ct3 + dt4 )
(1 ) [Xk ' Xk+ d
6 . aproksimacij e derivacije u nekim točkama segmenta gdje su U primjenama se koristi nekoliko algoritama četvrtog reda. Sljedeći se pripisuje Kutti:
t l , t2 , t3 , t4
Yk+ l = Yk + 6h (tl + 2t2 + 2t3 + t4 ) tl = f(xk , Yk ), l l t2 = f(Xk + "2h, Yk + "2ht l ), l l t3 = f(Xk + "2h, Yk + 2ht 2) t4 = f(Xk + h, Yk + ht3 ). (17) (17) s e također svodi na Simpsonovu formulu ako je f funkcija samo od x . Jedan drugi algoritam četvrtog reda koji se također pripisuje Kutti glasi Yk+ l = Yk + 8h (tl + 3t2 + 3t3 + t4), tl = f(xk, Yk ), l l (18) t2 = f(Xk + 3h, d, Yk + 3ht l 2 Y - 3ht t3 = f(Xk + 3h, l + ht2 ), k t4 = f(Xk + h, Yk + htl - ht2 + ht3 ) ·
Često se upotrebljava i slijedeći algoritam četvrtog reda a pripisuje se matematičaru Gillu.
Yk+ l = Yk + � [tl + 2 ( 1 - �) t2 + 2 ( 1 + �) f3 + t4] ' t l = f(Xk , Yk ), t2 = f (Xk + �h' Yk + � htl) ' t3 = f (Xk + � h' Yk + (-� + �) htl + ( l - �) ht2) ' t4 = f (Xk + h, Yk - � ht2 + ( 1 + �) ht3) .
(19)
Spomenimo da se u literaturi može naći više algoritama petog reda u što se ovdje ne upuštamo. Istaknimo da se za sve Runge-Kuttine algoritme može pokazati da konvergiraju, tj . da vrijedi
h
To nam kaže da uz manji dobivamo bolju aproksimaciju. Što se tiče ocjene pogreške, može se pokazati (u što se ne upuštamo) daje za algoritam i -tog reda pogreška � C; i , međutim, praktički je gotovo nemoguće naći konstante Ci . Na taj način obično ne
h
6.3. RUNGE-KuTTlNI POSTUPCI
193
znamo kako malen lt treba uzeti da postignemo željenu točnost. Jedan način kako si pomažemo je sljedeći. Izaberemo jedan lt i izračunamo YI , Y2 , . . . , Yn ' Tada ponovimo račun za � i usporedimo rezultate. Ako su razlike malene onda smo obično zadovoljni rezultatom, a ako su velike, onda moramo ponoviti postupak sa manjim li , dok ne postignemo zadovoljavajući rezultat. Spomenimo još jedan kriterij za Runge-Kuttin algoritam (1 ) koj i potječe od Collatza, a sastoji se u sljedećem: Poslije svakog koraka izračuna se7
I
t3
t2
1
t2 . tl
Ako taj omjer postane velik (veći od nekoliko stotina), onda se Iz mora smanjiti. To je sasvim kvalitativan indikator, međutim, vrlo je spretan jer je dodatno računanje zanemarivo.
194
KAZALO
KAZALO
Aitkenova šema. 5 Aitkenov algoritam, 5 algebarska jednadžba. 148 apsolutna norma, 90 brzi Fourierovi transformati, 28 brzo oscilirajuća. 60 Budan-Fourierov teorem, 1 54 Bunemanova metoda, 78 Choleskyjeva šema, 76 Cooley-Tukeyeva metoda, 29 Cotesovi koficijenti, 43 Čebiševljevi polinomi, 31 Čebiševsko ekonomiziranje, 35 čvor, 2 Danilevskijeva metoda, 1 1 6 Descartesovo pravilo, 1 53 determinanta, 69 diferencija unaprijed, I I diferencija unatrag, 1 2 dijagonalno dominantan sustav, 96 po recima, 96 - po stupcima, 96 direktne metode, 66 dominantna svojstvena vrijednost, 129 duljina, 89
-
ekstrapolacija, 5 euklidska norma, 90, 9 1 Eulerova metoda, 1 85 fazni interpolacijski polinom, 23 fiksna točka. 179 Filonova formula, 6 1 Frobeni usov oblik, 1 1 6 Gauss - Jordanova metoda, 70 Gaussova metoda, 66 Gaussove formule, 57 Gauss - Seidelova metoda.. 98 glavni element, 7 1 granice Iješenja a lgebarskih jednadžbi , 1 49 Heunova metoda, 1 90 i ndeks polinoma s obzirom na pravac, 1 58 i nterpolacija, 5
interpolacijski polinom, I Lagrangeov obli k, 2 - Newtonov obl ik s diferencijama unaprijed, 1 2 - Newtonov oblik s diferenci jama unatrag, 1 2 - Newtonov oblik s kvocijentima diferencija, 10 -
interpolacijski splajn, 18 inverzna interpolacija, 1 6 inverzna matrica, 69, 7 1 iteracijske metode, 84 iterirana linearna interpolacija, 5 Jacobijeva metoda, 95 Jordanova forma, 87 Jordanove elementarne klijetke, 87 Jordanovi blokovi, 87 karakteristična jednadžba, 87 karakteristični polinom, 1 1 6, 1 24, 1 27 kompleksna rješenja, 1 57, 1 66 kontrakcija, 1 79 konzistentnost normi. 93 korak i nterpolacije, 4 Krilovljeva metoda, 124 kubni splajn, 19 kvadratična konvergencija, 143 kvocijent diferencija prvog reda, 7 k vocijent diferencija n -tog reda, 8 . . tiA Lagrangeovi k 9 L2 -aproksim Legendreovi polinomi, 54 Leverrierova metoda, 127 linearna i teracija, 84 lp norma, 90 LU (LR) faktorizacija, 75
maksimum norma, 9 1 metoda i teraci je, 137. 1 74, 1 78 metoda neodređenih koeficijenata, 1 1 5 metoda raspolavljanja, 136 metoda relaksacije, 101 metoda sekante, 144 metoda sukcesivne aproksimacije, 1 80 metoda sukcesivrie nadrelaksacije, 104
195
KAZALO metoda tangente, 140 minimaks polinom, 34 minimaks princip, 34 Misesova metoda, 1 28 modificirana Eulerova metoda,
relaksacijski parametar, 104 Richardsonova ekstrapolacija, Rombergov algoritam, 50 Rombergova tablica, 53 r -ta diferencija unaprijed, I I r -ta diferencija unatrag, 12 Runge - Kuttini postupci. 1 88
1 91
nelineame jednadžbe, 1 34 nestabilan sustav, 102 Newton-Cotesova formula, 43 Newtonova metoda, 140, 1 64, 1 69 Newtonove formule, 127 Newtonov iteracij ski postupak, 141, Newtonov test, 1 52 Newton - Raphsonova metoda, 141 norma, 89 normalni Frobeniusov oblik, 1 1 6 norma matrice, 90 normalni sustav, 1 84 norma vektora, 89 normirani oblik polinoma, 148 numeričko integriranje, 40 optimalni aproksimacijski polinom,
1 66
34
pivot element, 7 1 poboljšana Eulerova metoda, 1 90 pojednostavljena Newtonova metoda, poli nom najmanjih kvadrata, 37 pozitivno definitan sustav, 99 racionalna interpolacija, redna norma, 9 1 regula fal si, 144 relaksacija, \OJ
17
174
51
Simpsonova formula, 47 s -kratno rješenje, 1 48 slabo uvjetovan sustav, 102 sličnost matrica, 1 12 SOR metoda, 104 spektar matrice, 128 spektralni radijus, 87. 129 splajn, 1 9 stupčana norma, 9 1 Sturmov niz, 155 sustavi Iineamih jednadžbi, 65 sustavi nelineamih jednadžbi, 1 64 svoj stveni vektor, 87, l IO, 1 20, 125 svojstvena vrijednost, 87, 1 10 teleskopiranje reda potencija, 35 težinska funkcija, 58 trapezna formula, 45 trigonometrijski interpolacijski poli nom, 23 upotrebljivost rješenja, Vieta-ove formule, vodeći element, 7 1
149
82
LITERATURA
j
f1
[2
[3]
[4]
[5J
N. S. Bahvalov, Čislenije metodi l, Nauka, Moskva, 1975. L S. Berezin, N. P. Zhidkov, Computing Methods 1. 2, Pergamon Press, Oxford, •
1965.
B. Carnahan, H. A. Luther, J. O. Wilkes, Applied Numerical Methods, J. Wi ley, New York, 1 969. B.P.Demidovič, I. A. Maron, Computational Mathematics, Mir Publishers, Mos cow, 1987. B. P. Demidovich, l. A. Maron, Osnovi vičisliteljnoj matematik;, Nauka, Moskva.
] 1966.
[6 [7
1
N. Elezović, Linearna algebra, Element, Zagreb, 1 995. F. B. Hildebrand, Introduction to Numerical Analysis, Mc Graw - Hill, New York,
J
G. V. Milovanović, Numerička analiza l, Naučna knj iga, Beograd, 1988. C. E. Pearson Ed Handbook of Applied Mathematics. Selected Methods and Results, Van Nostrand, New York. 1 974. J. Stoer, R. Burlish. Introduction to Numerical Analysis, Springer-Verlag. Berlin.
[8
[9 [ 10
[l I
[ 12
{ 13J
1956.
P.Javor, Matematic"ka analiza J, Elefl!;ent, Zagreb, 1995. S. Kurepa, Uvod u linearnu algebru, Skolska knjiga, Zagreb, 1975. S. Kurepa, Matematička analiza l. II, 1/1, Tehnička knjiga, Zagreb,
1975.
.•
1980.
1975., 197 1 ..