12.1 Cayley-Hamilton-Sætningen

SEKTION 12.1 CAYLEY-HAMILTON-SÆTNINGEN 12.1 Cayley-Hamilton-Sætningen Sætning 12.1.1 (Cayley-Hamilton) Lad A Mat n,n (C). Så gælder p A (A) =. Sætningen gælder faktisk over et vilkårligt legeme, men vi viser det ikke her. Lad nu λ 1,..., λ n C være A s egenværdier, talt med multiplicitet. Så er så sætningen kan omformuleres: Sætning 12.1.2 p A (λ) = ( 1) n (λ λ 1 )... (λ λ n ) Lad A Mat n,n (C) have egenværdier λ 1,..., λ n C talt med multiplicitet. Så er (A λ 1 )(A λ 2 )... (A λ n )=. Vi viser dette først for en øvretriangulær matrix: Proposition 12.1.3 Lad T Mat n,n (F) være øvretriangulær, lad λ 1,..., λ n være T s diagonalindgange. Så er (T λ 1 )(T λ 2 )... (T λ n )=. Vi benytter induktion over n. Når n =1er T =[λ 1 ] og T λ 1 =[λ 1 ] λ 1 [1] =. Antag så, at resultatet gælder for øvretriangulære matricer i Mat, (F), og at T er som i hypotesen. Vi kan skrive [ ] λ1 b T = C hvor b Mat 1, (C) og C Mat, (C) er øvretriangulær med diagonalindgange λ 2,..., λ n. Vi har [ ] b T λ 1 = C λ 1 og [ ][ b λ1 λ (T λ 1 )(T λ 2 )= 2 b C λ 1 I C λ 2 [ ] b(c λ2 ) =. (C λ 1 )(C λ 2 ) ] 218

SEKTION 12.1 CAYLEY-HAMILTON-SÆTNINGEN, fortsat På samme måde fås (T λ 1 )(T λ 2 )(T λ 3 ) b(c λ 2 )(C λ 3 ) = (C λ 1 )(C λ 2 )(C λ 3 ),. (T λ 1 )... (T λ n ) b(c λ 2 )... (C λ n ) = (C λ 1 )(C λ 2 )... (C λ n ). Induktionshypotesen giver, at (C λ 2 )... (C λ n ) =, så (T λ 1 )... (T λ n )=. Induktionsskridtet er taget, og resultatet dermed bevist. for Sætning 12.1.2 Ifølge Schurs sætning findes der en unitær matrix U Mat n,n (C) så U T AU = T, en øvretriangulær matrix med A s egenværdier λ 1,..., λ n som diagonalindgange. Proposition 12.1.3 giver så, at Da U T AU λ i = U T (A λ i )U fås så (U T AU λ 1 )(U T AU λ 2 )... (U T AU λ n )=. U T (A λ 1 )U U T (A λ 2 )U... U T (A λ n )U =, U T (A λ 1 )(A λ 2 )... (A λ n )U =, fordi UU T =. Gang fra venstre med U, og fra højre med U T : (A λ 1 )(A λ 2 )... (A λ n )=. 219

SEKTION 12.1 CAYLEY-HAMILTON-SÆTNINGEN Korollar 12.1.4 Lad A Mat n,n (C); og lad p være et komplekst polynomium. Der findes et polynomium q af grad <nså p(a) =q(a). Vi vil vise, at hvis P er et komplekst polynomium af grad n, så findes der et polynomium Q af grad mindre end P så P (A) =Q(A); resten følger iterativt. Antag, at P (x) =a k x k +... + a, hvor k n, og lad Så er grad Q k 1, og Q = P ( 1) n a k x k n p A. Q(A) =P (A) ( 1) k a k A k n p A (A) =P (A). 22

12.2 Matrix-eksponentialet og lineære differentialligninger Sætning 12.2.1 Lad A Mat n,n (C). Der findes en differentiabel matrix-funktion t exp(ta) :R Mat n,n (C) således at exp(a) = og d (exp(ta)) = A exp(ta); dt og denne funktion er entydigt bestemt af disse betingelser. Det påstås i [L] (s. 338), at denne funktion eksisterer, og er givet som summen af matrixrækken + ta + t2 2! A2 +.... Der skal dog bruges nogle dybere resultater fra matematisk analyse for at vise, at rækken konvergerer. Fremgangsmåden er heller ikke særligt praktisk, fordi rækkens sum er ikke nem at beregne direkte (med mindre A er diagonaliserbar, se [L], s.337). Her er et andet argument, som bruger Cayley-Hamilton-sætningen og kun helt elementær analyse. Sætning 12.2.2 (Putzers algoritme) Lad A Mat n,n (C); lad λ 1,..., λ n være egenværdierne for A, talt med multiplicitet. Lad P =, og, for k =1,..., n, P k = k j=1 (A λ j ); og definer Q(t) = r k+1 (t)p k, k= hvor r 1 (t) =e λ1t, og r k er induktivt defineret, for k =2,..., n, ved r k (t) =e λ kt e λ ks r k 1 (s) ds. Så gælder, at Q() = og Q (t) =AQ(t) =Q(t)A. Vi ser, at r 1 () = 1 og r k () = for k =2,..., n, så Q() = P =. Det er klart, at A kommuterer med A λ i for i = 1,..., n, så den kommuterer med P,..., P og så med Q(t); altså AQ(t) =Q(t)A. Vi har, for k>1, at r k(t) =λ k e λ kt = λ k r k (t)+r k 1 (t); e λ ks r k 1 (s) ds + e λ kt e λ kt r k 1 (t) ved at definere r (t) til at være identisk gælder dette også når k =1. 221

, fortsat Vi har da Q (t) = r k+1(t) P k k= ( = λk+1 r k+1 (t)+r k (t) ) P k, k= så Q ( ) (t) AQ(t) = rk+1 (t)(λ k+1 P k AP k )+r k (t) P k k= ( ) = rk+1 (t)(a λ k+1 )P k + r k (t) P k k= ( ) = rk+1 (t) P k+1 + r k (t) P k k= = r n (t) P n =, fordi ( 1) n P n = p A (A), som er ifølge Cauchy-Hamilton-sætningen. et er fuldført. Addendum 12.2.3 Lad R : R Mat n,n (C) tilfredsstille, at R() = og R (t) =AR(t). Så er R = Q. Vi beregner d dt (Q( t)r(t)) = Q ( t)r(t)+q( t)r (t) = (Q( t)a)r(t)+ Q( t)(ar(t)) = ; så Q( t)r(t) er konstant, så lig med, som er dens værdi når t =. Dette gælder også når R = Q; så Q(t) er invertibel, med invers Q( t). Vi får derfor som ønsket. Q(t) = Q(t) = Q(t)(Q( t)r(t)) = (Q(t)Q( t))r(t) = R(t) = R(t), Putzers algoritme og addendummet viser Sætning 12.2.1. 222

Korollar 12.2.4 Lad A Mat n,n (C), v C n. Ligningen y = Ay har en entydig løsning x : R C n med x() = v, givet ved x(t) = exp(ta)v. Vi beregner x (t) = d dt (exp(ta)v) = A exp(ta)v = Ax(t); da x() = v = v er x en løsning med den ønskede -værdi. Lad z være en anden løsning med z() = v. Vi beregner d dt (exp( ta)z(t)) = A exp( ta)z(t) + exp( ta)z (t) = A exp( ta)z(t) + exp( ta)az(t) = fordi A og exp( ta) (som er Q( t) fra Proposition 12.2.2 og Addendum 12.2.3) kommuterer. Så exp( ta)z(t) er konstant, så lig med v, dens værdi når t =. Vi har da og entydigheden er også vist. z(t) = exp(ta) exp( ta)z(t) = exp(ta)v = x(t), 223

Putzers algoritme giver en ret effektiv metode til at beregne exp(ta). Eksempel 12.2.5 Lad 1 A = 1. 1 3 3 Vi beregner exp(ta). Det karakteriske polynomium er λ 1 p A (λ) = det λ 1 1 3 3 λ [ ] [ ] λ 1 1 = λ det det 3 3 λ 1 3 λ så λ 1 = λ 2 = λ 3 =1. Vi beregner = λ( λ(3 λ) + 3) + 1 = 1 3λ +3λ 2 λ 3 = (1 λ) 3 ; r 1 (t) =e t, r 2 (t) =e t e s e s ds = e t 1 ds = te t, r 3 (t) =e t e s se s ds = e t s ds = 1 2 t2 e t ; så Da fås exp(ta) =e t + te t (A )+ 1 2 t2 (A ) 2 = e t ( + t(a )+ 1 2 t2 (A ) 2 ). 1 1 1 2 1 A = 1 1, (A ) 2 = 1 2 1 1 3 2 1 2 1 1 t + 1 exp(ta) =e t 2 t2 t t 2 1 2 t2 1 2 t2 1 t t 2 t + 1 2 t2. t + 1 2 t2 3t t 2 1+2t + 1 2 t2 Det centrale i Putzers algoritme ses at være beregning af funktionerne r k, en beregning som er uafhængig af andet end λ 1,..., λ n. 224

Proposition 12.2.6 Lad værdierne af λ 1,..., λ k være de p tal µ 1,..., µ p, som optræder i listen af λ i erne med multipliciteter k 1,..., k p. r k (t) er da en lineær kombination af de k funktioner t m e µjt, m<k j, 1 j p. Vi argumenterer induktivt over k. Når k =1gælder påstanden, idet r 1 (t) =e λ1t = e µ1t. Antag nu induktivt, at påstanden gælder for r k 1 (t). Så er r k (t) en lineær kombination af funktionerne f jm (t) =e λ kt s m e (µj λ k)s ds, m (k 1) j, j p. Det er derfor nok at vise, at hver af disse funktioner er en lineær kombination af t m e µjt, m<k j, 1 j p. Hvis λ k = µ j, så k j =(k 1) j +1, er f jm (t) =e µjt s m ds = 1 m +1 tm+1 e µjt, og m +1< (k 1) j + 1 = k j, så f jm (t) har den ønskede form. Hvis λ k µ j, så k j =(k 1) j, er sm e (µj λk)s ds en lineær kombination af den konstante funktion 1 og t r e (µj λk)t, r m, et resultat der følger ved gentagen delvis integration, eller af formlen ( t s m e as ds = m! m ) (at) r a m+1 e at 1 r! med a = λ k µ j. Så f jm (t) er en lineær kombination af funktionerne e λ kt og t r e µjt, r m. Da λ k = µ q for et q mellem 1 og p (q j), er k q >. Vi har også r m (k 1) j = k j. Så f jm (t) har den ønskede form også i dette tilfælde. Den induktive skridt er taget, og beviset er fuldført. r= Dette resultat indikerer, at potenser af t vil optræde i Putzer-beregningen af exp(ta) så snart der er egenværdier med algebraisk multiplicitet større end 1. På den anden side, betragt diagonaliserbar A Mat n,n (C). Så findes der en invertibel matrix V så A = V diag(λ 1,..., λ n )V 1, og vi har tidligere set, at exp(ta) =V diag(e λ1t,..., e λnt )V 1, lige meget hvilke multipliciteter A s egenværdier λ 1,..., λ n har. De potenser af t, der kunne vise sig undervejs i Putzer-beregningen må derfor på snedig vis forsvinde til sidst! Man kan også arrangere beregningerne så de ikke optræder overhovedet. Det er ikke svært at se, at hvis µ 1,..., µ p er de forskellige værdier taget af λ 1,..., λ n, så er (A µ 1 I)... (A µ p I)=. Altså, hvis vi ordner egenværdierne for A med µ 1,..., µ p først og gentagelsene senere, så vil Putzer-beregningen slutte efter p skridt (fordi =P p = P p+1 =...), uden at potenser af t optræder i r 1 (t),..., r p (t). Mere generelt, hvis λ er en egenværdi for B Mat n,n (C), så kan t m e λt optræde i exp(tb) kun hvis m Alg(λ) Geo(λ), men det kan vi ikke vise her. 225

Lad os nu betragte differentialligningen y (n) + p y () + + p 1 y + p y = ( ) hvor p,..., p C og y (r) er y s r te afledede; vi vil ofte også bruger denne notation med r =1 (y (1) = y ) og r =(y () = y). En løsning til denne ligning er en n gange differentiable funktion f : R C således, at f (n) (t)+p f () (t)+ + p 1 f (t)+p y(t) =for alle t R. Det er nemt at se, at løsningsmængden L er et underrum af C n (R, C), rummet af n gange differentiable funktioner. Proposition 12.2.7 Lad A være n n-matricen 1... 1....... 1 p p 1 p 2... p ; og lad [f (t),f 1 (t),..., f (t)] være den første række i exp(ta). 1. f,..., f er løsninger til ligningen ( ), som tilfredstiller, for i, j n 1, at f (j) i () er 1 hvis i = j, og hvis i j. 2. {f,..., f } er en basis for løsningsmængden L for ( ). 1. En vektor-funktion G : R C n med komponenter g,g 1,..., g er en løsning til ligningen y = Ay hvis og kun hvis g (t) =g 1 (t), g 1(t) =g 2 (t),..., g n 2(t) =g (t), og så hvis og kun hvis g (t) = p g (t)... p g (t), og g 1 (t) =g (1) (t), g 2(t) =g (2) (t),., g (t) =g () (t), g (n) (t) = p g (t)... p g () ; dvs. hvis og kun hvis G s første komponent g er en løsning til ( ) og de resterende komponenter er afledede af g, g r = g (r) for r =1,..., n 1. 226

, fortsat Lad nu i n 1. Ifølge Korollar 12.2.4 er exp(ta)e i+1 løsningen til y = Ay med -værdi e i+1 ; så dens første komponent-funktion f i er en løsning til ( ) og Sættes t =fås f i (t) f (1) i (t) exp(ta)e i+1 =.. f () i (t) e i+1 = f i () f (1) i (). f () i (), så f (j) i () er 1 hvis i = j, og hvis i j, som påstået. 2. Lad g L, løsningmængden for ( ). Ifølge det ovenstående er en løsning G til x = Ax givet ved g g (1) G =.. g () Ifølge Korollar 12.2.4 er G(t) = exp(ta)g(), så har første indgang g()f (t)+g (1) ()f 1 (t)+... + g () ()f (t). Så og f,f 1,..., f udspænder L. g = g()f + g (1) ()f 1 +... + g () ()f ; Antag nu, at der findes a,a 1,..., a C så a f + a 1 f 1 + + a f =. Lad j n 1. Ved at differentiere j gange, og evaluere derefter i, fås a f (j) () + a 1f (j) 1 () + + a f (j) () =. Da f (j) i () er 1 hvis i = j, og hvis i j, giver dette a j =. Så f,f 1,..., f er lineært uafhængige. Vi har vist, at {f,f 1,..., f } er en basis for L, som ønsket. En egentlig beregning af løsninger til ( ) i konkrete eksempler kræver egenværdier. 227

Lemma 12.2.8 Lad A Mat n,n (C) være matricen 1... 1....... 1 p p 1 p 2... p Så er p A (λ) =( 1) n (λ n + p λ +... + p 1 λ + p ).. Minormatricen M(A λ ) ni har blokform [ ] Pi 1 Q n i hvor λ 1... λ... P i 1 =.... λ 1... λ er en (i 1) (i 1) øvre-trekants matrix med λ i diagonalindgangene, og 1... λ 1... Q n i =.... 1... λ 1 er en (n i) (n i) nedre-trekants matrix med 1 i diagonalindgangene. Så det(m(a λ ) ni ) = det(p i 1 ) det(q n i ) = ( λ) i 1 og, ved at udvikle langs n te række af A λ, fås som påstået. p A (λ) = det(a λ ) = ( 1) n+i ( p i 1 )( λ) i 1 +( 1) 2n ( p λ)( λ) i=1 =( 1) n (λ n + p λ +... + p 1 λ + p ), 228

Sætning 12.2.9 Lad p,p 1,..., p C; og lad µ 1,..., µ p C være de forskellige rødder for polynomiet λ n + p λ +... + p 1 λ + p, med respektive multipliciteter n 1,..., n p (så n 1 +... + n p = n). De n funktioner g mi : R C givet ved g mi (t) =t m e µit for m<n i, 1 i p, udgør da en basis for løsningsrummet L til differentialligningen y (n) + p y () +... + p 1 y + p y =. ( ) Lad A Mat n,n (C) være matricen fra Proposition 12.2.7 og Lemma 12.2.8. Ifølge Lemma 12.2.8 er µ 1,..., µ p de forskellige egenværdier for A, med respektive algebraiske multipliciteter n 1,..., n p. Ifølge Sætning 12.2.2 og Proposition 12.2.6 er indgangene i exp(ta) da lineære kombinationer af g mi (t), m < n i, 1 i p. Dette gælder specielt for indgangene i den første række, dvs. for f (t),f 1 (t),..., f (t), hvor f,f 1,..., f er basis en for L fundet i Proposition 12.2.7; så f,f 1,..., f er lineære kombinationer af g mi, m<n i, 1 i p. Lad L = Span(g mi : m < n i, 1 i p). Da L er udspændt af n elementer er dim(l ) n. Vi har set ovenfor, at f,f 1,..., f L. Men de n funktioner f,f 1,..., f er uafhængige, så dim(l )=n, og {f,f 1,..., f } er en basis for L. Men så er L = Span(f,f 1,..., f )=L. L er derfor udspændt af de n funktioner g mi, m < n i, 1 i p; da dim(l) =n må disse da være en basis for L. Notation 12.2.1 Polynomiet p givet ved p(λ) =λ n + p λ +... + p 1 λ + p kaldes det karakterisktiske polynomium af differentialligningen y (n) + p y () +... + p 1 y + p y =. 229

Eksempel 12.2.11 Vi vil finde løsningen f : R C til differentialligningen y (4) 8y (2) + 16y = med f() = f (1) () = f (2) () =, f (3) () = 32. Det karakteriske polynomium er λ 4 8λ 2 + 16 = (λ 2 4) 2 =(λ 2) 2 (λ + 2) 2 ; så rødderne er 2 og 2, begge med multiplicitet 2, og f(t) er derfor en lineær kombination af e 2t, te 2t,e 2t og te 2t ; vi skriver med a, b, c, d C. Vi differentierer tre gange: Nu sættes t =: f(t) =ae 2t + bte 2t + ce 2t + dte 2t, f (t) =a(2e 2t )+b(2te 2t + e 2t )+c( 2e 2t )+d( 2te 2t + e 2t ), f (t) =a(4e 2t )+b(4te 2t +4e 2t )+c(4e 2t )+d(4te 2t 4e 2t ), f (t) =a(8e 2t )+b(8te 2t + 12e 2t )+c( 8e 2t )+d( 8te 2t + 12e 2t ). =f() = a + c, =f () = 2a + b 2c + d, =f () = 4a +4b +4c 4d, 32 =f () = 8a + 12b 8c + 12d. Ligningssystemet løses ved rækkereduktion: 1 1 2 1 2 1 4 4 4 4 8 12 8 12 32 så a = 1, b=2,c=1,d=2, og 1 1 1 2 1 1 1 2 f(t) =e 2t ( 1+2t)+e 2t (1 + 2t)., 23