Aflevering 4: Mindste kvadraters metode Daniel Østergaard Andreasen December 2, 2011 Abstract Da meget få havde løst afleveringsopgave 4, giver jeg har en mulig (men meget udførlig) løsning af opgaven. Desuden snakker jeg lidt om hvorfor det her mindste kvadraters metode er vigtigt. 1 Opgave formulering - Introduktion Det antages, at der er en sammenhæng mellem to variable x og y af formen y c 0 + x. På baggrund af følgende data x -2 0 2 y -1 0 ønskes en bestemmelse af de bedst mulige værdier ( best least squares fit ) for koefficienterne c 0 og. Når der bedes om en sammenhæng af formen y c 0 + x, så er det bare en omskrivning af den lineære sammenhæng (y ax + b), som vi kender og har elsket siden folkeren - her er a og b c 0. 1.1 Matematisk sammenhæng Bemærk desuden, at det er meget vigtigt hvilken sammenhæng der antages at være mellem de data man har. I denne opgave antager vi en lineær sammenhæng og få desuden ikke at vide hvad y og x står for. Som et eksempel kan vi kort diskutere sammenhængen mellem en persons højde og det personen vejer. Det kan synes meget rimeligt at der i hvert fald er en sammenhæng mellem hvor høj en person er og hvor meget vedkommende vejer - spørgsmålet er nu: Hvilken form for matematisk sammenhæng? Hvis vi lader y være personens vægt og x personens højde, er sammenhængen så lineær eller kvadratisk (y c 0 + c 2 x 2 ) eller eksponentiel (y c e x ) eller er der en anden form for sammenhæng? Når man bedriver videnskab består den videnskabelige opgave i mange tilfælde netop i at finde ud af, hvilken sammenhæng, der er rimelig at forvente. Resten er matematisk databehandling. I bogen (Lineær Algebra via eksempler) viser eksempel 5.16 og 5.17 hvordan man behandler data, hvor man forventer, at sammenhængen er henholdvis eksponentiel og parabel-sammenhæng. For at vende tilbage til vægt-vs-højde-eksemplet har man, for at fastlægge det såkaldte BMI (body-mass-index), valgt at antage sammenhængen y c 2 x 2 gælder for forskellige grupper, hvor c 2 er det såkaldte BMI, som er forskellig 1
for hver gruppe. Dette bruges som I sikkert ved, til, at man som enkelt person kan udregne sit BMI (c 2 ) (ens vægt over højden i anden - dvs: y/x 2 ) og så sammenligne og finde ud af hvilken gruppe (vildt fede, fede, knap så fede, lidt kedelige eller ret så kedelige) man passer ind i. Det er dog blot en simpel matematisk model og behøver bestemt ikke være rigtig, men nogen har altså foretaget et valg og forsøge så at analysere data ud fra det valg. 1.2 Overblik over data For at få et overblik over vores data plotter vi dem ind i et koordinat system som, jeg har gjort herunder. Derefter laver man med en linial den umiddelbart bedste rette linie. Hældningskoefficienten for denne linie samt dens skæring med 2.-aksen kan nu aflæses. Den rette linie, jeg har gættet på, har en hældning på 1, dvs. 1, og den skærer 2.-asken i en halv, dvs. c 0 0.5. 4 2 1 0-2 -1 0 1 2-1 gæt paa sammenhæng: 0.5 og c1 1 data -2 Bemærk at den linie jeg har lagt ind kun er mit bedste bud ud fra mit øjemål. Dette resultat er altså kun midlertidigt og skal bare hjælpe mig til at fange, hvis jeg laver fejl i udregningerne. 2 Opstil ligningssystemet Opstil et ovrbestemt ligningssystem på formen A c y til bestemmelse af vektoren c. Alle vores målepunkter fra tabellen kan skrive ind i den generelle matematiske sammenhæng (altså: y c 0 + x). Det gør vi ved at indsætte samhørende værdier for x og y fra tabellen i den generelle ligning. Herved får vi disse fire 2
ligninger: 1 c 0 + ( 2) 0 c 0 + 0 2 c 0 + 2 c 0 + Dette kan skrives op på vektor form: y 1 1 y y 2 y 0 y 4 1 c 0 + ( 2) 1 c 0 + 0 1 c 0 + 2 1 c 0 + I den sidste vektor har jeg eksplicit skrevet at c 0 bliver ganget med 1, dette gør det forhåbentligt nemmere at se at den sidste vektor kan opfattes som et matriksprodukt på følgende måde: 1 c 0 + ( 2) 1 c 0 + 0 1 c 0 + 2 1 c 0 + 1 2 Man kan overbevise sig om omskrivningen ved at udfører matrixmultiplikationen. Vi kan nu skrive: y 1 0 1 2 ( ( ) ) 1 2 c og har hermed opstillet det efterspurgte overbestemte ligningssystem. Ved at sammenligne med den form der spørges efter kan vi se at matrice A i vores tilfælde er: A 1 2 Normalligningerne Udregn normalligningerne A T A c A T y. Da vi har fundet A kan vi finde A T, som den matrice hvor første række har de samme indgange som A s første søjle og den anden række har samme indgange som A s anden søjle. Det vil sige: 2 0 2
og Matricen A T A og vektoren A T y findes nu ved matricemultiplikation: A 2 0 2 1 2 1 1 + 1 1 + 1 1 + 1 1 1 ( 2) + 1 0 + 1 2 + 1 ( 2) 1 + 0 1 + 2 1 + 1 ( 2) ( 2) + 0 0 + 2 2 + 4 17 1 y 0 2 0 2 1 ( 1) + 1 0 + 1 + 1 ( 2) ( 1) + 0 0 + 2 + 5 17 Normalligningerne finder vi nu ved at sætte ind det udtryk der er givet i opgaven: A T A c A T y 4 5 c 17 17 ( 4 5 17 17) { 4c 0 + 5 c 0 + 17 17 De tre udtryk er forskellige måder at skrive de samme to normalligninger. At det netop er normalligningerne der bestemmer c 0 og, så den linie de repræsenterer passer bedst muligt med vores målepunkter, kan umiddelbart virke som noget tryl. Normalligningerne kommer fra vores krav om at afstanden mellem ethvert punkt og vores bedste rette linie skal være mindst muligt. Da det er mindste kvadraters metode vi bruger, er det faktisk afstanden i anden vi minimerer. For at se udledningen af normalligningerne se boks 5.9 side 98 sammen med eksempel 5.14 på side 95 i bogen. 4 c 0 og Find c 0 og 4
Vi løser ligningssystemet ved at bringe matricen på echelonform: ( 4 5 17 17) 4 5 1 14 12 1 14 12 17 17 17 17 0 5 ) 1 0 0 1 ( 4 5 c 0 4 og 5 1 0 4 5 0 1 Vi ser nu at skæringen med 2.-aksen (c 0 ) er cirka 0.576, hvilket er ret tæt på vores umiddelbare gæt (0.5) og at hældningen ( ) er cirka 0.898 hvilket også er rimelig tæt på vores gæt (1). Udregningen er derfor nok ikke helt tosset. 5