Bedste rette linje ved mindste kvadraters metode

Relaterede dokumenter
Funktioner. 3. del Karsten Juul

Når eleverne skal opdage betydningen af koefficienterne i udtrykket:

ØVEHÆFTE FOR MATEMATIK C FORMLER OG LIGNINGER

Funktioner. 1. del Karsten Juul

Aflevering 4: Mindste kvadraters metode

Andengradspolynomier - Gymnasienoter

Løsninger til eksamensopgaver på A-niveau 2017

Afstande, skæringer og vinkler i rummet

Afstande, skæringer og vinkler i rummet

Kapitel 3 Lineære sammenhænge

Værktøjskasse til analytisk Geometri

Vektorer og lineær regression

Vektorer og lineær regression. Peter Harremoës Niels Brock

Start-mat. for stx og hf Karsten Juul

Værktøjskasse til analytisk Geometri

Analytisk geometri. Et simpelt eksempel på dette er en ret linje. Som bekendt kan en ret linje skrives på formen

ØVEHÆFTE FOR MATEMATIK C FORMLER OG LIGNINGER

lineær regression er en metode man bruger for at finde den mindste afstand mellem bestemte punkter ved at bruge denne formel: a= n i=1 i=1

Der er facit på side 7 i dokumentet. Til opgaver mærket med # er der vink eller kommentarer på side 6.

Lineære sammenhænge. Udgave Karsten Juul

qwertyuiopåasdfghjklæøzxcvbnmqw ertyuiopåasdfghjklæøzxcvbnmqwert yuiopåasdfghjklæøzxcvbnmqwertyui opåasdfghjklæøzxcvbnmqwertyuiopå

Lineære sammenhænge, residualplot og regression

Differentialregning med TI-Interactive! Indledende differentialregning Tangenter Monotoniforhold og ekstremum Optimering Jan Leffers (2009)

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0

Kapitel 8. Hvad er matematik? 1 ISBN Øvelse 8.2

Løsninger til eksamensopgaver på B-niveau maj 2016: Delprøven UDEN hjælpemidler 4 4

Andengradsligninger. Frank Nasser. 11. juli 2011

Projekt 8.1 Andengradspolynomier og andengradsligningen

Emneopgave: Lineær- og kvadratisk programmering:

Andengradsligninger. Frank Nasser. 12. april 2011

qwertyuiopåasdfghjklæøzxcvbnmqw ertyuiopåasdfghjklæøzxcvbnmqwert yuiopåasdfghjklæøzxcvbnmqwertyui Polynomier opåasdfghjklæøzxcvbnmqwertyuiopå

Uafhængig og afhængig variabel

Det grafiske billede af en andengradsfunktion er altid en parabel. En parabels skæring med x-aksen kaldes nulpunkter eller rødder.

Løsninger til eksamensopgaver på A-niveau 2016

Formler & algebra - Fase 2 Omskriv & beregn med variable

Kompendium i faget. Matematik. Tømrerafdelingen. 2. Hovedforløb. Y = ax 2 + bx + c. (x,y) Svendborg Erhvervsskole Tømrerafdelingen Niels Mark Aagaard

Lektion 7 Funktioner og koordinatsystemer

Arealet af en trekant Der er mange formler for arealet af en trekant. Den mest kendte er selvfølgelig

Løsningsforslag Mat B August 2012

Differentiation af sammensatte funktioner

Louise F Jensen MATEMATIK. VUC Roskilde

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Algebra - Teori og problemløsning

Formler, ligninger, funktioner og grafer

Konstruktion af Splines

Afstandsformlen og Cirklens Ligning

Oversigt. funktioner og koordinatsystemer

matx.dk Enkle modeller

Projekt 2.1: Parabolantenner og parabelsyning

Besvarelser til Lineær Algebra og Calculus Globale Forretningssystemer Eksamen - 6. Juni 2016

Grønland. Matematik A. Højere teknisk eksamen

Matematik. 1 Matematiske symboler. Hayati Balo,AAMS. August, 2014

A U E R B A C H M I K E # e z. a z. # a. # e x. # e y. a x

Projekt 1.4 Tagrendeproblemet en instruktiv øvelse i modellering med IT.

Forelæsning 11: Kapitel 11: Regressionsanalyse

TALTEORI Ligninger og det der ligner.

Undervisningsbeskrivelse

Eksponentielle sammenhænge

Potensfunktioner samt proportional og omvent proportional. for hf Karsten Juul

Projekt 2.5 Brændpunkt og ledelinje for parabler

Graph brugermanual til matematik C

Besvarelser til Calculus og Lineær Algebra Globale Forretningssystemer Eksamen - 8. Juni 2015

2 Erik Vestergaard

Opgave 6. Opgave 7. Peter Harremoës Matematik A med hjælpemidler 26 maj a) Se Bilag 2! b) Variablen n isoleres. L = 2 z 1 α. L = 2 z 1 α L = n =

EKSAMENSOPGAVELØSNINGER CALCULUS 2 (2005) AUGUST 2006 AARHUS UNIVERSITET

MATEMATIK A-NIVEAU. Kapitel 1

Vinkelrette linjer. Frank Villa. 4. november 2014

Komplekse tal. Mikkel Stouby Petersen 27. februar 2013

sammenhänge for C-niveau i stx 2013 Karsten Juul

Besvarelser til Calculus og Lineær Algebra Globale Forretningssystemer Eksamen - 3. Juni 2014

Projekt 3.1 Fjerdegradspolynomiets symmetri

Matematik i grundforløbet

D = 0. Hvis rører parablen x- aksen i et enkelt punkt, dvs. den tilhørende andengradsligning

Funktioner - Fase 2 Anvende ikke-lineære funktioner til beskrivelse

Kvadratisk regression

Matematik A og Informationsteknologi B

Lokalt ekstremum DiploMat 01905

BEVISER TIL KAPITEL 3

Mattip om. Den rette linje

gudmandsen.net 1 Parablen 1.1 Grundlæggende forhold y = ax 2 bx c eksempelvis: y = 2x 2 2x 4 y = a x 2 b x 1 c x 0 da x 1 = x og x 0 = 1

Projekt 2.5 Brændpunkt og ledelinje

Matematik A-niveau 22. maj 2015 Delprøve 2. Løst af Anders Jørgensen og Saeid Jafari

Undervisningsbeskrivelse

Variabel- sammenhænge

Fejlkorligerende køder Fejlkorrigerende koder

Analyse af en lineær regression med lav R 2 -værdi

Computerundervisning

Besvarelse af stx_081_matb 1. Opgave 2. Opgave 1 2. Ib Michelsen, 2z Side B_081. Reducer + + = + + = Værdien af

Kapitel 2 Tal og variable

Løsningsforslag MatB December 2013

Delprøven uden hjælpemidler

Vejledende besvarelse på august 2009-sættet 2. december 2009

MATEMATIK A. Indhold. 92 videoer.

Undervisningsbeskrivelse

Funktioner. 2. del Karsten Juul

GrundlÄggende variabelsammenhänge

Lineær Programmering i GeoGebra Side 1 af 8

Svar på sommeropgave (2019)

i tredje sum overslag rationale tal tiendedele primtal kvotient

Transkript:

1/9 Bedste rette linje ved mindste kvadraters metode - fra www.borgeleo.dk Figur 1: Tre datapunkter og den bedste rette linje bestemt af A, B og C Målepunkter og bedste rette linje I ovenstående koordinatsystem er indtegnet tre målepunkter sammen med en ret linje, som skal placeres bedst muligt - sådan at målepunkterne ligger så tæt på linjen som muligt. Punkterne har koordinaterne A(x 1, y 1 ) B(x 2, y 2 ) C(x 3, y 3 ) Hvordan beregner vi så ligningen for den bedste rette linje (modelfunktionen)?

2/9 Formlen er (1) y = ax + b hvor konstanterne a og b er givet ved formlerne og (2) a = n S xy S x S y n S xx S x 2 (3) b = S y S xx S x S xy n S xx S x 2 Her har vi indført betegnelserne n = antal datapunkter (som er 3 på figur 1 men der kunne være flere) S x = x i S y = y i S xy = x i y i 2 S xx = x i 2 S yy = y i = summen af x-værdierne for alle datapunkterne = summen af y-værdierne for alle datapunkterne = summen af produkterne af x og y for hvert datapunkt = summen af kvadraterne af x-værdierne = summen af kvadraterne af y-værdierne Vær opmærksom på, at disse summer nemt kan beregnes, når datapunkterne er kendt! Når a og b er beregnet, kan den rette linje med ligningen (1) tegnes sammen med datapunkterne. Eksempel: Lad os se på hvordan vi beregner a og b i et konkret tilfælde: A(x 1, y 1 ) = (2,3) B(x 2, y 2 ) = (5,4) C(x 3, y 3 ) = (7,8) Vi beregner de 4 forskellige summer: S xx = x i 2 = 2 2 + 5 2 + 7 2 = 78 S x = x i = 2 + 5 + 7 = 14 S y = y i = 3 + 4 + 8 = 15

3/9 S xy = x i y i = 2 3 + 5 4 + 7 8 = 82 Og indsætter tallene i formlerne for a og b: a = b = 3 82 14 15 3 78 14 2 = 36 38 = 0,947368 78 15 14 82 3 78 14 2 = 22 38 = 0,578947 Altså er ligningen for den bedste rette linje: y = ax + b = 0, 947368 x + 0, 578947 Dette er ligningen for den bedste rette linje bestemt af datapunkterne A, B og C Øvelse 1: Prøv med et værktøj som Excel eller Tinspire at lave lineær regression på de tre datapunkter A, B og C fra eksemplet ovenfor for at se, om du får samme løsning for den bedste rette linjes ligning som ovenfor. Bevis for formlerne for a og b for den bedste rette linje Men hvordan begrunder vi nu formlerne (2) og (3)? Vi vil her nøjes med at se på et eksempel med 3 datapunkter for at beregningerne kan blive mere overskuelige. Det er nemt senere at vende tilbage til de generelle formler. Først en figur, hvor vi kan se afvigelserne d 1, d 2 og d 3 mellem en ret linje med ligningen y = a x + b og de 3 datapunkter A, B og C. Se figuren nedenfor (figur 2). De tre datapunkter er, som nævnt tidligere: A(x 1, y 1 ) = (2,3) B(x 2, y 2 ) = (5,4) C(x 3, y 3 ) = (7,8)

4/9 Figur 2: de tre datapunkter A, B og C og den rette linje med ligningen y = a x + b Her skal vi opstille et udtryk for summen af de kvadratiske afvigelser mellem linjens y-værdier i de x-værdier, der stammer fra målepunkterne - og så datapunkternes y-værdier: (4) S(a, b) = (d 1 ) 2 + (d 2 ) 2 + (d 3 ) 2 Afvigelserne d 1, d 2 og d 3 afhænger af linjens placering og dermed tallene a og b. For hver x-værdi for datapunkterne kan vi udregne den tilhørende y-værdi for den rette linje, fx for det første datapunkt: y linje = a x 1 + b. Datapunktets y-værdi er y 1, og dermed bliver afvigelsen d 1 = a x 1 + b y 1

5/9 Øvelse 2: Indtegn y-værdien y linje = a x 1 + b og datapunktets y-værdi y 1 på y-aksen på figur 2 ovenfor. For de to øvrige datapunkter kan vi på samme måde lave formler for afvigelserne, og herved bliver summen af de kvadratiske afvigelser: (5) S(a, b) = (a x 1 + b y 1 ) 2 + (a x 2 + b y 2 ) 2 + (a x 3 + b y 3 ) 2 summen af de kvadratiske afvigelser mellem modelfunktion y = ax+b og datapunkters y- værdier. I dette udtryk indgår alle datapunkterne, men også de to variable a og b - hvor a er hældningskoefficienten for den rette linje, og b er denne linjes skæring med y-aksen. Opgaven: Vi skal i udtrykket S(a,b) vælge de værdier af a og b, der gør summen mindst mulig, sådan at den rette linje ligger så tæt på datapunkterne som mulig (mindst mulig afvigelse). Og vise, at det netop er de to værdier fra formlerne (2) og (3). I udtrykket (5) skal vi kunne udregne en parentes med 3 led opløftet til anden potens! Og så oven i købet 3 af dem. Det gør vi i to step: Øvelse 3 Vis, at følgende ligning er rigtig fx ved at gange to ens parenteser sammen, hvor hver parentes indeholder a x + b y: (a x + b y) 2 = a 2 x 2 + b 2 + y 2 + 2a x b 2a x y 2b y Denne udregning skal vi bruge på hvert led i ligning (5). Resultatet er: S(a, b) = a 2 x 1 2 + b 2 + y 1 2 + 2a x 1 b 2a x 1 y 1 2b y 1 + a 2 x 2 2 + b 2 + y 2 2 + 2a x 2 b 2a x 2 y 2 2b y 2 Dette kan reduceres til + a 2 x 3 2 + b 2 + y 3 2 + 2a x 3 b 2a x 3 y 3 2b y 3

6/9 (5a) (a, b) = a 2 (x 1 2 + x 2 2 + x 3 2 ) + 3b 2 + (y 1 2 + y 2 2 + y 3 2 ) + 2a (x 1 + x 2 + x 3 ) b 2a (x 1 y 1 + x 2 y 2 + x 3 y 3 ) 2b (y 1 + y 2 + y 3 ) Øvelse 4 Prøv om du selv kan lave denne omformning! I udtrykket (5a) optræder der i parenteserne nogle summer, der kan beregnes ud fra datapunkterne. Vi indfører nogle kortere betegnelser for disse summer (S for sum!) og udregner dem, idet vi husker, at A(x 1, y 1 ) = (2,3), B(x 2, y 2 ) = (5,4) og C(x 3, y 3 ) = (7,8): S xx = x 2 1 + x 2 2 + x 2 3 = 2 2 + 5 2 + 7 2 = 78 S yy = y 2 1 + y 2 2 + y 2 3 = 3 2 + 4 2 + 8 2 = 89 S x = x 1 + x 2 + x 3 = 2 + 5 + 7 = 14 S xy = x 1 y 1 + x 2 y 2 + x 3 y 3 = 2 3 + 5 4 + 7 8 = 82 S y = y 1 + y 2 + y 3 = 3 + 4 + 8 = 15 n = antal datapunkter = 3 (vi lavede disse udregninger allerede på side 2!) Indfører vi disse tal i det forrige udtryk (5a) for S(a, b), får vi: (6) S(a, b) = 78 a 2 + 3 b 2 + 89 + 2 14 a b 2 82 a 2 15 b Øvelse 5 Tjek lige, at det er rigtigt! Vi ser så først på hvordan denne funktion S(a, b) afhænger af a (b betragtes her som et fast tal!) En lille omskrivning giver:

7/9 (6a) S(a) = 78 a 2 + 2 (14 b 82) a + (3 b 2 + 89 2 15 b) Øvelse 6 Kontroller, at omformningen er rigtig! Men (6a) er jo et 2. gradsudtryk i den variable a! (når b er et fast tal) Derfor kan vi beregne toppunktets a-værdi: Øvelse 7 2 (14 b 82) 82 14 b a = = 2 78 78 Vis, at dette er rigtigt du skal bruge formlen for toppunktets 1. koordinat for en parabel! Se evt. hjælpen i slutningen af dette dokument. Dette kan omskrives til ligningen (7) 78 a + 14 b = 82 Øvelse 8 Vis, at omformningen er rigtig! Men b skal jo også vælges, så udtrykket S(a, b) bliver mindst mulig! Derfor omskriver vi igen udtrykket til det følgende, hvor vi nu ser på a som en konstant: (6b) S(b) = 3 b 2 + 2 (14 a 15) b + (78 a 2 a 2 82 + 89) Øvelse 9 Vis igen, at dette er en rigtig omformning af formel (6)!

8/9 Udtrykket er jo nu et 2. grads udtryk i den variable b! (når a er et fast tal) Vi beregner så b-værdien for toppunktet: Denne ligning kan omskrives til: (8) 14 a + 3 b = 15 2 (14 a 15) 15 14 a b = = 2 3 3 Vi samler nu de to ligninger, der sikrer os den mindste værdi for summen af de kvadratiske afvigelser: (9) 78 a + 14 b = 82 14 a + 3 b = 15 Løsning med lige store koefficienters metode For at løse de to ligninger (9) med to ubekendte bruger vi lige store koefficienters metode. Først skal vi finde talværdien for den variable a: Vi ganger nu den første ligning i (9) igennem med 3 og den anden med 14: 3 78 a + 14 3 b = 3 82 14 2 a + 14 3 b = 14 15 Og vi trækker nu den nederste ligning fra den øverste (b-leddene forsvinder fordi der er lige mange b-er i de to ligninger): Så sætter vi a uden for en parentes: Og endelig deles med parentesen på begge sider: 3 78 a 14 2 a = 3 82 14 15 a (3 78 14 2 ) = 3 82 14 15 (10) a = 3 82 14 15 3 78 14 2 = 36 38 = 0,947368 For at finde b gør vi noget tilsvarende: vi ganger den første ligning i (9) igennem med 14 og den anden med 78 men det må du selv gøre for at kunne lave den næste øvelse!

9/9 Øvelse 10 Løs de to ligninger (9) for at finde den ubekendte b! Vis, at Øvelse 11 (11) b = 78 15 14 82 78 3 14 2 = 22 38 = 0,578947 Beregn summen af de kvadratiske afvigelser fra formel (5) når du har a og b som i formlerne (10) og (11). Denne værdi af summen er den mindst mulige! Du kan prøve vælge andre værdier for a og b så vil du opdage, at summen af de kvadratiske afvigelser altid er større med de samme datapunkter! Øvelse 12 For at få de generelle formler for a og b, skal du genindføre summerne S x, S y, S xy og S xx fra side 6 i dette dokument i formlerne (10) og (11). Vis, at du herved vender tilbage til de generelle formler (2) og (3) fra side 2. Øvelse 13 (sværere!) Prøv at gennemføre beviset for formlerne for a og b ved at erstatte summerne i parenteserne i formel (5a) med symbolerne S x, S y, S xy og S xx fra side 6 altså uden at sætte tal ind. Prøv så derfra at gennemføre beviset for formlerne for a og b, sådan at du viser de generelle formler (2) og (3) direkte! Øvelse 14 Bestem ligningen for den bedste rette linje, når datapunkterne er A(x 1, y 1 ) = ( 2,11), B(x 2, y 2 ) = (3,9), C(x 3, y 3 ) = (9,4) og D(x 4, y 4 ) = (17,1) Indtegn datapunkter og den bedste rette linje i samme koordinatsystem. Sådan finder man 1. koordinat for parabels toppunkt Parablen med ligningen (12) y = α x 2 + β x + γ har et toppunkt med x-koordinaten (13) x = β 2α