Lineær Regression. Anders Rønn-Nielsen Copenhagen Business School. Bo Markussen Købanhavns Universitet. 6. april, 2018

Størrelse: px
Starte visningen fra side:

Download "Lineær Regression. Anders Rønn-Nielsen Copenhagen Business School. Bo Markussen Købanhavns Universitet. 6. april, 2018"

Transkript

1 Lineær Regression Anders Rønn-Nielsen Copenhagen Business School Bo Markussen Købanhavns Universitet 6. april, 2018 Forord En måde at blive klogere på den omkringliggende verden er ved at indsamle data og bruge dette til at opnå en forståelse af eventuelle sammenhænge. En udfordring man ofte møder er, at data i mange situationer er behæftet med variation, eller støj, som vi også vil kalde det. Formålet med en statistisk analyse er at adskille underliggende sammenhænge fra denne usikkerhed. I dette manuskript vil vi vise, hvorledes dette kan gøres i situationer, der samlet set går under beregnelsen regressionsanalyse. Det grundlæggende eksempel kaldes for simpel lineær regression. Udgangspunktet for dette er: Sammenhørende par (x 1, y 1 ),..., (x n, y n ) af tal. Her er n antallet af tal par, dette kunne f.eks. være n = 10. Disse talpar kan f.eks. tegnes som punkter i et koordinatsystem. For at linear regression overhovedet giver mening er det afgørende, at en sådan tegning viser en passende lineær sammenhæng. Hvis tegningen viser talpar, der synes at variere omkring en ret linje, så kan denne linje bruges som en overordnet beskrivelse af punkterne. En sådan simpel beskrivelse kaldes for en model. Vores model er altså en ret linje l(x) = a x + b 1

2 Der er måske nogle læsere, som undrer sig over, hvorfor vi ikke lægger vægt på sandsynlighedsregning og normalfordelingen i forbindelse med lineær regression. Det kunne vi såmænd også godt havde gjort, og for en dybere matematisk analyse (som gives i statistikundervisningen på mange videregående uddannelser) er normalfordelingen heller ikke til at komme udenom. Det er dog vores håb, at en statistik analyse uden brug af sandsynlighedsregningen vil give en bedre forståelse af, hvordan den statistiske metode egentlig virker. Til sidst i dette dokument vil vi dog vise, hvordan de anvendte datasæt passer sammen med normalfordelingen. Et andet princip, som har været styrende for udformningen af dette manuskript, er, at vi bruger rigtige datasæt. Altså datasæt der er blevet indsamlet ude i virkeligheden for at beskrive og forstå virkelige fænomener. Det skal understreges, at god statistik ofte sker i samspil med viden og indsigt fra andre fagområder. Hvis der er en naturlig forklaring på og forståelse af en sammenhæng, så giver det nemlig bedre mening at lede efter den i tallene. Med de enorme mængder data der er tilrådighed i dag risikerer man ellers blot at finde de såkaldte spuriøse sammenhænge (se [3] for underholdende eksempler på dette), der ikke er udtryk for nogen underliggende mekanismer. Der er indsat øvelsesopgaver inde i teksten. Vi anbefaler, at man løser opgaverne undervejs inden man læser videre i teksten. 1 Simpel lineær regression I dette afsnit vil vi se på et meget berømt datasæt, der blev indsamlet af Francis Galton tilbage i 1880 erne til en undersøgelse af Darwins arvelighedsteori. Historisk set var det analysen af dette datasæt, som medførte det umiddelbart besynderlige navn regressionsanalyse. Datasættet er altså interessant i matematikkens historie, men det illustrerer også på bedste vis mekanikken i regressionsanalysen. Og så kan vi ovenikøbet besvare det biologiske spørgsmål om i hvilken grad, en drengs højde kan forudses ud fra højden på hans far. Datasættet indeholder sammenhørende målinger af fædres højder og deres førstefødte sønners højder som voksne. Der er målinger for i alt 952 par af fædre og sønner. De første 10 målinger (angivet i cm) ser ud som i skemaet herunder. 2

3 fars højde søns højde 1 186,9 183, ,6 172, ,0 179, ,1 165, ,4 155, ,4 160, ,7 165, ,7 168, ,5 160, ,4 157,5 For at få et overblik over alle 952 par af målinger, laver vi et plot, hvor hvert af de 952 par indtegnes som et punkt med faderens højde som x-værdi og sønnens højde som y-værdi. Dette plot kan ses på figur 1. søns højde i cm fars højde i cm Figur 1: De 952 sammenhørende par af målinger for fædre og sønner. Opgave 1. Indlæs datasættet i (Navn på program... ) og tegn et tilsvarende plot. Hvad er den mindste og største værdi af fædrenes højder? Hvad er den mindste og største værdi af sønnernes højder? Når man kigger på plottet, kunne det ved første øjekast godt se ud som om, punkterne ligger i en stor og tilfældig sky uden nogen nævneværdig sammenhæng mellem fædres og sønners højder. Ved nærmere eftersyn kan man 3

4 imidlertid konstatere, at både øverste venstre hjørne og nederste højre hjørne er stort set tomme for punkter. De fleste af punkterne ligger tilsyneladende i et retlinjet bælte fra plottets nederste venstre hjørne til det øverste højre hjørne. Dette er et tegn på, hvad vi vil kalde en voksende sammenhæng (betegnes også som en positiv sammenhæng) mellem fædres og sønners højder. Blandt de høje fædre er der en tendens til, at sønnerne er højere end gennemsnittet, mens der modsat er en tendens til, at sønner af relativt lave fædre selv er relativt lave. Det er denne voksende sammenhæng, vi vil se nærmere på. Det første, vi vil gøre, er at forsøge at indtegne en ret linje på plottet, der passer så godt som muligt med punkterne. Opgave 2. Prøv at indtegne forskellige linjer i plottet fra før. Overvej, hvad der skal til, for at en linje passer godt med punkterne. søns højde i cm søns højde i cm fars højde i cm fars højde i cm Figur 2: To valg af linjer til at beskrive punkternes voksende tendens. To mere eller mindre vellykkede forsøg på at indtegne en god ret linje kan ses på figur 2. Umiddelbart kan man påstå, at linjen til venstre måske er lidt for stejl, mens hældningen på linjen til højre er for lille. Spørgsmålet er, hvilken af de to linjer, der passer bedst, og om vi mon kan finde en, der passer endnu bedre? Her får vi brug for en metode til at måle, hvor godt en given linje passer med punkterne. For at gøre det lidt lettere at overskue, vil vi til at starte med nøjes med at finde den linje, der passer bedst med de 10 første punkter på listen. Opgave 3. Lav et plot, der kun viser de 10 første punkter. 4

5 søns højde i cm fars højde i cm Figur 3: De ti første punkter sammen med et (godt) bud på en linje (rød). De blå linjestykker markerer de lodrette afstande mellem punkterne og linjen. Det skal bemærkes, at 2 af de 10 fædre tilfældigvis har den samme højde (179,7 cm). Derfor er to af punkterne indtegnet lodret over hinanden. På figur 3 er de 10 punkter indtegnet sammen med et forslag til en linje, der passer relativt godt med punkterne. Linjen har hældning a = 2,1 og skæring b = 213. Derudover er de lodrette afstande fra hvert datapunkt indtil linjen markeret med blå linjestykker. Vi vil bruge disse 10 lodrette afstande til at vurdere, hvor præcist den røde linje passer med datapunkterne. De 10 lodrette afstande udreges som fars højde søns højde lodret afstand 1 186,9 183,4 3, ,6 172,0 2, ,0 179,0 3, ,1 165,4 3, ,4 155,4 8, ,4 160,3 1, ,7 165,0 0, ,7 168,7 4, ,5 160,3 2, ,4 157,5 6,4 5

6 Opgave 4. Den første lodrette afstand er udreget ved hjælp af formlen 183,4 ( 2,1 186,9 213 ) = 3,9 Overvej, hvorfor formlen ser ud, som den gør. Kontroller, at vi har regnet rigtigt ved selv at udregne alle de 10 lodrette afstande. Som mål for, hvor godt et givent valg af den røde linje passer med punkterne, vil vi bruge udtrykket lodrette afstande (størrelsen af lodret afstand) 2 (1) Det store græske bogstav kaldes for sigma, og er matematisk notation for at lægge sammen. Med de 10 første par af fædres og sønners højder og valget af den rød linje med hældningen 2,1 og skæring 213, som på figur 3, bliver udtrykket altså 3,9 2 + ( 2,7) 2 + 3,4 2 + ( 3,9) 2 + ( 8,2) 2 + ( 1,3) 2 + 0, , , ,4 2 = 187,19 Vi vedtager nu, at den røde linje som passer bedst muligt med datapunkterne er den linje, som gør at dette udtryk bliver mindst muligt. Intuitivt giver dette mål ret god mening: Hvis den røde linje passer godt med punkterne, bliver alle de lodrette afstande små, og summen bliver lille. Omvendt bliver summen stor, hvis den røde linje passer dårligt med datapunkterne. I afsnit 1.1 vil vi argumentere for hvorfor det giver mening at minimere de lodrette afstande, og i afsnit 4 vil vi argumentere for, hvorfor dette gøres via summen af de lodrette afstande sat i anden. Men indtil videre vil vi blot adoptere denne tilgang, som kaldes for mindste kvadraters metode. Opgave 5. Udregn selv summen af de kvadrerede lodrette afstande. Prøv at ændre på hældning og skæring og udregn talværdien igen. Prøv at finde værdier af hældning og skæring, der gør summen af de kvadrerede afstande så lille som muligt. Man kan selvfølgelig komme ret langt ved bare at prøve sig frem. Imidlertid kan det også godt lade sig gøre at lave et matematisk beregning af, hvilken linje der passer bedst med en given samling af punkter. For at kunne gøre dette, vil vi introducere lidt notation. Vi vil formulere det generelt, således at vi kommer frem til et resultat, der også kan bruges, selvom der ikke er tale om 952 sammenhørende værdier af fædres og sønners højdemålinger. Antag, at vi har n sammenhørende datapunkter, (x i, y i ) for i = 1,..., n. Det kunne altså f.eks. være de n = 952 målinger af fædres og sønners højde. 6

7 Så ville x i være den i te fars højde, mens y i ville være målingen hørende til den i te søn. For eksempel var det første punkt i datasættet (186,9, 183,4). Med den nye notation er så x 1 = 186,9 og y 1 = 183,4. En linje, der har hældning a og skæring b, har forskriften l(x) = a x + b Den lodrette afstand mellem det i te punkt (x i, y i ) og linjen bliver (lige som før, men nu med den abstrakte notation a og b for hældning og skæring) y i (a x i + b), og derfor kan vi skrive summen af de kvadrerede lodrette afstande, altså formlen (1), på følgende måde n ( yi a x i b ) 2. (2) i=1 Vi er interesserede i at finde det valg af hældningen a og skæringen b, som gør summen af de kvadrerede lodrette afstande mellem datapunkter og den rette linje l(x) mindst mulig. For at bestemme den bedste hældning og skæring skal vi bruge gennemsnittet af x værdierne og y værdierne. Disse kaldes for x og ȳ, og beregnes via formlerne x = x x n n ȳ = y y n n = 1 n = 1 n n x i, i=1 n y i. Opgave 6. Eftervis i datasættet bestående af de 10 første punktpar, at x = 180,6 og ȳ = 166,7. Nu kan vi komme med et matematisk udtryk for, hvordan den optimale hældning og den optimale skæring skal se ud. Vi dekorerer disse valg af a og b med tegnet ˆ for at angive, at dette er de optimale valg. Der gælder n i=1 â = (y i ȳ) (x i x) n i=1 (x, i x) 2 (3) ˆb = ȳ â x. Det betyder, at udtrykket (2) bliver mindst muligt, netop når a = â og b = ˆb. Vi vil undlade at komme med et matematisk bevis for dette men blot bemærke, at beviset kan gennemføres ved at bruge formlen for toppunktet for en parabel. 7 i=1

8 Hvis vi skulle udregne tælleren i udtrykket for â for de første 10 punktpar, skulle vi regne (183,4 166,7) (186,9 180,6) + (172,0 166,7) (184,6 180,6) + + (157,5 166,7) (173,4 180,6) og nævneren i udtrykket for â for de 10 punktpar er (186,9 180,6) 2 + (184,6 180,6) (173,4 180,6) 2 Opgave 7. Udregn den optimale hældning â for de 10 første punktpar i datasættet. Udregn derefter den optimale hældning ˆb bemærk, at den udregnede værdi af â skal bruges i udtrykket for ˆb. Indtegn denne optimale linje i plottet sammen med punkterne. søns højde i cm fars højde i cm Figur 4: Alle datapunkter indtegnet sammen med det bedste valg af ret linje. Når â og ˆb udregnes på baggrund af alle 952 datapunkter med højdemålinger for fædre og sønner, fås â = 0,612 og ˆb = 67,2. Altså linjen l(x) = 0,612 x + 67,2 Linjen er indtegnet i et plot sammen med punkterne på figur 4. Vores umiddelbare forventning om, at der ville være en voksende sammenhæng mellem fædres og sønners højder er altså blevet bekræftet: Hældningen er positiv! 8

9 Spørgsmålet er nu, hvad vi kan bruge linjen til? Det er jo ikke sådan, at punkterne ligger perfekt på linjen. Derimod ligger de i en tilsyneladende tilfældig sky omkring linjen. En måde at tænke på linjen på er følgende: Vi forestiller os et nyt far søn par, som ikke er med i undersøgelsen, hvor vi kender højden af faderen, mens sønnens højde er ukendt. Måske er sønnen et barn og dermed ikke udvokset endnu. Vi vil gerne prøve at forudsige sønnens højde. Lad os antage, at faderens højde er 183 cm. Så er vores bedste bud på sønnens højde baseret på datasættet at udregne linjens værdi, når x værdien er 183. Altså et bud på sønnens højde givet ved l(183) = 0, ,2 = 179,2 Vores gæt er altså, at en far, der er 183 cm høj, har en søn på 179,2 cm. Opgave 8. Antag, at en fars højde er 168 cm. Giv et bud på, hvor høj hans søn bliver. Prøv det samme, hvor faderens højde er 188 cm. Opgave 9. Antag for et øjeblik, at linjen, der passede bedst med punkterne, havde hælding 1 og skæring 0. Altså at den så ud på følgende måde: l(x) = 1 x + 0 = x Hvordan ville buddene på sønnernes højder være for de to far højder 168 cm og 188 cm? Hvis den bedste hældning var præcis 1, og den bedste skæring var 0, så ville buddet på sønners højde altså være nøjagtig deres fars højde. Men sådan er det tilsyneladende ikke. I stedet er det sådan, at sønner af meget høje (højere end gennemsnittet) fædre ganske vist forventes at blive høje, men ikke helt så høje som deres fædre. Samtidigt forventes sønner af fædre, der er lavere end gennemnsnittet, at blive relativt lave, men ikke helt så lave som deres fædre. Dette fænomen, som matematisk giver sig til udtryk ved at â her ligger mellem 0 og 1, kaldes i den statistiske verden for regression towards the mean. Vi vil se nærmere på dette i afsnit 1.1. Nu har vi set, hvordan den bedste rette linje kan bruges til at gætte på højden af sønnen i et nyt far søn par. Vi har imidlertid ikke sagt noget om, hvor godt gættet er. Ovenfor gættede vi på, at en far med højden 183 cm ville få en søn, der var 179,2 cm høj. Det betyder ikke, at vi tror, at sønnen så faktisk får præcis højden 179,2 cm. Der er jo heller ingen af de andre punkter, der ligger nøjagtigtigt på linjen. Men vores bedste bud er 179,2 cm, og så kan vi få en ide om usikkerheden ved at kigge på, hvor langt alle de 9

10 andre punkter ligger fra linjen. I det følgende vil vi give et matematisk mål for denne usikkerhed. Den gennemsnitlige kvadratiske afvigelse fra den bedste rette linje betegnes ofte med symbolet ˆσ 2, og den har formel udtrykket ˆσ 2 = 1 n 2 n ( yi â x i ˆb ) 2 i=1 Bemærk, at der i denne formel divideres med n 2 og ikke med n, som man ellers umiddelbart ville gøres ved beregningen af gennemsnittet for de n kvadrerede lodrette afstande. Der er en matematisk forklaring på dette, som det dog vil føre for vidt at gå i dybden med her. Tager man kvadratroden, så fås ˆσ = 1 n ( yi â x i n 2 ˆb ) 2 (4) i=1 Størrelsen ˆσ kaldes residualspredningen og er altså et mål for, hvor langt punkterne i gennemsnit ligger fra den bedste rette linje. Opgave 10. Herunder ses et lille datasæt med 10 punktpar x y 2,2 5,3 8,3 11,9 14,4 21,0 21,7 24,2 29,1 30,9 Indtegn de 10 punkter i et plot sammen med den bedste rette linje gennem punkterne. Beregn residualspredningen. Gør det samme for dette datasæt x y 5,5 9,5 9,0 16,1 12,3 13,1 21,8 20,9 26,9 31,4 Diskuter, hvad størrelsen på ˆσ betyder for punkternes afstand til den bedste rette linje (er punkterne generelt længere fra linjen, når ˆσ er stor eller lille?). Opgave 11. Beregn ˆσ ud fra de 10 første punktpar i far søn datasættet. Diskuter hvad denne størrelse siger om usikkerheden på gættet for sønnens højde? Hvis ˆσ er forholdsvis stor, er vi så mere eller mindre sikre på vores forudsigelse af sønnens højde? En rimelig konklusion på opgaverne ovenfor er, at ˆσ siger noget om, hvor langt punkterne overordnet set ligger fra den bedste rette linje. Hvis punkterne generelt ligger langt fra linjen, er ˆσ mindre, end den havde været, hvis punkterne lå tættere på linjen. 10

11 På den måde er ˆσ et mål for usikkerheden i, hvor langt fra linjen punkterne ligger. En nyttig tommelfingerregel er, at punkterne i det store og hele opfylder, at den lodrette afstand ind til linjen højst er 2 ˆσ. Hvad der menes med i det store og hele vil blive præciseret senere. Hvis vi regner ˆσ for hele far søn datasættet fås, at ˆσ = 6, 0 (efter afrunding). Tommelfingerreglen siger så, at for de fleste af punkterne er den lodrette afstand mellem punktet og den bedste rette linje højst 2 6 = 12. Vi efterprøver dette på det første punkt i datasættet, hvor x 1 = 186,9 og y 1 = 183,4. Den lodrette forskel mellem punktet og den bedste rette linje, der jo havde forskriften l(x) = 0,612 x + 67,2, bliver nu 183,4 l(186,9) = 183,4 (0, ,9 + 67,2) = 1,8 Forskellen er tydeligvis mindre end 12, så tommelfingerreglen havde heldigvis ret i dette tilfælde! Vi kan gentage øvelsen for det andet punkt, hvor x 2 = 184,6 og y 2 = 172,0. Her fås 172,0 l(184,6) = 172,0 (0, ,6 + 67,2) = 8,2 Også her er den lodrette forskel (numerisk) mindre end 12. Det er dog ikke alle punkter, der opfylder tommelfingerreglen om at afstanden fra punkt til linje højst er 12. Hvis vi kigger på figur 4, kan vi se et punkt, hvor faderens højde er lige under 180 cm og sønnens højde kun er lidt over 155 cm: Her ser det oplagt ud som om, at den lodrette forskel er noget større end 12. Ved at kigge datasættet igennem kan finde det rigtige punkt allerede i den femte linje: x 5 = 179,4 og y 2 = 155,4. Her fås så, at den lodrette forskel er 155,4 l(179,4) = 155,4 (0, ,4 + 67,2) = 21,6 hvilket er en meget større afstand end 12 (der er jo næsten dobbelt så meget). Det er altså ikke alle punkterne, der opfylder tommelfingereglen, men det blev jo også kun præsenteret, som en egenskab, der holdt i det store og hele! Tommelfingerreglen kan imidlertid præciseres: Generelt vil ca. 95% af punkterne højst ligge i afstanden 2 ˆσ fra den bedste rette linje. I vores tilfælde, hvor der er 952 punkter, vil vi så forvente, at cirka 0, af punkterne højst har afstanden 12 til linjen givet ved l(x) = 0,612 x+67,2. Omvendt vil vi forvente, at cirka 0, af punkterne har en afstand til linjen, der er større end 12. Opgave 12. Undersøg hvor mange af punkterne, der opfylder, at den lodrette afstand mellem punktet og linjen l(x) = 0,612 x + 67,2 højst er 12. Undersøg også hvor mange af punkterne, der opfylder, at den lodrette afstand højst er 6. 11

12 Tommelfingerreglen kan også bruges som hjælp til at vurdere usikkerheden, når den bedste rette linje benyttes til at forudsige højden af sønnen i et nyt far søn par, hvor faderens højde er kendt. Husk på, at vi gættede på, at en far på 183 cm ville få en søn på 179,2 cm. Nu kan vi sige, at den rigtige søn højde med stor rimelighed kommer til at være højst 12 cm fra vores gæt. Vi er altså temmelig sikre på, at den rigtige søn højde vil ligge et eller andet sted mellem 179,2 12 = 167,2 cm og 179, = 191,2 cm. Samlet siger vi, at vores bedste bud er 179,2 cm, og så udstyrer vi vores bud med prædiktionsintervallet [167,2; 191,2], hvor vi i hvert fald er temmelig sikre på, at den rigtige søn højde kommer til at ligge. Opgave 13. I opgave 8 blev der givet et bud på sønnens højde, hvis faderen er hhv. 168 cm høj og 188 cm høj. Find prædiktionsintervallerne hørende til hvert af disse to bud. 1.1 Matematikken i biologien Udfra et biologisk synspunkt er det forventeligt, at en søns højde er positivt korreleret med faderens højde. Sønnen og faderen deler nemlig nøjagtig halvdelen af deres gener. Den anden halvdelen af generne har sønnen arvet fra sin mor, mens faderens øvrige gener alene deles med farmor og farfar (cirka en fjerdedel for hver). Derudover kan en sammenhæng mellem fædre og sønners højde skyldes kulturelle og sociologiske forhold. Hvis mænd og kvinder foretrækker en partner af sammenlignelig højde som den selv, så vil moderens gener ligne faderes gener mht. højde, hvormed det genetiske aspekt vil blive yderligere forstærket. Videre kunne der f.eks. være sammenhæng mellem faderens og sønnens opvækstvilkår, men idet der er gået mange år fra at faderen voksede op til at sønner vokser op, så er dette formodentlig af mindre betydning. Alt dette er ikke bare snak, men det har en konsekvens for hvordan vi kvantificerer sammenhængen mellem sønnens og faderens højde. Hvis vi ønsker at forudsige hvor høje sønner en mand har alene udfra hans højde, så giver diskussionen ovenfor, at vi indirekte leder efter effekten af den genetiske fællesmængde mellem faderen og sønnen. Men hvis faderen f.eks. er usædvanlig høj, så kunne dette også skyldes nogle af de gener som faderen har til fælles med farmor eller farfar, men som ikke er gået i arv til sønnen. Hvis vi ønsker at beskrive sammenhængen mellem sønnens og faderens højde med en ret linje og bruge denne til at forudsige sønnernes højde udfra deres faders højde, så har det således følgende matematiske konsekvenser: 1. Faderen har den højde han nu en gang har, og det er kun en del af faderes afvigelse fra gennemsnits højden af fædre der kan forventes 12

13 overført til sønnen. Resten af afvigelsen skal føres tilbage (på engelsk: to regress ) mod gennemsnittet. 2. Den bedste rette linje er den, som på passende vis minimerer den lodrette afstand til datapunkterne, altså afvigelsen mellem den faktiske højde af sønnerne og forudsigelsen udfra deres fars højde. Begrebet regression towards the mean er altså et matematisk fænomen der optræder, når en egenskab (genetisk, sociologisk, økonomisk, eller andet) delvist deles af og har indflydelse på to forskellige enheder (far og søn), og man forsøger at prædiktere den ene udfra den anden. Opgave 14. Vi forestiller os et nyt far-søn par, som ikke er med i undersøgelsen, hvor vi kender sønnens højde, mens faderens højde er ukendt. Diskutér om man kan bruge den samme bedste rette linje som før til at forudsige faderens højde. Dette er et svært spørgsmål, men man eventuelt tage udgangspunkt i begrebet regression towards the mean vil man f.eks. forvente at en far er lige så høj som sin søn, hvis sønnen er meget høj? 2 Statistisk model I de forrige afsnit kom vi frem til, at der godt kan siges at være en lineær sammenhæng mellem fædres og sønners højder. Det skal ikke forstås sådan, at hvis man kender faderens højde, så ved man også præcist, hvor høj sønnen er. Derimod vil det være i orden at sige, at hvis man kender faderens højde, så kan den rette linje bruges til at sige, i hvilket område af y værdier, vi kan forvente at finde sønnens højde. Nu vil vi vende hele tankegangen omkring datapunkterne på hovedet. I stedet for bare at kigge på de observerede datapunkter, vil vi prøve at lave en slags matematisk beskrivelse af, hvordan sønnernes højder er fremkommet som resultat af fædrenes højder. Bemærk, at der tales om en matematisk beskrivelse. Vi er altså ikke ude efter at give en detaljeret biologisk forklaring på, hvorfor den enkelte søns højde er blevet det eksakte tal, der er observeret. Vi tænker os, at sønnernes værdier, altså tallene y 1,..., y 952, er frembragt ud fra fædrenes værdier, x 1,..., x 952 efter følgende opskrift y i = a x i + b + r i (5) for alle i = 1,..., 952. Her er a og b henholdsvis hældning og skæring for en ret linje l(x) = a x + b, og r 1,..., r 952 er afvigelserne fra linjen. I statistik jargon kaldes størrelserne r i for residualerne, og de bestemmes altså som den fejl der bliver begået, hvis man forsøger at udregne y værdierne ud fra 13

14 x værdierne ved brug af den rette linje l(x) = a x+b. Umiddelbart virker det måske som ren snyd at opskrive sammenhængen mellem x i erne og y i erne på denne måde. Vi har jo bare introduceret en række tal r 1,..., r 952, der får ligningen til at passe for alle punkterne! Imidlertid er det en rigtig nyttig skrivemåde, da vi så får en notation for forskellen mellem datapunkterne og linjen. Vi forestiller os, at de enkelte fejlled r i er tilfældige. De kan være både positive og negative, og hvis et af r i erne er positivt, har det ingen indflydelse på, om de andre er positive eller negative. Denne antagelse om fejlene er ensbetydende med at sige, at alle punkterne er placeret tilfældigt omkring linjen. Nogle ligger over, mens andre ligger under. Nogle ligger langt fra linjen, og andre ligger tættere på, og det hele skal være tilfældigt i den forstand, at der ikke er noget system i, hvordan punkterne varierer omkring linjen. Videre tænker vi os, at linjen l(x) = a x + b er ukendt for os. Den repræsenterer den underliggende biologiske sammenhæng mellem fædres og sønners højde. Vi kender ikke denne sammenhæng præcist, men er selvfølgelig interesserede i at sige noget om den. Hele den ovenstående beskrivelse af, hvordan y i værdien er blevet lavet ud fra x i værdierne og passende tilfældigheder, er det, der i statistiksprog kaldes en statistisk model. Vi har allerede udviklet en metode til at give vores bedste bud på den ukendte underliggende rette linje l(x) = a x + b. Nemlig ved at udregne hældningen vha. formlen for â og skæringen vha. formlen for ˆb. I statistiksprog kaldes a og b for modellens parametre, og â og ˆb for estimater for parametrene. Vi kan ikke være sikre på, at estimaterne giver os præcis de rigtige, men ukendte, parametre a og b, som blev brugt, da naturen frembragte sønnernes højder ud fra fædrenes via den rette linje og de tilfældige afvigelser. Men estimaterne â og ˆb er altså vores bedste bud på hældningen og skæringen. 3 Eksponentiel regression og potensregression Indtil videre har vi undersøgt statistiske metoder for situationen, hvor sammenhængen i datapunkterne (x 1, y 1 ),..., (x n, y n ) kan beskrives som tilfældig variation omkring en ret linje. Vi vil nu undersøge muligheden for at udvide disse metoder til situationen, hvor sammenhængen enten kan beskrives ved en ekponentialfunktion eller en potensfunktion. Antag, at alle y værdierne er større end 0, således at vi kan tage logaritmen (i den følgende bruger vi den naturlige logaritme ln, men faktisk er det ligegyldigt hvilken logaritme, man vælger at bruge). Hvis vi bruger den sta- 14

15 tistiske model i ligning (5) mellem x værdierne og logaritmen af y værdierne, så får vi følgende sammenhæng mellem x værdierne og y værdierne ln(y i ) = a x i + b + r i Hvis vi derefter tager tager eksponentialfunktionen på begge sider af lighedstegnet og introducerer parameteren c = exp(b) og fejlene f 1 = exp(r 1 ),..., f n = exp(r n ), så får vi y i = exp(a x i + b + r i ) = exp(a x i ) exp(b) exp(r i ) = c exp(a x i ) f i Dette er nu en statistisk model for en eksponentiel sammenhæng mellem y værdierne og x værdierne, hvor fejlene f i skal ganges på i stedet for at lægges til. Selv om det ser kompliceret ud, så ved vi allerede hvordan vi kan regne i denne model. Nemlig ved at lave simpel lineær regression af ln(y i ) erne på x i erne. Før vi afprøver dette på et datasæt illustrerer følgende opgave, hvorledes samme tilgang kan bruges til at lave en statistisk model for en potens sammenhæng meller y værdierne og x værdierne. Opgave 15. Antag, at alle x værdierne og alle y værdierne er større end 0. Antag videre, at sammenhængen mellem ln(y i ) erne og ln(x i ) erne kan beskrives via en simpel lineær regression ln(y i ) = a ln(x i ) + b + r i Hermed mener vi, at ln(y i ) erne varierer omkring en ret linje mht. ln(x i ) erne. Diskutér, hvorledes dette fører til en potenssammenhæng mellem y værdierne og x værdierne. 3.1 Eksempel på en eksponentiel regression Figur 5 viser sammenhængen mellem pris og alder for 124 brugte biler af mærket Mazda solgt i Melbourne, Australien, i året Som det tydeligt fremgår at plottet, så vil en ret linje ikke kunne beskrive sammenhængen mellem y i og x i, hvor x i = alder for den i te bil målt i år y i = pris for den i te bil målt i australske dollars 15

16 alder i år pris i australske dollars Figur 5: 124 sammenhørende par af pris og alder for brugte Mazda er solgt i Melbourne i alder i år ln(pris i australske dollars) Figur 6: 124 sammenhørende par af ln(pris) og alder for brugte Mazda er solgt i Melbourne i Men hvis vi laver et plot af logaritmen af prisen mod alderen, så synes 16

17 der at være en pæn lineær sammenhæng. Se figur 6. Resultat af en simpel lineær regression er, at den bedste rette linje til beskrivelse af ln(pris) udfra alder er l(alder) = 0,1647 alder + 10,188 Opgave 16. Prøv selv at lave et plot som det på figur 6. Prøv også selv at udregne den bedste rette gennem punkterne og indtegn denne linje sammen med punkterne i plottet. I modsætning til eksemplet med Galtons højdemålinger, så har parametrene â = 0,1647 og ˆb = 10,188 nogle interessante fortolkninger i sig selv. De følgende to opgaver omhandler fortolkningen af henholdsvis skæringen og hældningen. Opgave 17. Argumentér for, at den forventede pris på en helt ny brugt bil (altså en brugt bil med alder 0 år) er exp(b). Argumentér for, at vores estimat for prisen på en helt ny brugt bil af mærket Mazda i året 1991 er australske dollars. Opgave 18. Vi har set, at der er en aftagende eksponentiel sammenhæng mellem prisen på en brugt Mazda og dens alder. I fysikkens verden kender man aftagende eksponentielle sammenhæng fra f.eks. radioaktivt henfald. En standard beskrivelse af radioaktivt henfald er ved den såkaldte halvveringstid, altså hvor lang tid der går før radioaktiviteten er halvveret. I situationen med prisen på brugte Mazda er kan vi helt tilsvarende beregne halveringstiden, altså hvor lang tid der går før prisen er halvveret. Argumentér for, at halvveringstiden for prisen er givet udfra formlen ln( 1 2 ) a = ln(2) a og at vores bedste bud på denne størrelse er ln(2) â = ln(2) 0,1647 = 4,21 Det betyder, at vores forståelse af prisudviklinen er, at prisen på brugt Mazda halvveres hver gang bilen er 4 år og 2,5 måneder ældre. 4 Normalfordelingen I afsnit 1 kiggede vi på sammenhængen mellem fædres og sønners højder, og vi så, at der var en voksende tendens, som kunne beskrives ved en ret 17

18 linje. Vi regnede os frem til den linje, der passede bedst med punkterne ved at vælge den linje, som gjorde summen af de kvadrerede residualer mindst mulig. Husk på, at residual bare er et andet navn for den lodrette afstand mellem punktet og den rette linje. Resultatet blev linjen l(x) = 0,612 x + 67,2 Vi udregnede endvidere residualspredningen ˆσ, som kan forstås som et mål for hvor store residualerne er (regnet numerisk). Så en stor resiudalspredning betyder, at residualerne generelt set er numerisk størrere (enten positive eller negative), altså at punkterne generelt set ligger længere væk fra den rette linje. Vi vil se lidt nærmere på, hvordan residualerne samlet set opfører sig. Vi vil studere det, der kaldes residualernes fordeling antal residualer r i Figur 7: Histogram over alle residualerne, der fremkommer ved at regne de lodrette afstande mellem de 952 punkter for far søn målingerne og den bedste rette linje gennem punkterne. På figur 7 er der tegnet et histogram over alle residualværdierne. Opgave 19. Prøv selv at tegne et histogram over residualernes værdier. Bemærk, at det ikke nødvendigvis kommer til at ligne histogrammet på figur 7 fuldstændigt. Det kommer an på hvor brede søjlerne i histrogrammet er lavet. På figur 7 er histrogrammet konstrueret, så alle søjler har bredde 1. 18

19 Histogrammet har pånær nogle enkelte svipsere overordnet set en klokkeagtig form, der er symmetrisk omkring 0. De fleste residualværdier er altså relativt tæt på 0, der er ca. lige mange på den negative side som på den positive side, og dem på den negative side er fordelt nogenlunde som dem på den positive bare spejlvendt. Vi kan også bemærke, at langt de fleste residualer ligger mellem 12 og 12. Opgave 20. Tænk over, hvordan det passer med den tommelfingerregel, der blev omtalt i afsnit 1: De fleste lodrette afstande må forventes at være numerisk mindre end 2 gange residualspredningen. Nu laver vi et forsøg, der måske kan virker en lille smule arbitrært: Vi indtegner grafen for følgende funktion i histogrammet ϕ(x) = 63 e x2 2 ˆσ 2 Her er ˆσ residualspredningen, som blev udregnet til at være 6,0. Konstanten 63 foran eksponetialfunktionen er udregnet ved π ˆσ, men det vil vi ikke interessere os nærmere for i dette notat. Det væsentlige er, at funktionen er givet som en passende konstant gange eksponentialfunktionen. På figur antal residualer r i Figur 8: Histogram over alle residualerne sammen med grafen for funktionen ϕ(x). Grafen for ϕ(x) er indtegnet med rødt. er grafen for funktionen ϕ(x) indtegnet sammen med histogrammet. Det 19

20 interessante er, at histogrammet og funktionen ϕ(x) faktisk følger hinanden ret godt. Det tyder på, at residualerne tilnærmelsesvist er fordelt som det, der kaldes normalfordelingen. Mere generelt siges en samling af talværdier at følge normalfordelingen, hvis et histogram over dem nogenlunde følger en funktion ϕ(x) på formen ϕ(x) = K e x2 2 C, hvor K og C er passende konstanter. Det fungerede i vores histogram, hvis K blev sat til 63, og C blev valgt som ˆσ 2 = 6 2 = 36. At residualerne kan siges tilnærmelsesvist at være normalfordelte sker overraskende tit, og for meget forskelligartede datasæt. Dette er til stor glæde både for statistikeren, der så kan beskrive mange forskellige slags datasæt med den samme type af modeller, og for matematikeren, der kan give dybtliggende sandsynlighedsteoretiske argumenter for, hvorfor det er tilfældet residualer r i normalfordelingsfraktiler Figur 9: Normalfordelingsfraktildiagram for residualerne for far søm datasættet. Der findes en anden - og også lettere måde at efterse, om residualerne er normalfordelte, end ved at tegne histogrammet sammen med en passende valgt eksponentialfunktion. Det gøres ved at tegne et normalfordelingsfraktildiagram. Hvis punkterne på sådan en tegning stort set ligger på en ret linje, så indikerer dette, at resiudalerne godt kan antages at være 20

21 normalfordelte. Et normalfordelingsfraktildiagram kan let tegnes i (navn på program) ved hjælp af funktionen (navn på funktionalitet). På figur 9 er der tegnet et normalfordelingsfraktildiagram for residualerne for far søn datasættet. Punkterne i diagrammet ligger med enkelte undtagelser pænt på en ret linje, hvormed vi endnu engang kan konstatere, at residualerne er normalfordelte. Opgave 21. Prøv at tegne et normalfordelingsfraktildiagram for residualerne fra opgave 16. Overvej, om residualerne kan antages at være normalfordelte. Litteratur [1] Francis Galton (1886), Regression towards Mediocrity in Hereditary Stature, Journal of the Anthropological Institute, side [2] A. Lee (1994), Data Analysis: An introduction based on R, Department of Statistics, University of Auckland. Datasæt kan downloades fra http: // [3] Tyler Vigen, Spurious Correlations, Hjemmeside tylervigen.com/spurious-correlations. 21

Lineær Regression A-niveau

Lineær Regression A-niveau Lineær Regression A-niveau Bo Markussen Københavns Universitet Anders Rønn-Nielsen Copenhagen Business School 14. september, 2018 Forord En måde at blive klogere på den omkringliggende verden er ved at

Læs mere

Residualer i grundforløbet

Residualer i grundforløbet Erik Vestergaard www.matematikfysik.dk 1 Residualer i grundforløbet I dette lille tillæg til grundforløbet, skal vi kigge på begreberne residualer, residualplot samt residualspredning. Vi vil se, hvad

Læs mere

Kvadratisk regression

Kvadratisk regression Kvadratisk regression Helle Sørensen Institut for Matematiske Fag Københavns Universitet Juli 2011 I kapitlet om lineær regression blev det vist hvordan man kan modellere en lineær sammenhæng mellem to

Læs mere

Lineære sammenhænge, residualplot og regression

Lineære sammenhænge, residualplot og regression Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge

Læs mere

Analyse af en lineær regression med lav R 2 -værdi

Analyse af en lineær regression med lav R 2 -værdi Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet

Læs mere

Potensfunktioner samt proportional og omvent proportional. for hf Karsten Juul

Potensfunktioner samt proportional og omvent proportional. for hf Karsten Juul Potensfunktioner samt proportional og omvent proportional for hf 2018 Karsten Juul Potensfunktion 1. Oplæg til forskrift for potensfunktion...1 2. Forskrift for potensfunktion...2 3. Udregn x eller y i

Læs mere

Vektorer og lineær regression. Peter Harremoës Niels Brock

Vektorer og lineær regression. Peter Harremoës Niels Brock Vektorer og lineær regression Peter Harremoës Niels Brock April 2013 1 Planproduktet Vi har set, at man kan gange en vektor med et tal. Et oplagt spørgsmål er, om man også kan gange to vektorer med hinanden.

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Vektorer og lineær regression

Vektorer og lineær regression Vektorer og lineær regression Peter Harremoës Niels Brock April 03 Planproduktet Vi har set, at man kan gange en vektor med et tal Et oplagt spørgsmål er, om man også kan gange to vektorer med hinanden

Læs mere

Bedste rette linje ved mindste kvadraters metode

Bedste rette linje ved mindste kvadraters metode 1/9 Bedste rette linje ved mindste kvadraters metode - fra www.borgeleo.dk Figur 1: Tre datapunkter og den bedste rette linje bestemt af A, B og C Målepunkter og bedste rette linje I ovenstående koordinatsystem

Læs mere

Eksponentielle sammenhænge

Eksponentielle sammenhænge Eksponentielle sammenhænge 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Indholdsfortegnelse Variabel-sammenhænge... 1 1. Hvad er en eksponentiel sammenhæng?... 2 2. Forklaring med ord af eksponentiel vækst... 2, 6

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Dig og din puls Lærervejleding

Dig og din puls Lærervejleding Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet

Læs mere

2 Erik Vestergaard www.matematikfysik.dk

2 Erik Vestergaard www.matematikfysik.dk Erik Vestergaard www.matematikfysik.dk Erik Vestergaard www.matematikfysik.dk 3 Lineære funktioner En vigtig type funktioner at studere er de såkaldte lineære funktioner. Vi skal udlede en række egenskaber

Læs mere

Funktioner. 3. del Karsten Juul

Funktioner. 3. del Karsten Juul Funktioner 3. del 019 Karsten Juul Funktioner 3. del, 019 Karsten Juul 1/9-019 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm. Hæftet må benyttes i undervisningen hvis læreren

Læs mere

Projekt 1.4 Tagrendeproblemet en instruktiv øvelse i modellering med IT.

Projekt 1.4 Tagrendeproblemet en instruktiv øvelse i modellering med IT. Projekt 1.4 Tagrendeproblemet en instruktiv øvelse i modellering med IT. Projektet kan bl.a. anvendes til et forløb, hvor en af målsætningerne er at lære om samspillet mellem værktøjsprogrammernes geometriske

Læs mere

Projektopgave Observationer af stjerneskælv

Projektopgave Observationer af stjerneskælv Projektopgave Observationer af stjerneskælv Af: Mathias Brønd Christensen (20073504), Kristian Jerslev (20072494), Kristian Mads Egeris Nielsen (20072868) Indhold Formål...3 Teori...3 Hvorfor opstår der

Læs mere

π er irrationel Frank Nasser 10. december 2011

π er irrationel Frank Nasser 10. december 2011 π er irrationel Frank Nasser 10. december 2011 2008-2011. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Indhold 1 Introduktion

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen:

Læs mere

Statistisk modellering og regressionsanalyse

Statistisk modellering og regressionsanalyse Statistisk modellering og regressionsanalyse Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Oktober 25, 2018 Slides @ biostatistics.dk/talks/ 1 2 Hvad er statistik? Statistics is a science, not

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Introduktion til differentialregning 1. Jens Siegstad og Annegrethe Bak

Introduktion til differentialregning 1. Jens Siegstad og Annegrethe Bak Introduktion til differentialregning 1 Jens Siegstad og Annegrete Bak 16. juli 2008 1 Indledning I denne note vil vi kort introduktion til differentilregning, idet vi skal bruge teorien i et emne, Matematisk

Læs mere

Modellering af elektroniske komponenter

Modellering af elektroniske komponenter Modellering af elektroniske komponenter Formålet er at give studerende indblik i hvordan matematik som fag kan bruges i forbindelse med at modellere fysiske fænomener. Herunder anvendelse af Grafregner(TI-89)

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Kompendium i faget. Matematik. Tømrerafdelingen. 2. Hovedforløb. Y = ax 2 + bx + c. (x,y) Svendborg Erhvervsskole Tømrerafdelingen Niels Mark Aagaard

Kompendium i faget. Matematik. Tømrerafdelingen. 2. Hovedforløb. Y = ax 2 + bx + c. (x,y) Svendborg Erhvervsskole Tømrerafdelingen Niels Mark Aagaard Kompendium i faget Matematik Tømrerafdelingen 2. Hovedforløb. Y Y = ax 2 + bx + c (x,y) X Svendborg Erhvervsskole Tømrerafdelingen Niels Mark Aagaard Indholdsfortegnelse for H2: Undervisningens indhold...

Læs mere

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0 BAndengradspolynomier Et polynomium er en funktion på formen f ( ) = an + an + a+ a, hvor ai R kaldes polynomiets koefficienter. Graden af et polynomium er lig med den højeste potens af, for hvilket den

Læs mere

Funktioner. 2. del Karsten Juul

Funktioner. 2. del Karsten Juul Funktioner 2. del 2018 Karsten Juul 18. Eksponentiel funktion forskrift 18.1 Oplæg nr. 1 til forskrift for eksponentiel funktion... 52 18.2 Oplæg nr. 2 til forskrift for eksponentiel funktion... 53 18.3.

Læs mere

Eksponentielle sammenhænge

Eksponentielle sammenhænge Eksponentielle sammenhænge Udgave 009 Karsten Juul Dette hæfte er en fortsættelse af hæftet "Lineære sammenhænge, udgave 009" Indhold 1 Eksponentielle sammenhænge, ligning og graf 1 Procent 7 3 Hvad fortæller

Læs mere

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014 Vejledning til udvalgte opgave fra Matematik B, sommer 2014 Opgave 7 Størrelsen og udbudsprisen på 100 fritidshuse på Rømø er indsamlet via boligsiden.dk. a) Grafisk præsentation, der beskriver fordelingen

Læs mere

Lineære sammenhænge. Udgave 2. 2009 Karsten Juul

Lineære sammenhænge. Udgave 2. 2009 Karsten Juul Lineære sammenhænge Udgave 2 y = 0,5x 2,5 2009 Karsten Juul Dette hæfte er en fortsættelse af hæftet "Variabelsammenhænge, 2. udgave 2009". Indhold 1. Lineære sammenhænge, ligning og graf... 1 2. Lineær

Læs mere

Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ

Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ Per Bruun Brockhoff, DTU Compute, Claus Thorn Ekstrøm, KU Biostatistik, Ernst Hansen, KU Matematik January 17, 2017 Abstract

Læs mere

Graph brugermanual til matematik C

Graph brugermanual til matematik C Graph brugermanual til matematik C Forord Efterfølgende er en guide til programmet GRAPH. Programmet kan downloades gratis fra nettet og gemmes på computeren/et usb-stik. Det betyder, det også kan anvendes

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Pointen med Differentiation

Pointen med Differentiation Pointen med Differentiation Frank Nasser 20. april 2011 c 2008-2011. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Bemærk:

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Funktioner - supplerende eksempler

Funktioner - supplerende eksempler - supplerende eksempler Oversigt over forskellige typer af funktioner... 9b Omvendt proportionalitet og hyperbler... 9c Eksponentialfunktioner... 9e Potensfunktioner... 9g Side 9a Oversigt over forskellige

Læs mere

Kapitel 2 Tal og variable

Kapitel 2 Tal og variable Tal og variable Uden tal ingen matematik - matematik handler om tal og anvendelse af tal. Matematik beskæftiger sig ikke udelukkende med konkrete problemer fra andre fag, og de konkrete tal fra andre fagområder

Læs mere

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje. Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Erik Vestergaard 1. Opgaver. i Lineære. funktioner. og modeller

Erik Vestergaard   1. Opgaver. i Lineære. funktioner. og modeller Erik Vestergaard www.matematikfsik.dk Opgaver i Lineære funktioner og modeller Erik Vestergaard www.matematikfsik.dk Erik Vestergaard, Haderslev. www.matematikfsik.dk Teknik. Aflæse forskrift fra graf...

Læs mere

Tilfældige rektangler: Et matematikeksperiment Variable og sammenhænge

Tilfældige rektangler: Et matematikeksperiment Variable og sammenhænge Tilfældige rektangler: Et matematikeksperiment Variable og sammenhænge Baggrund: I de senere år har en del gymnasieskoler eksperimenteret med HOT-programmet i matematik og fysik, hvor HOT står for Higher

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau)

Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau) Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter En sumkurve fremkommer ifølge definitionen, ved at vi forbinder en række punkter afsat i et koordinatsystem med rette

Læs mere

I. Deskriptiv analyse af kroppens proportioner

I. Deskriptiv analyse af kroppens proportioner Projektet er delt i to, og man kan vælge kun at gennemføre den ene del. Man kan vælge selv at frembringe data, fx gennem et samarbejde med idræt eller biologi, eller man kan anvende de foreliggende data,

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Studieretningsprojekter i machine learning

Studieretningsprojekter i machine learning i machine learning 1 Introduktion Machine learning (ml) er et område indenfor kunstig intelligens, der beskæftiger sig med at konstruere programmer, der kan kan lære fra data. Tanken er at give en computer

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Eksponentielle funktioner for C-niveau i hf

Eksponentielle funktioner for C-niveau i hf Eksponentielle funktioner for C-niveau i hf 2017 Karsten Juul Procent 1. Procenter på en ny måde... 1 2. Bestem procentvis ændring... 2 3. Bestem begyndelsesværdi... 2 4. Bestem slutværdi... 3 5. Vækstrate...

Læs mere

Pointen med Funktioner

Pointen med Funktioner Pointen med Funktioner Frank Nasser 0. april 0 c 0080. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Bemærk: Dette er en

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Algebra - Teori og problemløsning

Algebra - Teori og problemløsning Algebra - Teori og problemløsning, januar 05, Kirsten Rosenkilde. Algebra - Teori og problemløsning Kapitel -3 giver en grundlæggende introduktion til at omskrive udtryk, faktorisere og løse ligningssystemer.

Læs mere

Gruppeteori. Michael Knudsen. 8. marts For at motivere indførelsen af gruppebegrebet begynder vi med et eksempel.

Gruppeteori. Michael Knudsen. 8. marts For at motivere indførelsen af gruppebegrebet begynder vi med et eksempel. Gruppeteori Michael Knudsen 8. marts 2005 1 Motivation For at motivere indførelsen af gruppebegrebet begynder vi med et eksempel. Eksempel 1.1. Lad Z betegne mængden af de hele tal, Z = {..., 2, 1, 0,

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,

Læs mere

Potensfunktioner, Eksponentialfunktioner og Logaritmer

Potensfunktioner, Eksponentialfunktioner og Logaritmer Potensfunktioner, Eksponentialfunktioner og Logaritmer Frank Villa 23. februar 2014 Dette dokument er en del af MatBog.dk 2008-2012. IT Teaching Tools. ISBN-13: 978-87-92775-00-9. Se yderligere betingelser

Læs mere

Emneopgave: Lineær- og kvadratisk programmering:

Emneopgave: Lineær- og kvadratisk programmering: Emneopgave: Lineær- og kvadratisk programmering: LINEÆR PROGRAMMERING I lineær programmering løser man problemer hvor man for en bestemt funktion ønsker at finde enten en maksimering eller en minimering

Læs mere

Afstande, skæringer og vinkler i rummet

Afstande, skæringer og vinkler i rummet Afstande, skæringer og vinkler i rummet Frank Villa 2. maj 202 c 2008-20. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Indhold

Læs mere

Simpel Lineær Regression: Model

Simpel Lineær Regression: Model Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]

Læs mere

Eksempel på logistisk vækst med TI-Nspire CAS

Eksempel på logistisk vækst med TI-Nspire CAS Eksempel på logistisk vækst med TI-Nspire CAS Tabellen herunder viser udviklingen af USA's befolkning fra 1850-1910 hvor befolkningstallet er angivet i millioner: Vi har tidligere redegjort for at antallet

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Appendiks 6: Universet som en matematisk struktur

Appendiks 6: Universet som en matematisk struktur Appendiks 6: Universet som en matematisk struktur En matematisk struktur er et meget abstrakt dyr, der kan defineres på følgende måde: En mængde, S, af elementer {s 1, s 2,,s n }, mellem hvilke der findes

Læs mere

Afstande, skæringer og vinkler i rummet

Afstande, skæringer og vinkler i rummet Afstande, skæringer og vinkler i rummet Frank Nasser 9. april 20 c 2008-20. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her.

Læs mere

Asymptoter. for standardforsøgene i matematik i gymnasiet. 2003 Karsten Juul

Asymptoter. for standardforsøgene i matematik i gymnasiet. 2003 Karsten Juul Asymptoter for standardforsøgene i matematik i gymnasiet 2003 Karsten Juul Indledning om lodrette asymptoter Lad f være funktionen bestemt ved =, 2. 2 Vi udregner funktionsværdierne i nogle -værdier der

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Løsning af simple Ligninger

Løsning af simple Ligninger Løsning af simple Ligninger Frank Nasser 19. april 2011 c 2008-2011. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Bemærk:

Læs mere

Matematisk modellering og numeriske metoder. Lektion 5

Matematisk modellering og numeriske metoder. Lektion 5 Matematisk modellering og numeriske metoder Lektion 5 Morten Grud Rasmussen 19. september, 2013 1 Euler-Cauchy-ligninger [Bogens afsnit 2.5, side 71] 1.1 De tre typer af Euler-Cauchy-ligninger Efter at

Læs mere

Undersøge funktion ved hjælp af graf. For hf-mat-c.

Undersøge funktion ved hjælp af graf. For hf-mat-c. Undersøge funktion ved hjælp af graf. For hf-mat-c. 2018 Karsten Juul Bestemme x og y 1. Bestemme x eller y...1 Andengradspolynomium 2. Forskrift for andengradspolynomium...2 3. Graf for andengradspolynomium...2

Læs mere

Kapitel 7 Matematiske vækstmodeller

Kapitel 7 Matematiske vækstmodeller Matematiske vækstmodeller I matematik undersøger man ofte variables afhængighed af hinanden. Her ser man, at samme type af sammenhænge tit forekommer inden for en lang række forskellige områder. I kapitel

Læs mere

Projekt 6.1 Rygtespredning - modellering af logistisk vækst

Projekt 6.1 Rygtespredning - modellering af logistisk vækst Projekt 6.1 Rygtespredning - modellering af logistisk vækst (Projektet anvender værktøjsprogrammet TI Nspire) Alle de tilstedeværende i klassen tildeles et nummer, så med 28 elever i klassen uddeles numrene

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Matematisk modellering og numeriske metoder. Lektion 16

Matematisk modellering og numeriske metoder. Lektion 16 Matematisk modellering og numeriske metoder Lektion 16 Morten Grud Rasmussen 6. november, 2013 1 Interpolation [Bogens afsnit 19.3 side 805] 1.1 Interpolationspolynomier Enhver kontinuert funktion f på

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

fortsætte høj retning mellem mindre over større

fortsætte høj retning mellem mindre over større cirka (ca) omtrent overslag fortsætte stoppe gentage gentage det samme igen mønster glat ru kantet høj lav bakke lav høj regel formel lov retning højre nedad finde rundt rod orden nøjagtig præcis cirka

Læs mere

Ligningsløsning som det at løse gåder

Ligningsløsning som det at løse gåder Ligningsløsning som det at løse gåder Nedenstående er et skærmklip fra en TI-Nspirefil. Vi ser at tre kræmmerhuse og fem bolsjer balancerer med to kræmmerhuse og 10 bolsjer. Spørgsmålet er hvor mange bolsjer,

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Om at finde bedste rette linie med Excel

Om at finde bedste rette linie med Excel Om at finde bedste rette linie med Excel Det er en vigtig og interessant opgave at beskrive fænomener i naturen eller i samfundet matematisk. Dels for at få en forståelse af sammenhængende indenfor det

Læs mere

Matematik A og Informationsteknologi B

Matematik A og Informationsteknologi B Matematik A og Informationsteknologi B Projektopgave 2 Eksponentielle modeller Benjamin Andreas Olander Christiansen Jens Werner Nielsen Klasse 2.4 6. december 2010 Vejledere: Jørn Christian Bendtsen og

Læs mere

Differensligninger og populationsstørrelser

Differensligninger og populationsstørrelser Differensligninger og populationsstørrelser Søren Højsgaard Department of Mathematical Sciences Aalborg University, Denmark October 22, 2015 Printed: October 22, 2015 File: differensligninger-slides.tex

Læs mere

Ting man gør med Vektorfunktioner

Ting man gør med Vektorfunktioner Ting man gør med Vektorfunktioner Frank Villa 3. august 13 Dette dokument er en del af MatBog.dk 8-1. IT Teaching Tools. ISBN-13: 978-87-9775--9. Se yderligere betingelser for brug her. Indhold 1 Introduktion

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Matema10k. Matematik for hhx C-niveau. Arbejdsark til kapitlerne i bogen

Matema10k. Matematik for hhx C-niveau. Arbejdsark til kapitlerne i bogen Matema10k Matematik for hhx C-niveau Arbejdsark til kapitlerne i bogen De følgende sider er arbejdsark og opgaver som kan bruges som introduktion til mange af bogens kapitler og underemner. De kan bruges

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Mandags Chancen. En optimal spilstrategi. Erik Vestergaard

Mandags Chancen. En optimal spilstrategi. Erik Vestergaard Mandags Chancen En optimal spilstrategi Erik Vestergaard Spilleregler denne note skal vi studere en optimal spilstrategi i det spil, som i fjernsynet går under navnet Mandags Chancen. Spillets regler er

Læs mere

Kapitel 8. Hvad er matematik? 1 ISBN Øvelse 8.2

Kapitel 8. Hvad er matematik? 1 ISBN Øvelse 8.2 Kapitel 8 Øvelse 8.2 Til Maria Pia broen bruger vi de tre punkter (0,0), (80,60) og (160,0). Disse er indtegnet i et koordinatsstem og vi har lavet andengradsregression. Og Garabit broen: Øvelse 8.8 Definitionsmængden

Læs mere

Projekt 2.5 Brændpunkt og ledelinje for parabler

Projekt 2.5 Brændpunkt og ledelinje for parabler Hvad er matematik? Projekter: Kapitel. Projekt.5 Brændpunkt og ledelinje for parabler Projekt.5 Brændpunkt og ledelinje for parabler En af de vigtigste egenskaber ved en parabel er, at den har et såkaldt

Læs mere

Funktioner. 1. del Karsten Juul

Funktioner. 1. del Karsten Juul Funktioner 1. del 0,6 5, 9 2018 Karsten Juul 1. Koordinater 1.1 Koordinatsystem... 1 1.2 Kvadranter... 1 1.3 Koordinater... 2 1.4 Aflæs x-koordinat... 2 1.5 Aflæs y-koordinat... 2 1.6 Koordinatsæt... 2

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

ØVEHÆFTE FOR MATEMATIK C FORMLER OG LIGNINGER

ØVEHÆFTE FOR MATEMATIK C FORMLER OG LIGNINGER ØVEHÆFTE FOR MATEMATIK C FORMLER OG LIGNINGER INDHOLDSFORTEGNELSE 0. FORMELSAMLING TIL FORMLER OG LIGNINGER... 2 Tal, regneoperationer og ligninger... 2 Isolere en ubekendt... 3 Hvis x står i første brilleglas...

Læs mere