Lineær regression i Standard ML
|
|
- Hans Strøm
- 7 år siden
- Visninger:
Transkript
1 Lineær regression i Standard ML Hans Hüttel 1. november 2001 Indhold 1 Hvad denne note handler om 2 2 Hvor bruger man lineær regression? 2 3 Problemanalyse Den matematiske teori Krav til program Interface Programmering Hvordan skal data repræsenteres i programmet? Repræsentation af data Repræsentation af resultat Statistiske funktioner Hjælpefunktioner Middelværdi SSD En meddelelse fra ML-systemet Beregning af bedste linie Test 9 hans@cs.auc.dk. Denne note er naturligvis skrevet med dokumentbehandlingssystemet LA TE X. 1
2 1 Hvad denne note handler om I denne note skal vi se hvordan man kan implementere lineær regression i Standard ML. Denne note giver et første eksempel på hvordan man i ingeniørsammenhænge kan drage stor nytte af programmering til problemløsning. Samtidig giver denne note et realistisk eksempel på anvendelse af begreberne fra kapitlerne 3, 4 og 5 i [HR99]. I en senere note følger vi op på dette eksempel og viser hvordan man kan lave et program der læser data til en regressionsanalyse fra en l og skriver resultaterne ud til plotteprogrammet gnuplot. Herved bliver det muligt at bruge Standard ML til at generere illustrationer af sammenhænge i data. 2 Hvor bruger man lineær regression? Lineær regression er en statistisk metode der tillader os at nde den bedste rette linie givet en mængde af datapunkter. Lineær regression dukker op i ingeniørvidenskaberne i mange sammenhænge. Herunder er nogle eksempler. I kemi dukker lineær regression hyppigt op. Man kan ønske at undersøge om der er en lineær sammenhæng mellem to datasæt. Eller man har behov for kalibrere måleapparatur således at måleapparaturet viser en lineær sammenhæng mellem f.eks. koncentrationen af en analyt og en tilført værdi. I mekanisk fysik er mange sammenhænge lineære eller tilnærmelsesvist lineære. Et velkendt eksempel er Hookes lov. Denne giver en sammenhæng mellem kraften virkende på et elastisk objekt og dette objekts bøjning. Et eksempel kunne være en bjælke der ligger vandret. Hvis x er nedbøjningen af bjælken, når man belaster den med kraften F, siger Hooke's lov at F = b x b er en konstant, der kaldes blødheden. At blødheden er konstant betyder, at den ikke afhænger af nedbøjning eller kraft. En velkendt problemstilling vil være at bestemme et skøn over bjælkens blødhed b ud fra en række målinger af F og x. Hertil bruger man lineær regression. I kredsløbsteori er mange sammenhænge lineære eller tilnærmelsesvist lineære eller tilnærmelsesvist lineære.. Et velkendt eksempel er Ohms lov, der siger at sammenhængen mellem spændingsforskel U, modstand R og strømstyrke I er 2
3 U = R I En velkendt problemstilling vil være at bestemme et skøn over modstanden R ud fra en række målinger af U og I. Hertil bruger man lineær regression. 3 Problemanalyse Inden programmeringsarbejdet skal vi analysere vores problem og opstille krav til det program vi skal konstruere. 3.1 Den matematiske teori Lad os antage at vi har målt to størrelser X og Y n gange. Dette har givet os datasættene (x 1,..., x n ) og (y 1,..., y n ) henholdsvis. Vi antager at der er en lineær sammenhæng mellem X-værdierne og Y - værdierne, så X = my + b Vi vil nu estimere (nde de bedste bud på) hældningskoecienten m og skæringen b med y-aksen. Middelværdierne af X og Y er givet ved X = Y = ni x i n ni y i Ud fra middelværdierne skal vi nu beregne covariansen Var(X, Y ) og variansen Var(X) af X og variansen Var(Y ) af Y. Disse er givet ved n Var(X, Y ) = Var(X) = Var(Y ) = n (x i X)(y i Y ) i=1 n (x i X) 2 i=1 n (y i Y ) 2 i=1 3
4 Bemærk at varians og covarians ligner hinanden; de er begge en sum af produkter af forskelle. Hvis vi denerer størrelsen SSD ( Sums of Squares of Deviations) SSD(X 1, X 2, d 1, d 2 ) = n i+1 kan vi udtrykke varians og covarians som henholdsvis (x 1i d 1 )(x 2i d 2 ) (1) Var(X, Y ) = SSD(X, Y, X, Y ) (2) Var(X) = SSD(X, X, X, X) (3) Var(Y ) = SSD(Y, Y, Y, Y ) (4) (5) Estimaterne m og b er givet ved formlerne m = Var(X, Y ) (6) Var(X) b = Y mx (7) 3.2 Krav til program Vores program skal ud fra en given mængde af datapunkter kunne beregne m og b, Var(X) og Var(Y ) ved brug af formlerne (1)-(7). Datapunkterne skal være angivet i en liste. 3.3 Interface Vi ønsker at denere to nye typer, dataliste, der skal være typen af vore data, og resultat, der skal være typen af resultatet af en regressionsanalyse. En dataliste skal være en liste af par af real-værdier, mens et resultat skal være en record der rummer de interessante værdier som regressionsanalysen beregner. Vi vender tilbage til disse typer i afsnit 4. Vi ønsker at lave en funktion bedste_linie der, givet en dataliste, giver os et resultat af type resultat. Desuden er vi interesseret i en funktion middelv der, givet en liste af værdier, giver os middelværdien af værdierne i listen. Og endelig er vi interesseret i en liste der, givet to lister af værdier for X 1 og X 2 samt afvigelser d 1 og d 2, beregner SSD(X 1, X 2, d 1, d 2 ). Disse funktioner er angivet i interface-denitionen i Tabel 1. 4
5 Specikation type dataliste = (real * real) list type resultat = { hkoeff : real, skaering : real} middelv : real list -> real ssd : real list * real list * real * real -> real bedste_linie : dataliste -> resultat Kommentar Type af en liste af data Type af resultat Beregning af middelværdi Beregning af SSD Beregning af bedste linie Tabel 1: Interface Funktionerne i vores interface er de funktioner som en bruger af vores program skal kunne benytte. Desuden får vi brug for nogle hjælpefunktioner som brugeren ikke skal kunne se; disse skal ikke være med i vores interface. 4 Programmering Nu kan vi gå over til at skrive programtekst. 4.1 Hvordan skal data repræsenteres i programmet? Vores program skal bestå af en samling af funktioner der opererer på data. Først er vi derfor nødt til at nde ud af hvordan vi vil beskrive data i SML Repræsentation af data Et datapunkt skal være et par af kommatal; vores datasæt er en liste af datapunkter. Derfor giver følgende typeerklæringer god mening: type datapunkt = real * real; type dataliste = datapunkt list; Vores liste kunne f.eks. være denne val minliste = [(1.2,2.4),(1.3,2.6),(3.2,6.7)] : Repræsentation af resultat Vi ønsker at regressionsanalysen skal give os værdier for m og b, Var(X) og Var(Y ). Disse værdier kunne vi samle i et par eller i en record. Vi vælger at sige at typen af resultatet skal være en record. Felterne i en record er nemlig 5
6 navngivet og det gør det nemmere for os at huske hvilken værdi der er m og hvilken der er b når vi bliver præsenteret for resultatet af regressionsanalysen. Vi erklærer derfor denne type: type resultat = { hkoeff : real, skaering : real } Når vi kalder vores funktion der nder bedste linie skal vi derfor forvente at få et svar som f.eks. {hkoeff = 2.0, skaering = 0.0, x_varians = 9.48, y_varians = 37.92} : {hkoeff : real, skaering : real, x_varians : real, y_varians : real} 4.2 Statistiske funktioner Vi skal nu se hvordan man kan beregne værdierne deneret i (1)(7). Vores data repræsenterer vi som lister og de statistiske funktioner opererer således på lister. Vi tager derfor udgangspunkt i [HR99, kapitel 5] Hjælpefunktioner Vi får brug for nogle hjælpefunktioner. Fra en liste af par til et par af lister Vi repræsenterer data som en liste af par. Men når vi skal beregne middelværdier og SSD-værdier er det en fordel at kunne splitte listen op så vi kun en liste af første-komponenter eller en liste af anden-komponenter. Hertil kan vi bruge en funktion der allerede ndes, nemlig funktionen unzip fra [HR99, afsnit 5.6.4]. Denne funktion ndes i biblioteket ListPair som vi derfor skal huske at hente ind. unzip har typen val unzip = fn : ('a * 'b) list -> 'a list * 'b list og er en polymorf funktion som beskrevet i [HR99, afsnit 5.4.1]. unzip virker nemlig på vilkårlige lister af par. At summere værdierne i en liste Når vi skal beregne middelværdi får vi brug for at summere værdierne i en liste. Dette gør vi med funktionen sum_liste der kan deneres således: fun sum_liste [] = 0.0 sum_liste (x::l) = x + sum_liste l; 6
7 Denne funktion er rekursiv; summen af en tom liste er 0, 0 mens summen af en liste der ikke er tom er første element plus summen af resten af listen. Hvad er typen af sum_liste? Den er val sum_liste = fn : real list -> real Det var vigtigt at vi skrev 0.0 i denition. Hvis vi havde skrevet fun sum_liste [] = 0 sum_liste (x::l) = x + sum_liste l; ville vi få val sum_liste = fn : int list -> int da 0 har typen int. Dette ville give os en typefejl hvis vi ville anvende funktionen på en liste af type real list Middelværdi Ved hjælp af funktionen sum_liste kan vi nu let beregne middelværdi af en liste af real-værdier ved brug af (1). For at nde n skal vi bruge længdefunktionen length som giver os længden af en liste. Da length: 'a list -> int er længden et heltal, men vi skal dividere med en værdi af type real. En værdi af type int kan konverteres til en værdi af type real med funktionen real : int -> real. Vi får derfor fun middelv l = (sum_liste l)/(real(length l)); middelv har typen val middelv = fn : real list -> real SSD SSD(X, Y, d 1, d 2 ) kan beregnes med denne rekursive funktion: fun ssd ([],[], d1, d2) = 0.0 ssd ((x::lx),(y::ly),d1,d2) = (x-d1)*(y-d2) + ssd (lx,ly,d1,d2); ssd baner sig vej gennem parret af datalister på følgende vis: Hvis de to datalister begge er tomme, giver ssd værdien 0, 0. Ellers beregner ssd produktafvigelsen (x d 1 )(y d 2 ) for de første værdier x og y og lægger den fundne værdi til resultatet af at nde ssd for de to lister med de resterende data. 7
8 4.2.4 En meddelelse fra ML-systemet ML-systemet giver følgende meddelelse når det ser denitionen af ssd: Warning: pattern matching is not exhaustive Denne meddelelse skyldes at der ikke er en klausul for alle re mulige udseender af de to lister med data, men kun de to mønstre som er interessante. Denne meddelelse betyder ikke at der er noget galt, blot at funktionen ssd ikke kan kaldes med f.eks. to lister hvor kun den ene er tom som f.eks. ssd([],[1.3,2.4]) Der er nemlig ikke noget mønster i denition for dette tilfælde. Men det er ikke et problem i denne sammenhæng. Vi anvender nemlig kun ssd på par af lister hvor de to lister er lige lange i det rekursive kald af ssd i anden klausul kalder vi ssd med halerne, der jo er lister der begge er 1 element kortere. Hvis vi derfor kalder ssd med et par af lige lange lister vil vi til sidst kunne anvende første klausul i denitionen. ssd har typen val ssd = fn : real list * real list * real * real -> real 4.3 Beregning af bedste linie Vi kan nu denere funktionen bedste_linie der, givet en liste af par, udregner hældningskoecient m og skæring med y-akse. I funktionens denition er det en fordel at have nogle mellemregninger. Her er let-konstruktionen meget nyttig. Selve mellemregningerne anvender funktionerne middelv og ssd som i (2), (3) og (4). fun bedste_linie l = let (* lister af x- og y-vaerdier beregnes *) val (lx,ly) = ListPair.unzip l (* middelvaerdi af x-vaerdier *) val mx = middelv lx (* middelvaerdi af y-vaerdier *) val my = middelv ly (* varians af x-vaerdier *) val xvarians = ssd (lx,lx,mx,mx) (* varians af y-vaerdier *) val yvarians = ssd (ly,ly,my,my) 8
9 (* covarians *) val covarians = ssd (lx,ly,mx,my) (* haeldning *) val m = covarians/xvarians (* skaering *) val b = my - m*mx in { hkoeff= m, skaering=b } end; Typen af bedste_linie er som interface-denitionen krævede det val bedste_linie = fn : (real * real) list -> {hkoeff : real, skaering : real} 5 Test Også i dette tilfælde er det vigtigt at teste programmet systematisk. Her er den vigtige test testen af funktionerne middelv, ssd og bedste_linie. Da middelv også anvender sum_liste skal vi også teste denne funktion. Vi skal specielt teste hver klausul i sum_liste og ssd, da begge disse funktioner er rekursive og deneret ved et antal klausuler. For bedste_linie skal vi teste funktionen med et kendt eksempel på lineær regression fra litteraturen og sammenligne de fundne værdier med litteraturens. Litteratur [HR99] Michael R. Hansen og Hans Rischel. Introduction to Programming Using Standard ML, Addison-Wesley
Moduler i Standard ML
Moduler i Standard ML Hans Hüttel December 2001 I løbet af datalogikurset har vi haft glæde af en hel række forskellige standardmoduler som f.eks. Math, Int, Real og String. Disse moduler kan, har vi set,
Læs mereHjælp! Der er brok med mit ML-program
Hjælp! Der er brok med mit ML-program Hans Hüttel December 2001 Indhold 1 Formålet med denne note 1 2 Der er ere slags fejl 2 2.1 Brugerfejl............................. 2 2.2 Syntaksfejl.............................
Læs merePerspektiver i Matematik-Økonomi: Linær regression
Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: jlj@imf.au.dk Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem
Læs mereEt SML-program til at finde rødder i en kontinuert funktion
Et SML-program til at finde rødder i en kontinuert funktion Hans Hüttel Ole Høgh Jensen 11 januar 2002 Indhold 1 Om denne tekst 1 2 Hvad er bisektion? 1 3 Specifikation af vores program 2 4 SML-versionen
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereFor at få tegnet en graf trykkes på knappen for graftegning. Knap for graftegning
Graftegning på regneark. Ved hjælp af Excel regneark kan man nemt tegne grafer. Man åbner for regnearket ligger under Microsoft Office. Så indtaster man tallene fra tabellen i regnearkets celler i en vandret
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereDig og din puls. 17-10-2004 Dig og din puls Side 1 af 17
Dig og din puls Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004 Dig og din puls Side 1 af 17
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereErik Vestergaard 1. Opgaver. i Lineære. funktioner. og modeller
Erik Vestergaard www.matematikfsik.dk Opgaver i Lineære funktioner og modeller Erik Vestergaard www.matematikfsik.dk Erik Vestergaard, Haderslev. www.matematikfsik.dk Teknik. Aflæse forskrift fra graf...
Læs mereFunktioner og ligninger
Eleverne har både i Kolorit på mellemtrinnet og i Kolorit 7 matematik grundbog arbejdet med funktioner. I 7. klasse blev funktionsbegrebet defineret, og eleverne arbejdede med forskellige måder at beskrive
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereInstitut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6
Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs merea) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?
Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereMikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1
Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereStatistisk modellering og regressionsanalyse
Statistisk modellering og regressionsanalyse Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Oktober 25, 2018 Slides @ biostatistics.dk/talks/ 1 2 Hvad er statistik? Statistics is a science, not
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: Maj-juni, 14. Denne
Læs mereKvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe
Læs mereInstitut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med
Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X
Læs mereBedste rette linje ved mindste kvadraters metode
1/9 Bedste rette linje ved mindste kvadraters metode - fra www.borgeleo.dk Figur 1: Tre datapunkter og den bedste rette linje bestemt af A, B og C Målepunkter og bedste rette linje I ovenstående koordinatsystem
Læs mereKapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Læs mereResidualer i grundforløbet
Erik Vestergaard www.matematikfysik.dk 1 Residualer i grundforløbet I dette lille tillæg til grundforløbet, skal vi kigge på begreberne residualer, residualplot samt residualspredning. Vi vil se, hvad
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: Maj-juni, 11. Denne
Læs mere2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter
Opgave I I mange statistiske undersøgelser benytter man binomialfordelingen til at beskrive den tilfældige variation. Spørgsmål I.1 (1): For hvilken af følgende 5 stokastiske variable kunne binomialfordelingen
Læs mereEt eksempel på en todimensional normalfordeling Anders Milhøj September 2006
Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af
Læs mereØkonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereØvelse 1.5: Spændingsdeler med belastning Udført af: Kari Bjerke Sørensen, Hjalte Sylvest Jacobsen og Toke Lynæs Larsen.
Øvelse 1.5: Spændingsdeler med belastning Udført af: Kari jerke Sørensen, Hjalte Sylvest Jacobsen og Toke Lynæs Larsen. Formål: Formålet med denne øvelse er at anvende Ohms lov på en såkaldt spændingsdeler,
Læs mere2 X 2 = Antal mygstik på enpersoniløbetaf1minut
Opgave I I mange statistiske undersøgelser bygger man analysen på anvendelse af normalfordelingen til (eventuelt tilnærmelsesvist) at beskrive den tilfældige variation. Spørgsmål I.1 (1): Forén af følgende
Læs mereLineære sammenhænge, residualplot og regression
Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge
Læs mereKursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Læs mereAntal timer 19 5 7 10 0 6 6 3 7 6 4 14 6 5 12 10 Køn k m k m m k m k m k k k m k k k
Statistik 5 Statistik er en meget omfattende matematisk disciplin, og den anvendes i meget stor udstrækning i vores moderne samfund. Den handler om at analysere et (ofte meget stort) talmateriale. Det
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereNaturvidenskab. En fællesbetegnelse for videnskaberne om naturen, dvs. astronomi, fysik, kemi, biologi, naturgeografi, biofysik, meteorologi, osv
Naturvidenskab En fællesbetegnelse for videnskaberne om naturen, dvs. astronomi, fysik, kemi, biologi, naturgeografi, biofysik, meteorologi, osv Naturvidenskab defineres som menneskelige aktiviteter, hvor
Læs mereDet teknisk-naturvidenskabelige basisår Matematik 1A, Efterår 2005, Hold 3 Prøveopgave B
Det teknisk-naturvidenskabelige basisår Matematik 1A, Efterår 2005, Hold 3 Opgaven består af fire dele, hver med en række spørgsmål, efterfulgt af en liste af teorispørgsmål. I alle opgavespørgsmålene
Læs mereKapitel 3 Centraltendens og spredning
Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling
Læs mereKvadratisk regression
Kvadratisk regression Helle Sørensen Institut for Matematiske Fag Københavns Universitet Juli 2011 I kapitlet om lineær regression blev det vist hvordan man kan modellere en lineær sammenhæng mellem to
Læs mereTak for kaffe! 17-10-2004 Tak for kaffe! Side 1 af 16
Tak for kaffe! Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004 Tak for kaffe! Side 1 af 16 Tak
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Skoleåret 2018/19 Institution Viden Djurs - VID Gymnasier Uddannelse Fag og niveau Lærer Hold HTX Matematik
Læs mereØkonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006
Dagens program Økonometri Den simple regressionsmodel 5. september 006 Den simple lineære regressionsmodel (Wooldridge kap.4-.6) Eksemplet fortsat: Løn og uddannelse på danske data Funktionel form Statistiske
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: Maj-juni, 14. Denne
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereSimpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Læs mere1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable
Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder
Læs mereStatistik i GeoGebra
Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik
Læs mereStudieplan. Stamoplysninger. Oversigt over planlagte undervisningsforløb. Periode November Maj 2018 Institution Vejen Business College
Studieplan Stamoplysninger Periode November 2017 - Maj 2018 Institution Vejen Business College Uddannelse Fag og niveau Lærer(e) Hold Hhx Matematik-B Sabine Lindemann Petersen MatematikB-hh1117-EF1718-AFS/VØ
Læs mereAnalyse af en lineær regression med lav R 2 -værdi
Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet
Læs mereTeoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.
Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt
Læs mereAnalyse af måledata II
Analyse af måledata II Usikkerhedsberegning og grafisk repræsentation af måleusikkerhed Af Michael Brix Pedersen, Birkerød Gymnasium Forfatteren gennemgår grundlæggende begreber om måleusikkerhed på fysiske
Læs mereEt SML-program til sortering af linier i en tekstfil
Et SML-program til sorterg af lier i en tekstfil Hans Hüttel 10. januar 2002 Indhold 1 Om denne tekst 2 2 Interface 2 3 At dlæse strenge fra en fil og danne en liste af dem 3 3.1 Funktionsdefitioner.......................
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mere2 Erik Vestergaard www.matematikfysik.dk
Erik Vestergaard www.matematikfysik.dk Erik Vestergaard www.matematikfysik.dk 3 Lineære funktioner En vigtig type funktioner at studere er de såkaldte lineære funktioner. Vi skal udlede en række egenskaber
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Institution Uddannelse Fag og niveau Lærer(e) Hold Termin hvori undervisningen afsluttes: Maj-juni, 14. Denne
Læs mereSkriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Læs mereOpgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Læs mereUniversity of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version
university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,
Læs mereExcel tutorial om lineær regression
Excel tutorial om lineær regression I denne tutorial skal du lære at foretage lineær regression i Microsoft Excel 2007. Det forudsættes, at læseren har været igennem det indledende om lineære funktioner.
Læs mereDagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22
Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som
Læs mere3 Algebra. Faglige mål. Variable og brøker. Den distributive lov. Potenser og rødder
3 Algebra Faglige mål Kapitlet Algebra tager udgangspunkt i følgende faglige mål: Variable og brøker: kende enkle algebraiske udtryk med brøker og kunne behandle disse ved at finde fællesnævner. Den distributive
Læs mereVægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen
Vægte motiverende eksempel Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@mathaaudk Institut for Matematiske Fag Aalborg Universitet Højdeforskellen mellem punkterne P
Læs mereDaniells element Louise Regitze Skotte Andersen
Louise Regitze Skotte Andersen Fysikrapport. Morten Stoklund Larsen - Lærer K l a s s e 1. 4 G r u p p e m e d l e m m e r : N i k i F r i b e r t A n d r e a s D a h l 2 2-0 5-2 0 0 8 2 Indhold Indledning...
Læs mereMM501 forelæsningsslides
MM501 forelæsningsslides uge 40, 2010 Produceret af Hans J. Munkholm bearbejdet af JC 1 Separabel 1. ordens differentialligning En generel 1. ordens differentialligning har formen s.445-8 dx Eksempler
Læs mereLandmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl
Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/36 Estimation af varians/spredning Antag X 1,...,X n stokastiske
Læs mereβ = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1
Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)
Læs mereEksponentielle sammenhænge
Eksponentielle sammenhænge 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Indholdsfortegnelse Variabel-sammenhænge... 1 1. Hvad er en eksponentiel sammenhæng?... 2 2. Forklaring med ord af eksponentiel vækst... 2, 6
Læs mereTest nr. 6 af centrale elementer 02402
QuizComposer 2001- Olaf Kayser & Gunnar Mohr Contact: admin@quizcomposer.dk Main site: www.quizcomposer.dk Test nr. 6 af centrale elementer 02402 Denne quiz angår forståelse af centrale elementer i kursus
Læs mereEn intro til radiologisk statistik. Erik Morre Pedersen
En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur
Læs mereDeskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mere1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller
Læs mereOversigt over Forenklede Fælles Mål i forbindelse med kapitlerne i MULTI. Modellering
MULTI 7 Forenklede Fælles Mål Oversigt over Forenklede Fælles Mål i forbindelse med kapitlerne i MULTI Kapitel 1 Læs og skriv matematik Eleven kan kommunikere mundtligt og skriftligt med og om matematik
Læs mereEn Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereTilgang til data. To udbredte metoder for at tilgå data: Sekventiel tilgang Random access: tilgang via ID (også kaldet key, nøgle) for dataelementer.
Merging og Hashing Tilgang til data To udbredte metoder for at tilgå data: Sekventiel tilgang Random access: tilgang via ID (også kaldet key, nøgle) for dataelementer. API for sekventiel tilgang (API =
Læs mereSimpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Læs mereStikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Læs mereLandmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl
Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf13 Institut for Matematiske Fag Aalborg Universitet 1/1 Vægtet
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Termin Juni 119 Institution Tønder Handelsgymnasium & Handelsskole Uddannelse Fag og niveau Lærer Hold Matematik B Jesper Uhre (JUH) 2018hh2a 2a Forløbsoversigt (4) Forløb 1 Forløb
Læs mereOm at udregne enkeltstående hexadecimaler i tallet pi
Om at udregne enkeltstående hexadecimaler i tallet pi I 996 var det en sensation, da det kom frem, at det var lykkedes D. Bailey, P. Borwein og S. Plouffe at finde en formel for tallet π, med hvilken man
Læs mereDeformation af stålbjælker
Deformation af stålbjælker Af Jimmy Lauridsen Indhold 1 Nedbøjning af bjælker... 1 1.1 Elasticitetsmodulet... 2 1.2 Inertimomentet... 4 2 Formelsamling for typiske systemer... 8 1 Nedbøjning af bjælker
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereDATALOGI 0 GA. Skriftlig eksamen tirsdag den 18. januar 2005 af to timers varighed. Opgavesæt med vejledende løsninger
Københavns Universitet bacheloruddannelsen i datalogi side 1 af 6 DATALOGI 0 GA Skriftlig eksamen tirsdag den 18. januar 2005 af to timers varighed Opgavesæt med vejledende løsninger Dette opgavesæt består
Læs mereStudieretningsprojekter i machine learning
i machine learning 1 Introduktion Machine learning (ml) er et område indenfor kunstig intelligens, der beskæftiger sig med at konstruere programmer, der kan kan lære fra data. Tanken er at give en computer
Læs mereDig og din puls Lærervejleding
Dig og din puls Lærervejleding Indledning I det efterfølgende materiale beskrives et forløb til matematik C, hvori eleverne skal måle hvilepuls og arbejdspuls og beskrive observationerne matematisk. Materialet
Læs mere02402 Løsning til testquiz02402f (Test VI)
02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:
Læs mereUndervisningsplan. Stamoplysninger til brug ved prøver til gymnasiale uddannelser. Oversigt over planlagte undervisningsforløb
Undervisningsplan Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Skoleåret 2016-2017 Institution Svendborg Erhvervsskole Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C Ole
Læs mere