Modul 1: Beskrivende dataanalyse
|
|
- Caspar Tobias Steensen
- 7 år siden
- Visninger:
Transkript
1 Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 1: Beskrivende dataanalyse 1.1 Statistik og dataanalyse Variable og data Typer af variable Grafiske metoder til at vise data Vurdering af grafer Nøglestørrelser for numeriske variable Positionsmål Variationsmål Box plots Sammenhængsmål Statistik og dataanalyse In God we trust, all others must bring data. W. Edwards Deming Data = systematisk indsamlet information. Eksempler: 1. Massefylden af vand ved 10 givne temperaturer. 2. Koncentrationen af HCl i 15 prøver fra en industriel produktion. 3. De første 300,000 primtal. 4. En algoritmes tidsforbrug for 75 forskellige inddata. 5. Den daglige dollarkurs i Vanddybden i 25 søer på Fyn. 7. Massespektret for 27 proteinprøver. Statistik = at indsamle, fortolke og analysere data. Eksempler på statistiske problemstillinger: 1. Hvordan afhænger vands massefylde af temperaturen?
2 1.2 Variable og data 2 2. Hvordan fordeler koncentrationen af HCl sig langs tromlen? 3. Hvordan kan man beskrive den asymptotiske fordelingen af primtallene på aksen? 4. For hvilken type inddata er algoritmen bedst? 5. Hvorledes opfører de daglige fluktuationer af dollarkursen sig? 6. Hvor mange dybe søer er der på Fyn? 7. Hvad siger massespektret om proteinsammensætningen? Variationskilder = hvor kommer variationen fra? Nogle eksempler: 1. Massefylden afhænger af temperaturen. 2. Koncentrationen af HCl aftager i procesretningen. 3. Spiller tilfældigheder ind på fordelingen af primtallene? 4. Algoritmen er robust over for komplexiteten af input. 5. Dollarkursen svinger tilfældigt fra dag til dag. 6. De dybe søer er formet af istiden. 7. Der er forskel på en ondartet og en godartet knude. To typer variationskilder: Systematisk variation. Hvordan måles den? Tilfældig variation. Hvordan måles den? 1.2 Variable og data Variable: betegnelsen for det man registrerer (måler, tæller, observerer,...) fx højde, længde, køn, styrke, vægtforskel, koncentration, farve, vindretning,... Data: de faktiske målinger, observationer,... fx 198 cm, 0.05 mm, kvinde, 42 p.s.i., 45kg, 3%, blå, sydøst...
3 1.3 Grafiske metoder til at vise data 3 Bemærk: I dette kursus bruger vi engelsk decimalpunktum i stedet for komma! Eksempel 1.1 Standardvægt Tidligere havde United States National Bureau of Standards en standardvægt på 10g. For at sikre sig at vægten var tilregnelig, vejedes den jævnligt. 100 målinger resulterede i: g, g, g,..., g. Eksempel 1.2 Studerendes fravær I et kursus med 28 forelæsninger, blev fraværet af hver af de 203 studerende noteret: 2, 3, 2,..., 4, 1. Eksempel 1.3 Isforbrug og temperatur Isforbruget per inbygger (i pints per dag) blev målt i forskellige områder af USA om sommeren. Desuden blev, for hver måling af isforbrug, gennemsnitstemperaturen noteret (bl.a.): Isforbrug (pints): Temperatur (Fahrenheit): Typer af variable Variabeltyper: Kvalitative (fx køn, farve, hvorvidt man lider af en bestemt sygdom,...) Dvs. klasseopdeling, skal være entydig. Kvantitative Diskret (fx antal biler i husstand, antal tropenætter i juli, antal fejl i en test,...) Kontinuert (fx længde, højde, vægt, styrke, koncentration,...) 1.3 Grafiske metoder til at vise data Søjlediagram (kun for diskrete variable): 1. En søjle for hver mulige/relevante værdi af variabel. 2. Søjlehøjde = antal data med pågældende værdi.
4 1.3 Grafiske metoder til at vise data 4 Tæthedsdiagram: del søjlehøjderne med det totale antal data. Figur 1.1: Fraværende Studerende. Histogram for kontinuert variabel. Frekvenshistogram: 1. Del det mulige/relevante interval op i et antal lige store intervaller. 2. Søjlehøjde = antal data i pågældende interval. 3. Søjlerne skal hænge sammen. Tæthedshistogram (standard): 1. Del det mulige/relevante interval op i et antal intervaller. 2. Søjlehøjde = antal data i pågældende interval delt med samlet antal data og med intervallængden. 3. Søjlerne skal hænge sammen. Areal under kurven = 1. Kan håndtere varierende intervallængde. 4. Bemærk: Grafen afhænger i høj grad af den valgte intervalopdeling!
5 1.3 Grafiske metoder til at vise data 5 Figur 1.2: Standardvægt 1. Figur 1.3: Standardvægt 2 (andet startpunkt).
6 1.3 Grafiske metoder til at vise data 6 Figur 1.4: Standardvægt 3 (mindre intervallængde). Figur 1.5: Standardvægt 4 (mindste intervallængde). Scatterplot: (for to (sædvanligvis) kontinuerte variable) 1. Tegn samhørende punkter (x,y) ind i diagram.
7 1.3 Grafiske metoder til at vise data 7 Figur 1.6: Isforbrug og temperatur Vurdering af grafer Søjlediagram/histogram: Hvor mange data danner baggrund for grafen? Er grafen fornuftig? er intervalopdelingen for grov/fin? er endepunkterne for intervallerne valgt fornuftigt? Er grafen som forventet? stemmer den overens med din forhåndsviden? hvordan afviger grafen fra forventningen? hvorfor? Er grafen pæn? symmetrisk/skæv? lige/ujævn? et eller flere toppunkter (modus er)? er der outliers? Scatterplot:
8 1.3 Grafiske metoder til at vise data 8 Figur 1.7: Isforbrug og temperatur 2. Er der sammenhæng mellem de to variable? lineær/ikke-lineær? følger de hinanden tæt? er de positivt/negativt korrelerede? er der outliers? Eksempel 1.4 Anoreksibehandling I en engelsk undersøgelse blev unge anoreksiramte piger behandlet med cognitiv terapi. Forskellen i vægt før og efter behandling blev målt i pund (lb). Figur 1.8: Vægtforøgelse efter terapi.
9 1.4 Nøglestørrelser for numeriske variable 9 Eksempel 1.5 Papirstyrke Styrken (p.s.i.) blev målt for forskellige partier af Kraft Paper (kraftigt indpakningspapir). For hvert parti er også angivet andelen af hårdt træ i papirmassen. Figur 1.9: Papirstyrke. 1.4 Nøglestørrelser for numeriske variable Beskriv fordelingen af givne data med nogle få talstørrelser: Position hvor på aksen er vi? (systematikken) Variation hvor store er de tilfældige udsving? Sammenhængen mellem to variable. Generel betegnelse for data fra variablen y: n = antal data. y 1,y 2,...,y n Eksempel 1.6 Flagermus på jagt Når flagermus jager, udsender de højfrekvente lyde og bruger ekkoet af lyden til at finde byttet. Data angiver afstanden (i cm) mellem flagermus og byttedyret, når flagermusen opdager byttet
10 1.4 Nøglestørrelser for numeriske variable 10 Figur 1.10: Afstand mellem flagermus og bytte Positionsmål Middelværdi ȳ: Gennemsnit ȳ = 1 n n y i. i=1 Eksempel 1.6 Flagermus på jagt Middelværdi: ȳ = ( )/11 = Median Q 2 : Midterste værdi Stil data op i rækkefølge y (1) y (2) y (n) Hvis n ulige: Q 2 = y ((n+1)/2) Hvis n lige: Q 2 = y (n/2) + y (n/2+1). 2 Eksempel 1.6 Flagermus på jagt Ordnede data:
11 1.4 Nøglestørrelser for numeriske variable 11 Median: Q 2 = 45 Typetal (modus): Mest typiske værdi/interval Værdi som flest data antager (diskret variabel) Midtpunkt i intervalstykke med flest data (kontinuert variabel) Bemærk: Modus bruges ofte om samtlige høje toppe i et diagram. Eksempel 1.6 Flagermus på jagt Data: Interval Frekvens Typetal: 45 Fordele og ulemper: Middelværdi: God at regne med, men påvirkes meget af outliers. Median: Påvirkes ikke af outliers, men er sværere at regne med. Typetal: Let at forklare, men varierer meget. Andre mål for position: Fraktil (percentil) for 0 q 1: et tal Q q så: mindst q 100% af data er Q q og mindst (1 q) 100% af data er Q q Kvartiler: Nedre (første) kvartil: Q 1 = Q 25% Median (anden kvartil): Q 2 = Q 50% Øvre (tredje) kvartil Q 3 = Q 75%
12 1.4 Nøglestørrelser for numeriske variable 12 IQR = Q 3 Q 1 min = Q 0% max = Q 100% range =max min Eksempel 1.6 Flagermus på jagt Ordnede data: Nedre kvartil: Q 1 = 34 Median: Q 2 = 45 Øvre kvartil: Q 3 = 62 Hvis Q q ligger mellem to dataværdier, defineres Q q som gennemsnittet af de to værdier. Eksempel 1.6 (fortsat) Flagermus på jagt (reducerede data) Ordnede data: Nedre kvartil: Q 1 = ( ) /2 = 33.5 Median: Q 2 = ( ) /2 = 43.5 Øvre kvartil: Q 3 = ( ) /2 = Variationsmål Varians s 2 : s 2 = 1 n 1 n (y i ȳ) 2 i=1 Eksempel 1.6 Flagermus på jagt Varians: s 2 = 1 [ ( ) 2 + ( ) ( ) 2] =
13 1.5 Box plots 13 Spredning (standardafvigelse): s = s 2 = 1 n (y i ȳ) 2. n 1 i=1 Eksempel 1.6 Flagermus på jagt Spredning: s = = Interquantile range IQR: IQR = Q 3 Q 1 Eksempel 1.6 Flagermus på jagt IQR = Q 3 Q 1 = = Box plots En simpel figur, som viser de vigtigste nøglestørrelser: Medianen Q 2 Nedre og øvre kvartiler, h.h.v. Q 1 og Q 3 Øvre og nedre adjacent values, defineret ved A + = den største værdi som er mindre end Q IQR (øvre hinge) A = den mindste værdi som er større end Q IQR (nedre hinge) Værdier som er uden for de to hinges kaldes outside values, og markeres ofte med.
14 1.5 Box plots 14 Figur 1.11: Flagermus på jagt Figur 1.12: Fraværende studerende.
15 1.6 Sammenhængsmål 15 Figur 1.13: Afvigelser på standardvægt. Outliers: Særligt store eller særligt små værdier, som ikke passer med resten af data. Outside values regnes ofte for at være muligt outliers. Om det er tilfældet, afhænger af, hvor grelle de er, og om de i øvrigt er specielle. 1.6 Sammenhængsmål Givet et variabelpar (x,y). n par af data: (x 1,y 1 ),...,(x n,y n ), målt på (x,y). Hvor stærkt (linært) afhængige er de to variable x og y, bedømt ud fra data? Kovarians mellem x og y: c = c xy = 1 n 1 n (x i x) (y i ȳ). i=1 Gennemsnitlig grad af ko-variation mellem x og y, dvs. hvor meget de varierer sammen (co-vary). Korrelation (Pearsons korrelationskoefficient): r = r xy = 1 n 1 n i=1 Mål for associationen mellem x og y. (x i x) (y i ȳ) s x s y = 1 n 1 n ( )( ) xi x yi ȳ. i=1 s x s y
16 1.6 Sammenhængsmål 16 Bemærk: Mulige værdier: r [ 1,1] Fortegn: Positiv korrelation hvis r > 0. Negativ korrelation hvis r < 0. Styrke: Stærk korrelation hvis r stor, dvs. tæt ved 1. Svag korrelation hvis r lille, dvs. tæt ved 0. Eksakt lineær sammenhæng hvis r = 1. Ingen lineær sammenhæng hvis r = 0. Eksempler: Isforbrug og temperatur: r = Lineær regression Den lineære sammenhæng mellem x og y kan beskrives ved lineær regression. Vi taler om regression af y på x, dvs. vi forklarer y s variation ved x s variation. Sammenhængen er givet ved regressionslinien. For givne værdier af x, ȳ, s x og c xy er linien y = ȳ + b(x x), hvor hældningen b er defineret ved Det forudsættes at s 2 x > 0. b = c xy s 2. x
17 1.6 Sammenhængsmål 17 Figur 1.14: Isforbrug og temperatur, med ret linie indlagt.
Beskrivende statistik
Beskrivende statistik Stikprøve af størrelse n for variablen x: x 1, x 2,, x n Beskriv fordelingen af data med nogle få talstørrelser. Centralt mål: en værdi som data er centreret om. Variationsmål: mål
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Læs mereKvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereModul 6: Regression og kalibrering
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................
Læs mereModul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereLøsninger til kapitel 1
Opgave. a) observation hyppighed frekvens kum. frekvens 2,25,25 3,875,325 2 3,875,5 3 3,875,6875 4,625,75 5,625,825 6,,825 7 2,25,9375 8,,9375 9,625, Frekvenser illustreres i et pindediagram,2,8,6,4,2,,8,6,4,2
Læs mereKapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereBinomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereBilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereDeskriptiv statistik for hf-matc
Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...
Læs mereDeskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereVIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning
Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereDeskriptiv statistik for matc i stx og hf
Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj / juni 2014 Institution Campus Vejle Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C Lene Thygesen
Læs mereBilledbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS
Læs mereOversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information
Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereForelæsning 1: Intro og beskrivende statistik
Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Kontinuerte fordelinger Ventetider i en Poissonproces Beskrivelse af kontinuerte fordelinger: - Median og kvartiler - Middelværdi - Varians Simultane fordelinger 1 Ventetider i en Poissonproces
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin aug-juni 10/11 Institution Campus Vejle Handelsgymnasie Uddannelse Fag og niveau Lærer(e) Hold HHX Statistik
Læs mereIndblik i statistik - for samfundsvidenskab
Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik
Læs mereStatistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Læs mereModul 12: Regression og korrelation
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................
Læs mereSkriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl
Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl. 9.00 12.00 IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt. Opgavesættet består af 5
Læs mereStatistik. Introduktion Deskriptiv statistik Sandsynslighedregning
Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereKapitel 3 Centraltendens og spredning
Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling
Læs mereEt eksempel på en todimensional normalfordeling Anders Milhøj September 2006
Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs merePerspektiver i Matematik-Økonomi: Linær regression
Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: jlj@imf.au.dk Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem
Læs mereStatistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mere2011.09.20 lth@campus.dk
2011.09.20 lth@campus.dk Intro Læseplan Beskrivende Statistik Sandsynligheder Ordet kommer fra Latin.: statisticum (statsrådgiver) Italiensk.: statistica (statsmand / politiker) Hvorfor statistik? Træk
Læs mereModul 12: Exercises. 12.1 Sukkersygepatienters vægt
Modul 12: Exercises 12.1 Sukkersygepatienters vægt............... 1 12.2 Newfoundlandske kvinders blodtryk.......... 4 12.3 Korrelationskoefficient.................. 6 12.4 Højde og vægt......................
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereTeoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.
Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt
Læs merebrikkerne til regning & matematik statistik preben bernitt
brikkerne til regning & matematik statistik 2+ preben bernitt brikkerne til regning & matematik statistik 2+ 1. udgave som E-bog ISBN: 978-87-92488-33-6 2009 by bernitt-matematik.dk Kopiering af denne
Læs mereOpgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)
Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i
Læs mere2 Populationer. 2.1 Virkelige populationer
2 Populationer I en statistisk sammenhæng er en population en samling af elementer, fx personer, virksomheder, lande, kunder eller mere abstrakte objekter. Fra en population kan man udtage en stikprøve.
Læs mereSupplerende opgaver til TRIP s matematiske GRUNDBOG. Forlaget TRIP. Opgaverne må frit benyttes i undervisningen.
48-50. Side 1 af 7 Statistik og sandsynlighedsregning ( 48-50) Opgaverne med svar starter på side 5, og deres numre har et s efter nummeret. Deres nummerering starter forfra. Svarene står fra side 6 med
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mereØvelser til basalkursus, 2. uge
Øvelser til basalkursus, 2. uge Opgave 1 Vi betragter igen Sundby95-materialet, og skal nu forbedre nogle af de ting, vi gjorde sidste gang. 1. Gå ind i ANALYST vha. Solutions/Analysis/Analyst. 2. Filen
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Sommer 2015 Institution Campus vejle Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C MIHY (Michael
Læs mereAntal timer 19 5 7 10 0 6 6 3 7 6 4 14 6 5 12 10 Køn k m k m m k m k m k k k m k k k
Statistik 5 Statistik er en meget omfattende matematisk disciplin, og den anvendes i meget stor udstrækning i vores moderne samfund. Den handler om at analysere et (ofte meget stort) talmateriale. Det
Læs mereForelæsning 2: Kapitel 4, Diskrete fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs merefor gymnasiet og hf 2017 Karsten Juul
for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen
Læs mereStatistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning
Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj juni 2011 Institution Campus Vejle Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C Jarl Mølgaard
Læs merec. Radius for hver sekter er målt i cm og angivet i følgende tabel. Desuden er arealet af hvert område beregnet.
Kapitel 2 Øvelse 2.2 Cirklen er inddelt i 12 sektorer, én for hver måned. Antallet af dødsfald vokser kraftigt i juli og august og er højt flere måneder, men stiger yderligere hen over vintermånederne.
Læs mereKvadratisk regression
Kvadratisk regression Helle Sørensen Institut for Matematiske Fag Københavns Universitet Juli 2011 I kapitlet om lineær regression blev det vist hvordan man kan modellere en lineær sammenhæng mellem to
Læs mereStatistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen
Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager
Læs mereModule 1: Data og Statistik
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 1: Data og Statistik 1.1 Hvad er statistik?................................... 1 1.2 Datatyper.......................................
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj/juni 2016 Institution Campus vejle Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C Jørn Ole Spedtsberg
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mereOversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen
Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereLars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereStudieplan. Stamoplysninger. Oversigt over planlagte undervisningsforløb. Periode November Maj 2018 Institution Vejen Business College
Studieplan Stamoplysninger Periode November 2017 - Maj 2018 Institution Vejen Business College Uddannelse Fag og niveau Lærer(e) Hold Hhx Matematik-B Sabine Lindemann Petersen MatematikB-hh1117-EF1718-AFS/VØ
Læs mereEx µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:
Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:
Læs mereStatistik. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer.
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Læs mereBilag 2: Undersøgelse af de nationale tests reliabilitet. Sammenfatning
Bilag 2: Undersøgelse af de nationale tests reliabilitet Sammenfatning I efteråret 2014 blev der i alt gennemført ca. 485.000 frivillige nationale tests. 296.000 deltog i de frivillige test, heraf deltog
Læs mereStatistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Læs mereStatistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22
Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: kkb@math.aau.dk
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Juni 2019 Institution Videndjurs - Handelsgymnasium Grenaa Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik
Læs mereTo samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Læs mereStatistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Sommer 2015 Institution Campus vejle Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C PEJE (Pernille
Læs mereFagplan for statistik, efteråret 2015
Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat
Læs mereModul 2: Sandsynlighedsmodeller og diskrete stokastiske variable
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable 2.1 Sandsynlighedsbegrebet............................... 1 2.1.1
Læs mereOvenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.
Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder
Læs mereStatistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning
Side 1 af 6 Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,
Læs mere5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14
Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5
Læs mereGrupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)
Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Til Gribskovløbet 006 gennemførte 118 kvinder 1,4 km distancen. Fordelingen af kvindernes løbstider
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs merefor gymnasiet og hf 2016 Karsten Juul
for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Institution Uddannelse Fag og niveau Lærer Hold IBC Aabenraa HHX Matematik C Lars Erik Henriksen 1HHI 1 Funktioner og polynomier a) Lave en grafisk funktionsanalyse. 1. Definitionsmængde.
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærer: Jørgen Holm Petersen Øvelseslærere: Signe, Helene, Marie, Amalie Databehandling: SPSS Eksamen: Ugeopgave efterfulgt
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mere6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)
Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen:
Læs mereUndervisningsplan. Stamoplysninger til brug ved prøver til gymnasiale uddannelser. Oversigt over planlagte undervisningsforløb
Undervisningsplan Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Skoleåret 2016-2017 Institution Svendborg Erhvervsskole Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C Ole
Læs mereKvantitative Metoder 1 - Efterår Dagens program
Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler
Læs mereHuskeliste Printark. U4 Tastetider U5 Hvor hurtigt regner du? E4 Begreber og fagord - Statistik. Materialer. Mobiltelefon Stopur
Statistik - Lærervejledning Om kapitlet I dette kapitel om statistik skal eleverne arbejde med statistik og lære at indsamle, beskrive, bearbejde og præsentere store mængder af tal og data. I kapitlet
Læs mereUndervisningsbeskrivelse
Undervisningsbeskrivelse Termin Oktober-december 2014 Institution Niels Brock Uddannelse Fag og niveau Lærer Hold HHX Matematik - Niveau B Peter Harremoës GSK hold: k12gymabu1n2 Oversigt over gennemførte
Læs mere