Modul 1: Beskrivende dataanalyse
|
|
|
- Caspar Tobias Steensen
- 9 år siden
- Visninger:
Transkript
1 Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 1: Beskrivende dataanalyse 1.1 Statistik og dataanalyse Variable og data Typer af variable Grafiske metoder til at vise data Vurdering af grafer Nøglestørrelser for numeriske variable Positionsmål Variationsmål Box plots Sammenhængsmål Statistik og dataanalyse In God we trust, all others must bring data. W. Edwards Deming Data = systematisk indsamlet information. Eksempler: 1. Massefylden af vand ved 10 givne temperaturer. 2. Koncentrationen af HCl i 15 prøver fra en industriel produktion. 3. De første 300,000 primtal. 4. En algoritmes tidsforbrug for 75 forskellige inddata. 5. Den daglige dollarkurs i Vanddybden i 25 søer på Fyn. 7. Massespektret for 27 proteinprøver. Statistik = at indsamle, fortolke og analysere data. Eksempler på statistiske problemstillinger: 1. Hvordan afhænger vands massefylde af temperaturen?
2 1.2 Variable og data 2 2. Hvordan fordeler koncentrationen af HCl sig langs tromlen? 3. Hvordan kan man beskrive den asymptotiske fordelingen af primtallene på aksen? 4. For hvilken type inddata er algoritmen bedst? 5. Hvorledes opfører de daglige fluktuationer af dollarkursen sig? 6. Hvor mange dybe søer er der på Fyn? 7. Hvad siger massespektret om proteinsammensætningen? Variationskilder = hvor kommer variationen fra? Nogle eksempler: 1. Massefylden afhænger af temperaturen. 2. Koncentrationen af HCl aftager i procesretningen. 3. Spiller tilfældigheder ind på fordelingen af primtallene? 4. Algoritmen er robust over for komplexiteten af input. 5. Dollarkursen svinger tilfældigt fra dag til dag. 6. De dybe søer er formet af istiden. 7. Der er forskel på en ondartet og en godartet knude. To typer variationskilder: Systematisk variation. Hvordan måles den? Tilfældig variation. Hvordan måles den? 1.2 Variable og data Variable: betegnelsen for det man registrerer (måler, tæller, observerer,...) fx højde, længde, køn, styrke, vægtforskel, koncentration, farve, vindretning,... Data: de faktiske målinger, observationer,... fx 198 cm, 0.05 mm, kvinde, 42 p.s.i., 45kg, 3%, blå, sydøst...
3 1.3 Grafiske metoder til at vise data 3 Bemærk: I dette kursus bruger vi engelsk decimalpunktum i stedet for komma! Eksempel 1.1 Standardvægt Tidligere havde United States National Bureau of Standards en standardvægt på 10g. For at sikre sig at vægten var tilregnelig, vejedes den jævnligt. 100 målinger resulterede i: g, g, g,..., g. Eksempel 1.2 Studerendes fravær I et kursus med 28 forelæsninger, blev fraværet af hver af de 203 studerende noteret: 2, 3, 2,..., 4, 1. Eksempel 1.3 Isforbrug og temperatur Isforbruget per inbygger (i pints per dag) blev målt i forskellige områder af USA om sommeren. Desuden blev, for hver måling af isforbrug, gennemsnitstemperaturen noteret (bl.a.): Isforbrug (pints): Temperatur (Fahrenheit): Typer af variable Variabeltyper: Kvalitative (fx køn, farve, hvorvidt man lider af en bestemt sygdom,...) Dvs. klasseopdeling, skal være entydig. Kvantitative Diskret (fx antal biler i husstand, antal tropenætter i juli, antal fejl i en test,...) Kontinuert (fx længde, højde, vægt, styrke, koncentration,...) 1.3 Grafiske metoder til at vise data Søjlediagram (kun for diskrete variable): 1. En søjle for hver mulige/relevante værdi af variabel. 2. Søjlehøjde = antal data med pågældende værdi.
4 1.3 Grafiske metoder til at vise data 4 Tæthedsdiagram: del søjlehøjderne med det totale antal data. Figur 1.1: Fraværende Studerende. Histogram for kontinuert variabel. Frekvenshistogram: 1. Del det mulige/relevante interval op i et antal lige store intervaller. 2. Søjlehøjde = antal data i pågældende interval. 3. Søjlerne skal hænge sammen. Tæthedshistogram (standard): 1. Del det mulige/relevante interval op i et antal intervaller. 2. Søjlehøjde = antal data i pågældende interval delt med samlet antal data og med intervallængden. 3. Søjlerne skal hænge sammen. Areal under kurven = 1. Kan håndtere varierende intervallængde. 4. Bemærk: Grafen afhænger i høj grad af den valgte intervalopdeling!
5 1.3 Grafiske metoder til at vise data 5 Figur 1.2: Standardvægt 1. Figur 1.3: Standardvægt 2 (andet startpunkt).
6 1.3 Grafiske metoder til at vise data 6 Figur 1.4: Standardvægt 3 (mindre intervallængde). Figur 1.5: Standardvægt 4 (mindste intervallængde). Scatterplot: (for to (sædvanligvis) kontinuerte variable) 1. Tegn samhørende punkter (x,y) ind i diagram.
7 1.3 Grafiske metoder til at vise data 7 Figur 1.6: Isforbrug og temperatur Vurdering af grafer Søjlediagram/histogram: Hvor mange data danner baggrund for grafen? Er grafen fornuftig? er intervalopdelingen for grov/fin? er endepunkterne for intervallerne valgt fornuftigt? Er grafen som forventet? stemmer den overens med din forhåndsviden? hvordan afviger grafen fra forventningen? hvorfor? Er grafen pæn? symmetrisk/skæv? lige/ujævn? et eller flere toppunkter (modus er)? er der outliers? Scatterplot:
8 1.3 Grafiske metoder til at vise data 8 Figur 1.7: Isforbrug og temperatur 2. Er der sammenhæng mellem de to variable? lineær/ikke-lineær? følger de hinanden tæt? er de positivt/negativt korrelerede? er der outliers? Eksempel 1.4 Anoreksibehandling I en engelsk undersøgelse blev unge anoreksiramte piger behandlet med cognitiv terapi. Forskellen i vægt før og efter behandling blev målt i pund (lb). Figur 1.8: Vægtforøgelse efter terapi.
9 1.4 Nøglestørrelser for numeriske variable 9 Eksempel 1.5 Papirstyrke Styrken (p.s.i.) blev målt for forskellige partier af Kraft Paper (kraftigt indpakningspapir). For hvert parti er også angivet andelen af hårdt træ i papirmassen. Figur 1.9: Papirstyrke. 1.4 Nøglestørrelser for numeriske variable Beskriv fordelingen af givne data med nogle få talstørrelser: Position hvor på aksen er vi? (systematikken) Variation hvor store er de tilfældige udsving? Sammenhængen mellem to variable. Generel betegnelse for data fra variablen y: n = antal data. y 1,y 2,...,y n Eksempel 1.6 Flagermus på jagt Når flagermus jager, udsender de højfrekvente lyde og bruger ekkoet af lyden til at finde byttet. Data angiver afstanden (i cm) mellem flagermus og byttedyret, når flagermusen opdager byttet
10 1.4 Nøglestørrelser for numeriske variable 10 Figur 1.10: Afstand mellem flagermus og bytte Positionsmål Middelværdi ȳ: Gennemsnit ȳ = 1 n n y i. i=1 Eksempel 1.6 Flagermus på jagt Middelværdi: ȳ = ( )/11 = Median Q 2 : Midterste værdi Stil data op i rækkefølge y (1) y (2) y (n) Hvis n ulige: Q 2 = y ((n+1)/2) Hvis n lige: Q 2 = y (n/2) + y (n/2+1). 2 Eksempel 1.6 Flagermus på jagt Ordnede data:
11 1.4 Nøglestørrelser for numeriske variable 11 Median: Q 2 = 45 Typetal (modus): Mest typiske værdi/interval Værdi som flest data antager (diskret variabel) Midtpunkt i intervalstykke med flest data (kontinuert variabel) Bemærk: Modus bruges ofte om samtlige høje toppe i et diagram. Eksempel 1.6 Flagermus på jagt Data: Interval Frekvens Typetal: 45 Fordele og ulemper: Middelværdi: God at regne med, men påvirkes meget af outliers. Median: Påvirkes ikke af outliers, men er sværere at regne med. Typetal: Let at forklare, men varierer meget. Andre mål for position: Fraktil (percentil) for 0 q 1: et tal Q q så: mindst q 100% af data er Q q og mindst (1 q) 100% af data er Q q Kvartiler: Nedre (første) kvartil: Q 1 = Q 25% Median (anden kvartil): Q 2 = Q 50% Øvre (tredje) kvartil Q 3 = Q 75%
12 1.4 Nøglestørrelser for numeriske variable 12 IQR = Q 3 Q 1 min = Q 0% max = Q 100% range =max min Eksempel 1.6 Flagermus på jagt Ordnede data: Nedre kvartil: Q 1 = 34 Median: Q 2 = 45 Øvre kvartil: Q 3 = 62 Hvis Q q ligger mellem to dataværdier, defineres Q q som gennemsnittet af de to værdier. Eksempel 1.6 (fortsat) Flagermus på jagt (reducerede data) Ordnede data: Nedre kvartil: Q 1 = ( ) /2 = 33.5 Median: Q 2 = ( ) /2 = 43.5 Øvre kvartil: Q 3 = ( ) /2 = Variationsmål Varians s 2 : s 2 = 1 n 1 n (y i ȳ) 2 i=1 Eksempel 1.6 Flagermus på jagt Varians: s 2 = 1 [ ( ) 2 + ( ) ( ) 2] =
13 1.5 Box plots 13 Spredning (standardafvigelse): s = s 2 = 1 n (y i ȳ) 2. n 1 i=1 Eksempel 1.6 Flagermus på jagt Spredning: s = = Interquantile range IQR: IQR = Q 3 Q 1 Eksempel 1.6 Flagermus på jagt IQR = Q 3 Q 1 = = Box plots En simpel figur, som viser de vigtigste nøglestørrelser: Medianen Q 2 Nedre og øvre kvartiler, h.h.v. Q 1 og Q 3 Øvre og nedre adjacent values, defineret ved A + = den største værdi som er mindre end Q IQR (øvre hinge) A = den mindste værdi som er større end Q IQR (nedre hinge) Værdier som er uden for de to hinges kaldes outside values, og markeres ofte med.
14 1.5 Box plots 14 Figur 1.11: Flagermus på jagt Figur 1.12: Fraværende studerende.
15 1.6 Sammenhængsmål 15 Figur 1.13: Afvigelser på standardvægt. Outliers: Særligt store eller særligt små værdier, som ikke passer med resten af data. Outside values regnes ofte for at være muligt outliers. Om det er tilfældet, afhænger af, hvor grelle de er, og om de i øvrigt er specielle. 1.6 Sammenhængsmål Givet et variabelpar (x,y). n par af data: (x 1,y 1 ),...,(x n,y n ), målt på (x,y). Hvor stærkt (linært) afhængige er de to variable x og y, bedømt ud fra data? Kovarians mellem x og y: c = c xy = 1 n 1 n (x i x) (y i ȳ). i=1 Gennemsnitlig grad af ko-variation mellem x og y, dvs. hvor meget de varierer sammen (co-vary). Korrelation (Pearsons korrelationskoefficient): r = r xy = 1 n 1 n i=1 Mål for associationen mellem x og y. (x i x) (y i ȳ) s x s y = 1 n 1 n ( )( ) xi x yi ȳ. i=1 s x s y
16 1.6 Sammenhængsmål 16 Bemærk: Mulige værdier: r [ 1,1] Fortegn: Positiv korrelation hvis r > 0. Negativ korrelation hvis r < 0. Styrke: Stærk korrelation hvis r stor, dvs. tæt ved 1. Svag korrelation hvis r lille, dvs. tæt ved 0. Eksakt lineær sammenhæng hvis r = 1. Ingen lineær sammenhæng hvis r = 0. Eksempler: Isforbrug og temperatur: r = Lineær regression Den lineære sammenhæng mellem x og y kan beskrives ved lineær regression. Vi taler om regression af y på x, dvs. vi forklarer y s variation ved x s variation. Sammenhængen er givet ved regressionslinien. For givne værdier af x, ȳ, s x og c xy er linien y = ȳ + b(x x), hvor hældningen b er defineret ved Det forudsættes at s 2 x > 0. b = c xy s 2. x
17 1.6 Sammenhængsmål 17 Figur 1.14: Isforbrug og temperatur, med ret linie indlagt.
Beskrivende statistik
Beskrivende statistik Stikprøve af størrelse n for variablen x: x 1, x 2,, x n Beskriv fordelingen af data med nogle få talstørrelser. Centralt mål: en værdi som data er centreret om. Variationsmål: mål
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Kvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Modul 6: Regression og kalibrering
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................
Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Løsninger til kapitel 1
Opgave. a) observation hyppighed frekvens kum. frekvens 2,25,25 3,875,325 2 3,875,5 3 3,875,6875 4,625,75 5,625,825 6,,825 7 2,25,9375 8,,9375 9,625, Frekvenser illustreres i et pindediagram,2,8,6,4,2,,8,6,4,2
Kapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Løsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Deskriptiv statistik for hf-matc
Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...
Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium
Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,
Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Lineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Deskriptiv statistik for matc i stx og hf
Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede
Undervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Maj / juni 2014 Institution Campus Vejle Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C Lene Thygesen
Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)
; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS
Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information
Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Forelæsning 1: Intro og beskrivende statistik
Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby
Undervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin aug-juni 10/11 Institution Campus Vejle Handelsgymnasie Uddannelse Fag og niveau Lærer(e) Hold HHX Statistik
Indblik i statistik - for samfundsvidenskab
Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik
Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Modul 12: Regression og korrelation
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................
Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl
Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl. 9.00 12.00 IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt. Opgavesættet består af 5
Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning
Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:
Multipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Kapitel 3 Centraltendens og spredning
Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling
Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006
Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af
Anvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Perspektiver i Matematik-Økonomi: Linær regression
Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: [email protected] Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem
Statistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden
Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
brikkerne til regning & matematik statistik preben bernitt
brikkerne til regning & matematik statistik 2+ preben bernitt brikkerne til regning & matematik statistik 2+ 1. udgave som E-bog ISBN: 978-87-92488-33-6 2009 by bernitt-matematik.dk Kopiering af denne
2 Populationer. 2.1 Virkelige populationer
2 Populationer I en statistisk sammenhæng er en population en samling af elementer, fx personer, virksomheder, lande, kunder eller mere abstrakte objekter. Fra en population kan man udtage en stikprøve.
Supplerende opgaver til TRIP s matematiske GRUNDBOG. Forlaget TRIP. Opgaverne må frit benyttes i undervisningen.
48-50. Side 1 af 7 Statistik og sandsynlighedsregning ( 48-50) Opgaverne med svar starter på side 5, og deres numre har et s efter nummeret. Deres nummerering starter forfra. Svarene står fra side 6 med
Normalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Antal timer 19 5 7 10 0 6 6 3 7 6 4 14 6 5 12 10 Køn k m k m m k m k m k k k m k k k
Statistik 5 Statistik er en meget omfattende matematisk disciplin, og den anvendes i meget stor udstrækning i vores moderne samfund. Den handler om at analysere et (ofte meget stort) talmateriale. Det
Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable
Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
for gymnasiet og hf 2017 Karsten Juul
for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen
Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning
Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,
Kvadratisk regression
Kvadratisk regression Helle Sørensen Institut for Matematiske Fag Københavns Universitet Juli 2011 I kapitlet om lineær regression blev det vist hvordan man kan modellere en lineær sammenhæng mellem to
Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen
Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager
Module 1: Data og Statistik
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 1: Data og Statistik 1.1 Hvad er statistik?................................... 1 1.2 Datatyper.......................................
12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen
Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt
Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Statistik. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer.
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Bilag 2: Undersøgelse af de nationale tests reliabilitet. Sammenfatning
Bilag 2: Undersøgelse af de nationale tests reliabilitet Sammenfatning I efteråret 2014 blev der i alt gennemført ca. 485.000 frivillige nationale tests. 296.000 deltog i de frivillige test, heraf deltog
Statistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22
Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: [email protected]
To samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1
Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke
Undervisningsbeskrivelse
Undervisningsbeskrivelse Stamoplysninger til brug ved prøver til gymnasiale uddannelser Termin Sommer 2015 Institution Campus vejle Uddannelse Fag og niveau Lærer(e) Hold HHX Matematik C PEJE (Pernille
Fagplan for statistik, efteråret 2015
Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat
Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable 2.1 Sandsynlighedsbegrebet............................... 1 2.1.1
Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.
Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder
Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning
Side 1 af 6 Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,
Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)
Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Til Gribskovløbet 006 gennemførte 118 kvinder 1,4 km distancen. Fordelingen af kvindernes løbstider
Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
for gymnasiet og hf 2016 Karsten Juul
for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen
Undervisningsbeskrivelse
Undervisningsbeskrivelse Institution Uddannelse Fag og niveau Lærer Hold IBC Aabenraa HHX Matematik C Lars Erik Henriksen 1HHI 1 Funktioner og polynomier a) Lave en grafisk funktionsanalyse. 1. Definitionsmængde.
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærer: Jørgen Holm Petersen Øvelseslærere: Signe, Helene, Marie, Amalie Databehandling: SPSS Eksamen: Ugeopgave efterfulgt
1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)
Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen:
Huskeliste Printark. U4 Tastetider U5 Hvor hurtigt regner du? E4 Begreber og fagord - Statistik. Materialer. Mobiltelefon Stopur
Statistik - Lærervejledning Om kapitlet I dette kapitel om statistik skal eleverne arbejde med statistik og lære at indsamle, beskrive, bearbejde og præsentere store mængder af tal og data. I kapitlet
Undervisningsbeskrivelse
Undervisningsbeskrivelse Termin Oktober-december 2014 Institution Niels Brock Uddannelse Fag og niveau Lærer Hold HHX Matematik - Niveau B Peter Harremoës GSK hold: k12gymabu1n2 Oversigt over gennemførte
