Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
|
|
- Finn Graversen
- 7 år siden
- Visninger:
Transkript
1 Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1
2 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable: Simpel eller multipel lineær regression. Undersøge forskellen i middelværdi for to grupper Denne gang: Sammenligne middelværdier i mere end to grupper Metode: Variansanalyse (ANalysis Of VAriance) Eksempel: Er der forskel i middelløn for tre grupper 2
3 Eksempel: Politisk Ideologi Hver af 943 personer har angivet: Parti Demokrat, Uafh., Republikaner Politisk ideologi Heltal fra 1 til 7 Opsummering af data: SPSS: Analyze Compare Means Means SPSS: Chart builder: Histogram + Groups/Point ID Rows panel variable 3
4 ANOVA: Setup Vi har g grupper Dvs. hvis vi vil sammenligne tre grupper, så er g = 3 De g grupper har middelværdierne µ 1, µ 2,, µ g Dvs. µ 1 er middelværdi for gruppe 1, osv. Variansanalyse er et F-test af H 0 : µ 1 = µ 2 = µ g (ens middelværdier) H a : Mindst en middelværdi skiller sig ud 4
5 Antagelser Antagelser for at F-testet i ANOVA er gyldigt: Hver af de g grupper er normalfordelte Samme standardafvigelsen, σ, for alle grupper De g stikprøver er uafhængige σ µ 1 µ 2 µ
6 Hypotese og Fortolkning Variansanalyse er et F-test af H 0 : µ 1 = µ 2 = = µ g (ens middelværdier) H a : Mindst en middelværdi skiller sig ud Fortolkning: Hypoteserne har følgende fortolkning H 0 : Ingen effekt af den forklarende variabel H a : Den forklarende variabel har en effekt Hvis vi afviser H 0, så kan årsagen fx være at Én gruppe skiller sig ud Alle grupper har forskellige middelværdier 6
7 Mærkeligt navn Hvorfor hedder det variansanalyse, når det handler om at sammenligne middelværdier??? Case 1 Case 2 Case 1: Tydelig forskel i middelværdi! Case 2: Ikke så tydeligt De tre middelværdier er de samme i begge cases!! Forskellen: Vi sammenligner variationen af middelværdien med variationen i hver af de tre grupper. Derfor hedder det variansanalyse 7
8 F-testet: Forhold af variansestimater Notation: gennemsnittet i i te gruppe gennemsnittet af alle data F-teststørrelsen er Variansestimater: Between-groups: Baseret på variationen i erne (omkr. ). y i y F = Between - groups variansestimat Within - groups variansestimat Er et unbiased estimat af σ 2, hvis H 0 er sand. Within-groups: Baseret på variationen i grupperne. Er altid et unbiased estimat af σ 2! Hvis H 0 er falsk, har F tendens til at være stor. y i y 8
9 Illustration af middelværdier Alt data slået sammen Data inddelt efter flytype y 1 y y 2 y 3
10 Eksempel: Politisk Ideologi Hver af 943 personer har angivet: Parti Demokrat, Uafh., Republikaner Politisk ideologi Heltal fra 1 til 7 Opsummering af data: SPSS: Analyze Compare Means Means SPSS: Chart builder: Histogram + Groups/Point ID Rows panel variable 10
11 Eksempel SPSS: Analyze Comapre Means One- Way ANOVA H 0 afvises der er en forskel i middelværdierne. 42,691 Between-Groups variansestimat F = = 25, 547 1,671 P-værdi Within-Groups variansestimat F = 25,547 11
12 Variansanalyse og Regression Vi kan formulere en variansanalyse som en multipel lineær regression! Det kræver vi indfører såkaldte dummy-variable. Eksempel: Vi har g = 3 grupper Vi indfører to dummy variable z 1 og z 2, der indikerer om en observation tilhører hhv. gruppe 1 eller 2. Obs. grp. z 1 = z 2 = Dvs. for en observation fra gruppe 2 har vi z 1 = 0 og z 2 = 1. 12
13 Regressionsmodel Vi kan nu formulere en multipel lineær regressionsmodel: E[y] = α + β 1 z 1 + β 2 z 2 For gruppe 1 har vi z 1 = 1 og z 2 = 0 dvs. E[y] = α + β β 2 0 = α + β 1 = µ 1 For gruppe 2 har vi z 1 = 0 og z 2 = 1 dvs. E[y] = α + β β 2 1 = α + β 2 = µ 2 For gruppe 3 har vi z 1 = 0 og z 2 = 0 dvs. E[y] = α + β β 2 0 = α = µ 3 13
14 Fortolkning Vi kan nu formulere en multipel lineær regressionsmodel: E[y] = α + β 1 z 1 + β 2 z 2 Gruppe z 1 = z 2 = Middelv. for y Fortolkning af β µ 1 = α + β 1 β 1 = µ 1 µ µ 2 = α + β 2 β 2 = µ 2 µ µ 3 = α α kan fortolkes som middelværdien for gruppe 3 (referencegruppen) β 1 og β 2 kan fortolkes som forskelle i middelværdien for hhv. gruppe 1 og 2 i forhold til referencegruppen (gruppe 3) 14
15 Estimation SPSS: Analyze General Linear Model Univariate Under options vælg Parameter estimates Output: a b 1 b 2 Estimerede model: yˆ = z z Dvs. den estimerede middelværdi for gruppe 1 er: = =
16 Hypotesetest i Regressionsmodel I multipel lineær regression udførte vi et F-test af hypotesen: H 0 : β 1 = β 2 = 0 H a : mindst et β j 0 Fortolkningen af H 0 : Alle grupper har samme middelværdi. Det svarer præcist til F-testet i ANOVA H 0 : µ 1 = µ 2 = µ 3 H a : Mindst et µ j skiller sig ud. Dvs. der er intet tabt ved at bruge regressionsformuleringen. 16
17 Hypotesetest i SPSS SPSS: Analyze General Linear Model Univariate Bemærk: Resultat er præcist som når vi bruger One-Way ANOVA funktionen i SPSS. 17
18 Sammenligninger af mange middelværdier Antag vi har afvist H 0, dvs. middelværdierne er forskellige. Spørgsmål: Hvilken middelværdi skiller sig ud? Ide: Udregn konfidensintervaller for forskellen i middelværdi for alle par af middelværdier: Et konfidensinterval for µ i µ j er y i y j ± t α 1 2 s + n i 1 n j t har df = N g frihedsgrader. n i er antal observationer i i te gruppe. N er det totale antal observationer i de g grupper. 18
19 Eksempel Find et 95% konfidensinterval for forskellen i middel ideologi for demokrater og republikanere: Demokrater: y 1 = 3.82, n 1 = 340. Republikanere:, n 3 = 290. y 3 = % konfidensinterval for µ 3 µ 1 : y i y j ± t s 1 n i + 1 n j = ( 0.51; 0. 92) Dvs. vi er 95% sikre på at forskellen er mellem 0.51 og t =1.96, df =
20 Mange sammenligninger Har vi g = 10 grupper laver vi g(1-g)/2 = 45 parvise sammenligninger fx vha. 95% konfidensintervaller. Hvert konfidensinterval vil isoleret set indeholde den sande forskel med 95% sikkerhed. Derimod vil de 45 intervaller typisk ikke alle samtidigt indeholde den sande værdi med 95% sikkerhed! Løsning: Bonferroni sammenligning Antag vi har g = 4 grupper, dvs. 6 sammenligninger. I stedet for (1 α)100% = 95% konfidensintervaller (α = 5%), så bruger vi (1 α/6)100% = 99.2% konfidensintervaller. Dette sikre at konfidensniveauet er mindst 95%. 20
21 Eksempel: Bonferroni Forskellen mellem demokrater og republikanere: g = 3, dvs. 3(3-1)/2 = 3 sammenligninger. Så vi skal bruge α = 0,05/3 = 0,017. y i y j 1 1 ± t s + = ( 0.47 ; 0.96) / 2 n n I SPSS vælger man Bonferroni under Post-hoc t 0.017/2 = 2.40, df = 940. i j 21
22 Eksempel: Bonferroni Bonferroni i SPSS: Vælges under Post Hoc 22
23 To-sidet Variansanalyse (Two-Way ANOVA) Indtil nu: Hvordan middelværdien for én kontinuert variabel (Ideologi) afhænger af én kategorisk variabel (Parti ID): Ensidet variansanalyse. Vi vil nu se på, hvordan én kontinuert variabel afhænger af to kategorisk variabel Eksempel: Ideologi forklaret ved Parti ID og køn SPSS: Compare Means Means Tilføj PartyID og Gender i hvert sit Layer 23
24 Mange middelværdier i spil I eksemplet er der 2 3 = 6 celler i spil, med hver deres middelværdi: Party ID Gender Democrat Independent Republican Female µ FD µ FI µ FR Male µ MD µ MI µ MD En to-sidet variansanalyse handler om at undersøge, hvordan de to forklarende variable (Party ID og Gender) påvirker disse middelværdier. Der er to slags effekter: Hovedeffekter: Isoleret effekten af en forklarende variabel Vekselvirkningseffekt: Effekten af en variabel påvirkes af en anden variabel. 24
25 ANOVA model uden vekselvirkning Fortolkninger: 1. Effekten af køn er den samme for alle Parti ID 2. Effekten af Parti ID er den samme for begge køn. Ideologi Mand Kvinde Demokrat Uafh. Republikaner Parti ID
26 ANOVA kun med hovedeffekt A Fortolkning: Kun hovedeffekt A (Parti ID) har en betydning for Ideologi. Ideologi Mand/ Kvinde Demokrat Uafh. Republikaner Parti ID
27 ANOVA kun med hovedeffekt B Fortolkning: Kun hovedeffekt B (Køn) har en betydning for Ideologi. Ideologi Mand Kvinde Demokrat Uafh. Republikaner Parti ID
28 ANOVA model med vekselvirkning Fortolkning: Effekten af Parti ID afhænger af køn (og omvendt) Ideologi Kvinde Mand Demokrat Uafh. Republikaner Parti ID
29 For data ser det sådan ud Ikke meget tegn på vekselvirkning Ikke meget tegn på effekt af køn En svag effekt af Party ID 29
30 Hypoteser og Antagelser Antagelser: Observationerne i hver celle er normalfordelte Standardafvigelsen er konstant på tværs af celler Vi tester hypoteser på formen H 0 : Ingen effekt af prediktor (=forklarene variabel) H a : Der er en effekt af prediktor Generelt: Antag vi har to prediktore, A og B: Vi vil teste Hovedeffekten af prediktor A Hovedeffekten af prediktor B Vekselvirkningseffekten ml. A og B. 30
31 Analyse-Strategi Slagplanen minder om den for multipel lineær regression: Først tester vi effekten af vekselvirkningen. Er vekselvirkningen signifikant, så tester vi ikke mere. Det giver ikke mening at teste hovedeffekter, hvis der er en vekselvirkning. Er vekselvirkningen ikke signifikant, så fjerner vi den fra modellen og tester de to tilbageværende hovedeffekter. 31
32 Hypoteser og Antagelser Vi tester altså hypoteser på formen H 0 : Ingen effekt af prediktor H a : Der er en effekt af prediktor Teststørrelsen er generelt på formen Mean square for prediktor F = Mean square error Generelt gælder der at Mean square = Sum of squares SPSS finder Sum of Squares og antal frihedsgrader (df). df 32
33 Eksempel: Model uden Vekselvirkning I SPSS er vekselvirkning tager med pr. default, så det skal der gøres noget ved. Vælg Custom model. Vælg Main effects Overfør de to factors 33
34 SPSS: Resultat H 0 : Ingen effekt af køn vs H a : Der er en effekt af køn Teststørrelse F = = Konklusion: Da P-værdien > 0.05 kan vi ikke afvise H 0. Igen effekt af køn. F = P-værdi 34
35 Test af vekselvirkning Vi spoler lige et trin tilbage. Antag at vi også inkluderer vekselvirkning i modellen: Enten skal man sikre sig at Full factorial er valgt: Alternativt kan man selv angive modellen med vekselvirkning: Marker både partyid og gender, vælg Interaction og før over. Vigtigt: Det er vigtig at man først overfører hovedeffekterne og derefter vekselvirkningseffketer: 35
36 SPSS: Resultat H 0 : Ingen effekt af vekselvirkning Teststørrelse F = = Konklusion: Da P-værdien > 0.05 kan vi ikke afvise H 0. Igen vekselv. effekt. F = P-værdi 36
37 To-sidet variansanalyse og Regression Først skal vi definere to sæt dummy-variable: For Parti ID har vi to: p 1 og p 2 For Køn har vi en: s Party ID p 1 = p 2 = Democrat 1 0 Independent 0 1 Republican 0 0 Gender s = Female 1 Male 0 To-sidet variansanalysemodel uden vekselvirkning: E [ y] = α + β p + β p + β s 37
38 Fortolkning Fortolkning af modellen: E [ y] = α + β p + β p + β s Tabel over middelværdier ifølge modellen: E[y]= Demokrat p 1 =1 p 2 =0 Uafh. p 1 =0 p 2 =1 Republikaner p 1 =0 p 2 =0 Kvinde s = 1 α+β 1 +β 3 α+β 2 +β 3 α+β 3 Mand s = 0 α+β 1 α+β 2 α Bemærk: β 1 og β 2 angiver effekten af at være hhv. Demokrat og Uafh. i forhold til at være Republikaner (referencen). Effekten af Parti ID den samme for begge køn. β 3 angiver effekt af Kvinde i forhold til Mand. 38
39 Estimation Fra SPSS får vi: Estimerede model: ˆ 1 2 y = p p s Effekten af at være Demokrat eller Uafh. i forhold til at være Republikaner er negativ. Effekten af Kvinde er negativ (i forhold til Mand). 39
40 Model med vekselvirkning To-sidet variansanalyse med vekselvirkning: E[ y] = α + β1z1 + β2z2 + β3s + β4z1s + β5z2s Som i multipel lineær regression er vekselvirkning opnået ved at gange de to variable sammen. E[y]= Demokrat p 1 =1 p 2 =0 Uafh. p 1 =0 p 2 =1 Republikaner p 1 =0 p 2 =0 Kvinde s = 1 α+β 1 +β 3 +β 4 α+β 2 +β 3 +β 5 α+β 3 Mand s = 0 α+β 1 α+β 2 α Bemærk at vi har 6 parametre og 6 celler. Det er muligt med denne model frit at tildele hver celle en middelværdi uafhængigt af de andre celler. Man kalder sådan en model mættet det er ikke muligt at gøre den mere kompliceret. 40
41 Estimation Den estimerede model: yˆ = p p s p1 s p2 s 41
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereStatistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Læs mereStatistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereSidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion
VARIANSANALYSE 2 Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: (Analysis of variance) med interaktion Problem: Hvordan håndterer vi forsøg, hvor effekten er forårsaget af to faktorer og en evt.
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereModule 12: Mere om variansanalyse
Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........
Læs mere1 Multipel lineær regression
1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereTo-sidet varians analyse
To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mere1 Multipel lineær regression
Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereIndhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9
Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................
Læs mereAnvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereStatistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereIkke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereModule 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Læs mereTo-sidet variansanalyse
Program 1. To-sidet variansanalyse 2. Hierarkisk princip 3. Tre (og flere) sidet variansanalyse 4. Variansanalyse med blocking 5. Flersidet variansanalyse med tilfældige faktorer 6. En oversigtsslide til
Læs mereReeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereMPH specialmodul Epidemiologi og Biostatistik
MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:
Læs mereProgram: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereProgram. 1. Flersidet variansanalyse 1/11
Program 1. Flersidet variansanalyse 1/11 To-sidet variansanalyse Eksempel: (opgave 14.2 side 587) vitamin indhold i frossen juice målt for ialt 9 kombinationer af mærke (Rich food, Sealed-sweet, Minute
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereProgram. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12
Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereProgram. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren
Faculty of Life Sciences Program Sammenligning af grupper Ensidet ANOVA Claus Ekstrøm E-mail: ekstrom@life.ku.dk Sammenligning af to grupper: tre eksempler Sammenligning af mere end to grupper: ensidet
Læs mereReminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereØkonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater
Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi
Læs mereØkonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion
Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mereØkonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereModul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereMultipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).
Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereProgram. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al
Program Tosidet variansanalyse og forsøgsplanlægning Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Ensidet ANOVA: repetition og Collinge eksempel. Additiv tosidet ANOVA (blokforsøg) Tosidet ANOVA
Læs mereβ = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1
Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede
Læs mereHvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller
Hvad skal vi lave? 1 Kovariansanalyse Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning 2 Sammenligning af modeller 3 Mere generelle modeller PSE (I17) ASTA - 14. lektion
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereResumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereKursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereUge 13 referat hold 4
Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs mereNote om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Læs mereForelæsning 11: Envejs variansanalyse, ANOVA
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mereModule 3: Statistiske modeller
Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med
Læs mereSimpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereOversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen
Kursus 02402/02323 Introducerende Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Oversigt 1 Intro: Regneeksempel og TV-data fra B&O 2 Model og hypotese Per Bruun Brockhoff DTU Compute, Statistik
Læs mereMorten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Læs mereØkonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1
Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereProgram. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper
Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet
Læs mereMultipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model
Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ
Læs merek normalfordelte observationsrækker (ensidet variansanalyse)
k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er
Læs mereSide 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402
Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/33
Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,
Læs mereHypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j
Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!
Læs mereBesvarelse af vitcap -opgaven
Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.
Læs mereForsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mere