Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
|
|
|
- Karen Ella Jensen
- 10 år siden
- Visninger:
Transkript
1 Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion Opsummering af statistiske modeller/eksempler Modelkontrol Prædiktion Slide 2 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Multiple sammenligninger Opgave 5.2: fosforkoncentration Lineær regression Hver gang vil laver et test er der risiko for at lave en fejl af type I. Risikoen afhænger af signifikansniveauet ofte 5%. Ved et test: risiko for fejl: 5% Ved m tests: m Probability No. of tests (m) Uge Forfor Statistisk model: fosfor i = α + β uge i + e i, R: model1 <- lm(fosfor ~uge) Slide 3 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 4 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion
2 Opgave 6.7: vægttilvækst hos kyllinger Opgave 6.1: drægtighed for heste Ensidet ANOVA Statistisk model: Feed type Weight gain gain i = α feed(i) + e i, R: model2 <- lm(gain~factor(feed)) Bemærk factor(feed)! En enkelt stikprøve Drægtighedstider for 13 heste: Statistisk model: gest i N(µ,σ 2 ) uafhængige Modellen kan også skrives: gest i = µ + e i, R: model3 <- lm(gest~1) Slide 5 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 6 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Alle modeller fosfor i = α + β uge i +e i, gain i = α feed(i) +e i, gest i = µ+e i, Variabeltyper: Responsvariabel, y: fosfor, gain, gest Forklarende variabel: age (kvantitativ), feed (faktor/kategorisk) Antagelser: Alle e i (eller y i ) er normalfordelte Middelværdien af y i afhænger evt. af en forklarende variabel Alle e i (eller y i ) har samme spredning e 1,...,e n (eller y 1,...,y n ) uafhængige Resumé 1: statistiske modeller og inferens Modellerne for lineær regression, ensidet variansanalyse og en enkelt stikprøve er i virkeligheden meget ens! Det er derfor den statistiske inferens også er den samme i de tre slags modeller (p er antallet af middelværdiparametre): middelværdiparametre estimeres med LS spredningen σ estimeres på samme måde Konfidensintervaller: estimat ± t 0.975,n p SE(estimat) Hypotesetest udføres som t-test eller F -test Modellerne kan udvides til at omfatte flere forklarende variable kvantitative variable og/eller faktorer. Lineære normale modeller: y i = middelværdi i + e i Slide 7 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 8 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion
3 Residualer Forventet værdi eller fittet værdi eller prædikteret værdi, ŷ i : ŷ i = fosfor i = ˆα + ˆβ x i ŷ i = ĝain i = ˆα g(i) ŷ i = ĝest i = ˆµ Residualer: r i = y i ŷ i = observeret fittet Residualerne er vores bedste gæt på e erne! Så ˆσ = s = 1 n p n i=1 ri 2 hvor p er antal middelværdiparametre (2, k, 1) residualerne kan bruges til modelkontrol! Residualer i R > model1 <- lm(fosfor~uge) ## Lineær regression > fit1 <- fitted(model1) ## Fittede værdier > res1 <- residuals(model1) ## Rå residualer > stdres1 <- rstandard(model1) ## Standard. residualer > model2 <- lm(gain~factor(feed)) > fit2 <- fitted(model2) > res2 <- residuals(model2) > stdres2 <- rstandard(model2) Og hvis du har isdals installeret > residualplot(model1) Residualerne kan standardiseres så de har spredning 1: r i = r i /SE(r i ). Slide 9 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 10 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Modelkontrol: hvorfor? Modelkontrol består i at kontrollere om modelantagelserne er rimelige for vores data. Hvorfor skal vi lave modelkontrol? Hvis antagelserne er ok, så indeholder 95%-CI populationsværdien med 95% sandsynlighed, og p-værdierne er korrekte. Vi kan stole på vores resultater! Hvis antagelserne ikke er ok, så ved vi ikke om vi kan stole på vores resultater! Antagelserne om e 1,...,e n kontrolleres vha. de standardiserede residualer r 1,..., r n. Modelkontrol: hvordan? Antagelser: 1. e i er normalfordelt 2. e i har middelværdi 0 uanset de forklarende variable 3. e i har samme spredning uanset de forklarende variable 4. e 1,...,e n uafhængige Hvordan? Uafhængighed er snarere et spørgsmål om eksperimentielt design Kontrollerer de tre første antagelser om e 1,...,e n vha. de standardiserede residualer r 1,..., r n Thorvald Nicolai Thiele, Man skal tegne før man kan regne Slide 11 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 12 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion
4 Plantevækst og fosfor: antagelse 1 Plantevækst og fosfor: antagelse 2 og 3 Sample Quantiles Normal Q Q Plot Theoretical Quantiles Antagelse 1. e i er normalfordelt: QQ-plot over r 1,..., r n Sammenlign med ret linie, med skæring 0 og hældning 1 Standardized residuals Fitted values Hvis man har installeret isdals kan man bruge residualplot(model) Antagelse 2. og 3. e i har middelværdi 0 og samme spredning Residualplot, r i mod ŷ i Ingen systematik i den lodrette variation Er det outliers, dvs. ekstreme observationer? ( r 1,..., r n har spredning 1) Slide 13 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 14 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Residualplot for to andre datasæt Residualanalyse for kyllingedata Andemad (eks. 2.4 og 6.2) Pillbugs/bænkebidere (case 2) QQ-plot Residualplot Std. residuals rstandard(model2) Sample Quantiles stdres Predicted values fitted(model2) Theoretical Quantiles fit2 Slide 15 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 16 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion
5 Antagelse 4: uafhængighed Resumé 2: modelkontrol Kan som regel ikke testes vha. data (residualer), men er snarere et spørgsmål om eksperimentets design. Observationerne må ikke dele information. Hvis en observation ligger højere end forventet, ændrer det så vores viden om hvorvidt de nogle af de øvrige observationer ligger højere/lavere end forventet? Eksempler på afhængige data: Data fra samme marker, samme personer, samme planter, etc. Data fra søskende, kuld,... Sommetider vil vi gerne have afhængighed men så skal der tages højde for det i modellen. Det er ekstremt vigtigt at at lave modelkontrol, for ellers ved vi ikke om vi kan stole på konfidensintervaller, p-værdier osv. Modelkontrol udføres først og fremmest grafisk, vha. residualplot og QQ-plot for standardiserede residualer. Især residualplottet er vigtigt! I residualplottet skal den lodrette variation være tilfældig. Må ikke være systematisk forskellige fra venstre til højre. Meget store standardiserede residualer svarer til ekstreme observationer eller outliers. Bør undersøges nærmere. I QQ-plottet skal punkterne som sædvanlig være spredt tilfældigt om en ret linie, her linien med skæring 0 og hældning 1. Er det rimeligt at antage uafhængighed? Slide 17 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 18 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Plantevækst og fosfor: prædiktion Plante bliver fulgt i 7 uger. Forventet forforkoncentration er α + β 7 der estimeres til ŷ = ˆα + ˆβ 7 = = med estimeret spredning (side 110) 1 (7 x)2 SE(ŷ 0 ) = s + = = n SS x 95%-konfidensinterval: ± = (0.2688; ) En plante på 7 uger får målt forfoskoncentrationen til Hvorfor kan vi ikke bruge konfidensintervallet til at afgøre om det er usædvanligt? Plantevækst og fosfor: prædiktion Konfidensintervallet udtaler sig om den forventede værdi ikke en ny observation. Konfidensintervallet tager kun hensyn til estimationfejlen ikke observationsfejlen. 95%-prædiktionsinterval: Plante på 7 uger: ŷ ± t 0.975,n 2 s n + (x 0 x) 2 SS x ŷ ± = (0.2377,0.3394) Er en fosforkoncentration på 0.25 usædvanlig for en plante på 7 uger? Slide 19 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 20 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion
6 Konfidensinterval vs. prædiktionsinterval Resumé 3: prædiktion Fatpct Age CI vs. PI: Fortolkning: forventet værdi eller ny observation PI altid bredere end CI CI kan gøres vilkåligt smalt ved at øge n, PI kan ikke Prædiktion i ensidet ANOVA og en enkelt stikprøve: se afsnit 7.2.3! Prædiktion handler om at forudsige nye observationer. 95%-prædiktionsintervallet indeholder med sandsynlighed 95% en ny observation for en given værdi af de(n) forklarende variabel. Et prædiktionsintervaller er altid bredere end det tilsvarende konfidensinterval fordi det ogå tager hensyn til observationsfejlen Kan ikke gøres vilkårligt smalle ved at øge n. Slide 21 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 22 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Resumé 1 3 Dagens hovedpunkter Modellerne for lineær regression, ensidet ANOVA og en enkelt stikprøve er samme suppe. Samme antagelser på nær specifikationen af middelværdien To typer forklarende variable: kvantitative og faktorer Statistisk inferens ens : LS-estimation, konfidensintervaller, test, prædiktion, modelkontrol Flere forklarende variable kan kobles på stadig samme modeltype og samme måde at lave statistisk inferens Modellerne er baseret på normalfordelingen pga. den centrale grænseværdisætning! Multiple sammenligninger hvorfor er det et problem, og hvad kan vi gøre ved det? Modelkontrol Analyse af standardiserede residualer hvad skal vi se efter? Prædiktion. Forskel på konfidens- og prædiktionsintervaller. Udregning. Slide 23 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 24 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion
7 Ordliste Engelsk explanatory variable independence response variable standardized residual outlier Dansk forklarende variabel uafhængighed responsvariabel standardiseret residual ekstrem observation Slide 25 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion
Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)
Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: [email protected] Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse
Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks
Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data
Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: [email protected] Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration
To samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Modelkontrol i Faktor Modeller
Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk
Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren
Faculty of Life Sciences Program Sammenligning af grupper Ensidet ANOVA Claus Ekstrøm E-mail: [email protected] Sammenligning af to grupper: tre eksempler Sammenligning af mere end to grupper: ensidet
Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot
Program Residualanalyse Flersidet variansanalyse Helle Sørensen Modelkontrol (residualanalyse) i tosidet ANOVA med vekselvirkning. Test og konklusion i tosidet ANOVA (repetition) Tresidet ANOVA: the works
Løsning til øvelsesopgaver dag 4 spg 5-9
Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for
Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie
Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................
Program. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer
Program Simpel og multipel lineær regression Helle Sørensen E-mail: [email protected] Simpel LR: repetition, konfidensintervaller, test, prædiktionsintervaller, mm. Multipel LR: estimation, valg af model,
Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper
Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: [email protected] I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet
Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie
Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: [email protected] I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:
Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: [email protected] I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Ensidet variansanalyse
Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: [email protected] StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger
Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
To-sidet variansanalyse
Program 1. To-sidet variansanalyse 2. Hierarkisk princip 3. Tre (og flere) sidet variansanalyse 4. Variansanalyse med blocking 5. Flersidet variansanalyse med tilfældige faktorer 6. En oversigtsslide til
Konfidensinterval for µ (σ kendt)
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)
Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Multipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne
Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne 5. undervisningsuge, onsdag
Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller
Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende
Note til styrkefunktionen
Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H
12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau
ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Statistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12
Program 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Dæktyper og brændstofforbrug Data fra opgave 10.43, side 360: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt
Basal statistik. 30. januar 2007
Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Modul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Statistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Module 12: Mere om variansanalyse
Mathematical Statistics ST06: Linear Models Bent Jørgensen og Pia Larsen Module 2: Mere om variansanalyse 2. Parreded observationer................................ 2.2 Faktor med 2 niveauer (0- variabel)........................
Module 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff
Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark
Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Modul 6: Regression og kalibrering
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................
Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Reeksamen i Statistik for Biokemikere 6. april 2009
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på
Module 9: Residualanalyse
Mathematical Statistics ST6: Linear Models Bent Jørgensen og Pia Larsen Module 9: Residualanalyse 9 Rå residualer 92 Standardiserede residualer 3 93 Ensidig variansanalyse 4 94 Studentiserede residualer
Kvantitative Metoder 1 - Forår 2007. Dagens program
Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative
Konfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud
Epidemiologi og Biostatistik
Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag
1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller
Lineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Valgkampens og valgets matematik
Ungdommens Naturvidenskabelige Forening: Valgkampens og valgets matematik Rune Stubager, ph.d., lektor, Institut for Statskundskab, Aarhus Universitet Disposition Meningsmålinger Hvorfor kan vi stole på
Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion
Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,
Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22
Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som
Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??
Dagens Temaer k normalfordelte obs. rækker i proc glm. Test for lineær regression Test for lineær regression - via proc glm p. 1/?? Proc glm Vi indlæser data i datasættet stress, der har to variable: areal,
Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008
Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet [email protected] www.biostat.ku.dk/~bxc
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Modul 5: Test for én stikprøve
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................
Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Statistisk modellering og regressionsanalyse
Statistisk modellering og regressionsanalyse Claus Thorn Ekstrøm KU Biostatistik [email protected] Oktober 25, 2018 Slides @ biostatistics.dk/talks/ 1 2 Hvad er statistik? Statistics is a science, not
9. Chi-i-anden test, case-control data, logistisk regression.
Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU [email protected], 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/
Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge
Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges
Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen
1 Velkommen til kurset Teoretisk Statistik Lærer: Niels-Erik Jensen Plan for i dag: 1. Eks: Er euro'en skæv? 4. Praktiske informationer 2. Eks: Regressionsmodel (kap. 1) 5. Lidt om kursets indhold 3. Hvad
Statistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Multipel regression 22. Maj, 2012
Data: Det færøske kviksølv-studie Simpel linær regression Confounding Multipel lineær regression Fortolkning af parametre Vekselvirkning Kollinearitet Modelkontrol Multipel regression 22. Maj, 2012 Esben
Rygtespredning: Et logistisk eksperiment
Rygtespredning: Et logistisk eksperiment For at det nu ikke skal ende i en omgang teoretisk tørsvømning er det vist på tide vi kigger på et konkret logistisk eksperiment. Der er selvfølgelig flere muligheder,
Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at
Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af
Anvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner
Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation
Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Tema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
02402 Løsning til testquiz02402f (Test VI)
02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:
Statistik i basketball
En note til opgaveskrivning [email protected] 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større
Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable
Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Sammenhæng
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige
Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al
Program Tosidet variansanalyse og forsøgsplanlægning Helle Sørensen E-mail: [email protected] I formiddag: Ensidet ANOVA: repetition og Collinge eksempel. Additiv tosidet ANOVA (blokforsøg) Tosidet ANOVA
