Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Relaterede dokumenter
24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Generelle lineære modeller

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Løsninger til kapitel 7

Maja Tarp AARHUS UNIVERSITET

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Program. Middelværdi af Y = t(x ) Transformationssætningen

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Uge 40 I Teoretisk Statistik, 30. september 2003

Estimation ved momentmetoden. Estimation af middelværdiparameter

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

antal gange krone sker i første n kast = n

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Stikprøvefordelinger og konfidensintervaller

Motivation. En tegning

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Opsamling. Lidt om det hele..!

Sammenligning af to grupper

Teoretisk Statistik, 9. februar Beskrivende statistik

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

STATISTIKNOTER Simple normalfordelingsmodeller

Vejledende opgavebesvarelser

Kvantitative metoder 2

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

9. Binomialfordelingen

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Den flerdimensionale normalfordeling

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Vejledende besvarelser til opgaver i kapitel 15

STATISTISKE GRUNDBEGREBER

Introduktion til Statistik

STATISTISKE GRUNDBEGREBER

Diskrete og kontinuerte stokastiske variable

Modul 14: Goodness-of-fit test og krydstabelanalyse

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER

Morten Frydenberg version dato:

Hovedpointer fra SaSt

Teoretisk Statistik, 18. november Stikprøveteori: hvor er vi, og hvor skal vi hen? Proportional allokering Optimal allokering

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Supplerende noter II til MM04

Deskriptiv teori: momenter

STATISTIK x-klasserne Gammel Hellerup Gymnasium

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Statistiske Modeller 1: Notat 1

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

x-klasserne Gammel Hellerup Gymnasium

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Asymptotisk estimationsteori

Undersøgelse af numeriske modeller

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Supplement til Kreyszig

HASTIGHEDSKORT FOR DANMARK VHA. GPS

Konfidens intervaller

Nogle Asymptotiske Resultater. Jens Ledet Jensen Matematisk Institut, Aarhus Universitet. 1 Indledning 1

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

Projekt 1.3 Brydningsloven

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

Sandsynlighedsteori 1.2 og 2 Uge 5.

Formelsamling til statistik-del af metodekursus, 4. semester, lægevidenskab Version 3 (26/9-2011)

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Eksempel 10.1 En autoregressiv proces af orden 1 (ofte blot kaldet en AR(1)- proces) pårhar et opdateringsskema (10.1) med funktionen. for y R.

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

TEKST NR TEKSTER fra IMFUFA

Noter om Kombinatorik 2, Kirsten Rosenkilde, februar

Projekt 9.10 St. Petersborg paradokset

GENEREL INTRODUKTION.

Matematisk Modellering 1 Hjælpeark

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Transkript:

Faculty of Life Scieces Program Esidet variasaalyse Normalfordelige Claus Ekstrøm E-mail: ekstrom@life.ku.dk Esidet variasaalyse (oe-way ANOVA) Hvilke type data? Hvad er problemstillige? Variatio mellem grupper og idefor grupper Residualer Normalfordelige Histogram og tæthed Sadsyligheder Symmetri, cetrum og spredig Slide Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Atibiotika og edbrydig af orgaisk materiale Tegiger Data Fem typer atibiotika og e kotrolbehadlig 36 kvier iddelt i seks grupper. Foder tilsat atibiotikum Gødig gravet ed i poser og mægde af orgaisk materiale målt efter 8 uger For spiramyci: ku fire brugbare måliger Formål Påvirker atibiotika edbrydige af orgaisk materiale? Hvis kotrolmåligere ligger lavere ed de adre, tyder det på at atibiotika hæmmer edbrydige. Me hvor meget lavere skal de ligge for at vi ka drage de koklusio? Det får vi ikke svar på i dag... Orgaic material Data Orgaic material Parallelle boxplot boxplot(org~treat) Slide 3 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Slide 4 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige

Gruppegeemsit og -sprediger Type j ȳ j s j Cotrol 6.603 0.9 α-cyperm. 6.895 0.7 Erofloxaci 6.70 0.6 Febedaz. 6.833 0.4 Ivermecti 6 3.00 0.09 Spiramyci 4.855 0.054 Orgaic material Hvad ka vi se fra tegiger og tal? Ka vi kokludere at der er forskel på gruppere? Populatioer, stikprøver og estimater Populatio vs. stikprøve De 34 kvier er e stikprøve fra populatioe af kvier Faktisk forestiller vi os seks delpopulatioer: kvier der får behadlig, kvier der får behadlig, osv. E kvie fra gruppe j er repræsetativ for de pågældede populatio Vil drage koklusioer om populatioere på grudlag af stikprøvere Middelværdi/geemsit i populatio: α j er populatiosgeemsit for kvier fra gruppe j Stikprøvegeemsittet ȳ j er estimat for α j : ˆα j = ȳ j Hvorda ka vi udtrykke at der ikke er oge effekt af atibiotika? Slide 5 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Slide 6 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Notatio k er atal grupper, her k = 6 j er atal obs. i gruppe j, her = = 5 = 6, 6 = 4. g(i) agiver gruppe for observatio i. For eksempel g() = = g(6) = cotrol, eller g(3) = = g(34) = Spiramyci g() = = g(6) =, g(3) = = g(34) = 6. Stikprøvegeemsit og -spredig i gruppe j: ȳ j = j y i s j = i:g(i)=j j (y i ȳ j ) i:g(i)=j Altså: ȳ j er geemsit af de observatioer i der har g(i) = j, dvs. kommer fra gruppe j. Sammevejet stikprøvespredig Hvis der er ogelude samme variatio i gruppere: beregig af et fælles stikprøvespredig... som er et estimat for e fælles spredig i populatioere Sammevejet eller pooled stikprøvespredig: s = k k ( j )sj j= ( = 5 s 8 + 5 s + + 3 ) s 6 = 0.7 Bemærk: Variasere lægges samme ikke spredigere. Slide 7 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Slide 8 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige

Orgaic material Variatio idefor og mellem grupper Variatio idefor grupper pukter vs. fuldt optruke liiestykker ( ) SS e = i= yi ȳ g(i) Variatio mellem grupper Fuldt optruke liieestykker vs. stiplet liie SS grp = k j= j (ȳ j ȳ) Total variatio Pukter vs. stiplet liie SS total = i=(y i ȳ) Variatioe mellem grupper skal ses ift. variatioe idefor grupper! Residualer mm. Husk residualer fra lieære regressio: r i = y i ˆα ˆβ x i. Esidet ANOVA: Residualer (hvor meget skyder vi galt?) r i = y i ȳ g(i) = observatio estimat Residualkvadratsumme er etop SS e : ) SS e = yi ȳ g(i) = i=( i= Beregig af spredigsestimat udfra residualkvadratsum: s = r i = ri k df e Såda er det altid! i= r i i= Slide 9 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Slide 0 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Uparrede og parrede stikprøver Esidet variasaalyse: resumé Uparrede forsøgsdesigs: grupper esidet variasaalyse. Parrede forsøgsdesig: Hvad gør vi her? Hvad vil vi? Hvorfor er parrede forsøg smarte? Observatioere iddelt i k grupper, fx. svarede til forskellige behadliger, sorter, aldersgrupper,... Formål: sammeligig af gruppere Opdelig af total variatio i variatio mellem grupper og variatio idefor grupper Sammevejet spredigsestimat, s Ka ikke kokludere om der er forskel på gruppere udfra tegiger og gruppegeemsit alee. Vi skal have e statistisk model for data! Slide Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Slide Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige

Hvorfor skal vi lære om ormalfordelige (u)? Har set tre typer af data/eksperimeter med kotiuerte data: Orgaic material Esidet ANOVA Digestibility % 65 70 75 80 85 90 95 00 Lieær regressio E stikprøve: Blood pressure 96 9 9 08 6 8 0 05 94 0 5 0 5 0 5 30 35 Stearic acid % Vi skal bruge ormalfordelige for alle tre forsøgstyper/datatyper! Vægt af krabber 6 krabber på e bestemt alder vejet: y,...,y 6. R: ȳ =.76, s =.5 Histogram ormeret så det samlede areal af rektagler er Graf for f, hvor f er tæthede for ormalfordelige f (y) = Desity 0.00 0.05 0.0 0.5 8 0 4 6 8 0 Weight ( exp (y.76) π.5.5 ) Grafe for f er e fi approksimatio af histogrammet. Slide 3 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Slide 4 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Sadsyligheder Husk: for stadardiseret histogram er relativ frekves = areal af rektagel, fx. atal krabber mellem 4 g og 5 g 6 = 0. Tilsvarede for tæthede: sadsylighede for at e observatio falder i itervallet fra a til b er lig arealet uder kurve, fx. b P(4 < Y < 5) = f (y)dy = 0.3 a De to sadsyligheder er ikke es: populatio vs. stikprøve. Hvis populatiosværdier er fordelt som tæthede beskriver, så vil histogram for stikprøve fra populatioe lige tæthede Normalfordeligstæthed som model for histogrammet Normalfordelig med middelværdi µ og spredig σ Udskift tallee.76 og.5 med µ og σ > 0: ( f (y) = exp ) (y µ) πσ σ Vi siger at e variabel Y er ormalfordelt med middelværdi µ og spredig σ hvis b P(a < Y < b) = f (y)dy. a for alle a og b, dvs. for alle itervaller. Vi skriver Y N(µ,σ ). Bemærk: σ ikke σ i dee otatio. Altså: hvis Y er ormalfordelt med middelværdi 3 og spredig, så er Y N(3,4). Slide 5 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige Slide 6 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige

Symmetri cetrum spredig Desity f(y) 0.0 0. 0.4 0.6 0.8 Slide 7 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige N(,0.5) N(0,) N(,) N(0,4) 6 4 0 4 6 y Dages hovedpukter Esidet variasaalyse: sammeligig af middelværdi for k grupper Variatio mellem grupper / variatio idefor grupper Populatio og tæthed vs. stikprøve og histogram Sadsylighed lig areal uder tæthed Tæthed for ormalfordelig: symmetri, cetrum og spredig På osdag (og måske æste madag): Egeskaber for ormalfordelige Hvorda kotrollerer vi, at data er ormalfordelt? Hvorfor lige etop ormalfordelige? Tyvstarter ved øvelsere i dag med at udersøge egeskaber vha. simulatio af N-fordelte variable (opgave 4.3). Slide 8 Statistisk Dataaalyse (Uge - 00) ANOVA. Normalfordelige