Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger



Relaterede dokumenter
24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Generelle lineære modeller

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Motivation. En tegning

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Teoretisk Statistik, 9. februar Beskrivende statistik

Løsninger til kapitel 7

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Konfidens intervaller

Diskrete og kontinuerte stokastiske variable

Estimation ved momentmetoden. Estimation af middelværdiparameter

Sammenligning af to grupper

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Kvantitative metoder 2

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Stikprøvefordelinger og konfidensintervaller

STATISTISKE GRUNDBEGREBER

STATISTIK x-klasserne Gammel Hellerup Gymnasium

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Opsamling. Lidt om det hele..!

STATISTISKE GRUNDBEGREBER

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

antal gange krone sker i første n kast = n

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Vejledende opgavebesvarelser

Program. Middelværdi af Y = t(x ) Transformationssætningen

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Formelsamling til statistik-del af metodekursus, 4. semester, lægevidenskab Version 3 (26/9-2011)

Morten Frydenberg version dato:

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

9. Binomialfordelingen

Statistik Lektion 8. Test for ens varians

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

Maja Tarp AARHUS UNIVERSITET

STATISTISKE GRUNDBEGREBER

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Vejledende besvarelser til opgaver i kapitel 15

Projekt 1.3 Brydningsloven

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Modul 14: Goodness-of-fit test og krydstabelanalyse

Lys og gitterligningen

HASTIGHEDSKORT FOR DANMARK VHA. GPS

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

STATISTISKE GRUNDBEGREBER

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Uge 37 opgaver. Opgave 1. Svar : Starter med at definere sup (M) og inf (M) :

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

Dansk. Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 2 Konfidensintervallet for µ Eksempel. 3 Den statistiske sprogbrug og formelle ramme

x-klasserne Gammel Hellerup Gymnasium

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Sandsynlighedsregning i biologi


Den hurtige Fouriertransformation. Jean Baptiste Joseph Fourier ( )

Den flerdimensionale normalfordeling

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Forelæsning 1: Intro og beskrivende statistik

c. Radius for hver sekter er målt i cm og angivet i følgende tabel. Desuden er arealet af hvert område beregnet.

GENEREL INTRODUKTION.

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Giv eksempler på hvordan forskellige ligningstyper (lineære, eksponentielle eller potens) løses.

Giv eksempler på hvordan forskellige ligningstyper (lineære, eksponentielle eller potens) løses.

Kvantitative Metoder 1 - Forår Dagens program

1. Undersøg om den nye astma-medicin har en signifikant virkning.

BILAG I PRODUKTRESUME

Begreber og definitioner

Statistik Lektion 4. Kovarians og korrelation Mere om normalfordelingen Den centrale grænseværdi sætning Stikprøvefordelingen

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Uge 40 I Teoretisk Statistik, 30. september 2003

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Statistik (deskriptiv)

StudyGuide til Matematik B.

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Længde [cm] Der er frit vandspejle i sandkassen. Herudover er sandkassen åben i højden cm i venstresiden og 0-20 cm i højresiden.

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Beskrivende statistik

Transkript:

Faculty of Life Scieces Program Populatioer og stikprøver Claus Ekstrøm E-mail: ekstrom@life.ku.dk Praktiske oplysiger Populatioer og stikprøver Data Datatyper Visualiserig Cetrum og spredig af e fordelig Slide 2 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Praktiske oplysiger Eksempel vaccie mod miltbrad hos får Kursushjemmeside: Absalo Program Øvelsere Øvelsestimer Afleverigsopgaver Prisopgave Cases Materiale Læreboge R Vaccieret Ej vaccieret Død 0 24 I live 24 0 Slide 3 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Slide 4 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver

Eksempel forekomst af leversvulster hos mus Eksempel 100 sprit for mæd E.coli Ret miljø Leversvulster 8 19 Ige svulster 5 30 Er der e effekt af miljø på forekomste af leversvulster? Ka tilfældig variatio være skyld i resultatet? Hvor stor er effekte? Slide 5 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Slide 6 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Eksempel LIFE Populatioer og stikprøver 0 2 4 6 8 10 g h 80 60 40 20 d e f puls a b c 80 60 40 20 80 60 40 20 0 2 4 6 8 10 time Slide 7 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver 0 2 4 6 8 10 Slide 8 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver

Stikprøver Der er variatio i populatioe ikke alle er es. Der er også variatio i stikprøveudtagige. Datatyper Kategoriske data Nomiale {Mad, kvide}, {Gul, grø, blå}. Ordiale {Ige, lidt, mellem, meget}, socialklasser. Kvatitative data Diskrete uger pr. kuld, atal familiemedlemmer. Kotiuerte lægde, højde, vægt, alder,... Slide 9 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Slide 10 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Datatyper eksempel Halthed hos kvæg 72 timer efter idtagelse af sukker. Sted Vægt (kg) Halthedsscore Atal hævede led I 276 Mildly lame 2 I 395 Mildly lame 1 I 356 Normal 0 I 437 Lame 2 II 376 Lame 0 II 350 Moderately lame 0 II 331 Lame 1 II 331 Normal 0 Visualiserig kategoriske data Frekvese = hyppighede eller atal forekomster. Hvis er atallet af observatioer er de relative frekves = frekvese. Group A Group B Group C Group D Total TD preset 21 7 6 12 46 TD abset 9 23 24 18 74 0.0 0.2 0.4 0.6 0.8 Grp A Grp B Grp C Grp D 0.0 0.2 0.4 0.6 0.8 1.0 Grp A Grp B Grp C Grp D Slide 11 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Slide 12 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver

Visualiserig kvatitative data Visualiserig kvatitative data ph Tuel Rapid group coolig coolig high 8.44 8.44 high 7.11 6.00 high 6.00 5.78 high 7.56 7.67 low 7.22 5.56 high 5.11 4.56 low 3.11 3.33 high 8.67 8.00 low 7.44 7.00 low 4.33 4.89 low 6.78 6.56 low 5.56 5.67 low 7.33 6.33 low 4.22 5.67 high 5.78 7.67 low 5.78 5.56 low 6.44 5.67 low 8.00 5.33 Mørhed af sviekød ved forskellige frysemetoder. Hvorda sammeliges resultater fra de to metoder lettest? Frequecy 0 1 2 3 4 5 Desity 0.0 0.1 0.2 0.3 0.4 0.5 3 4 5 6 7 8 Tederess (low ph) 3 4 5 6 7 8 Tederess (low ph) Frequecy 0 1 2 3 4 5 Desity 0.0 0.1 0.2 0.3 0.4 0.5 5 6 7 8 9 Tederess (high ph) 5 6 7 8 9 Tederess (high ph) Slide 13 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Slide 14 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Media, rage og kvartiler Mediae er de midterste observatio, hvis ma ragorder sie data. Er der et lige atal observatioer er mediae midt imellem de to midterste observatioer: { y Media = ( +1 2 ) hvis er ulige 1 2 [y (/2) + y (/2+1) ] hvis er lige Rage er defieret som de største mius de midste observatio: Rage = y () y (1) Kvartiler deler datasættet op i fire grupper således at de midste 25%, 50%, 75% og 100% af observatioere er i hhv. 1., 2., 3., og 4. kvartil (beævt Q 1,...,Q 4 ). Iter-quartile rage svarer til rage over de midterste 50% af observatioere: Q 3 Q 1 Boxplots E outlier er e observatio, der ikke passer så godt overes med de øvrige observatioer. Formelt defieres outliers som observatioer, der er udefor itervallet [Q 1 1.5 IQR;Q 3 + 1.5 IQR]. Et boxplot bruges til at illustrere e fordelig grafisk ved at plotte de 5 mål: miimum, Q 1, media, Q 3 og maximum. I et modificeret boxplot er miimum og maximum erstattet med hhv. de midste og største observerede værdi, som er ideholdt i itervallet [Q 1 1.5 IQR;Q 3 + 1.5 IQR]. Observatioer udefor itervallet markeres som pukter. Slide 15 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Slide 16 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver

Middelværdi og spredig Ifobox 1.1 Stikprøvemiddelværdie er defieret ved: ȳ = i y i = y Stikprøvespredige er defieret ved: s = i=1 (y i ȳ) 2. 1 Stikprøvevariase er givet som stikprøvespredige kvadreret. Bemærk, at både middelværdie og spredige har samme ehed som de måliger, der bereges ud fra. Lieær trasformatio af middelværdi og spredig Let ȳ ad s be the sample mea ad sample stadard deviatio from observatios y 1,...,y ad let y i = c y i + b be a liear trasformatio of the y s with costats b ad c. The ȳ = c ȳ + b ad s = c s. Simple lieære trasformatio har ige betydig. Vi ka tillade os at gage og addere ude at det resulterer i spøjse ædriger af middelværdie eller spredige. Slide 17 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Slide 18 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Media eller middelværdi? Fire eksempler Media / IQR Mediae deler datasættet op i to lige store dele Ordiale og kvatitative data Ikke følsom for outliers IQR fider de midterste 50% af data. 0 50 100 150 200 3 2 1 0 1 2 3 0 100 300 500 0 2 4 6 8 Middelværdi / spredig Middelværdie deler datasættet op så afstade fra cetrum kommer i betragig. Kvatitative data (primært symmetriske data). Følsom for outliers. Spredige er de geemsitlige afstad til geemsittet. 0 50 100 150 0 5 10 15 20 4 2 0 2 4 3 2 1 0 1 2 3 Slide 19 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver Slide 20 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver

Dages hovedpukter Populatioer / stikprøver og iferes. Datatyper. Visualiserig. Hvad er media, middelværdi, spredig, og IQR? Hvad fortæller de om data og hvorda fortolkes de? Slide 21 Statistisk Dataaalyse 1 (Uge 1-1 2010) Populatioer og stikprøver