Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1"

Transkript

1 Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

2 Hvad er hypotesetestning? I sundhedsvidenskab:! Hypotesetestning = Test af nulhypotesen Hypotese-testning anvendes til at vurdere, om en observeret forskel mellem to grupper er udtryk for en virkelig forskel eller et tilfældigt fund.! Ved vurdering af en estimeret relativ forskel: Odds ratio, relativ risiko! Ved vurdering af en estimeret absolut forskel: Forskel i middelværdi, risikodifferens Der opereres med to hypoteser! Nulhypotesen: Et postulat om, at der i virkeligheden ikke er forskel på de to grupper. Kan også kaldes hip som hap -hypotesen.! Alternativ-hypotesen (studiets hypotese): Et postulat om, at der i virkeligheden er forskel på de to grupper. Når vi har udregnet vores estimat, er det vort bedste bud på sandheden. Istedet for at bruge estimatet til at teste en alternativ hypotese, som man ikke kender (man kender ikke den præcise forskel), vælger man at teste nulhypotesen (karakteriseret ved at forskellen mellem de to grupper er præcis 0). Hvis det viser sig, at nulhypotesen kan forkastes, svarer det til, at alternativhypotesen antages at være sand. p-værdien udtrykker sandsynligheden (p=probability) for at observere den (numerisk) fundne forskel, eller én der er større, forudsat at nulhypotesen er sand.! p-værdien udtrykkes som en sandsynlighed med værdi mellem 0 og 1, fx 0,03 eller 0,4.! Ofte omskrives det til en procent, dvs. at 0,03 = 3%, 0,4 = 40% Mikrokursus i biostatistik 2

3 Eksempel på stikprøvernes fordeling ved repetitiv sampling, når nulhypotesen er sand: Projekt om kaffe Kurven viser fordelingen af estimaterne, altså vore bedste gæt, på forskel i middelværdi på fødselsvægt mellem de to grupper: kaffedrikkere og ikke kaffedrikkere når nulhypotesen er sand. Hver af kuglerne præsenterer 1% af estimaterne. De danner en normalfordeling omkring den sande forskel, som er 0. Det vidste vi egentlig godt! Men nu til p-værdier p udtrykkes ved hjælp af arealet under den blå kurve, så lad os se nærmere på det 95% af vores estimater indeholder 0 i deres 95% konfidensinterval og bekræfter dermed nulhypotesen. 5% af estimaterne indeholder ikke 0 i deres 95% konfidensinterval, selvom nulhypotesen er sand. 2,5% 2,5% 1 sse 1 sse 1 sse 1 sse 0 1,96 sse ,96 sse Mikrokursus i biostatistik 3

4 Opdeling af arealet under kurven for nulhypotesen Arealet under den blå kurve illustrerer sandsynligheden for udfald i forskellige intervaller, givet nulhypotesen er sand. Hele arealet er 1,00 eller 100% med 50% på hver sin side af 0. Arealet 0 +/- 1,96 sse = 0,95 Hvordan fastsætter vi det resterende areal? 1,00 0,95 = 0,05 eller 5% Det er fordelt på de 2 lige store trekanter, hvor der er 2,5% af arealet (0,025) i hver. 2,5% Lad os nu prøve at bruge disse 3 arealer til at sige noget om sandsynlighed: Når nulhypotesen er sand: -er der 100% sandsynlighed for, at estimaterne vil ligge under den blå kurve. -er der 95% sandsynlighed for, at estimaterne vil ligge indenfor 0 +/- 1,96 sse -er der 5% sandsynlighed for, at estimaterne vil ligge fra 0 +/- 1,96 sse og længere ud, væk fra 0 (altså ude i halerne svarende til det røde område). 2,5% 1 sse 1 sse 1 sse 1 sse 0 1,96 sse ,96 sse Mikrokursus i biostatistik 4

5 Opdeling af arealet under kurven for nulhypotesen Arealet 0 +/- 1 sse = 0,68 Hvordan fastsætter vi det resterende areal? 1,00 0,68 = 0,32 eller 32% Det er fordelt på de 2 lige store trekanter, hvor der er 16% af arealet (0,16) i hver. Lad os prøve at omskrive disse 2 arealer til sandsynligheder: 68% Når nulhypotesen er sand: -er der 68% sandsynlighed for, at estimaterne vil ligge indenfor 0 +/- 1sSE. -er der 32% sandsynlighed for, at estimaterne vil ligge fra 0 +/- 1sSE og længere ud, væk fra 0 (altså de røde områder ud mod halerne). 16% 16% 1 sse Mikrokursus i biostatistik 5 1 sse

6 Opdeling af arealet under kurven for nulhypotesen Arealet 0 +/- 2,58 sse = 0,99 Hvordan fastsætter vi det resterende areal? 1,00 0,99 = 0,01 eller 1% Det er fordelt på de 2 lige store trekanter, hvor der er 0,5% af arealet (0,005) i hver. Lad os prøve at omskrive disse 2 arealer til sandsynligheder: 99% Når nulhypotesen er sand: - er der 99% sandsynlighed for, at estimaterne vil ligge indenfor 0 +/- 2,58 sse. -er der 1% sandsynlighed for, at estimaterne vil ligge fra 0 +/- 2,58 sse og længere ud, væk fra 0 (altså helt ud i den sidste del af halerne). 0,5% 0,5% 1 sse 0 2,58 sse 1 sse 1 sse 1 sse 1 sse 0 1 sse 0 + 2,58 sse Mikrokursus i biostatistik 6

7 Eksempler på estimater udregnet fra en enkelt stikprøve på 2x200 kvinder Vi udfører studiet med 200 kvinder i hver gruppe og udregner en forskel på middelværdi i de to grupper på 100 g. STANDARD ERROR = 51 g! bruges som bedste gæt på sse.!!,96 sse = 100 g, som vi kan hhv. lægge til og trække fra 0- værdien, Så har vi markeret 95% af arealet. Hvad er p-værdien til de 100 g? Lige præcis 0,05 eller 5%! Hvorfor nu det?! HUSK: p-værdien udtrykker sandsynligheden for at observere den (numerisk) fundne forskel,ellerén,dererstørre, forudsat at nulhypotesen er sand. Den blå fordeling er nulhypotesen! Det areal, som ligger fra vores estimerede forskel og længere ud, væk fra 0, markerer vi med rødt.! Det repræsenterer sandsynligheden for at observere en forskel på 100 g eller én, der er større, samtidigt med at nulhypotesen er sand.! Da vi ser på numerisk forskel, skal vi også have den trekant med, der repræsenterer sandsynligheden for at få en forskel på -100 g eller endnu mere, samtidigt med at nulhypotesen er sand. 100 p=0,05 2,5% 49 g 51 g 51 g 49 g 0 1,96 sse ,96 sse 2,5% Mikrokursus i biostatistik 7

8 Eksempler på estimater udregnet fra en enkelt stikprøve på 2x200 kvinder Det er altså det røde areal, der repræsenterer sandsynligheden for at observere en numerisk forskel på 100 g eller endnu mere, samtidigt med at nulhypotesen er sand. Hvorledes kommer vi frem til en p-værdi på 0,05? Konklusion:Sandsynligheden for at observere den fundne forskel på 100 g eller en endnu større forskel, samtidigt med at nulhypotesen er sand, er på 5%. Hele arealet er 100% eller 1,00. Det røde areal svarer til: 1,00 arealet 0 +/- 1,96 sse (= 1,00-0,95 = 0,05)! DVS p = 0,05 eller 5% 2,5% 49 g 51 g 51 g 49 g ,96 sse ,96 sse 2,5% p=0, Mikrokursus i biostatistik 8

9 Eksempler på estimater udregnet fra en enkelt stikprøve på 2x200 kvinder Vi udfører igen studiet (n=2x200) og udregner en forskel på middelværdi i de to grupper på 50 g. STANDARD ERROR = 50 g! bruges som bedste gæt på sse. hvad er p-værdien? Udregnes således:! 1,00 - arealet 0 +/- 1 sse! ( = 1,00 0,68 = 0,32)! p = 0,32 eller 32%. 68% Konklusion:Sandsynligheden for at observere den fundne forskel på 50 g eller en endnu større forskel, samtidigt med at nulhypotesen er sand, er på 32%. 16% 16% 50 p=0,32 50 g 0 50 g Mikrokursus i biostatistik 9

10 Eksempler på estimater udregnet fra en enkelt stikprøve på 2x200 kvinder Vi udfører studiet (n=2x200) og udregner en forskel på middelværdi i de to grupper på 129 g. STANDARD ERROR = 50 g! bruges som bedste gæt på sse. Hvad er p-værdien? Udregnes således:! 1,00 - arealet 0 +/- 2,58sSE! ( = 1,00 0,99 = 0,01)! p = 0,01 eller 1%. 99% Konklusion:Sandsynligheden for at observere den fundne forskel på 129 g eller en endnu større forskel, samtidigt med at nulhypotesen er sand, er på 1%. 0,5% 50 g 0 2,58 sse = -129g 50 g 50 g 50 g 50 g g 0,5% 0 + 2,58 sse = 129 g p=0, Mikrokursus i biostatistik 10

11 De samme eksempler, når vi øger stikprøvestørrelsen Vi øger studiets størrelse(n=2x500) og forestiller os, at vi får de samme resultater: 50 g, 100 g og 129 g. STANDARD ERROR = 30 g! bruges som bedste gæt på sse. Hvor har vi nu p-værdierne (sådan cirka)?! 50 g har stadigvæk ikke en p- værdi under 5%. (p > 0,05)! Grænsen er her 30 x 1,96 = 59 g! 100 g og 129 g er begge høj signifikante med p-værdier under 0,01 (p< 0,01). 99% Konklusion: Når stikprøvestørrelsen øges, mindskes Standard Error, og sandsynligheden for, at de samme observerede forskelle kan forkaste nulhypotesen, er langt større. 0,5% 30 g 0 2,58 sse = -77g 30 g 30 g 30 g 30 g ,58 sse = 77 g Mikrokursus i biostatistik g

12 Eksempler på estimater udregnet fra en enkelt stikprøve på 2x200 kvinder??? Hvorfor kan man ikke bare tage p-værdien til en forskel på ex.100 g og være ligeglade med alt det, der er større end 100 g??? Forestil jer, hvor mange stikprøver der vil få estimatet præcis 100 g? Umiddelbart meget få, vil man tænke... Men i teorien slet ingen, - de vil alle være lidt større eller mindre, hvis man opgiver resultatet tilstrækkeligt nøjagtigt. Derimod kan et interval mellem 2 værdier sagtens definere et areal under kurven: Ex: Hvor mange % af stikprøverne får en forskel i middelværdi på mellem 51 og 100 g? Forskel på Præcis 51 g Forskel på præcis 100 g 49 g 51 g 51 g 49 g 0 1,96 sse ,96 sse Mikrokursus i biostatistik 12

13 Eksempler på estimater udregnet fra en enkelt stikprøve på 2x200 kvinder Man bruger derfor det fundne estimat som grænseværdi for starten på det areal, der svarer til p-værdien. Arealet svarer til den fundne forskel eller en der er større. Vores estimat repræsenterer således den familie af estimater, hvorom det gælder, at de andre er endnu mere usandsynlige i tilfælde af en sand nulhypotese Men såfremt det var et af disse estimater, vi havde fundet i stedet, ville vi have fået en endnu mindre p-værdi. Det vil være ulogisk at bruge det areal, der svarer til den fundne forskel eller en, der er mindre, fordi dette areal altid vil indeholde nul. Nul = nulhypotesen, som vi jo er i færd med at gøre et ærligt forsøg på at at falsificere. Men hvad svarer det areal til på figuren med en funden forskel på 100 g??? O,95 eller 95%... 2,5% 49 g 51 g 51 g 49 g ,96 sse ,96 sse p=0,05 2,5% Mikrokursus i biostatistik 13

14 Sammenhæng mellem konfidensintervaller og p-værdier I konfidensintervallet repræsenteres nul-værdien af!0 ved absolutte forskelle Forskel i middelværdi på fødselsvægt!1 ved relative forskelle Odds ratio eller relativ risiko Hvis denne nulværdi ikke er indeholdt i et 80% konfidensinterval, er p < 0,2 Hvis denne nulværdi ikke er indeholdt i et 90% konfidensinterval, er p < 0,1. Hvis denne nul-værdi ikke er indeholdt i et 95% konfidensinterval, er p < 0,05. Hvis denne nulværdi ikke er indeholdt i et 99% konfidensinterval, er p < 0,01. ETC, ETC Mikrokursus i biostatistik 14

15 Statistisk signifikans og klinisk relevans I sundhedsvidenskab er der konsensus om, at ved en p-værdi under 0,05 betragtes den observerede forskel som statistisk signifikant: VI TROR PÅ, AT FORSKELLEN IKKE SKYLDES TILFÆLDIGHEDER!!!!! Principielt kunne grænseværdien for statistisk signifikans lige så godt være en anden. Et statistisk signifikant resultat er ikke nødvendigvis det samme som et klinisk relevant resultat:! Man kan i store undersøgelser få statistisk signifikans (fx. p = 0,01) ved en lille odds-ratio (fx. 1,2 eller 1,3). Er det klinisk relevant? Hvis rygning øger risikoen for akut myokardieinfarkt med 30% (OR=1,3) er risikoforøgelsen i sig selv ikke særlig alarmerende, men den har alligevel klinisk relevans, fordi det er et hyppigt og alvorligt problem for samfundet. Hvis en speciel familiær konstellation øger risikoen for selvmord med 20%, kan man godt sætte spørgsmålstegn ved den kliniske relevans. Dels er selvmord sjældent, dels kan man sandsynligvis ikke ændre på den pågældende risikofaktor Mikrokursus i biostatistik 15

16 Styrkeberegninger og mere p-værdi Mikrokursus i biostatistik 16

17 En anden måde at forstå p-værdien på. Vi har lavet en undersøgelse, hvor vi prøver at påvise en forskel mellem to grupper, fx i risiko for at få et bestemt udfald. Man kan forestille sig, at vores undersøgelse er et forsøg på at udføre en diagnostisk test på en såkaldt hip som hap -verden:! Såfremt vores hip som hap -verden bliver syg, sker ting systematisk, dvs. at der er en forskel i risiko i de to grupper.! Så længe denne hip som hap -verden er rask, sker ting bare usystematisk. Det vil også sige, at når vores hip som hap -verden er rask, er der ingen forskel i risiko mellem de to grupper I kan sikkert godt regne ud, at denne hip som hap -verden er nulhypotesen Lad os opstille en tabel over resultaterne af vores diagnostiske test: Mikrokursus i biostatistik 17

18 Diagnostisk test på en hip som hap -verden. Sandheden ude i vores hip som hap -verden Der er en sand forskel i risiko i de 2 grupper, dvs. vores hip som hap -verden er blevet syg Der er ikke en sand forskel i risiko i de 2 grupper, dvs. vores hip som hap -verden er rask Vi finder en forskel i risiko i de 2 grupper Korrekt diagnose = SAND POSITIV Forkert diagnose = FALSK POSITIV 1 - β = styrke TYPE 1 fejl (risikoen for denne Konklusion fejl = p-værdien ) fra vores undersøgelse Vi finder ikke ikke en forskel i risiko i de 2 grupper Forkert diagnose = FALSK NEGATIV Korrekt diagnose = SAND NEGATIV TYPE 2 fejl (risiko for at lave denne fejl = β ) Mikrokursus i biostatistik 18

19 Der vil være to mulige udfald for vores diagnostiske test:! Vi finder en forskel mellem de to grupper. Testen er positiv.! Vi finder ikke en forskel mellem de to grupper. Testen er negativ.! Vi håber selvfølgelig, at resultatet af vores test er sand-positivt eller sand-negativt, og at vi har undgået at drage fejlagtige konklusioner i form af falsk-positive eller falsk-negative fortolkninger. Statistikere er så fantasifulde, at de har kaldt falsk-positiv fejlen for en TYPE 1 FEJL. Men det interessante er her, at når forfattere opgiver resultaterne fra deres undersøgelser, opgiver de altid risikoen for, at de har begået en sådan TYPE 1 FEJL = p-værdien.! P-værdien er nemlig sandsynligheden for den falsk-positive konklusion: At konkludere, at der er forskel mellem de to grupper, når der i virkeligheden ikke er det. Falsk-negativ fejlen kalder statistikerne for en TYPE 2 FEJL.! Størrelsen på den kan udregnes og kaldes β. Det interessante er, at går man op i cellen med de sandt positive, svarer den til (1 - β).! Dette tal er sandsynligheden for, at forfatterne konkluderer, at der er en forskel, når dette også er sandt.! Sandsynligheden for at drage en sand positiv konklusion, når man bør gøre det, kaldes studiets styrke eller power.! Således kan man sidestille styrken i et videnskabeligt studie med sensitiviteten i en diagnostisk test Mikrokursus i biostatistik 19

20 Overvejelser omkring styrken af et studie En styrkeberegning er en beregningsmetode til at vurdere, hvor godt et redskab en planlagt undersøgelse er til at finde den forskel, man leder efter: Det er ikke realistisk at finde en amøbe ved hjælp af en teaterkikkert! - Det er derimod realistisk at finde primaballarinaen Styrken = studiets statistiske styrke.! Defineres som sandsynligheden for at forkaste nulhypotesen i en signifikanstest, hvis den er forkert. Styrken kan også opfattes som sensitiviteten og skal helst være 80%.! Det vil sige, at der så kun er 20% s risiko for, at man med det valgte design (dvs antagelse om varians, forskellen mellem grupper og antal deltagere m.v.) ikke kan påvise en eksisterende forskel. Der er stærk tradition for at sætte risikoen for at begå en type 1 fejl (risiko for falsk positive fund) til 5% (evt. 1%).! Hvis der var mere elastik her, kunne man ligesom når man ændrer en grænseværdi i en diagnostisk test nemt opnå en højere styrke. Men nej Mikrokursus i biostatistik 20

21 Overvejelser omkring styrken af et studie Styrken afhænger således af:! Hvor stor en forskel leder man efter? En stor forskel er lettere at finde end en lille forskel Når man udfører sin styrkeberegning, kender man selvfølgelig ikke resultatet af studiet. Derfor indgår typisk en klinisk relevant værdi som stand-in for det kommende resultat, eller man udfører et pilotstudie. Kaffe og fødselsvægt: Vi sætter forskellen til 100 g. Det finder vi klinisk relevant. Endvidere ved vi fra tidligere studier, at forskellen nok er af den størrelsesorden.! Hvilken STANDARD ERROR kan vi forvente få? Afhænger af: Hvor stor variation vil der være i data? Fastsættes ud fra andre studier af fødselsvægt. Vi kan eventuel prøve at mindske variationen ved at udelukke kvinder, der tidligere har født for tidligt eller har født små børn. Hvor stor er sample size? Her har vi den største mulighed for at påvirke for vores styrke. Faktisk kan man ændre sample size, så man får den ønskede styrke. I praksis er der dog ofte en øvre grænse Mikrokursus i biostatistik 21

22 Eksempler på styrkeberegninger Bodils randomiserede undersøgelse: Det er realistisk at forestille sig en gennemsnitlig forskel i fødselsvægt på 100g. Ønsker man en teststyrke på 90% for at identificere en sådan forskel (eller en større) på 5% signifikansniveau (tosidigt) og med sammenligning af A versus b, skal der mindst 300 gravide i hver gruppe, når fødselsvægtens standard deviation sættes til 500 g. For at imødegå ikke komplet compliance foreslås 500 kvinder randomiseret til hver gruppe. Kommentarer:! Man har indstillet undersøgelsesredskabet på at finde en forskel på 100 g. Det kan være både +100 g eller 100 g.! Man accepterer en risiko på 5% for at konkludere, at der er en effekt af coffein på fødselsvægt, selvom der i virkeligheden ikke er nogen effekt.! Man accepterer en risiko på 10% for at overse, at der er en sand effekt af coffein på fødselsvægt Mikrokursus i biostatistik 22

23 Eksempler på styrkeberegninger Det svenske kaffe-studie: A post hoc power analysis showed that the study had 80 percent statistical power (at a 5 percent two-sided significance level) to detect the following differences between intake groups 0-99 mg per day and >300 mg per day: 169 g i birth weight, 3.6 days in gestational age, and 3.6 percent difference i birth weight ratio. Kommentarer:! Deres undersøgelsesredskab havde en styrke på 80% til at finde en forskel på 169 g i fødselsvægt mellem de følgende to grupper: Coffein sv.t. 2½ kop brygget kaffe eller derover/dag sammenlignet med coffein sv.t. 2 kopper te eller derunder/dag.! Forskellen kunne både være +169 g eller 169 g.! Man accepterede en risiko på 5% for at konkludere, at der var en effekt af coffein på fødselsvægt, selvom der i virkeligheden ikke var nogen effekt.! Man accepterede en risiko på 20% for at overse, at der var en sand effekt af coffein på fødselsvægt.! Hvad kan man kritisere? Den forskel, deres studie havde en anstændig styrke til at påvise, var urealistisk. Hvis de havde været mere beskedne og ledt efter en forskel på ex. 100 g, ville de sikkert have haft meget lav styrke Mikrokursus i biostatistik 23

24 SLUT! Mikrokursus i biostatistik 24

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

En intro til radiologisk statistik. Erik Morre Pedersen

En intro til radiologisk statistik. Erik Morre Pedersen En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

En intro til radiologisk statistik

En intro til radiologisk statistik En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Vejledende løsninger kapitel 8 opgaver

Vejledende løsninger kapitel 8 opgaver KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2. C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

S4-S5 statistik Facitliste til opgaver

S4-S5 statistik Facitliste til opgaver S4-S5 statistik Facitliste til opgaver Opgave 1 Middelværdien angiver det bedste bud på serummets sande værdi, mens spredningen angiver analyseusikkerheden. 95%-Konfidensinterval = Ja Standardafvigelsen

Læs mere

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt, Statistik noter Indhold Datatyper... 2 Middelværdi og standardafvigelse... 2 Normalfordelingen og en stikprøve... 2 prædiktionsinteval... 3 Beregne andel mellem 2 værdier, eller over og unden en værdi

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Konfidensinterval for µ (σ kendt)

Konfidensinterval for µ (σ kendt) Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Besvarelse af opgavesættet ved Reeksamen forår 2008

Besvarelse af opgavesættet ved Reeksamen forår 2008 Besvarelse af opgavesættet ved Reeksamen forår 2008 10. marts 2008 1. Angiv formål med undersøgelsen. Beskriv kort hvordan cases og kontroller er udvalgt. Vurder om kontrolgruppen i det aktuelle studie

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Tye og Tye 2 fejl Statistisk styrke Biostatistik uge 2 mandag Morten Frydenberg, Afdeling for Biostatistik Styrkeovervejelser i lanlægning af et studie Logistisk regression Præterm fødsel, rygning, alder,

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

Besvarelser til øvelsesopgaver i uge 6

Besvarelser til øvelsesopgaver i uge 6 Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret.

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T B l e g d a m s v e j 3 B 2 2 0 0 K ø b e n h a v n N ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

2 X 2 = Antal mygstik på enpersoniløbetaf1minut Opgave I I mange statistiske undersøgelser bygger man analysen på anvendelse af normalfordelingen til (eventuelt tilnærmelsesvist) at beskrive den tilfældige variation. Spørgsmål I.1 (1): Forén af følgende

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002 Epidemiologi og Biostatistik Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002 1 Statestik Det hedder det ikke! Statistik 2 Streptomycin til behandling af lunge-tuberkulose?

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 3. februar 005 Morten Frydenberg, Afdeling for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (ud

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Perspektiver i Matematik-Økonomi: Linær regression

Perspektiver i Matematik-Økonomi: Linær regression Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: jlj@imf.au.dk Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Statistik viden eller tilfældighed

Statistik viden eller tilfældighed MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Selektionsbias. Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk. Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Selektionsbias. Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk. Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab Selektionsbias Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab It og sundhed l 21. maj 2015 l Dias nummer 1 Sidste gang Vi snakkede om Præcision:

Læs mere

Estimation og konfidensintervaller

Estimation og konfidensintervaller Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Dagens program. Praktisk information: Husk evalueringer af kurset

Dagens program. Praktisk information: Husk evalueringer af kurset Dagens program Praktisk information: Husk evalueringer af kurset Hypoteseprøvning kap. 11.1-11.3 Fokastelsesområdet kap. 11.1 Type I og Type II fejl kap. 11.1 Styrkefunktionen kap. 11.2 Stikprøvens størrelse

Læs mere

Sammenligning af to sæt observationer p-værdier og sikkerhedsgrænser

Sammenligning af to sæt observationer p-værdier og sikkerhedsgrænser 9 STATISTIK Sammenligning af to sæt observationer p-værdier og sikkerhedsgrænser Klaus Johansen Hvad er p-værdier og sikkerhedsgrænser, og hvad kan disse udfaldsmål bruges til? Artiklen rummer nyttig repetition

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag susanne

Susanne Ditlevsen Institut for Matematiske Fag    susanne Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller

Læs mere

Test nr. 6 af centrale elementer 02402

Test nr. 6 af centrale elementer 02402 QuizComposer 2001- Olaf Kayser & Gunnar Mohr Contact: admin@quizcomposer.dk Main site: www.quizcomposer.dk Test nr. 6 af centrale elementer 02402 Denne quiz angår forståelse af centrale elementer i kursus

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

8.2 Statistiske analyse af hver enkelt indikator

8.2 Statistiske analyse af hver enkelt indikator 8.2 Statistiske analyse af hver enkelt indikator Basale ideer De avancerede statistiske metoder, som anvendes i denne rapport, fokuserer primært på vurdering af eventuel geografisk heterogenitet på regions-,

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. Sammenhængsanalyser Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. rygevaner som 45 årig * helbred som 51 årig Crosstabulation rygevaner

Læs mere