SENIORKURSUS STATA OG BIOSTATISTIK

Størrelse: px
Starte visningen fra side:

Download "SENIORKURSUS STATA OG BIOSTATISTIK"

Transkript

1 SENIORKURSUS STATA OG BIOSTATISTIK Aarhus Universitet juni 011 Genopfriskning af statistik Basale tankegange og begreber (i dag) Sammenligninger (i morgen) Sammenhænge (i overmorgen) Brug af programpakken Stata (alle dage) STATISTIK: Metoder til indsamling, analyse og vurdering af data Statistik Deskriptive metoder tabeller og figurer som belyser vigtige træk i data Analytiske metoder beregninger som søger at identificere og vurdere væsentlige aspekter af data Statistisk inferens Brug af statistiske metoder til at besvare (videnskabelige) spørgsmål ved hjælp af data som er underlagt tilfældig variation Data betragtes som en stikprøve (sample) fra en population. Den statistiske analyse af stikprøven har til formål at identificere og beskrive væsentlige forhold i denne population 1 De basale komponenter af en statistisk analyse 1.En statistisk model: Det videnskabelige problem oversættes til et statistisk problem. Hvilke systematiske forskelle vil man tage hensyn? Hvordan beskrives den tilfældige variation? En statistisk analyse er altid baseret på en statistisk model, som skal afspejle undersøgelsens design og formalisere de antagelser som gøres vedrørende den systematiske og tilfældige variation. Den statistiske model er en approksimation til virkeligheden. Valg af en passende model er et kompromis mellem: En simpel model, som giver en grov approksimation, men er nem at bruge En kompleks model, som giver et præcist billede, men som er vanskelig eller umulig at bruge Basale komponenter () Den statistiske model vil typisk indeholde nogle ukendte parametre, som afspejler de aspekter af problemstillingen, og som man ønsker at kende eller tage hensyn til.. Estimation af relevante parametre og vurdering af hvor godt de er bestemt. Hvad kan data fortælle om de ukendte parametre? Hvor godt er vores skøn bestemt? 3.Test af hypoteser om modellens parametre De spørgsmål som stilles til data kan ofte formuleres som spørgsmål vedrørende modellens parametre, typisk at de antager særlige værdier Er de afvigelser vi ser mellem den estimerede værdi og den forventede værdi udtryk for en reel afvigelse eller afspejler den bare den tilfældige variation? 3 4 Seniorkursus i Biostatistik og Stata, Dag1 1

2 Basale komponenter (3) Validiteten af analysens konklusioner afhænger af i hvor høj grad den statistiske model giver en rimelig beskrivelse af den systematiske og tilfældige variation, Variationskilderne afspejler design, dataindsamling/målemetoder og studiepopulation. 4. Modelkontrol en vurdering af om analysens forudsætninger synes at være opfyldte er derfor en vigtig del af en statistisk analyse. Valide konklusioner forudsætter at den statistiske model giver en adækvat beskrivelse af hvordan data er indsamlet og inddrager de relevante systematiske og tilfældige variationskilder. EKSEMPEL: Sammenligning af to behandlinger/lægemidler Formål: Undersøge om en behandling er bedre end en anden Design: Til en række Eksperimentelle enheder allokeres en af de to behandlinger. For hver enhed måles et kontinuert udfald som afspejler hvor virksom behandlingen er. Analyse: For hver behandlingsgruppe beregnes gennemsnittet af udfaldene. De to gennemsnit sammenlignes for at afgøre hvilken behandling der er bedst Mulige forklaringer på en forskel mellem de to gennemsnit 1. Den ene behandling er bedre end den anden. Tilfældigheder 3. Bias dvs grupperne ikke er sammenlignelige. Andre faktorer som har betydning for udfaldet er forskelligt fordelt i de to grupper 5 6 Spørgsmål: Hvilken forklaring er den rigtige? Overordnet strategi: Forsøge at vise at den første forklaring er den rigtige ved at udelukke de to andre forklaringer Tilfældig variation som forklaring I den statistiske analyse estimerer man forskellen mellem de to behandlingers virkning og man evaluerer om tilfældigheder er en plausibel forklaring Bias som forklaring Gennem studiets design (randomisering og blinding etc) og udførelse (compliance, drop-outs etc) kan vi reducere (eliminere?) bias så denne forklaring ikke er sandsynlig Om nødvendigt er det også muligt at reducere bias og derved at forbedre sammenligneligheden - ved af foretage korrektioner i den statistiske analyse (f.eks. korrektion for baseline forskelle). Hvis undersøgelsen er omhyggeligt planlagt og vel udført og hvis den statistiske analyse viser at tilfældig variation ikke er en plausibel forklaring så kan man konkludere at den første forklaring synes at være den rigtige dvs de to behandlinger virker forskelligt. Den statistiske analyse giver også et sikkerhedsinterval for behandlingsforskellens størrelse dvs de værdier af behandlingsforskellen, som er forenelige med de indsamlede data. 7 8 Seniorkursus i Biostatistik og Stata, Dag1

3 Eksempel: Fiskeolie tilskud til gravide kvinder Baggrund: Lav fødselsvægt og/eller for tidlig fødsel forøger risikoen for en række komplikationer Formål: At undersøge om tilskud af fiskeolie til gravide kvinder forlænger graviditeten og forøger fødselsvægten. Her ses på et sekundært endpoint: Diastolisk Blodtryk Design: Randomiseret, kontrolleret trial. 430 gravide kvinder blev inkluderet efter 30 ugers graviditet og randomiseret til enten at modtage et tilskud af fiskeolie eller et tilskud af anden olie. Her ses på følgende data: Ændring i diastolisk blodtryk = blodtryk i uge 37 blodtryk i uge 30 Overvej: Hvorfor korrigere for blodtryk i uge 30? Og skal det i givet fald ske ved at se på ændringer? Spørgsmål: Er der forskel på ændringen af det diastoliske blodtryk? Hvad siger data? 9 10 Density Control F ishoil increase in DBT Graphs by group Betydelig variation inden for hver gruppe. Beskeden forskel mellem grupperne. Problemstilling: den statistisk terminologi Et to-stikprøve problem for normaldelte observationer Den statistisk analyse tager udgangspunkt i følgende statistiske model: For hver behandlingsgruppe betragtes data som en stikprøve af uafhængige observationer fra en normalfordelt population. En normal fordeling er fuldstændigt karakteriseret ved middelværdi og spredning (eller middelværdi og varians) Vi antager gruppe middelværdi varians Kontrol Fiskeolie µ 1 µ σ σ Forudsætninger Uafhængige observationer både indenfor og mellem stikprøver Stikprøver fra to populationer med samme varians I hver population kan den tilfældige variation beskrives med en normalfordeling Er disse forudsætninger rimelige? Estimation af modellens parametre Populationsstørrelser estimeres med de tilsvarende størrelser i stikprøven 11 1 Kontrol Fiskeolie Gennemsnitlig ændring Gennemsnitlig ændring Skøn over fælles spredning = s = 7.96 mmhg = x = 1.90 mmhg 1 = x =.19 mmhg Seniorkursus i Biostatistik og Stata, Dag1 3

4 Statistisk test: Sammenligning af to middelværdier Den gennemsnitlige ændring af det diastoliske blodtryk er lidt højere i fiskeolie-gruppen. Er det udtryk for en systematisk forskel eller skyldes det blot tilfældigheder? Den basale strategi ved statistisk test af en hypotese: Man bekræfter ikke hypoteser, man afviser hypoteser. Her og generelt i superiority trials For at vise at der er en forskel forsøger man at afvise at de er ens. Test af hypotesen H 0 : µ 1 = µ Hvis hypotesen er korrekt må den forskel, som ses i data, skyldes tilfældigheder. Er dette rimeligt? Hvor store forskelle kan med rimelighed tilskrives tilfældig variation? Behandlingsforskellen estimeres til x x1 = = 0.9 Usikkerheden - induceret af den tilfældige variation i populationen - på dette skøn vil under de givne forudsætninger være σ 1 1 n + n Under nulhypotesen (samme forventet ændring) kan usikkerheden af den standardiserede værdi x x σ + n n 1 beskrives ved en standard normalfordeling (dvs middelværdi 0 og varians 1). Populationens spredning er ukendt. Bruges i stedet stikprøvens spredning skal den værdien vurderes i en t-fordeling. t-fordelinger er kendte og tabellerede så vi kan vurdere om den aktuelle t-værdi er ekstrem x x t = = = = s n n Sandsynligheden for at få en værdi mere ekstrem end den aktuelt observerede, også kaldet p-værdien, er Er behandlingerne lige virksomme vil man i 7 ud af 10 forsøg af denne type se en forskel som er mindst lige så stor som den aktuelle forskel. Traditionelt vælger man at afvise tilfældigheder som en mulig forklaring hvis p-værdien er mindre end 5% (signifikansniveauet) Konklusion: Vi kan ikke afvise at behandlingerne virker ens og at forskellen blot skyldes tilfældigheder MEN vi har ikke bevist at behandlingerne virker på samme måde for der er også andre værdier end 0 som heller ikke kan afvises. Et 95% sikkerhedsinterval (eller konfidensinterval) indeholder de værdier af forskellen som ikke kan afvises på niveau 5% Vi får følgende 95% sikkerhedsinterval for forskellen mellem den forventede ændring i de to grupper 0.9 t 0.77 µ µ t µ µ spredning på 0.1 forskel mellem 0.0 forskel mellem gennemsnit 97.5% percentil gennemsnit 15. juni Michael Væth 15 i t-fordeling 16 Seniorkursus i Biostatistik og Stata, Dag1 4

5 Sikkerhedsintervaller og statistiske test I eksemplet testede vi hypotesen µ 1 = µ, dvs samme ændring af det diastoliske blodtryk i de to grupper. Hypotesen kunne ikke afvises, p = 0.70, og derfor indeholder er 95% sikkerhedsinterval for den forventede forskel værdien 0. Et smalt sikkerhedsinterval for en parameter, her forskellen δ = µ 1 µ, betyder at den estimerede forskel er godt bestemt. Undersøgelsen indeholder meget information om denne parameter. Omvendt afspejler et bredt sikkerhedsinterval at parameteren er dårligt bestemt. De værdier som ikke kan afvises, kan være meget forskellige. Et sikkerhedsintervals bredde vil typisk aftage som 1/ n, hvor n er stikprøvens størrelse. Brug (misbrug?) af sikkerhedsintervaller Det Nationale Indikatorprojekt kvalitetsudvikling i det danske sundhedsvæsen I Det Nationale Indikatorprojekt forsøger man at vurdere kvalitet i behandlingen ved at opgøre om række forhold omkring behandlingerne lever op til nogle fastlagte standarder. Resultaterne er tilgængelige på nettet, se f.eks Det Nationale Indikatorprojekt (fortsat) Behandling af lungekræft 008 Indikator d. 5-års overlevelse Eksempel: Udredning og ventetid inden behandling for patienter med lungecancer: Kvalitetskrav: ventetiden må højst være 4 uger Standard: kvalitetskravet overholdes for mindst 85% af patienterne. OVERVEJ: Hvordan vurderer man om standarden er opfyldt? Er det en test situation? Hvilken hypotese vil man afvise? Hvad foregår her? 19 0 Seniorkursus i Biostatistik og Stata, Dag1 5

6 Behandling af lungekræft 008 Indikator 3a. Varighed af udredning Tidligere brugte man et andet format: Indikator : Udredningstid og ventetid inden behandling Indikator.a: Andel af patienter, hvor udredningstiden (højst 4 uger) overholdes. Standarden er, at udredningstiden overholdes for 90 % af patienterne. Indikatorværdier og standardopfyldelse Landsresultat (64-68) 17 Hvad foregår her? 1 Afdeling Frederikshavn-Skagen Sygehus, Medicinsk afdeling Sygehus Himmerland, Medicinsk afd., Farsø Hjørring-Brønderslev Sygehus, Lungemedicinsk afdeling Aalborg Sygehus, Lungemedicinsk afdeling Standard opfyldt? Ja/Nej Antal patientforløb som opfylder kravet Andel i % af patientforløbene som opfylder kravet (95 % CI) Antal patientforløb Manglende oplysninger Ja 1 50 (1-99) 1 Ja (44-97) 0 Nej (49-74) 1 Nej (31-58) 1 Nordjyllands Amt Nej (46-64) 3 ER KONKLUSIONERNE FORNUFTIGE??? GIVER DET MENING?? Estimation lidt mere I simple situationer bruges de naturlige estimater: Stikprøvens gennemsnit bruges som estimat for populationens middelværdi Den relative hyppighed bruges som estimat for tilsvarende sandsynlighed I mere komplicerede situationer er der ingen naturlige estimater. Der findes generelle metoder til beregning af optimale estimater, dvs estimater, som bedst muligt udnytter den information der er i data. Disse metoder giver også skøn over estimaternes usikkerhed Stata og andre statistiske programpakker - vil typisk bruge disse metoder til beregningerne. Statistiske test lidt mere (1) Mange statistiske test har formen Beregnet værdi - Forventet værdi T = Usikkerhed på beregnet værdi Den beregnede værdi vil typisk være et estimat eller en passende teststørrelse (eksempel = rangsummen i den ene stikprøve) Usikkerheden måles som standard fejlen (s.e.) for den beregnede størrelse. Teststørrelser af denne form vil i store stikprøver typisk kunne vurderes i en standard normalfordeling (følger af et matematisk resultat, en såkaldt central grænseværdi sætning) hvis hypotesen er korrekt. Alternativt kan man også i store stikprøver vurdere T i en chi-i-anden fordeling. 3 4 Seniorkursus i Biostatistik og Stata, Dag1 6

7 Statistiske test lidt mere () Er den beregnede værdi et estimat, dvs en teststørrelse på formen estimat - forventet værdi T = s.e.(estimat) kan dette resultat bruges til at beregne approksimative 95% sikkerhedsintervaller. Disse intervaller har formen estimat ± 1.96 s.e.(estimat) Sådanne sikkerhedsintervaller vil være valide i store stikprøver, men kan være mindre gode i små stikprøver. Dette problem kan ofte reduceres ved at beregne sikkerhedsintervallet for en passende transformation af estimatet og så regne tilbage. Er estimatet et simpelt gennemsnit fås gennemsnit ± 1.96 s.e.m. som et approksimativt 95% sikkerhedsinterval for middelværdien SD eller SE? Intervallet gennemsnit ± 1.96 s.e.m. fortæller således noget om hvor populationens middelværdi med ligger. Intervallet gennemsnit ± 1.96 s.d. fortæller noget om hvor de enkelte observationer typisk ligger. Kan observationernes variation beskrives med en normalfordeling ville dette interval omfatte (cirka) 95% af observationerne. Hvilket interval skal man bruge i figurer og tabeller? Svaret afhænger af hvad man ønsker at vise. 5 6 Statistiske test nogle generelle betragtninger (1) For at evaluere en hypoteses rimelighed beregnes en test størrelse, som følger en kendt fordeling, hvis hypotesen er sand. Det er derfor muligt at beregne sandsynligheden for at få en værdi, som er mindst lige så ekstrem som den observerede værdi af test størrelsen. Denne sandsynlighed kaldes p-værdien. Statistiske test nogle generelle betragtninger () I en beslutningsteoretisk formulering af hypotese testning er en nul hypotese er enten sand eller falsk og der skal træffes et valg en beslutning på basis af de indsamlede data Når hypotese testning betragtes som en beslutningsproblem er der to fejl som kan begås P-værdien beskriver i hvilken grad data understøtter hypotesen. Resultatet af det statistiske test klassificeres ofte som statistisk signifikant eller ikke statistisk signifikant alt efter om p-værdien et mindre eller større end signifikansniveauet, kaldet α, og sædvanligvis lig med 5%. Den hypotese som testes kaldes ofte nulhypotesen og repræsenterer sædvanligvis en forenkling af den statistiske model: ingen forskel eller ingen sammenhæng. Fejl af Type 1: En sand nulhypotese forkastes Fejl af Type : En falsk nulhypotese accepteres (dvs forkastes ikke) Signifikansniveauet angiver den højest acceptable risiko for fejl af type 1. Traditionelt testes en nulhypotese mod en alternativ hypotese som specificere en række andre mulige værdier af parameteren, f.eks. H : 0 versus : 0 0 µ = H A µ 7 8 Seniorkursus i Biostatistik og Stata, Dag1 7

8 Statistiske test nogle generelle betragtninger (3) Risikoen for fejl af type afhænger af hvilken af disse alternative værdier, der er den sande værdi. Styrken (power) af et statistisk test er 1 minus risikoen for type fejl og afhænger derfor også af det betragtede alternativ. En undersøgelse har derfor ikke én risiko for type fejl eller én statistisk styrke, men mange. Styrkeovervejelser baseret på et klinisk relevant alternativ bruges sædvanligvis til beregning af den nødvendige størrelse af studiet. Stata kan udføre sådanne beregninger ved hjælp at kommandoen sampsi Når data er indsamlet er sikkerhedsintervaller den mest relevante måde at beskrive resultaternes usikkerhed. STATA analyserne af ændring af diastolisk blodtryk Data findes i en Stata-fil som hedder fishoil.dta. Filen indeholder følgende variable grp behandlingsgruppe, 1 for control, for fish oil group a string variabel with med gruppernes navne difsys ændring i systolisk blodtryk fra uge 30 til uge 37 difdia ændring i diastolisk blodtryk fra uge 30 til 37 Histogrammerne laves med kommandoen histogram difdia, by(group) Normalfordelingsantagelsen kan checkes grafisk (Q-Q plots) ved qnorm difdia if grp==1, title("control") qnorm difdia if grp==, title("fish oil") 9 30 Antagelsen om samme variation i de to grupper kan vurderes ved at teste hypotesen H : σ = σ 1 Dette gøre i Stata med kommandoen sdtest sdtest difdia, by(grp) Denne hypotese kan ikke afvises (p = 0.1) Sammenligning af den forventede ændring i de to behandlingsgrupper foretages i Stata med kommandoen ttest difdia, by(grp) Output indeholder (stort set) alle relevante oplysninger, bl.a. 95% sikkerhedsinterval for forskellen og p-værdi for test af hypotesen og samme ændring i de to grupper. Stata s output fra kommandoen ttest: Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] control fish oil combined diff Degrees of freedom: 48 Ho: mean(control) - mean(fish oil) = diff = 0 Ha: diff < 0 Ha: diff!= 0 Ha: diff > 0 t = t = t = P < t = P > t = P > t = Seniorkursus i Biostatistik og Stata, Dag1 8

9 Kommandoen summarize giver basale oplysninger om en variabel sum difdia if grp==1 Variable Obs Mean Std. Dev. Min Max difdia Flere detaljer fås ved at skrive sum difdia if grp==1, detail Basale oplysninger for gruppe 1 og gruppe hver for sig: bysort grp: sum difdia 33 Seniorkursus i Biostatistik og Stata, Dag1 9

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer

Læs mere

Modul 5: Test for én stikprøve

Modul 5: Test for én stikprøve Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 8: Inferens for varianser (kap 9) Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Konfidensinterval for µ (σ kendt)

Konfidensinterval for µ (σ kendt) Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)

Læs mere

Seniorkursus i Biostatistik og Stata, Dag 2

Seniorkursus i Biostatistik og Stata, Dag 2 SENIORKURSUS STATA OG BIOSTATISTIK Aarhus Universitet juni DAGENS TEMA: SAMMENLIGNINGER FORMIDDAG: KONTINUERTE DATA EFTERMIDDAG: KATEGORISKE DATA STATISTISK ANALYSE AF TO UAFHÆNGIGE STIKPRØVER FRA NORMALFORDELTE

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra

Læs mere

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved

Læs mere

Signifikanstestet. usædvanlig godt godt

Signifikanstestet. usædvanlig godt godt Signifikanstestet Fordeling af rygevaner som 45-årig og senere selvrapporteret helbred som 51-årig blandt tilfældigt udvalgte mænd i Københavns Amt i 1987. helbred som 51 årig rygevaner som 45 årig Total

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25.

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. marts) En stikprøve bestående af 65 mænd og 65 kvinder

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Ensidet variansanalyse

Ensidet variansanalyse Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger

Læs mere

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

En intro til radiologisk statistik

En intro til radiologisk statistik En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 12. april 21 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse 1. Belys ud fra data ved 5 års follow-up den fordom, at der er flere

Læs mere

Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling.

Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling. Sammenligning af privatansatte kvinder og mænds løn Privatansatte kvindelige djøfere i stillinger uden ledelsesansvar har en løn der udgør ca. 96 procent af den løn deres mandlige kolleger får. I sammenligningen

Læs mere

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:

Læs mere

Vurdering af epidemiologiske undersøgelser igen

Vurdering af epidemiologiske undersøgelser igen Vurdering af epidemiologiske undersøgelser igen kob Grove 12. september, 2005 Program Confounding og effektmodifikation Hvad er confounding Hvad er effektmodifikation Er der confounding eller effektmodifikation

Læs mere

Skoleudvalget i Fredensborg Kommune har besluttet at ca. 10-12% lønmidlerne skal fordeles på baggrund af sociale indikatorer

Skoleudvalget i Fredensborg Kommune har besluttet at ca. 10-12% lønmidlerne skal fordeles på baggrund af sociale indikatorer Notat om fordeling af midlerne mellem Fredensborgs skoler med udgangspunkt i elevernes sociale baggrund Venturelli Consulting Oktober 2006 1 Indholdsfortegnelse 1. Resume...3 2. Baggrund...3 3. Den grundlæggende

Læs mere

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger

Økonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger Oversigt: De næste forelæsninger Økonometri Inferens i den lineære regressionsmodel 5. september 006 Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan drage konklusioner på

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter

Læs mere

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5

Læs mere

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X. Opgave I I en undersøgelse af et potentielt antibiotikum har man dyrket en kultur af en bestemt mikroorganisme og tilført prøver af organismen til 20 prøverør med et vækstmedium og samtidig har man tilført

Læs mere

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Module 2: Beskrivende Statistik

Module 2: Beskrivende Statistik Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen og Hans Chr. Petersen Module 2: Beskrivende Statistik 2.1 Histogrammer og søjlediagrammer......................... 1 2.2 Sammenfatning

Læs mere

BILAG A SPØRGESKEMA. I denne At-vejledning præsenteres et kort spørgeskema med i alt 44 spørgsmål fordelt på otte skalaer.

BILAG A SPØRGESKEMA. I denne At-vejledning præsenteres et kort spørgeskema med i alt 44 spørgsmål fordelt på otte skalaer. 16 BILAG A SPØRGESKEMA I denne At-vejledning præsenteres et kort spørgeskema med i alt 44 spørgsmål fordelt på otte skalaer. Skalaernes spørgsmål indgår i et større spørgeskema, der omfatter i alt 26 skalaer

Læs mere

9. Chi-i-anden test, case-control data, logistisk regression.

9. Chi-i-anden test, case-control data, logistisk regression. Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse 1. Hvor stor en andel af deltagerne var mænd? Var der samme andel i de tre randomiseringsgrupper?.

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Trivsel og fravær i folkeskolen

Trivsel og fravær i folkeskolen Trivsel og fravær i folkeskolen Sammenfatning De årlige trivselsmålinger i folkeskolen måler elevernes trivsel på fire forskellige områder: faglig trivsel, social trivsel, støtte og inspiration og ro og

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Besvarelse af opgavesættet ved Reeksamen forår 2008

Besvarelse af opgavesættet ved Reeksamen forår 2008 Besvarelse af opgavesættet ved Reeksamen forår 2008 10. marts 2008 1. Angiv formål med undersøgelsen. Beskriv kort hvordan cases og kontroller er udvalgt. Vurder om kontrolgruppen i det aktuelle studie

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Statistik og beregningsudredning

Statistik og beregningsudredning Bilag 7 Statistik og beregningsudredning ved Overlæge Søren Paaske Johnsen, medlem af Ekspertgruppen Marts 2008 Bilag til Ekspertgruppens anbefalinger til videreudvikling af Sundhedskvalitet www.sundhedskvalitet.dk

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Generelt er korrelationen mellem elevens samlede vurdering i forsøg 1 og forsøg 2 på 0,79.

Generelt er korrelationen mellem elevens samlede vurdering i forsøg 1 og forsøg 2 på 0,79. Olof Palmes Allé 38 8200 Aarhus N Tlf.nr.: 35 87 88 89 E-mail: stil@stil.dk www.stil.dk CVR-nr.: 13223459 Undersøgelse af de nationale tests reliabilitet 26.02.2016 Sammenfatning I efteråret 2014 blev

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Mathematical Statistics ST06: Linear Models Bent Jørgensen og Pia Larsen Module 2: Mere om variansanalyse 2. Parreded observationer................................ 2.2 Faktor med 2 niveauer (0- variabel)........................

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS

Læs mere

Estimation og usikkerhed

Estimation og usikkerhed Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode

Læs mere

En Introduktion til SAS. Kapitel 6.

En Introduktion til SAS. Kapitel 6. En Introduktion til SAS. Kapitel 6. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 6 Regressionsanalyse i SAS 6.1 Indledning Dette kapitel

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Epiduralbedøvelse som smertelindring til vaginale fødsler. Master of Public Health uddannelsen i Århus 2006

Epiduralbedøvelse som smertelindring til vaginale fødsler. Master of Public Health uddannelsen i Århus 2006 Epiduralbedøvelse som smertelindring til vaginale fødsler Master of Public Health uddannelsen i Århus 2006 Oversigt over fremlæggelse Udvikling i epiduralbedøvelse blandt fødende på fødegangen Aalborg

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002 Epidemiologi og Biostatistik Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002 1 Statestik Det hedder det ikke! Statistik 2 Streptomycin til behandling af lunge-tuberkulose?

Læs mere

Program. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer

Program. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer Program Simpel og multipel lineær regression Helle Sørensen E-mail: helle@math.ku.dk Simpel LR: repetition, konfidensintervaller, test, prædiktionsintervaller, mm. Multipel LR: estimation, valg af model,

Læs mere

Hypotesetests, fejltyper og p-værdier

Hypotesetests, fejltyper og p-værdier Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Læsevejledning til resultater på regionsplan

Læsevejledning til resultater på regionsplan Læsevejledning til resultater på regionsplan Indhold 1. Overblik... 2 2. Sammenligninger... 2 3. Hvad viser figuren?... 3 4. Hvad viser tabellerne?... 5 5. Eksempler på typiske spørgsmål til tabellerne...

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Helbred og sygefravær

Helbred og sygefravær 8. juli 2016 Helbred og sygefravær Langt størstedelen af FOAs medlemmer vurderer, at deres helbred er godt eller nogenlunde godt. Til gengæld forventer hvert femte medlem ikke at kunne arbejde, til de

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Centraltendens 3 Spredning 4 Praktisk beregning 5 Fraktiler 6 Opsamling 1 Indledning

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

LUP læsevejledning til regionsrapporter

LUP læsevejledning til regionsrapporter Indhold 1. Overblik... 2 2. Sammenligninger... 2 3. Hvad viser figuren?... 3 4. Hvad viser tabellerne?... 5 5. Eksempler på typiske spørgsmål til tabellerne... 6 Øvrigt materiale Baggrund og metode for

Læs mere

Hvem kender ÅOP? en empirisk undersøgelse

Hvem kender ÅOP? en empirisk undersøgelse N O T A T Hvem kender ÅOP? en empirisk undersøgelse 16. januar 2008 I forbindelse med julen 2007 blev der af Finansrådet udarbejdet en analyse af lån til forbrug. Analysen indeholdt blandt andet en forbrugerundersøgelse

Læs mere

Arealer under grafer

Arealer under grafer HJ/marts 2013 1 Arealer under grafer 1 Arealer og bestemt integral Som bekendt kan vi bruge integralregning til at beregne arealer under grafer. Helt præcist har vi denne sætning. Sætning 1 (Analysens

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Eksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 20-02-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 3. februar 005 Morten Frydenberg, Afdeling for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (ud

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Ligninger med reelle løsninger

Ligninger med reelle løsninger Ligninger med reelle løsninger, marts 2008, Kirsten Rosenkilde 1 Ligninger med reelle løsninger Når man løser ligninger, er der nogle standardmetoder som er vigtige at kende. Vurdering af antallet af løsninger

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere