3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Størrelse: px
Starte visningen fra side:

Download "3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven."

Transkript

1 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve Praktiske bemærkninger Eksempel: Sammenhæng mellem moderens alder og fødselsvægt Deskriptive metoder: prik-diagram, histogram Statistisk model og parametre (normalfordelingen) Estimation, hypoteser, test og konfidensintervaller Modelkontrol Formulering af konklusioner Videnskabeligt spørgsmål: Har moderens alder nogen indflydelse på fødselsvægten? Problem: Hvordan kan vi tilrettelægge et studium så vi kan belyse dette videnskabelige spørgsmål? Man ved fra andre studier at den gennemsnitlige fødselsvægt af alle danske børn født til tiden er kg. En mulig løsning: Betragt populationen af børn født til tiden af 40 år gamle danske kvinder. Vi kan, for eksempel, sammenligne fødselsvægten af disse børn med fødselsvægten af alle danske børn født til tiden (3.600 kg). Vi kan reformulere det oprindelige spørgsmål: Afviger den gennemsnitlige fødselsvægt af børn født af 40 år gamle kvinder fra det overordnede gennemsnit på kg? PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-1 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-2 Moderens alder og fødselsvægt: Data og deskriptive metoder Moderens alder og fødselsvægt: Data og deskriptive metoder (2) Det er naturligvis ikke ligetil at registrere fødselsvægten af ALLE disse børn, men vi er muligvis i stand til at udtage en stikprøve af disse. Antag at vi måler fødselsvægten (kg) for 10 sådanne børn. Data er Data er taget fra en stor database som indeholder informationer om alle fødsler på Skejby Hospital, Århus, i perioden En måde at sammenligne disse observerede fødselsvægte med den overordnede gennemsnitlige fødselsvægt på kg er at sammenligne gennemsnittet af data med det overordnede gennemsnit. En illustration er vist i nedenstående tegning hvor indikerer det overordnede gennemsnit kg og den gennemsnitlige fødselsvægt kg i stikprøven. Prik-diagram (se filen dag1.do): Prik-diagram: PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-3 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-4

2 Moderens alder og fødselsvægt: Data og deskriptive metoder (3) Moderens alder og fødselsvægt: Data og deskriptive metoder (4) Antag at 9 kolleger også betragter populationen bestående af børn født til tiden af 40 år gamle kvinder og hver indsamler en stikprøve af størrelse 10. I nedenstående tegning er alle 10 stikprøver vist. Den første er den, som vi tidligere har betragtet, indikerer det overordnede gennemsnit kg og gennemsnittet i hver stikprøve Stikprøve PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-5 Det forekommer rimeligt at konkludere at forskellen mellem det observerede gennemsnit (3.434 kg) og det overordnede gennemsnit (3.600 kg) kan forklares ved tilfældige fluktuationer. For at kunne kvantificere hvorvidt denne forskel kan forklares ved tilfældige fluktuationer har vi brug for en statistisk model, det vil sige en matematisk beskrivelse af fordelingen af fødselsvægte. Histogram: Frekvens PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-6 Moderens alder og fødselsvægt: Statistisk model Moderens alder og fødselsvægt: Statistisk model (2) Den statistiske model er en kontinuert kurve som beskriver et histogram baseret på mange observationer og en fin gruppeinddeling. Statistisk model: De observerede fødselsvægte x 1, x 2,...,x 10 kan beskrives som en stikprøve fra en normalfordeling. Hvis vi havde indsamlet flere data, kunne vi have anvendt en finere gruppeinddeling. For eksempel hvis vi havde 5000 fødselsvægte, så kunne histogrammet og normalfordelingskurven se således ud. Histogram med normalfordelingskurve (5000 observationer): Histogram med normalfordelingskurve (se filen dag1.do): PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-7 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-8

3 Sandsynligheden for lav fødselsvægt Sandsynligheden for lav fødselsvægt: Beregnet ud fra den statistiske model Hvad er sandsynligheden for at observere en fødselsvægt under kg? Hvad er sandsynligheden for at observere en fødselsvægt under kg? I denne hypotetiske undersøgelse har vi 529 ud af 5000 observerede fødselsvægte under kg svarende til en sandsynlighed på Baseret på den statistiske model (normalfordelingskurven) så er sandsynligheden for lav fødselsvægt lig med arealet under kurven (til venstre for kg), som her er lig med PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-9 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-10 Moderens alder og fødselsvægt: Konklusion Statistisk model og parametre: Normalfordelingen Med baggrund i den statistiske model: Tilfældige fluktuationer vil afstedkomme afvigelser mindst lige så ekstreme som de observerede omkring 1 ud af 3 gange (p-værdi på 38%). Konklusion: Data modsiger ikke at fødselsvægten for børn født af 40 år gamle danske kvinder er den samme som den overordnede gennemsnitlige fødselsvægt på kg. Hvor vil vi forvente at den gennemsnitlige fødselsvægt i populationen ligger (baseret på denne stikprøve)? Med 95% sandsynlighed forventer vi at intervallet fra kg til kg indeholder den gennemsnitlige fødselsvægt i populationen af børn født til tiden af 40 år gamle danske kvinder Hvordan kommer vi så frem til sådanne (forholdsvis) præcise konklusioner? Statistisk model: De observerede fødselsvægte x 1, x 2,...,x 10 kan beskrives som en stikprøve fra en normalfordeling. Normalfordelingskurve (tæthed): φ(x) = x i N(µ, σ 2 ), i = 1,...,10, 1 2πσ 2 e 1 2σ 2 (x µ)2 uafhængige Middelværdien µ er den forventede fødselsvægt i populationen Histogram med normalfordelingskurve: Variansen σ 2 (standardafvigelse σ) er et mål for variationen i populationen PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-11 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-12

4 Normalfordelingen: Forskellige normalfordelingskurver Statistisk model og parametre I hvilken tegning er middelværdien µ konstant og i hvilken er variansen σ 2 konstant? Normalfordelingskurve Normalfordelingskurve Den statistiske model: De observerede fødselsvægte x 1, x 2,...,x 10 kan beskrives som en stikprøve fra en normalfordeling med middelværdi µ og varians σ 2. Middelværdien µ og variansen σ 2 er ukendte konstanter (parametre). Formålet med den statistiske analyse er typisk at komme med udsagn om visse karakteristika ved en population ud fra en stikprøve fra den. Her vil vi finde de bedste gæt på værdierne af parameterne µ and σ 2 baseret på de faktiske observationer. En statistisk analyse er altid baseret på en statistisk model, som er en formalisering af antagelserne om de mekanismer som styrer den systematiske og tilfældige variation i den population hvorfra data er indsamlet. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-13 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-14 Estimation af parameterne i en statistisk model Hypoteser om parameterne i en statistisk model Middelværdien µ: Det bedste gæt på middelværdien (baseret på stikprøven) er gennemsnittet (stikprøvegennemsnittet) Her får vi Variansen σ 2 : ˆµ = x = 1 n n i=1 ˆµ = 1 ( ) = Det bedste gæt på variansen (baseret på stikprøven) er stikprøvevariansen ˆσ 2 = s 2 = 1 n (x i x) 2 n 1 i=1 Her får vi ˆσ 2 = (( )2 + +( ) 2 ) = (s = kg) x i Det er nødvendigt at oversætte det spørgsmål, som man er interesseret i at besvare, til et udsagn (hypotese) om parameterne i den statistiske model. Det videnskabelige spørgsmål: Har moderens alder nogen indflydelse på fødselsvægten? Dette bliver oversat til: Er den forventede fødselsvægt for børn født af 40 år gamle kvinder forskellig fra den overordnede gennemsnitlige fødselsvægt på kg? Udtrykt ved parameterne i den statistiske model, kan dette formuleres ved at opstille den følgende hypotese: H 0 : µ = Vi har observeret x = 3.434! Er stikprøvevariationen en mulig forklaring på forskellen mellem stikprøvegennemsnittet og 3.600? PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-15 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-16

5 Beregn t-teststørrelsen t = Statistisk test af en hypotese x /n = 1/10 = s Størrelsen s/ n = / 10 = i nævneren kaldes for standard error (s.e.). Den betegnes også s.e.m for at understrege at det er standard error af middelværdien. Hvis hypotesen er sand (µ = 3.600) så er fordelingen af t en t-fordeling med n 1 = 10 1 = 9 frihedsgrader. En t-fordeling med 9 frihedsgrader minder meget om en normalfordeling med middelværdi 0 og varians 1 (standardnormalfordeling). Statistisk test af en hypotese: p-værdi Vi bruger t-fordelingen til at beregne sandsynligheden for at observere en værdi af t-teststørrelsen som er mindst lige så ekstrem som den faktisk observerede (p-værdien). t(9) tæthedskurve observeret værdi N(0,1) t(9) p-værdi: p = P(t ) + P(t ) = % Vi konkluderer at hvis hypotesen er sand, så vil tilfældigheder resultere i afvigelser mindst lige så ekstreme som den observerede i omkring 1 ud af 3 tilfælde. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-17 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-18 Statistisk test af en hypotese: Signifikansniveau Konfidensintervaller for parametre i en statistisk model Normalt siger vi at der er nok der taler imod en hypotese til at vi forkaster den hvis p-værdien er under signifikansniveauet α. Typisk vælger man α = 0.05 Signifikansniveauet α er risikoen for at lave en Type 1 fejl (sandsynligheden for at forkaste en sand hypotese). Konklusion: Data modsiger ikke at den forventede fødselsvægt for børn født af 40 år gamle kvinder er den samme som det overordnede gennemsnit på kg. Vi kan IKKE konkludere at den forventede fødselsvægt for børn født af 40 år gamle kvinder er kg! Når p-værdien er mindre end signifikansniveauet α siger vi at forskellen mellem middelværdien µ og værdien under hypotesen (3.600 kg) er statistisk signifikant. Bedømt ud fra vores stikprøve er det bedste bud på den ukendte forventede fødselsvægt i populationen, µ, kg. På grund af variationen i data forekommer det dog rimeligt at sige at værdier tæt på kg også er i overensstemmelse med data. Spørgsmål: Kan vi angive alle de værdier af den ukendte parameter µ som er understøttet af data? Et Konfidensinterval er svaret på dette spørgsmål. Et 95%-konfidensinterval for den forventede fødselsvægt µ = Et interval (bestående af værdier af den forventede fødselsvægt) som med 95% sandsynlighed indeholder µ PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-19 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-20

6 Konfidensinterval for middelværdien Percentiler, medianen og kvartiler Et 95%-konfidensinterval for µ (estimat ± t standard error): s s x t < µ < X + t n n Her angiver t percentilen i t-fordelingen med n 1 frihedsgrader. t(9) tæthedskurve I dette eksempel får vi eller kg < µ < kg percentilen 97.5 percentilen < µ < Percentil: Den værdi under hvilken observationerne falder med en bestemt sandsynlighed 10-percentilen = Den værdi under hvilken observationerne falder med 10% sandsynlighed 25-percentilen = nedre kvartil 50-percentilen = medianen 75-percentilen = øvre kvartil Illustration af 10-percentilen: Dette areal er en tiendedel af dette areal 10 percentilen PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-21 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side percentilen i standardnormalfordelingen og t-fordelinger Fortolkning af konfidensintervaller 97.5-percentilen i t-fordelinger med f frihedsgrader: f t Grafisk kan man illustrere 97.5-percentilerne på følgende måde: N(0, 1) t(20) t(5) t(3) t(9) Antag at vi har 20 stikprøver fra hele populationen (hver med 10 fødselsvægte) og beregner 95%-konfidensintervallerne for middelværdien baseret på hver stikprøve: Stikprøve Vi forventer at 19 ud af 20 (95%) sådanne konfidensintervaller indeholder den sande middelværdi i populationen. Her ser vi præcist et KI (markeret med en ) som ikke indeholder middelværdien i populationen. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-23 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-24

7 Sammenhængen mellem populationen og en stikprøve Konfidensintervaller baseret på en større stikprøve Statistiske metoder til at drage inferens om populationen ud fra en stikprøve: Population Antag at vi havde en stikprøve af størrelse 100 og samme gennemsnit og standardafvigelse x = 3.434, s = Design p-værdi Konfidensinterval I dette tilfælde bliver 95%-konfidensintervallet eller kg < µ < kg < µ < Vi har mere information (100 observationer sammenlignet med 10 observationer) Stikprøve Statistisk model et smallere konfidensinterval (bredden er reduceret med en faktor ) Læg mærke til at i dette tilfælde ville vi have forkastet hypotesen µ = kg på et 5% niveau. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-25 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-26 Prædiktionsinterval (eng: prediction interval eller reference range) Spørgsmål: Hvis vi nu tænkte os at vi ville foretage en måling på et andet medlem af populationen, x ny, hvor vil vi så forvente at den måling ligger? Vores bedste gæt på den nye observation er estimatet for den forventede værdi i populationen, her kg, men kan vi bestemme et interval som vil indeholde den med en vis sandsynlighed? Svaret er 95%-prædiktionsintervallet (eng: prediction interval eller reference range): x 1.96 s < x ny < x s hvor 1.96 er 97.5-percentilen i standardnormalfordelingen. I vores eksempel ville vi få < x ny < eller kg < x ny < kg. Dette giver en direkte fortolkning af standardafvigelsen (95% af observationerne ligger indenfor x ± 2 s. Modelkontrol En statistisk analyse er altid baseret på en statistisk model. Gyldigheden af konklusionerne afhænger af hvorvidt den statistiske model beskriver data tilskrækkeligt. Det følger at en undersøgelse af rimeligheden af de underliggende antagelser er en vigtig del af den statistiske analyse. Antagelser: 1. Observationerne er uafhængige (kendskab til værdien af en observation influerer ikke på fordelingen af de andre observationer) 2. Observationerne har samme middelværdi og samme varians 3. Observationerne er normalfordelte PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-27 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-28

8 Modelkontrol: Check af rimeligheden af antagelserne Moderens alder og fødselsvægt: Modelkontrol Histogram og fraktildiagram (Q-Q plot, se filen dag1.do): Normalt gøres dette bedst ved at inspicere en række tegninger og diagrammer. 1. Uafhængighed checkes oftes ved at gennemgå dataindsamlingsproceduren: Her ville antagelsen ikke forekomme rimelig hvis data for eksempel indeholdt observationer svarende til tvillinger. 2. Samme middelværdi og samme varians: Har vi uafhængige gentagelser af det samme forsøg? Hvis data er indsamlet over tid, så kan det være en god ide at tegne data op mod tiden for at se om der sker en udvikling. 3. Kan fordelingen af observationerne approksimeres tilstrækkeligt af en normalfordeling? Tegn altid data!! Normalt laver man histogrammer og fraktildiagrammer (eng: Q-Q plots), som er observationerne tegnet op mod percentilerne fra normalfordelingen Fødselsvægt (kg) Fødselsvægt (kg) Percentiler fra Normalfordelingen De to tegninger (histogram og fraktildiagram) ser rimelige ud. Vi vil ikke tvivle på tilstrækkeligheden af modellen til beskrivelse af data baseret på disse tegninger. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-29 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-30 Modelkontrol: Fraktildiagrammer for stikprøver af størrelse 10 fra en normalfordeling Modelkontrol: Fraktildiagrammer for stikprøver af størrelse 50 fra en normalfordeling PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-31 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-32

9 Modelkontrol: Fraktildiagrammer for stikprøver af størrelse 250 fra en normalfordeling Modelkontrol: Fraktildiagrammer for stikprøver af størrelse 50 ikke fra en normalfordeling PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-33 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-34 Moderens alder og fødselsvægt: Formulering af konklusioner Moderens alder og fødselsvægt: Formulering af konklusioner (2) Se afsnit i Kirkwood & Sterne (2003). I en artikel ville vi måske beskrive den statistiske analyse og formulere konklusionerne på denne måde: Resultaterne af den statistiske analyse: Data blev analyseret som en stikprøve fra en normalfordeling. Hypotesen om at den forventede fødselsvægt for børn født af 40 år gamle danske kvinder er den samme som i hele populationen (3.600 kg) kunne ikke forkastes (p = 0.38). Et estimat for den forventede fødselsvægt er, sammen med et 95%-konfidensinterval, givet ved kg (3.032 kg, kg). Konklusioner: 1. Vi konkluderer at der ikke er noget i data som får os til at tvivle på hypotesen om at fødselsvægten for børn født af 40 år gamle kvinder er kg, som er den gennemsnitlige fødselsvægt i hele den danske befolkning. 2. Enten fordi dette studium er ret lille eller fordi der er en ganske stor variation mellem individer, ser vi et stort 95%-konfidensinterval (fra 568 g under til 236 g over den gennemsnitlige fødselsvægt i hele befolkningen). 3. Hvorvidt disse eventuelle afvigelser fra den gennemsnitlige fødselsvægt i hele befolkningen er af medicinsk vigtighed skal altid overvejes (af den medicinske ekspert tilknyttet studiet). 4. Studiet bidrager med meget begrænset information hvad angår det videnskabelige spørgsmål (sammenhængen mellem moderens alder og fødselsvægt). PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-35 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-36

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Vejledende løsninger kapitel 8 opgaver

Vejledende løsninger kapitel 8 opgaver KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2. C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag

Læs mere

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345) Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Perspektiver i Matematik-Økonomi: Linær regression

Perspektiver i Matematik-Økonomi: Linær regression Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: jlj@imf.au.dk Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem

Læs mere

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model). Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: 2019-03-17) 1 / 40 Statistisk test Et statistisk test er en konfrontation

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærer: Jørgen Holm Petersen Øvelseslærere: Amalie og Marie Databehandling: SPSS Eksamen: Ugeopgave efterfulgt af mundtlig

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Estimation og usikkerhed

Estimation og usikkerhed Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 3. februar 005 Morten Frydenberg, Afdeling for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (ud

Læs mere

Hypotesetests, fejltyper og p-værdier

Hypotesetests, fejltyper og p-værdier Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet

Læs mere

Uge 10 Teoretisk Statistik 1. marts 2004

Uge 10 Teoretisk Statistik 1. marts 2004 1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte Helle Sørensen Uge 9, onsdag SaSt2 (Uge 9, onsdag) Normalfordelingens venner 1 / 20 Program Resultaterne fra denne uge skal bruges

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Løsninger til kapitel 9

Løsninger til kapitel 9 Opgave 9.1 a) test for spredning, ensidet b) test for middelværdi, ensidet c) test for andel, ensidet d) test for to andele, ensidet e) test for spredning, tosidet f) test for middelværdi, ensidet g) test

Læs mere

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Forelæsning 2: Kapitel 4, Diskrete fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel

ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel ! ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel Opgave 1 Når populationens varians er kendt En virksomhed har udviklet en proces til at producere mursten,

Læs mere