Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Relaterede dokumenter
antal gange krone sker i første n kast = n

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Estimation ved momentmetoden. Estimation af middelværdiparameter

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Stikprøvefordelinger og konfidensintervaller

Løsninger til kapitel 7

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Generelle lineære modeller

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Diskrete og kontinuerte stokastiske variable

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Asymptotisk optimalitet af MLE

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Statistiske Modeller 1: Notat 1

Program. Middelværdi af Y = t(x ) Transformationssætningen

Maja Tarp AARHUS UNIVERSITET

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Motivation. En tegning

Projekt 9.10 St. Petersborg paradokset

Vejledende besvarelser til opgaver i kapitel 15

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

9. Binomialfordelingen

Konfidens intervaller

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Asymptotisk estimationsteori

Skitse til notat om hvor de forskellige sandsynlighedsfordelinger kan tænkes at komme fra

Sammenligning af to grupper

Sandsynlighedsregning

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Uge 40 I Teoretisk Statistik, 30. september 2003

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Introduktion til Statistik

Morten Frydenberg version dato:

Nogle Asymptotiske Resultater. Jens Ledet Jensen Matematisk Institut, Aarhus Universitet. 1 Indledning 1

6 Populære fordelinger

Estimation og test i normalfordelingen

STATISTISKE GRUNDBEGREBER

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Opsamling. Lidt om det hele..!

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

Den flerdimensionale normalfordeling

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Renteformlen. Erik Vestergaard

STATISTIK x-klasserne Gammel Hellerup Gymnasium

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Hovedpointer fra SaSt

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

x-klasserne Gammel Hellerup Gymnasium

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

STATISTISKE GRUNDBEGREBER

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Dagens forelæsning. Claus Munk. kap Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Claus Munk. kap. 1-3

Lys og gitterligningen

Eksempel 10.1 En autoregressiv proces af orden 1 (ofte blot kaldet en AR(1)- proces) pårhar et opdateringsskema (10.1) med funktionen. for y R.

STATISTIKNOTER Simple normalfordelingsmodeller

Noter om Kombinatorik 2, Kirsten Rosenkilde, februar

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

TEKST NR TEKSTER fra IMFUFA

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER

Susanne Ditlevsen Institut for Matematiske Fag susanne

BEVISER TIL KAPITEL 7

Elementær Matematik. Polynomier

Dårligt arbejdsmiljø koster dyrt

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353

Kvantitative metoder 2

Begreber og definitioner

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros

Viden Om Vind oftere, stop i tide

Matematisk Modellering 1 Hjælpeark

Projekt 9.8 Betingede sandsynligheder og paradokser i sandsynlighedsregningen

Sammensatte hypoteser i en polynomialfordeling

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Supplement til Kreyszig

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

Transkript:

Statistik ved Bachelor-uddaelse i folkesudhedsvideskab Græseværdisætiger

Det hadler om geemsit Statistikere elsker geemsit Det er oplagt e god ide at tage geemsit. Hvis jeg f.eks skal gætte på vægte af æste bar der fødes på Rigshospitalet, så ville det være e god ide at berege geemsitsvægte af et atal foregåede fødsler. Her skal vi se hvad der sker hvis vi tager geemsit over e lag række af uafhægige idetisk fordelte variable. 1

I dag skal vi se på fordelige af geemsit Hvorda ka geemsittet have e fordelig? Jeg slået e gag med 3 teriger (X 1 = 4, X 2 = 3, X 3 = 5) og fået et geemsit på 4.0 øje. 4.0 er da et tal og har ikke oge fordelig? Me hvis du getager forsøget (kast med 3 teriger) så ville du få oget lidt adet. Vi tæker på de fordelig der fremkommer år forsøget getages mage gage. Fordelige af geemsittet afhæger af hvor mage teriger der idgår i geemsittet 2

Empirisk og teoretisk middelværdi (terigekast) Empirisk middelværdi eller geemsit: Omskrivig(s 85): X 1 + X 2 +... + X atal 1 1 + atal 2 2 +.. + atal 6 6 = h 1 1+h 2 2+...+h 6 6 hvor h i er adele af kast der gav i-øje (dvs h i 1/6) Teoretisk middelværdi eller forvetet værdi: Beyt teoretiske sadsyligheder i stedet for h i E(X) = P (X = 1) 1 + P (X = 2) 2 +... + P (X = 6) 6 = 3.5 3

Fordelig af geemsit ved terigekast Jeg har kastet 15 teriger 10.000 gage Data: 4 3 5 5 2 1 4 5 1 6 5 4 2 4 2 4.00 3.53 6 4 5 1 5 6 5 6 4 6 4 3 3 1 4 5.00 4.20 4 4 6 5 4 6 2 5 1 6 6 2 3 6 1 4.67 4.07... Vil fide fordelige af 1. første terig 2. geemsit af de 3 første teriger 3. geemsit af de 15 teriger 4

Fordelig af geemsit ved terigekast Geemsit: X 1 + X 2 +... + X = 1 = 3 = 15 Fordeligere bliver mere cetreret omkrig middelværdie (3.5) Fordeligere liger mere og mere ormalfordelige (?) 5

De cetrale græseværdisætig Beskriver fordelige af geemsittet af uafhægige idetisk fordelte variable år er stor. X 1 + X 2 +... + X De cetrale græseværdisætig siger at geemsittet vil være approksimativt ormalfordelt. Dette gælder uaset hvilke fordelige X-ere har 6

Cetral græseværdisætig - illustratio Fordelig af svaree på spørgsmålet om de geerelle tilfredshed med livet. Kurve svarer til e ormalfordelig med samme middelværdi og spredig som i fordelige af tilfredshede 7

Fordelig af de geemsitlige tilfredshed med livet i 220 tilfældigt udvalgte grupper på 10 persoer. Kurve svarer til e ormalfordelig med samme middelværdi og spredig som i fordelige af tilfredshede 8

= 1 = 10 9

= 25 = 50 10

Cetrale græseværdisætig, mere præcist X 1,.., X er uafhægige og idetisk fordelte variable med middelværdi, µ, og varias, σ 2. Geemsittet ( X ) er approksimativt ormalfordelt. Hvilke ormalfordelig? E( X 1+...X ) = E(X 1+...X ) = E(X 1)+...+E(X ) = µ+...+µ = µ Geemsittet har samme middelværdi som de variable der tages geemsit over. V ( X 1+...X ) = V (X 1+...X ) 2 = V (X 1)+...+V (X ) 2 = σ2 +...+σ 2 2 = σ 2 / variase reduceres med e faktor Dvs X N(µ, σ 2 /) 11

Terigekast - middelværdisætig X 1,.., X er uafhægige og idetisk fordelte teriegkast med middelværdi, 3.5, og varias, 2.9. Så vil geemsittet ( X ), være approksimativt ormalfordelt X N(3.5, 2.9/) =10: X N(3.5, 0.29) =100: X N(3.5, 0.029) =10.000: X N(3.5, 0.0029) Variase går mod ul. Geemsittet vil med stor sadsylighed ligge meget tæt på de teoretiske middelværdi (Middelværdisætige s 110 i boge). 12

De relative hyppighed er et geemsit De relative hyppighed er et geemsit af 0/1-variable atal hædelser atal forsøg = X 1 +... + X hvor X i = 1 hvis hædelse idtræffer i i te forsøg, X i = 0 ellers 13

Møtkast - store tals lov X 1,.., X er uafhægige og idetisk fordelte møtkast med middelværdi, 0.5, og varias 0.25 [p(1 p)]. Så vil de relative hyppighed ( X ), være approksimativt ormalfordelt X N(0.5, 0.25/) =10: X N(0.5, 0.025) =100: X N(0.5, 0.0025) =10.000: X N(0.5, 0.000025) Variase går mod ul. De relative hyppighed vil (med stor sadsylighed) ligge meget tæt på de teoretiske sadsylighed (Store tals lov s 111 i boge). 14

Møtkast prop.of.heads 0.0 0.2 0.4 0.6 0 50 100 150 200 250 300 tosses år atallet af møtkast forøges, vil de relative hyppighed ærme sig sadsylighede. 15

Dødsfødsler Atal dødsfødsler (S) burde være approksimativt ormalfordelt S = relativ hyppighed = X 1+X 2 +...+X Hvis geemsittet er ormalfordelt må S også være det Me sidste gag så vi jo at det ikke gælder? Ja, me det er fordi ikke er stor ok Når p er meget lille eller tæt på 1, skal være stor før at ormalfordeligsapproksimatioe bliver god. 16

Fordelige af atallet af dødsfødsler = 100 = 1000 Atallet af dødsfødsler bladt 100 fødsler er ikke ormalfordelt Atallet af dødsfødsler bladt 1000 fødsler er æste ormalfordelt 17

Biomialfordelig - B(8, p) selv for = 8 ka opås e god approksimatio med ormalfordelige. 18