Statistik ved Bachelor-uddaelse i folkesudhedsvideskab Græseværdisætiger
Det hadler om geemsit Statistikere elsker geemsit Det er oplagt e god ide at tage geemsit. Hvis jeg f.eks skal gætte på vægte af æste bar der fødes på Rigshospitalet, så ville det være e god ide at berege geemsitsvægte af et atal foregåede fødsler. Her skal vi se hvad der sker hvis vi tager geemsit over e lag række af uafhægige idetisk fordelte variable. 1
I dag skal vi se på fordelige af geemsit Hvorda ka geemsittet have e fordelig? Jeg slået e gag med 3 teriger (X 1 = 4, X 2 = 3, X 3 = 5) og fået et geemsit på 4.0 øje. 4.0 er da et tal og har ikke oge fordelig? Me hvis du getager forsøget (kast med 3 teriger) så ville du få oget lidt adet. Vi tæker på de fordelig der fremkommer år forsøget getages mage gage. Fordelige af geemsittet afhæger af hvor mage teriger der idgår i geemsittet 2
Empirisk og teoretisk middelværdi (terigekast) Empirisk middelværdi eller geemsit: Omskrivig(s 85): X 1 + X 2 +... + X atal 1 1 + atal 2 2 +.. + atal 6 6 = h 1 1+h 2 2+...+h 6 6 hvor h i er adele af kast der gav i-øje (dvs h i 1/6) Teoretisk middelværdi eller forvetet værdi: Beyt teoretiske sadsyligheder i stedet for h i E(X) = P (X = 1) 1 + P (X = 2) 2 +... + P (X = 6) 6 = 3.5 3
Fordelig af geemsit ved terigekast Jeg har kastet 15 teriger 10.000 gage Data: 4 3 5 5 2 1 4 5 1 6 5 4 2 4 2 4.00 3.53 6 4 5 1 5 6 5 6 4 6 4 3 3 1 4 5.00 4.20 4 4 6 5 4 6 2 5 1 6 6 2 3 6 1 4.67 4.07... Vil fide fordelige af 1. første terig 2. geemsit af de 3 første teriger 3. geemsit af de 15 teriger 4
Fordelig af geemsit ved terigekast Geemsit: X 1 + X 2 +... + X = 1 = 3 = 15 Fordeligere bliver mere cetreret omkrig middelværdie (3.5) Fordeligere liger mere og mere ormalfordelige (?) 5
De cetrale græseværdisætig Beskriver fordelige af geemsittet af uafhægige idetisk fordelte variable år er stor. X 1 + X 2 +... + X De cetrale græseværdisætig siger at geemsittet vil være approksimativt ormalfordelt. Dette gælder uaset hvilke fordelige X-ere har 6
Cetral græseværdisætig - illustratio Fordelig af svaree på spørgsmålet om de geerelle tilfredshed med livet. Kurve svarer til e ormalfordelig med samme middelværdi og spredig som i fordelige af tilfredshede 7
Fordelig af de geemsitlige tilfredshed med livet i 220 tilfældigt udvalgte grupper på 10 persoer. Kurve svarer til e ormalfordelig med samme middelværdi og spredig som i fordelige af tilfredshede 8
= 1 = 10 9
= 25 = 50 10
Cetrale græseværdisætig, mere præcist X 1,.., X er uafhægige og idetisk fordelte variable med middelværdi, µ, og varias, σ 2. Geemsittet ( X ) er approksimativt ormalfordelt. Hvilke ormalfordelig? E( X 1+...X ) = E(X 1+...X ) = E(X 1)+...+E(X ) = µ+...+µ = µ Geemsittet har samme middelværdi som de variable der tages geemsit over. V ( X 1+...X ) = V (X 1+...X ) 2 = V (X 1)+...+V (X ) 2 = σ2 +...+σ 2 2 = σ 2 / variase reduceres med e faktor Dvs X N(µ, σ 2 /) 11
Terigekast - middelværdisætig X 1,.., X er uafhægige og idetisk fordelte teriegkast med middelværdi, 3.5, og varias, 2.9. Så vil geemsittet ( X ), være approksimativt ormalfordelt X N(3.5, 2.9/) =10: X N(3.5, 0.29) =100: X N(3.5, 0.029) =10.000: X N(3.5, 0.0029) Variase går mod ul. Geemsittet vil med stor sadsylighed ligge meget tæt på de teoretiske middelværdi (Middelværdisætige s 110 i boge). 12
De relative hyppighed er et geemsit De relative hyppighed er et geemsit af 0/1-variable atal hædelser atal forsøg = X 1 +... + X hvor X i = 1 hvis hædelse idtræffer i i te forsøg, X i = 0 ellers 13
Møtkast - store tals lov X 1,.., X er uafhægige og idetisk fordelte møtkast med middelværdi, 0.5, og varias 0.25 [p(1 p)]. Så vil de relative hyppighed ( X ), være approksimativt ormalfordelt X N(0.5, 0.25/) =10: X N(0.5, 0.025) =100: X N(0.5, 0.0025) =10.000: X N(0.5, 0.000025) Variase går mod ul. De relative hyppighed vil (med stor sadsylighed) ligge meget tæt på de teoretiske sadsylighed (Store tals lov s 111 i boge). 14
Møtkast prop.of.heads 0.0 0.2 0.4 0.6 0 50 100 150 200 250 300 tosses år atallet af møtkast forøges, vil de relative hyppighed ærme sig sadsylighede. 15
Dødsfødsler Atal dødsfødsler (S) burde være approksimativt ormalfordelt S = relativ hyppighed = X 1+X 2 +...+X Hvis geemsittet er ormalfordelt må S også være det Me sidste gag så vi jo at det ikke gælder? Ja, me det er fordi ikke er stor ok Når p er meget lille eller tæt på 1, skal være stor før at ormalfordeligsapproksimatioe bliver god. 16
Fordelige af atallet af dødsfødsler = 100 = 1000 Atallet af dødsfødsler bladt 100 fødsler er ikke ormalfordelt Atallet af dødsfødsler bladt 1000 fødsler er æste ormalfordelt 17
Biomialfordelig - B(8, p) selv for = 8 ka opås e god approksimatio med ormalfordelige. 18