antal gange krone sker i første n kast = n

Relaterede dokumenter
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Diskrete og kontinuerte stokastiske variable

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Estimation ved momentmetoden. Estimation af middelværdiparameter

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Stikprøvefordelinger og konfidensintervaller

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Program. Middelværdi af Y = t(x ) Transformationssætningen

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Asymptotisk optimalitet af MLE

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

9. Binomialfordelingen

Statistiske Modeller 1: Notat 1

Løsninger til kapitel 7

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Maja Tarp AARHUS UNIVERSITET

Asymptotisk estimationsteori

Motivation. En tegning

Den flerdimensionale normalfordeling

Hovedpointer fra SaSt

De reelle tal. Morten Grud Rasmussen 5. november Se Sætning 3.6 og 3.7 for forskellige formuleringer af egenskaben og dens negation.

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Skitse til notat om hvor de forskellige sandsynlighedsfordelinger kan tænkes at komme fra

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Sandsynlighedsregning

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

x-klasserne Gammel Hellerup Gymnasium

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Vejledende besvarelser til opgaver i kapitel 15

Elementær Matematik. Polynomier

Konfidens intervaller

Projekt 9.10 St. Petersborg paradokset

Teoretisk Statistik, 9. februar Beskrivende statistik

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Eksempel 10.1 En autoregressiv proces af orden 1 (ofte blot kaldet en AR(1)- proces) pårhar et opdateringsskema (10.1) med funktionen. for y R.

Supplerende noter II til MM04

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

Sandsynlighedsteori 1.2 og 2 Uge 5.

Opsamling. Lidt om det hele..!

Generelle lineære modeller

Introduktion til uligheder

Introduktion til Statistik

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Analyse 1, Prøve maj 2009

Nogle Asymptotiske Resultater. Jens Ledet Jensen Matematisk Institut, Aarhus Universitet. 1 Indledning 1

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

STATISTISKE GRUNDBEGREBER

Sammenligning af to grupper

6 Populære fordelinger

Introduktion til uligheder

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Lys og gitterligningen

STATISTISKE GRUNDBEGREBER

Renteformlen. Erik Vestergaard

BEVISER TIL KAPITEL 7

Uge 37 opgaver. Opgave 1. Svar : Starter med at definere sup (M) og inf (M) :

Deskriptiv teori: momenter

Uge 10 Teoretisk Statistik 1. marts 2004

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Morten Frydenberg version dato:

Talfølger og -rækker

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Undersøgelse af numeriske modeller

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

DATV: Introduktion til optimering og operationsanalyse, Bin Packing Problemet

DATV: Introduktion til optimering og operationsanalyse, Følsomhed af Knapsack Problemet

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

cos(t), v(t) = , w(t) = e t, z(t) = e t.

Estimation og test i normalfordelingen

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353

STATISTISKE GRUNDBEGREBER

Teoretisk Statistik, 18. november Stikprøveteori: hvor er vi, og hvor skal vi hen? Proportional allokering Optimal allokering

Kvantitative metoder 2

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

STATISTIK x-klasserne Gammel Hellerup Gymnasium

STATISTISKE GRUNDBEGREBER

Sandsynlighedsteori 1.2

STATISTIKNOTER Simple normalfordelingsmodeller

Transkript:

1 Uge 15 Teoretisk Statistik, 5. april 004 1. Store tals lov Eksempel: møtkast Koverges i sadsylighed Tchebychevs ulighed Sætig: Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder med N-sadsyligheder Eksempel: Møtkast Lad h være de relative hypighed af "kroe" efter kast: h atal gage kroe sker i første kast = Store tals lov (STL): h kovergerer mod P(kroe)=0.5. h er e stok. var. så det er ikke "almidelig" koverges. F.eks.: Vi kue i pricippet blive ved med at slå plat, svarede til h = 0 for alle. Me P(h = 0) = 0.5 0 for. Hvilke slags koverges?

() Eksempel: Møtkast Et aturligt kovergesbegreb er koverges med ssh. 1: P(h 0.5) = 1 Dette er desværre for matematisk kompliceret at arbejde med! I stedet arbejder ma med koverges i sadsylighed: P( h 0.5 ε) 1, for ethvert ε > 0. Vi skriver h 0. 5 og siger at h kovergerer mod 0.5 i sadsylighed. P (3) Eksempel: Møtkast Hvis vi defierer X i 1hviskroeikasti = 0hvisplatikasti så er X 1,,X uafhægige stokastiske variable: X i ~ bi(1,0.5). Specielt er µ = E[X i ] = 0.5. Og h atal kroe i første kast X + + X = = så resultatet fra før ka skrives P X µ 1 = X

3 Koverges i sadsylighed Følge af stokastiske variable Y 1,Y Tæk blot på situatioe med uafhægige, idetisk fordelte stokastiske variable X 1,X, og Y = (X 1 + + X )/, me variablee kue også være oget helt adet. Defiitio: Y kovergerer i sadsylighed mod a: der for ethvert ε > 0 gælder: P( Y a ε) 1, P Y a, hvis Store Tals Lov Lad X 1,X, være e følge af uafhægige, idetisk fordelte variable med middelværdi µ. Geemsit af de første variable: X = X + + X 1 Store Tals Lov: X kovergerer i sadsylighed mod µ: P X µ

4 Tchebychevs ulighed Hvis X har middelværdi µ og varias σ, så er [ ] var X E[(X ) ] (x ) f(x)dx = µ + x µ >ε µ x µ ε σ = = µ = µ (x ) f(x)dx (x ) f(x)dx x µ >ε ε f(x)dx=ε P( X µ >ε) σ P( X µ >ε) ε der kaldes Tchebychevs ulighed (TU) (og som også gælder for diskrete variable). Middelværdi og varias siger e hel del om fordelige af e stokastisk variabel. Sadsylighede er højest σ / ε for at e stokastisk variabel atager e værdi, hvis afstad fra middelværdie er større ed ε ( > 0). Eksempler vedr. Tchebychevs ulighed Eksempel (1) : X = atal terigkast til 6'er sker (se uge 7 II ). x 1 f(x) = p(1 p) x= 1,,..., hvor p = 1/6. X med dee puktsadsylighed siges at være geometrisk fordelt (GF) med E[X] = 1/p = 6 og var[x] = (1 - p)/p = 30.

5 30/36 5/ 6 0.83 ved TU P( X 6 6) = = x 1 11 = x = 1(5/ 6) (1/ 6) = (5/ 6) = 0.14 ved GF. Eksempel () : X = levetid for el-pære. Det atages at X ex( λ ) med E[X] = 1/ λ= 1 og var[x] = 1/ λ = 1. X 1 ) 1/4 = 0.5 ved TU P( = t e dt = [ t e ] = 3 e = 3 3 0.05 ved ex.ford. Bevis for Store Tals Lov Atag at X 1,X, har varias σ (STL gælder faktisk også for variable, hvor variase ikke eksisterer). Så er Dermed: E[X ] =µ, var[x ] =σ / eller σ P( X µ >ε) 0 for ε P( X µ ε ) = 1 P( X µ >ε) 1,

6 Store Tals Lov for hyppigheder Uafhægige getagelser af et eksperimet hvor hædelse A ete idtræffer eller ikke idtræffer. Lad X i 1 hvis A idtræffer i i'te getagelse = 0 ellers Så er X 1,X, uafhægige idetisk fordelte med E[X i ] = 1 P(A) + 0 P(A c ) = P(A), så store tals lov giver at X1+ + X Relativ hyppighed af A = h (A) = P(A) for. Teoretisk Statistik, 5. april 004 1. Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder med N-sadsyligheder

7 De cetrale græseværdisætig Store Tals lov siger at ok. Me hvad er fordelige af Hvis X ere er ormalfordelt, er situatioer? X ærmer sig E[X i ] = µ år bliver stor X,år er stor? X det også. Hvad med adre Det viser sig at X er asymptotisk ormalfordelt, dvs. at fordelige på e bestemt måde ka approksimeres med N(µ,σ /) uaset hvad fordelige af X ere er! Dette er meget bekvemt, fordi det gør det emt at berege (approksimative) sadsyligheder om X og adre størrelser. () De cetrale græseværdisætig Lad ige X 1,X,, være uafhægige, idetisk fordelte variable med mv. µ og var. σ. Husk at (X µ ) Z = σ E[X ] =µ og var[x ] =σ / så har mv. 0 og var. 1. Vi ka approksimere ford. af Z med N(0,1): (X µ ) Φ σ P u (u), Dette resultat kaldes de cetrale græseværdisætig.

8 (3) De cetrale græseværdisætig Approksimatio: P(X x) = Φ = P U (x µ ) σ ( x µ ) σ σ σ = P µ+ U x X =µ+ U~ N( µ, σ Ma ka altså approksimere ford. af stor. /) X med N(µ,σ /), år er (4) Eksempel: Møtkast Husk at h atal kroe i første kast X + + X = = 1 = X hvor X i 'ere var 0/1-variable; E[X i ] = 0.5, var[x i ] = 0.5. h = X ka atage værdiere 0,1/,/,,1, me de cetrale græseværdisætig siger at fordelige ka approksimeres med N(0.5, 0.5), år er stor ok.

9 Teoretisk Statistik, 5. april 004 1. Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder med N-sadsyligheder Approksimatio af biomialsadsyligheder Approksimatio af Poissosadsyligheder Approksimatio af hypergeometriske sadsyligheder Approksimatio af ssh.'er med N-sadsyligheder På grud af de cetrale græseværdisætig ka mage fordeliger approksimeres med ormalfordeliger. De følgede approksimatioer var vigtigere i gamle dage, dvs. før vi alle havde adgag til SAS (eller ligede). Me det vil ofte være såda at vi ikke keder de eksakte fordelig af e estimator (f.eks.), me ka vise at de approksimeres godt af e ormalfordelig! Edu e helt særlig egeskab for ormalfordelige!

10 Approksimatio af biomialsadsyligheder Lad X ~ bi(,p). Atag at X = I 1 + +I hvor I 1,,I er uafhægige og idetisk fordelte 0/1-variable med P(I i = 1) = p. Specielt er E[I i ] = p og var[i i ] = p(1-p). Derfor fås: x x/ p x p P(X x) = P I Φ =Φ p1 ( p )/ p(1 p dvs. vi ka approksimere bi(,p) med N (p,p(1 p)), år er stor! () Approksimatio af biomialsadsyligheder Approksimerer e diskret fordelig med e kotiuert. Puktet x svarer i e vis forstad til hele itervallet [x 0.5, x + 0.5]. At X x (x ) svarer derfor til at de tilhørede ormalfordelte approksimatio er højst x + 0.5. Derfor er følgede approksimatio bedre: x+ 0.5 p P(X x) Φ p(1 p) Tommelfigerregel: Approksimatio god, år p 5.

11 (3) Approksimatio af biomialsadsyligheder Atag at X ~ bi(0, 0.). Så er for eksempel P(3 X 6) = P(X 6) P(X ) 6+ 0.5 4 + 0.5 4 Φ Φ 0 0. 0.8 0 0. 0.8 = 0.919 0.01 = 0.718 Sade værdier: P(3 X 6) = P( > X 6) = P(X 6) P(X ) = 0.913 0.06 = 0.707 Approksimatio af biomialfraktiler Atag at vi vil fide 97.5%-fraktile i e bi(0,0.)-fordelig, dvs. fide x så P(X x) = 0.975. Approksimativt: x + 0.5 4 x 3.5 0.975 = P(X x) Φ =Φ 0 0. 0.8 1.789 x 3.5 1 Φ (0.975) = 1.96 x = 7.0 1.789 Sade værdier: P(X 7) = 0.968 og P(X 8) = 0.990.

1 Approksimatio af Poissosadsyligheder Lad X ~ Ps(λ). Ma ka vise at Ps(λ) for store værdier af λ ka approksimeres med N(λ,λ): X λ x λ x λ P(X x) = Φ λ λ λ Som før bliver approksimatio bedre, hvis vi korrigerer med 0.5: x+ 0.5 λ P(X x) Φ λ Tommelfigerregel: Approksimatioe er god, år λ >9. () Approksimatio af Poissosadsyligheder Atag at X ~ Ps(1). Så er 7+ 0.5 1 P(X > 7) = 1 P(X 7) 1 Φ = 1 0.097 = 0.903 1 Sad værdi: P(X > 7) = 1 P(X 7) = 1 0.090 = 0.910

13 Approksimatio af hypergeometriske sadsyligheder Hvis X ~ hypgeo (N,M,) så er M M N M N E[X] =, var[x] = N N N N 1 og hypgeo-sadsylighedere ka approksimeres ved ormalfordeligssadsyligheder : x+ 0.5 M/N P(X x) Φ MN MN N N N 1 3 exempler på avedelse af ormalfordeligsapproximatioe Eksempel 1 :størrelse af lager Givet: (1) Butik med e expediet har åbet 5 timer pr. uge () Gem. atal solgte eheder pr. uge er 15 stk. (3) I hvert salg som tager 15 mi. sælges ku et stk. (4) Lageret suppleres op hver madag morge. Krav : Ku i e uge ud af 100 må lageret slippe op ide uges udgag. Def. : r = miimumslager, der uder de 4 betigelser tilfredsstiller kravet. Spørgsmål : Hvad er r`s værdi? Def. : X = atal solgte eheder pr. uge Atag : X~ bi(= 4 5= 08, p= p/= 15/08= 0.07). For r gælder at 08 x=r+1 ( ) f x 08,0.07 0.01 1-F(r) 0.01 F(r) 0.99

For at bestemme r beyttes ormalfordeligsapproximatioe til biomialfordelige. Vi får σ = p(1 p) = 15 (1 0.07) = 13.91 <=> σ = 3.7307 og r +0.5 15 F(r 08,0.07) Φ 0.99 3.7307 hvoraf r 14.5 1 Φ ( 0.99) =.36 3.7307 <=> r 14.5 + 3.7307.36 = 3.18 4 14 Eksempel (): HT`s busser Givet: HT`s busser. Spørgsmål: Hvor mage mekaikere skal HT have asat, år ma kræver at sadsylighede skal være midst 95% for at der er e mekaiker rede til straks at reparere e sammebrudt motor? X : atal motorsammebrud pr. dag Atagelse: X~ Ps(λ) med λ= 5 sammebrud pr. dag Lad k være det midste atal mekaikere der tilfredsstiller kravet, dvs. λ k+1/-λ x=0 x! λ k x -λ P X k λ=5 = F k λ=5 = e Φ 0.95 ( ) ( ) ( ) -1 k+1/ - λ λ Φ 0.95 = 1.645 λ k λ -1/+1.645 λ = 3.73 33

15 Eksempel (3): meigsmålig (se uge 9) Atal orgaisatiosmedlemmer, N = 400 Stikprøvestørrelse: = 0. Strejke? Atagelse: M > N/ = 00 (<=> flertal for strejke) X = x = 3: atallet i stikprøve der stemmer for strejke Vurderig af resultatet af stikprøveudersøgelse : Til brug herfor øskes sadsylighede P(X 3 400, M> 00, 0) bereget. De ka imidlertid ikke bestemmes, medmidre M sættes lig e fast talværdi. Vi vælger da at sætte M=00, således at de ssh. vi bereger, er større ed de øskede P(X 3 400, M> 00, 0) < P(X 3 400, 00, 0) = 3 x= 0 00 00 x 0 x = 0.0013 400 0 Har ma ikke e tabel over de hypergeometriske fordelig med parametree N= 400, M= 00 og = 0 ka i stedet ormalfordeligsapproximatioe beyttes:

P 1 00 3+ 0 Φ 400 00 00 400 0 0 1 400 400 400 1 ( X 400, 00, 0) 6.5 =Φ =Φ(.979) = 0.0014 4.76 altså æste øjagtig det samme som tidligere. Dee ssh. er så lille, at atagelse må ases for at være forkert. Dvs. vi ka herved komme til at forkaste e sad atagelse (type 1-fejl). Alterativt kue vi acceptere atagelse, me så kue vi derved komme til at udlade at forkaste e forkert atagelse (type -fejl). 16