Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Relaterede dokumenter
Kogebog: 5. Beregn F d

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Løsninger til kapitel 7

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Stikprøvefordelinger og konfidensintervaller

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Estimation ved momentmetoden. Estimation af middelværdiparameter

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

antal gange krone sker i første n kast = n

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

9. Binomialfordelingen

Sammenligning af to grupper

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Konfidens intervaller

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Opsamling. Lidt om det hele..!

Maja Tarp AARHUS UNIVERSITET

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Program. Middelværdi af Y = t(x ) Transformationssætningen

Diskrete og kontinuerte stokastiske variable

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Vejledende besvarelser til opgaver i kapitel 15

Matematisk Modellering 1 Hjælpeark

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Vejledende opgavebesvarelser

Generelle lineære modeller

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Teoretisk Statistik, 9. februar Beskrivende statistik

L komponent produceret i linie 1

Tema. Dagens tema: Indfør centrale statistiske begreber.

Spørgsmål 1 (5 %) Bestem sandsynligheden for at batteriet kan anvendes i mere end 5 timer.

Motivation. En tegning

Supplement til Kreyszig

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Statistiske Modeller 1: Notat 1

bestemmes. kendes ( ) A i Subjektiv information + objektiv information Bayesiansk statistik (gang 10) Bayes sætning

Den flerdimensionale normalfordeling

Hovedpointer fra SaSt

STATISTIKNOTER Simple normalfordelingsmodeller

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Estimation og test i normalfordelingen

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

En Introduktion til SAS. Kapitel 5.

Vejledende besvarelser til opgaver i kapitel 14

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

StatDataN: Test af hypotese

Vi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Uge 40 I Teoretisk Statistik, 30. september 2003

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Introduktion til Statistik

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

Sandsynlighedsregning og statistisk

STATISTIK x-klasserne Gammel Hellerup Gymnasium

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Module 4: Ensidig variansanalyse

Modul 14: Goodness-of-fit test og krydstabelanalyse

Kvantitative metoder 2

Lys og gitterligningen

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Nanostatistik: Test af hypotese

Statistik Lektion 8. Test for ens varians

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Men tilbage til regression og Chi-i-anden. test. Begge begreber refererer til normalfordelingen med middelværdi μ og spredning σ.

Sandsynlighedsteori 1.2

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Udskiftning af et tag antages at vare 2-6 dage. Denne tidsperiode antages at være fastlagt ved følgende symmetriske tæthedsfunktion

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Morten Frydenberg version dato:

Transkript:

Statistik 8. gag 1 KONIDENSINTERVALLER Kofidesitervaller: kapitel 11 Valg og test af fordeligsfuktio

Statistik 8. gag 11. KONIDENS INTERVALLER Et kofides iterval udtrykker itervallet hvori de rigtige værdi af parametere K, med 100 γ % sadsylighed befider sig. Eks: X 1.96 S μ X + 1. 96 S er et kofides iterval for μ Geerelt udtrykkes et kofides iterval som: K D K K D dobbeltsidet est d est + d K est Estimatværdi af statistik K d ordeligsfaktor D Mål for spredig af K

Statistik 8. gag 3 K Kest d D edre ekeltsidet K K D øvre ekeltsidet est + d

Statistik 8. gag 4 Kofidesitervaller Statistisk basis ~ hypotese test sidste gag Kogebog: 1. Vælg 1- eller -sidet kofides iterval. Idetificer fordelig for K statistik 3. Vælg kofidesiveau, γ = 1 α α : sigifikasiveau 4. Idsaml data og bereg K est og D 5. Bereg d 6. Bestem kofides iterval

Statistik 8. gag 5 11.3.1 Kofidesiterval for middelværdi K est = X D = σ d = z α Spredig kedt: σ σ X zα / μ X + zα / -sidet σ X zα μ edre 1-sidet σ μ X + zα øvre 1-sidet Spredig ukedt: s s X tα /, 1 μ X + tα /, 1 -sidet s X tα, 1 μ edre 1-sidet s μ X + tα, 1 øvre 1-sidet

Statistik 8. gag 6 Eksempel 11- : vad kvalitet baseret på eksempel 9-3 = 10 X =.8 s = 0.4 spredig ukedt 95% kofidesiterval γ =0.95 α =0.05 Nedre kofidesiterval: t α, 1 = 1.83 s.8 0.4 1.83 10.57 X tα, 1 = = μ Alterativt: = 0 : t α, 1 = 1.7 s X t 1 =.8 1.73 0.4 0 α, =.65 μ Dvs.: tørre midre iterval og dermed større kofides til at μ ligger tæt ved X

Statistik 8. gag 7 Kofides itervaller afhæger af Atal data : større midre iterval Kofidesiveau γ : større γ større iterval ordeligstype kedt / ukedt spredig o Ukedt spredig større iterval

Statistik 8. gag 8 11.3.3 Kofidesiterval for varias σ 1 s χ α /, 1, 1 σ 1 s σ χ α 1 s χ 1 α /, 1 1 α, 1 -sidet edre 1-sidet 1 s σ øvre 1-sidet χ Eksempel 11-3 : vad dybder = 5 s=0.063 95% kofidesiterval γ =0.95 α =0.05 Øvre kofidesiterval: χ 1 α, 1 = 13.848 1 s 4 0.063 σ = = 0.006879 Kofidesiterval: 0 σ 0. 089 χ 13.848 1 α, 1

Statistik 8. gag 9 11.4.1 Bestemmelse af størrelse af data sample Givet: størrelse af kofidesiterval = H -sidet kofidesiterval Kedt spredig σ σ σ H = X + zα / X z α / = zα / σ = zα / H typisk vælges σ H = 0.01 1 Ukedt spredig σ = tα /, 1 H -sidet iteratio ødvedig σ = tα, 1 H 1-sidet iteratio ødvedig

Statistik 8. gag 10 Eksempel 11-5 eks. 9-3: vadkvalitet 95% kofidesiterval γ =0.95 α =0.05 ukedt spredig H = 0.05 1-sidet iterval σ = 10: t 0.05, 9 = 1.83 = 14: t 0.05, 13 = 1.77 1 = 1.83 = 13.4 0.05 1 = 1.77 = 1.6 0.05 = 13

Statistik 8. gag 11 9.5 Valg og test af fordeligsfuktio orudsætig for hidtil omtalte statistiske metoder for hypoteser og kofidesitervaller er at data følger ormalfordelige test af atagelse ødvedig! χ test Kolmogorov Smirov test

Statistik 8. gag 1 9.5.1 χ test Test af om e valgt fordelig er OK: hypotesetest 1. Hypotese Eks: H 0 : H : 1 Eks: H 0 : H : 1 NB: X er esformig fordelt mellem 0 og 40: U0,40 X U0,40 X er ormalfordelt med μ =0 og σ =5 : N0,5 X N0,5 forkastelse ka skyldes - fordeligstype er forkert - parametre er forkerte

Statistik 8. gag 13. Vælg model Sadsyligheder med model sammeliges med data histogram Test statistik: k Oi Ei χ T = i= 1 E O i observeret frekves for iterval i celle i E i estimeret frekves for iterval i celle i k atal itervaller celler i

Statistik 8. gag 14 χ : χ fordelt med k-j frihedsgrader j: atal parametre estimeret fra data = 1 hvis ku frekveser estimeres beyttes = 3 hvis også X og s estimeres midst 15 data i alt hvert iterval celle bør ideholde midst 4-5 data k større ed 3 3. Vælg sigifikasiveau α 4. Bereg test statistik 5. Defier forkastelsesområdet χ > χ T α, k j 6. Koklusio

Statistik 8. gag 15 Eksempel 9-7: χ -test for ormalfordelig: brudlaster af bjælke Data: Histogram: = 84 X =10.100 s = 780 ad 1 hypotese H 0 : X er ormalfordelt med μ =10.100 og σ =780 : N10.100, 780 H : X N10.100, 780 1

Statistik 8. gag 16 ad model ormerede data: z i i X X = z : N0,1 P = Φ s Z z i i s

Statistik 8. gag 17 ad 3 sigifikasiveau α =0.05 ad 4 beregig af teststatistik χ T =10.09 ad 5 forkastelsesområde k=6 j=3 χ 7. 817 ad 6 koklusio 0.05,6 3 = Da χ T =10.09 > 7.817 forkastes hypotese

Statistik 8. gag 18 9.5. Kolmogorov-Smirov 1-sample test Ka beyttes ved et lille atal data 1. Hypotese H 0 : data er samples fra give fordelig X med give parametre H : data er ikke samples fra give fordelig med give parametre 1. Model test statistik for sorterede data: 1... Sample fordeligsfuktio: 0 for 1 i S = for i i+ 1 1 for 0 = 0 S Give fordelig: X

Statistik 8. gag 19 },,,,,,, ma{ 1 1 1 1 1 0 1 S X S X i S i X i S i X S X S X S X S X KS = L L

Statistik 8. gag 0 3. Vælg sigifikasiveau α 4. Bereg test statistik KS 5. Defier forkastelsesområdet KS > KS α tabel A-7 6. Koklusio

Statistik 8. gag 1 Eksempel 9-10: Kolmogorov-Smirov test for vadkvalitet Data: 47 53. 44 ppm = 13 X =54.6 s = 6. ad 1 hypotese H 0 : X er ormalfordelt med μ =54.6 og σ =6. : N54.6, 6. H : X N54.6, 6. 1 ad model ad 3 sigifikasiveau α =0.05

Statistik 8. gag ad 4 beregig af teststatistik KS=0.0787

Statistik 8. gag 3

Statistik 8. gag 4 ad 5 forkastelsesområde KS α =0.361 ad 6 koklusio Da KS< KS accepteres hypotese α

Statistik 8. gag 5 Valg af fordeligsfuktio sadsylighedspapir

Statistik 8. gag 6 Plot af data: Data ragordes: 1... i... Tilhørede sadsylighed: i P i = +1 Weibull plotte formel i 0. 5 P i = Haze plotte formel Pukter ligger på e ret liie hvis de følger e Normal fordelig Eksempel:

Statistik 8. gag 7 Returperiode Ku relevat hvis data beskriver ma eller mi værdier geem e give tidsperiode Returperiode T : geemsitlig tid mellem overskridelse af e give græse T med e sadsylighed på p Data: 1: ma værdi over første tidsperiode τ ofte τ = 1 år : ma værdi over ade tidsperiode τ : ma værdi over te tidsperiode τ X : fordeligsfuktio for stokastisk variabel X der beskriver ma værdi over tidsperiode τ Sadsylighed overskridelse af græse T = p = P X T = 1 X T τ Returperiode T = p Kedes T og τ ka T bereges Kedes τ og T ka T bereges

Statistik 8. gag 8 Eksempel: Vadmægde i flod: Data: 58 årlige ma værdier af vadmægde: Middelværdi: X = 860 Spredig: s = 418

Statistik 8. gag 9 Plot på Normal-papir med Weibull plotte formel: Dårligt fit!! 100-års vadførig: τ = 1 år T = 100 år 1 p = = 0. 01 100 beregig: z 1 0.01 =. 3 100 = X +. 3s = 18.00 aflæsig: 100 > 3.000 Atagelse om at data er LogNormal fordelt giver meget bedre fit!!