Kogebog: 5. Beregn F d

Relaterede dokumenter
Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Den stokastiske variabel X angiver levetiden i timer for en elektrisk komponent. Tæthedsfunktionen for den stokastiske variabel er givet ved

Afsnit , Hypotesetest for en varians... 19

Analyse af bivariate data: korrelation og regression. korrelation. Korrelation og regression: Co-varians:

bestemmes. kendes ( ) A i Subjektiv information + objektiv information Bayesiansk statistik (gang 10) Bayes sætning

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

L komponent produceret i linie 1

Men tilbage til regression og Chi-i-anden. test. Begge begreber refererer til normalfordelingen med middelværdi μ og spredning σ.

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Statistik 9. gang 1 REGRESSIONSANALYSE. Korrelation (kontrol af model) Regression (tilpasning af model)

Spørgsmål 1 (5 %) Bestem sandsynligheden for at batteriet kan anvendes i mere end 5 timer.

Estimation og test i normalfordelingen

Vi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser

Repetition. Forårets højdepunkter

Hvorfor n-1 i stikprøvevariansen?

Simpel Lineær Regression - repetition

Scorer FCK "for mange" mål i det sidste kvarter?

Statistik Lektion 8. Test for ens varians

Statistik Lektion 14 Simpel Lineær Regression. Simpel lineær regression Mindste kvadraters metode Kovarians og Korrelation

Økonometri 1. Funktionel form. Funktionel form (fortsat) Dagens program. Den simple regressionsmodel 14. september 2005

Variansanalyse (ANOVA) Repetition, sammenligning af to grupper Variansanalyse: Sammenligning af flere end to middelværdier.

Pearsons formel for χ 2 test. Den teoretiske forklaring

Induktionsbevis og sum af række side 1/7

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

1.0 FORSIKRINGSFORMER

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

BEVISER TIL KAPITEL 7

Notato: k grupper observeret tl tdspuktere (logartmerede) t1;t2;:::;t k. Tl tdspukt observeres et atal ( ) ph-vρrder, 1 ; 2 ;:::;. V opfatter dem som

Kursus Introduktion til Statistik. Oversigt, Inferens for gennemsnit (One-sample setup)

Fordelingen af gentagne observationer (målinger) kan beskrives ved hjælp af et histogram, der viser antallet af målinger i et givet interval.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Videregående Algoritmik. David Pisinger, DIKU. Reeksamen, April 2005

Økonometri 1. For mange variable i modellen. For få variable. Dagens program. Den multiple regressionsmodel 21. september 2004

Kvalitet af indsendte måledata

FY01 Obligatorisk laboratorieøvelse. O p t i k. Jacob Christiansen Afleveringsdato: 3. april 2003 Morten Olesen Andreas Lyder

Program. Konfidensinterval og hypotesetest en enkelt normalfordelt stikprøve. Eksempel: hjerneceller hos marsvin. Eksempel: hjerneceller hos marsvin

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Indeks over udviklingen i biltrafikken i Danmark

Kvantitative metoder 2

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 21. september 2005

Supplement til sandsynlighedsregning og matematisk statistik

x-klasserne Gammel Hellerup Gymnasium

Kontrol af udledninger ved produktion af ørred til havbrugsfisk

Løsninger til kapitel 7

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Matematisk Modellering 1 Hjælpeark

Statistisk analyse. Vurdering af usikkerhed i forbindelse med statistiske opgørelser forudsætter:

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

FACITLISTE TIL KOMPLEKSE TAL

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Lys og gitterligningen

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Ikke-parametriske tests af forskel i central tendens. Tests for forskel i central tendens for data på ordinal- og intervalskala

Betænkning om kommunernes udgiftsbehov. Bilag (med metodediskussion af professor Anders Milhøj)

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Korrelation (kontrol af model) Regression (tilpasning af model) 1. Grad af fælles variation mellem X og Y. 2. Område og fordeling af sample data

SUPPLEMENT til Anvendt statistik

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Stikprøvefordelinger og konfidensintervaller

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

IKKE-KONTINUERTE (DISKRETE) STOKASTISKE VARIABLE MIDDELVÆRDI, VARIANS, SPREDNING FORDELINGER: HYPERGEOMETRISK, BINOMIAL, POISSON

antal gange krone sker i første n kast = n

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Økonometri lektion 7 Multipel Lineær Regression. Testbaseret Modelkontrol

Variansanalyse. på normalfordelte observationer af Jens Friis

FORDELINGER: HYPERGEOMETRISK FORDELING, BINOMIALFORDELING MIDDELVÆRDI DEFINITION. X er en stokastisk variabel på et endeligt sandsynlighedsfelt ( )

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Rettevejledning til Økonomisk Kandidateksamen 2006I, Økonometri 1

Økonometri 1. Instrumentvariabelestimation 26. november Plan for IV gennemgang. Exogenitetsantagelsen. Exogenitetsantagelsen for OLS

Elementær Matematik. Sandsynlighedsregning

Regressions modeller Hvad regresserer vi på og hvorfor? Anders Stockmarr Axelborg statistikgruppe 6/

Længde [cm] Der er frit vandspejle i sandkassen. Herudover er sandkassen åben i højden cm i venstresiden og 0-20 cm i højresiden.

HASTIGHEDSKORT FOR DANMARK VHA. GPS

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

6.7 Capital Asset Pricing Modellen

Lineær regression lidt mere tekniske betragtninger om R^2 og et godt alternativ

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

9. Binomialfordelingen

Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test

Motivation. En tegning

Kvantitative metoder 2

3y MA, Steen Toft Jørgensen side 1/5 Helsingør Gymnasium. Definitioner, formler, sætninger og ideen i beviserne så det er muligt at huske beviserne.

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Brugen af R 2 i gymnasiet

BESTEMMELSE AF KARAKTERISTISKE VÆRDIER FOR MATERIALEPARAMETRE

Vejledende opgavebesvarelser

bestemmelse af karakteristiske værdier for materialeparametre og modstandsevner

DLU med CES-nytte. Resumé:

Projekt 1.3 Brydningsloven

Overlappende stationsoplande: Bestemmelse af passagerpotentialer

SUPPLEMENT til Matematiske Grundbegreber

Transkript:

tattk 8. gag KONFIDENINERVALLER Kofdetervaller: kaptel Valg og tet af fordelgfukto tattk 8. gag. KONFIDEN INERVALLER Et kofde terval udtrykker tervallet hvor de rgtge værd af parametere K, med γ % adylghed befder g. Ek:.96 µ +. 96 er et kofde terval for µ Geerelt udtrykke et kofde terval om: K F D K K F D (dobbeltdet) et d et + d K et Etmatværd af tattk K F d Fordelgfaktor D Mål for predg af K tattk 8. gag 3 K Ket Fd D (edre ekeltdet) tattk 8. gag 4 Kofdetervaller tattk ba ~ hypotee tet (dte gag) Kogebog:. Vælg - eller -det kofde terval. Idetfcer fordelg for K tattk K K F D (øvre ekeltdet) et + d 3. Vælg kofdeveau, γ = α (α : gfkaveau) 4. Idaml data og bereg K et og D 5. Bereg F d 6. Betem kofde terval

tattk 8. gag 5.3. Kofdeterval for mddelværd K et = D = F d = z α predg kedt: zα / µ + zα / -det zα µ edre -det µ + zα øvre -det predg ukedt: tα /, µ + tα /, -det tα, µ edre -det µ + tα, øvre -det tattk 8. gag 6 Ekempel - : vad kvaltet (baeret på ekempel 9-3) = =.8 =.4 (predg ukedt) 95% kofdeterval γ =.95 α =.5 Nedre kofdeterval: t α, =.83.8.4.83.57 tα, = = µ Alteratvt: = : t α, =.7.4 t =.8.73 =.65 α, µ Dv.: tørre mdre terval og dermed tørre kofde tl at µ lgger tæt ved tattk 8. gag 7 Kofde tervaller afhæger af Atal data : tørre mdre terval Kofdeveau γ : tørre γ tørre terval Fordelgtype (kedt / ukedt predg) o Ukedt predg tørre terval tattk 8. gag 8.3.3 Kofdeterval for vara ( ) α /,, ( ) α ( ) α /, α, -det edre -det ( ) øvre -det Ekempel -3 : vad dybder = 5 =.63 95% kofdeterval γ =.95 α =.5 Øvre kofdeterval: α, = 3.848 ( ) 4.63 = =.6879 Kofdeterval:. 89 3.848 α,

tattk 8. gag 9.4. Betemmele af tørrele af data ample Gvet: tørrele af kofdeterval = H (-det kofdeterval) Kedt predg H = + zα / z α / = zα / = zα / H typk vælge H =. Ukedt predg = tα /, H (-det) terato ødvedg = tα, H (-det) terato ødvedg tattk 8. gag Ekempel -5 (ek. 9-3: vadkvaltet) 95% kofdeterval γ =.95 α =.5 ukedt predg H =.5 -det terval = : t.5, 9 =.83 = 4: t.5, 3 =.77 = 3 =.83 = 3.4.5 =.77 =.6.5 tattk 8. gag 9.5 Valg og tet af fordelgfukto Forudætg for hdtl omtalte tattke metoder for hypoteer og kofdetervaller er at data følger ormalfordelge tet af atagele ødvedg! tattk 8. gag 9.5. tet et af om e valgt fordelg er OK: hypoteetet. Hypotee tet Kolmogorov mrov tet Ek: H : H : Ek: H : H : NB: er eformg fordelt mellem og 4: U(,4) U(,4) er ormalfordelt med µ = og =5 : N(,5) N(,5) forkatele ka kylde - fordelgtype er forkert - parametre er forkerte

tattk 8. gag 3. Vælg model adylgheder med model ammelge med data htogram et tattk: k ( O E ) = = E O oberveret frekve for terval (celle ) E etmeret frekve for terval (celle ) k atal tervaller (celler) tattk 8. gag 4 : fordelt med k-j frhedgrader j: atal parametre etmeret fra data = hv ku frekveer etmere ( beytte) = 3 hv ogå og etmere mdt 5 data alt hvert terval (celle) bør deholde mdt 4-5 data k tørre ed 3 3. Vælg gfkaveau α 4. Bereg tet tattk 5. Defer forkateleområdet > α, k j 6. Kokluo tattk 8. gag 5 Ekempel 9-7: -tet for ormalfordelg: brudlater af bjælke Data: Htogram: tattk 8. gag 6 ad ) model ormerede data: z x x = z : N(,) P = Φ ( Z z ) = 84 =. = 78 ad ) hypotee H : er ormalfordelt med µ =. og =78 : N(., 78) H : N(., 78)

tattk 8. gag 7 ad 3) gfkaveau α =.5 ad 4) beregg af tettattk =.9 ad 5) forkateleområde k=6 j=3 7. 87 ad 6) kokluo Da.5,6 3 = =.9 > 7.87 forkate hypotee tattk 8. gag 8 9.5. Kolmogorov-mrov -ample tet Ka beytte ved et llle atal data. Hypotee H : data er ample fra gve fordelg F (x) med gve parametre H : data er kke ample fra gve fordelg med gve parametre. Model tet tattk for orterede data: x x... ample fordelgfukto: for x x F ) = for x x x+ for x x ) = F x Gve fordelg: F (x) tattk 8. gag 9 tattk 8. gag 3. Vælg gfkaveau α 4. Bereg tet tattk K 5. Defer forkateleområdet K > 6. Kokluo K α (tabel A-7) K = max{ F F L F L F ) F ) F ) F ) F ), ), F ), F ), F ) F F ) F ) F ) F ), ), ), ) }

tattk 8. gag Ekempel 9-: Kolmogorov-mrov tet for vadkvaltet tattk 8. gag ad 4) beregg af tettattk Data: 47 53. 44 ppm = 3 =54.6 = 6. ad ) hypotee H : er ormalfordelt med µ =54.6 og =6. : N(54.6, 6.) H : N(54.6, 6.) ad ) model ad 3) gfkaveau α =.5 K=.787 tattk 8. gag 3 tattk 8. gag 4 ad 5) forkateleområde K α =.36 ad 6) kokluo Da K< K acceptere hypotee α

tattk 8. gag 5 Valg af fordelgfukto adylghedpapr tattk 8. gag 6 Plot af data: Data ragorde: x x... x... x lhørede adylghed: P = + Webull plotte formel. 5 P = Haze plotte formel Pukter lgger på e ret le hv de følger e Normal fordelg Ekempel: tattk 8. gag 7 Returperode Ku relevat hv data bekrver max (eller m) værder geem e gve tdperode Returperode : geemtlg td mellem overkrdele af e gve græe x med e adylghed på p Data: x : max værd over førte tdperode τ (ofte τ = år) x : max værd over ade tdperode τ x : max værd over te tdperode τ tattk 8. gag 8 Ekempel: Vadmægde flod: Data: 58 årlge max værder af vadmægde: Mddelværd: = 86 predg: = 48 F (x): fordelgfukto for tokatk varabel der bekrver max værd over tdperode τ adylghed (overkrdele af græe x ) = p = P( x ) = F ) τ Returperode = p Kede og τ ka x berege Kede τ og x ka berege

tattk 8. gag 9 Plot på Normal-papr med Webull plotte formel: Dårlgt ft!! -år vadførg: τ = år = år p = =. beregg: z. =. 3 x = +. 3 = 8. aflæg: x > 3. Atagele om at data er LogNormal fordelt gver meget bedre ft!!