Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Relaterede dokumenter
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Tema. Dagens tema: Indfør centrale statistiske begreber.

Forelæsning 11: Kapitel 11: Regressionsanalyse

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Normalfordelingen og Stikprøvefordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Kvantitative Metoder 1 - Forår 2007

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Forelæsning 10: Statistik ved hjælp af simulering

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Forelæsning 1: Intro og beskrivende statistik

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Konfidensintervaller og Hypotesetest

Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Løsning eksamen d. 15. december 2008

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Produkt og marked - matematiske og statistiske metoder

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Løsning til eksaminen d. 14. december 2009

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Opgaver til kapitel 3

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Løsning til eksaminen d. 29. maj 2009

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Kvantitative Metoder 1 - Forår Dagens program

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Note om Monte Carlo metoden

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Forelæsning 11: Envejs variansanalyse, ANOVA

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Transkript:

Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: perbb@dtu.dk Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 1 / 40

Oversigt, Inferens for gennemsnit (One-sample setup) 1 Intro og generelle begreber Populationer og stikprøver Inferens og stikrøvefordeling Central Grænseværdisætning 2 Maksimal fejl på et estimat Eksempel 1 3 Bestemmelse af stikprøvestørrelse Eksempel 2 4 Udvidelse til "ukendt varians-setup t-fordeling Maximal fejl Eksempel 3 5 Konfidensinterval Eksempel 4 6 Kendt eller ukendt varians 7 R (R note 6) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 2 / 40

Intro og generelle begreber Oversigt 1 Intro og generelle begreber Populationer og stikprøver Inferens og stikrøvefordeling Central Grænseværdisætning 2 Maksimal fejl på et estimat Eksempel 1 3 Bestemmelse af stikprøvestørrelse Eksempel 2 4 Udvidelse til "ukendt varians-setup t-fordeling Maximal fejl Eksempel 3 5 Konfidensinterval Eksempel 4 6 Kendt eller ukendt varians 7 R (R note 6) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 3 / 40

Intro og generelle begreber Motiverende eksempel En bilproducent er interesseret i at fastlægge benzinforbruget ved kørsel på motorvej for et nyt bilmærke. Fra et pilotstudie vides, at variansen af forbruget, σ 2, er 0.2 2 (l/100 km) 2. Der udføres nu 25 forsøgsture (samme fører), hvor hver bil kører 100 km, og fra disse målinger estimeres middelværdien. Hvad bliver V ar[ X]? Beregn maksimal fejl med 95% sandsynlighed, dvs. E 0.95 Beregn maksimal fejl med 99% sandsynlighed, dvs. E 0.99 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 4 / 40

Intro og generelle begreber Kapitel 7: Inferens for gennemsnit Estimation (7.1-7.2) Maksimal fejl på estimat af middelværdi Intervalestimation Kapitel 6: Stikprøvefordelinger Definition af population og tilfældig stikprøve Stikprøvefordeling for gennemsnit fra en normalfordeling t-fordelingen R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 5 / 40

Intro og generelle begreber Populationer og stikprøver Populationer og stikprøver Ved hjælp af en stikprøve forsøger man at generalisere om en population Det er derfor vigtigt, at stikprøven er repræsentativ for populationen Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 6 / 40

Intro og generelle begreber Populationer og stikprøver Definition af population og tilfældig stikprøve (Kap. 6.1) Tilfældig stikprøve fra en endelig population: Observationerne X 1, X 2,..., X n er en tilfældig stikprøve af størrelse n fra en endelig population af størrelse N, såfremt værdierne er valgt således, at enhver delmængde af størrelse n af de N elementer fra populationen har den samme sandsynlighed for at blive valgt. Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 7 / 40

Intro og generelle begreber Populationer og stikprøver Definition af tilfældig stikprøve (Kap. 6.1) Tilfældig stikprøve fra en uendelig population: Et sæt observationer X 1, X 2,..., X n er en tilfældig stikprøve af størrelse n fra en uendelig population f(x) såfremt: 1 Hvert X i er en stokastisk variabel med tæthedsfunktion f(x) 2 De n stokastiske variable er uafhængige Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 8 / 40

Intro og generelle begreber Inferens og stikrøvefordeling Inferens for middelværdier Parameter: middelværdi af population µ Data: en tilfældig stikprøve med udfald x 1, x 2,..., x n fra stokastiske variable: X 1, X 2,..., X n Estimator - gennemsnittet: X Varians på gennemsnit:(fra Kap. 6.2) V ar[ X] = σ2 n Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 9 / 40

Intro og generelle begreber Inferens og stikrøvefordeling Stikprøvefordeling for gennemsnittet når variansen er kendt (Theorem 6.1, side 180) Uendelig population: Lad X være gennemsnittet af en stikprøve af størrelse n fra en fordeling med middelværdi µ og varians σ 2 Da er X en stokastisk variabel og følger en fordeling med middelværdi µ og varians σ2 n Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 10 / 40

Intro og generelle begreber Inferens og stikrøvefordeling Stikprøvefordeling for gennemsnittet når variansen er kendt (Theorem 6.1, side 180) Endelig population: Lad X være gennemsnittet af en stikprøve af størrelse n fra en fordeling med middelværdi µ og varians σ 2 Da er X en stokastisk variabel og følger en fordeling med middelværdi µ og varians σ2 n N n N 1 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 11 / 40

Intro og generelle begreber Inferens og stikrøvefordeling Begreber Central Estimator: En estimator ˆθ er central (eller ikke-biased), hvis og kun hvis, middelværdien af stikprøvefordelingen for estimatoren er lig θ Efficient Estimator En estimator ˆθ 1 er en mere efficient estimator af θ end estimatoren ˆθ 2 hvis: 1 ˆθ1 og ˆθ 2 begge er centrale estimatorer af θ 2 Variansen af stikprøvefordelingen for ˆθ 1 er mindre end for ˆθ 2 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 12 / 40

Intro og generelle begreber Central Grænseværdisætning Den centrale grænseværdisætning (Theorem 6.3, side 184) Lad X være gennemsnittet af en stikprøve fra en fordeling med middelværdi µ og varians σ 2. Da vil Z = X µ σ/ n følge en N(0, 1 2 ) fordeling for n HVIS data i sig selv følger en normalfordeling, så er stikprøvefordelingen også normal: X i N(µ, σ 2 ) Z N(0, 1). Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 13 / 40

Maksimal fejl på et estimat Oversigt 1 Intro og generelle begreber Populationer og stikprøver Inferens og stikrøvefordeling Central Grænseværdisætning 2 Maksimal fejl på et estimat Eksempel 1 3 Bestemmelse af stikprøvestørrelse Eksempel 2 4 Udvidelse til "ukendt varians-setup t-fordeling Maximal fejl Eksempel 3 5 Konfidensinterval Eksempel 4 6 Kendt eller ukendt varians 7 R (R note 6) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 14 / 40

Maksimal fejl på et estimat Maksimal fejl på et estimat For store n gælder (den centrale grænseværdi sætning): X µ σ/ n N(0, 12 ) Den maksimale fejl, E, på et estimat med sandsynlighed (1 α) bliver: E = z α/2 σ n hvor z α/2 findes i standard normalfordelingen (tabel 3) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 15 / 40

Maksimal fejl på et estimat Eksempel 1 Eksempel 1 En bilproducent er interesseret i at fastlægge benzinforbruget ved kørsel på motorvej for et nyt bilmærke. Fra et pilotstudie vides, at variansen af forbruget, σ 2, er 0.2 2 (l/100 km) 2. Der udføres nu 25 forsøgsture (samme fører), hvor hver bil kører 100 km, og fra disse målinger estimeres middelværdien. Hvad bliver V ar[ X]? Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 16 / 40

Maksimal fejl på et estimat Eksempel 1 Eksempel 1 Beregn maksimal fejl med 95% sandsynlighed, dvs. E 0.95 Beregn maksimal fejl med 99% sandsynlighed, dvs. E 0.99 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 17 / 40

Bestemmelse af stikprøvestørrelse Oversigt 1 Intro og generelle begreber Populationer og stikprøver Inferens og stikrøvefordeling Central Grænseværdisætning 2 Maksimal fejl på et estimat Eksempel 1 3 Bestemmelse af stikprøvestørrelse Eksempel 2 4 Udvidelse til "ukendt varians-setup t-fordeling Maximal fejl Eksempel 3 5 Konfidensinterval Eksempel 4 6 Kendt eller ukendt varians 7 R (R note 6) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 18 / 40

Bestemmelse af stikprøvestørrelse Bestemmelse af stikprøvestørrelse Den maksimale fejl med sandsynlighed (eller konfidens) 1 α er: E = z α/2 σ n Når σ er kendt og vi ønsker at bestemme stikprøvestørrelse n for en maksimal fejl med sandsynlighed 1 α fås: n = ( z α/2 σ E )2 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 19 / 40

Bestemmelse af stikprøvestørrelse Eksempel 2 Eksempel 2 Bilproducenten beslutter sig for at afprøve nogle justeringer, der antages at have indflydelse på benzinforbruget. Baseret på pilotstudiet antages indledningsvist, at variansen af forbruget, σ 2, er 0.2 2 (l/100 km) 2. Der køres igen ture á 100 km. Bestem den nødvendige stikprøvestørrelse (antal ture), såfremt man ønsker, at den maksimale fejl med 95% sandsynlighed højst er E 95 = 0.10 (l/100 km)? Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 20 / 40

Udvidelse til "ukendt varians-setup Oversigt 1 Intro og generelle begreber Populationer og stikprøver Inferens og stikrøvefordeling Central Grænseværdisætning 2 Maksimal fejl på et estimat Eksempel 1 3 Bestemmelse af stikprøvestørrelse Eksempel 2 4 Udvidelse til "ukendt varians-setup t-fordeling Maximal fejl Eksempel 3 5 Konfidensinterval Eksempel 4 6 Kendt eller ukendt varians 7 R (R note 6) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 21 / 40

Udvidelse til "ukendt varians-setup Stikprøvefordeling for middelværdien når variansen ikke er kendt Lad X være middelværdien af en stikprøve af størrelse n fra en fordeling med middelværdi µ og varians σ 2 og hvor stikprøvens varians er estimeret: S 2 = 1 n 1 n (X i X) 2 i=1 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 22 / 40

Udvidelse til "ukendt varians-setup t-fordeling Stikprøvefordeling for middelværdien når variansen ikke er kendt Da er S 2 = 1 n 1 n (X i X) 2 i=1 t = X µ S/ n en stokastisk variabel og følger en t-fordeling med parameter v = n 1 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 23 / 40

Udvidelse til "ukendt varians-setup t-fordeling t-fordelingen t fordeling med 10 frihedsgrader tæthed 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 24 / 40

Udvidelse til "ukendt varians-setup t-fordeling t-fordelingen sammenligning af en normal og t fordeling (n 1=10) tæthed 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 25 / 40

Udvidelse til "ukendt varians-setup t-fordeling Tabelopslag i t-fordelingen Tabelopslag i t-fordelingen gøres vha tabel 4 Ved t α (n 1) forstås den værdi, således at P (t t α ) = α Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 26 / 40

Udvidelse til "ukendt varians-setup Maximal fejl Maksimal fejl på et estimat (σ ukendt) Når σ er ukendt, anvendes estimatet s for σ. I stedet for z α/2 anvendes t α/2 og den maksimale fejl, E med (1 α) konfidens, bliver E = t α/2 s n hvor t α/2 = t(n 1) α/2 findes i t-fordelingen (tabel 4) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 27 / 40

Udvidelse til "ukendt varians-setup Eksempel 3 Eksempel 3 Med de nye justering udføres 16 forsøg. Fra disse estimeres variansen s 2 = 0.25 2. Bestem den maksimale fejl, E 0.95, dvs. med 95% sandsynlighed. Forklar hvorfor estimatet af E 0.95 i dette tilfæde er større end 0.10 (l/100 km). Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 28 / 40

Konfidensinterval Oversigt 1 Intro og generelle begreber Populationer og stikprøver Inferens og stikrøvefordeling Central Grænseværdisætning 2 Maksimal fejl på et estimat Eksempel 1 3 Bestemmelse af stikprøvestørrelse Eksempel 2 4 Udvidelse til "ukendt varians-setup t-fordeling Maximal fejl Eksempel 3 5 Konfidensinterval Eksempel 4 6 Kendt eller ukendt varians 7 R (R note 6) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 29 / 40

Konfidensinterval Intervalestimation Det er ofte mere informativt at angive intervalestimater end blot en enkelt værdi, f.eks. kan man være interesseret i et interval, der dækker (1 α)%. Idet vi kan skrive for kendt σ: z α/2 < X µ σ/ n < z α/2 Ved omskrivning fås (1 α) konfidensintervallet: x z α/2 σ n < µ < x + z α/2 σ n Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 30 / 40

Konfidensinterval Konfidensinterval Såfremt man ikke kender σ, men har en stor stikprøve (n 30) anvendes den samme formel, blot erstattes σ med estimatet s: x z α/2 s n < µ < x + z α/2 s n Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 31 / 40

Konfidensinterval Konfidensinterval Såfremt man ikke kender σ og har en lille stikprøve (n < 30), erstattes σ med estimatet s, og z α/2 erstattes med t α/2 : x t α/2 s n < µ < x + t α/2 s n (Under antagelse af, at data er normalfordelt!) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 32 / 40

Konfidensinterval Eksempel 4 Eksempel 4 I et amerikansk studie ønskede man at sammenligne indhold af arsenik i drikkevandet ved 8 forskellige lokaliteter: lokalitet vandprøve (ppm) 1 2.2 2 4.1 3 2.1 4 0.8 5 0.1 6 3.2 7 2.9 8 2.2 x = 2.2 og s 2 x = 1.64 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 33 / 40

Konfidensinterval Eksempel 4 Eksempel 4 Det antages nu, at vandprøvemålingerne følger en normalfordeling. Angiv et 95% konfidensinterval for middelindholdet µ x af arsenik i drikkevandet. Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 34 / 40

Konfidensinterval Eksempel 4 Eksempel 4 Fra et tidligere studie oplyses, at et konfidensinterval for middelværdien af arsenik i drikkevandet er [1.63; 2.37]. Det oplyses, at ovenstående konfidensinterval var baseret på en stikprøve med n = 50 observation med estimeret middelindhold x = 2 og varians s 2 = 1.50. Hvor stort konfidensinterval 1 α (i %) er der tale om? Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 35 / 40

Kendt eller ukendt varians Oversigt 1 Intro og generelle begreber Populationer og stikprøver Inferens og stikrøvefordeling Central Grænseværdisætning 2 Maksimal fejl på et estimat Eksempel 1 3 Bestemmelse af stikprøvestørrelse Eksempel 2 4 Udvidelse til "ukendt varians-setup t-fordeling Maximal fejl Eksempel 3 5 Konfidensinterval Eksempel 4 6 Kendt eller ukendt varians 7 R (R note 6) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 36 / 40

Kendt eller ukendt varians Generelt I de anførte formler anvendes: 1 Når variansen er kendt, anvendes σ og z α/2 2 Når variansen ikke er kendt, men stikprøven er stor, anvendes s og z α/2 3 Når variansen ikke er kendt og stikprøven er lille, anvendes s og t α/2 NB: "Ukendt betyder at man bruger foreliggende data til at bestemme variansen (Og erkender begrænsningen/usikkerheden i dette) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 37 / 40

R (R note 6) Oversigt 1 Intro og generelle begreber Populationer og stikprøver Inferens og stikrøvefordeling Central Grænseværdisætning 2 Maksimal fejl på et estimat Eksempel 1 3 Bestemmelse af stikprøvestørrelse Eksempel 2 4 Udvidelse til "ukendt varians-setup t-fordeling Maximal fejl Eksempel 3 5 Konfidensinterval Eksempel 4 6 Kendt eller ukendt varians 7 R (R note 6) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 38 / 40

R (R note 6) R (R note 6) R t chisq f Betegnelse t-fordelingen χ 2 -fordelingen F-fordelingen d Tæthedsfunktion f(x) (probability distribution). p Fordelingsfunktion F (x) (cumulative probability function). q Fraktil (quantile) i fordeling. r Simulering (random sampling from distribution). Eksempel: P (t 2) pt(2) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 39 / 40

R (R note 6) Oversigt 1 Intro og generelle begreber Populationer og stikprøver Inferens og stikrøvefordeling Central Grænseværdisætning 2 Maksimal fejl på et estimat Eksempel 1 3 Bestemmelse af stikprøvestørrelse Eksempel 2 4 Udvidelse til "ukendt varians-setup t-fordeling Maximal fejl Eksempel 3 5 Konfidensinterval Eksempel 4 6 Kendt eller ukendt varians 7 R (R note 6) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 5 Foråret 2014 40 / 40