Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Relaterede dokumenter
1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Stikprøvefordelinger og konfidensintervaller

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Estimation ved momentmetoden. Estimation af middelværdiparameter

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Løsninger til kapitel 7

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Konfidens intervaller

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Motivation. En tegning

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

9. Binomialfordelingen

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Maja Tarp AARHUS UNIVERSITET

Generelle lineære modeller

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Sammenligning af to grupper

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Vejledende besvarelser til opgaver i kapitel 15

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

antal gange krone sker i første n kast = n

Opsamling. Lidt om det hele..!

Hovedpointer fra SaSt

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Kvantitative metoder 2

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Diskrete og kontinuerte stokastiske variable

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Statistik Lektion 8. Test for ens varians

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Renteformlen. Erik Vestergaard

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

Asymptotisk estimationsteori

STATISTISKE GRUNDBEGREBER

Morten Frydenberg version dato:

Den flerdimensionale normalfordeling

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Uge 40 I Teoretisk Statistik, 30. september 2003

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Supplement til Kreyszig

Introduktion til Statistik

Modul 14: Goodness-of-fit test og krydstabelanalyse

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

STATISTISKE GRUNDBEGREBER

Asymptotisk optimalitet af MLE

STATISTISKE GRUNDBEGREBER

Estimation og test i normalfordelingen

STATISTISKE GRUNDBEGREBER

STATISTIKNOTER Simple normalfordelingsmodeller

Matematisk Modellering 1 Hjælpeark

Program. Middelværdi af Y = t(x ) Transformationssætningen

og Fermats lille sætning

Statistik Lektion 14 Simpel Lineær Regression. Simpel lineær regression Mindste kvadraters metode Kovarians og Korrelation

Statistiske Modeller 1: Notat 1

Teoretisk Statistik, 18. november Stikprøveteori: hvor er vi, og hvor skal vi hen? Proportional allokering Optimal allokering

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Konfidensintervaller og Hypotesetest

Statistik Lektion 4. Kovarians og korrelation Mere om normalfordelingen Den centrale grænseværdi sætning Stikprøvefordelingen

Supplerende noter II til MM04

Vi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Repetition. Forårets højdepunkter

Vejledende opgavebesvarelser

STATISTIK x-klasserne Gammel Hellerup Gymnasium

og Fermats lille Projekt 0.4 Modulo-regning, restklassegrupperne sætning ..., 44, 20,4,28,52,... Hvad er matematik? 3 ISBN

Normalfordelingen og Stikprøvefordelinger

Teoretisk Statistik, 9. februar Beskrivende statistik

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

Variansanalyse. på normalfordelte observationer af Jens Friis

Bestemmelse af vandføring i Østerå

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

Lys og gitterligningen

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

Transkript:

Avedt Statistik Lektio 3 Pukt- og itervalestimater Kofidesitervaller Valg af stikprøvestørrelse

Pukt- og itervalestimater: Motivatio Motiverede eksempel: I e udersøgelse er adele af rygere 0.27. Det aslås at populatiosadele er mellem 0.25 og 0.29. Begreber: De 0.27 er et pukt-estimat Itervallet 0.25 til 0.29 er et iterval-estimat. Dvs. populatiosadele falder (aslået) idefor pukt-estimat +/- fejl-margi. Fejl-margi er her 0.02

Pukt-estimat og -estimator E estimator er e geerel formel, der bruges til at estimere e parameter med, fx. y = y 1 + y + + Et estimat er e kokret udregig af e estimator, ved at idsætte data. 2 y Der ka være mage estimatore for de samme parameter. Hvis populatiosfordelige er symmetrisk er både stikprøve-media og -geemsit estimatore for populatios-middelværdie.

E god estimator E god estimator har typisk følgede egeskaber: De er Ubiased dvs. at estimatore i geemsit er lig parametere. De er Efficiet dvs. fejl-margi bliver midre jo mere data der er til rådighed. Stikprøve-mediae er e biased estimator for populatiosmiddelværdie, hvis fordelige ikke er symmetrisk.

Notatio e på hatte Stikprøve-geemsittet y er e estimator for populatiosmiddelværdie µ. Geerelt vil vi betege e estimator med e hat ^. ^ Fx. beteger µ e estimator for µ.

Kofidesiterval Motivatio: Ifølge udersøgelse: 54% er vilde med pålægschokolade! Spørgsmål: Hvor sikkert er dette estimat? Kofidesiterval Et kofidesiterval agiver et iterval, hvor vi tror parametere ligger. Sadsylighede for at kofidesitervallet ideholder parametere beteges kofidesiveauet. Kofidesiveauet er typisk 0.95 eller 0.99.

Kofidesiterval: Typisk opskrift I mage tilfælde er stikprøvefordelige for estimatore (tilærmelsesvis) ormalfordelt. Fx stikprøvegeemsittet. I disse tilfælde er kofidesitervallet givet ved pukt-estimat fejl-margi Spørgsmål: Hvorda fider vi fejl-margi?

Kofidesiterval for adele Notatio π : populatios-adel ^ π : stikprøve-adel Bemærk: π er e estimator for π. Atag y = 1 : succes / vild med pålægschokolade y = 0 : fiasko / ikke vild med pålægschokolade Vi har ^ P(1) = π og P(0) = 1-π. Middelværdi og stadard-afvigelse for y (populatioe) er hhv. µ = π og σ = π(1 π)

Adele er et geemsit Bemærk: πˆ = y y 1 + y2 + + y i i = Dvs. stikprøve-adele er et geemsit. For geemsit ved vi at stadard-fejle er så for stikprøve-adele er de σ = y σ σ ˆ π = π (1 π )

Kofidesiterval for π for stort ^ Da π er et geemsit siger CLT, at π ca. følger e ormalfordelig hvis bare er stor ok. ^ Med 95% sadsylighed vil π falde i itervallet π ±1.96 σ ˆ π Omvedt: Med 95% sadsylighed vil π ligge i itervallet ˆ π ± 1.96 σ ˆ π ^

Kofides-iterval: E figur Stikprøvefordelige for π^ 0.4 0.3 95% 0.2 0.1 2.5% 2.5% 0.0 ˆ π 1.96 π ( 1 π ) π ˆ π + 1.96 π x ( 1 π ) πˆ πˆ * πˆ πˆ πˆ πˆ πˆ πˆ πˆ *

Kofidesiterval I praksis keder vi ikke π, dvs. vi keder ikke stadard fejle: = π (1 π ) σ ˆ π I stedet for π bruger vi estimatet π : ^ Et 95% kofides-iterval for π er u givet ved πˆ ± 1. 96 se hvor se = ˆ π (1 ˆ π ) se = stadard error

Eksempel Af 1200 adspurgte i Florida svarer 396 ja til reduktio af abortrettigheder. Fid et 95% kofidesiterval for populatiosadele af ja-sigere. ^ π = se = 95% kofidesiterval:

Hvad med et 99% kof. iterval? Et 99% kofidesiterval: πˆ ± 2. 58 se 0.0 0.1 0.2 0.3 0.4 99% Et (1-α)100% kofidesiterval ˆ π ( 1 ˆ π ) ˆ π ± z 0.0 0.1 0.2 0.3 0.4 z=2.58-3 -2-1 0 1 2 3 α/2 (1 α)% Egeskaber ved kofidesitervaller: o o o -3-2 -1 0 1 2 3 Jo højere kofidesiveau, jo større z og jo lægere kofides-iterval Jo større stikprøve () jo kortere kofidesiterval Firdoblig af sikre halverig af kofidesiterval. z

Kofidesiterval for middelværdi Igredieser: µ : Populatios-middelværdi y : Stikprøve-geemsit y er et puktestimat for µ. For store stikprøver er y ormalfordelt. Stadardfejle er altid σ σ y = hvor σ er stadard-afvigelse for populatioe. De estimerede stadard-fejl er se = s

Eksempel Kofidesiterval for middelværdi er y ± z se, hvor se = s Eksempel: På et spørgsmål om atal seksuelle partere bladt = 231 kvider, var geemsittet y = 4.96 og stadard-afvigelse 6.81. Fid et 95% kofidesiterval for populatios-middelværdie µ.

Kofidesiterval for middelværdi små stikprøver Atag: populatioe er ormal-fordelt. Da er y ormalfordelt uaset stikprøve-størrelse. Hvis vi keder pop. stadard-afvigelse σ er et (eksakt) kofidesiterval givet ved y ± z Hvis σ er ukedt, erstatter vi med stikprøve stadardafvigelse s. Problem: For små stikprøver medfører dette e ekstra usikkerhed. Løsig: Erstat z med t! σ

t-fordelige t-fordelige er Klokkeformet og symmetrisk omkrig 0 Stadard-afvigelse er lidt større ed 1 Facoe afhæger af atal frihedsgrader (df). Har lidt tykkere haler ed stadard ormalfordelige. Liger e ormalfordelig for df 30. N(0,1) df = 6 df = 2-3 -2-1 0 1 2 3

Kofidesiterval for små stikprøver For e ormalfordelt populatio er et (1-a)100% kofidesiterval for µ s y ± tα / 2 se, hvor se = hvor df = -1. α/2 α/2 1 α -3-2 -1 0 1 2 3 Eksempel: Vi har observeret 29 vægtædriger, hvor y = 3.01 og s = 7.31. Fid et 95% kof. iterval for µ : Løsig: df = -1 = 28, α = 0.025, så t 0.025 = 2.048 t α/2 t α/2

t-tabelle a

I SPSS SPSS: Aalyze Compare Meas Oe-Sample T-Test

Valg af stikprøvestørrelse Hvorda vælger ma stikprøvestørrelse så vi opår e Give fejl-margi ved et Givet kofidesiveau Eksempel: Vi øsker at bestemme et kofidesiterval for π, så Fejl-margi : Max 0.04 Kofidesiveau : 95% Løsig:

Geerel løsig for adele For at populatiosadel π vælg Fejl-margi: M Sigifikasiveau: (1-α)100% Stikprøvestørrelse skal da være: z = π ( 1 π ) M 2 Hvis populatios-adele π er helt og aldeles ukedt bruges π = 0.5 i formle. 0.0 0.1 0.2 0.3 0.4 (1 α)100% α/2 z z α/2-3 -2-1 0 1 2 3

Geerel løsig for middelværdi For middelværdie µ vælg Fejl-margi: M Sigifikasiveau: (1-α)100% Stikprøvestørrelse skal da være: 0.0 0.1 0.2 0.3 0.4 2 = σ z M (1 α)100% 2 Hvis populatiosstadardafvigelse σ er ma ød til at gætte sig frem til. Hellere lidt for stor ed for lille. α/2 z z α/2-3 -2-1 0 1 2 3

Eksempel Middel atal års uddaelse bladt idiaere Øsker: Fejl-margi: M = 1år Kofidesiveau: 99% Først skal vi gætte σ! Vi tror (æste) alle har mellem 5 og 20 års uddaelse Derfor er vores gæt σ = 2.5 år!