Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Relaterede dokumenter
Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Vejledende besvarelser til opgaver i kapitel 14

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Kapitel 7 Forskelle mellem centraltendenser

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Konfidensintervaller og Hypotesetest

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Løsning eksamen d. 15. december 2008

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Module 4: Ensidig variansanalyse

Løsning til eksaminen d. 29. maj 2009

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Eksamen i Statistik for biokemikere. Blok

Løsninger til kapitel 9

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Kapitel 12 Variansanalyse

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Statistik og Sandsynlighedsregning 2

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

Forsøgsplanlægning Stikprøvestørrelse

Nanostatistik: Opgavebesvarelser

Kapitel 12 Variansanalyse

Om hypoteseprøvning (1)

Vejledende løsninger kapitel 8 opgaver

StatDataN: Test af hypotese

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Løsning til eksaminen d. 14. december 2009

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Nanostatistik: Test af hypotese

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Forelæsning 9: Inferens for andele (kapitel 10)

Opgaver til kapitel 3

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Estimation og konfidensintervaller

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Kvantitative Metoder 1 - Forår 2007

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Susanne Ditlevsen Institut for Matematiske Fag susanne

Hypotesetests, fejltyper og p-værdier

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Løsning til eksamen d.27 Maj 2010

Definition. Definitioner

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Forsøgsplanlægning Stikprøvestørrelse

(studienummer) (underskrift) (bord nr)

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Besvarelser til øvelsesopgaver i uge 6

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

1 Hb SS Hb Sβ Hb SC = , (s = )

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Nanostatistik: Konfidensinterval

Personlig stemmeafgivning

Forelæsning 2: Kapitel 4, Diskrete fordelinger

(studienummer) (underskrift) (bord nr)

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Dagens program. Praktisk information:

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Skriftlig eksamen Science statistik- ST501

Forelæsning 8: Inferens for varianser (kap 9)

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Schweynoch, Se eventuelt

Transkript:

Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ hypotese, der må accepteres hvis H 0 forkastes Trin : Vælg statistisk model Test statistik og sampling fordeling fastsættes (vælges under hensyntagen til H 0 og H ) Trin 3: Vælg signifikansniveau Beslutning: H 0 er sand H 0 er ikke sand Accepter H 0 Korrekt beslutning Forkert beslutning Type II fejl Forkast H 0 Forkert beslutning Type I fejl Korrekt beslutning

Statistik 7. gang Beslutning: H 0 er sand H 0 er ikke sand Accepter H 0 Korrekt beslutning Forkert beslutning Type II fejl Forkast H 0 Forkert beslutning Type I fejl Korrekt beslutning Type I og II fejl er ikke uafhængige Normalt tages der mest hensyn til type I fejl! Signifikansniveau: α sandsynlighed for type I fejl β sandsynlighed for type II fejl Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.0 eller 0.05

Statistik 7. gang 3 Trin 4: Indsaml data og beregn test statistik Udfra en stikprøve med n udfald beregnes test statistikken Trin 5: Definer forkastelsesområdet Det område for test statistikken, der medfører at H 0 forkastes (område der er usandsynligt for test statistikken, hvis hypotesen er sand)

Statistik 7. gang 4 Området afhænger af: - Formuleringen af H - Fordelingsfunktionen for test statistikken - Signifikans-niveauet Trin 6: Konklusion H 0 accepteres hvis værdien af test statistikken ligger indenfor det acceptable område H 0 forkastes og derved accept af H hvis værdien af test statistikken ligger udenfor det acceptable område

Statistik 7. gang 5 9.3. HYPOTESETEST AF MIDDELVÆRDIER KENDT SPREDNING Eks: Test af stål trækstyrke: kan det konkluderes at forventningsværdien af trækstyrken er mindst 35 MPa? - spredningen er kendt: σ = 6 MPa. trin: Hypotese: H 0 : μ = μ 0 = 35 MPa H : μ < μ 0 = 35 MPa (eller H : μ > μ0) (eller H : μ μ0)

Statistik 7. gang 6 I dette tilfælde udføres en enkeltsidet test, små styrker betragtes som kritiske : H 0 accepteres hvis Z > Zα Hvis H 0 accepteres kan det ikke afvises, at middeltrækstyrken er 35 MPa eller større.. trin: statistisk model Fordeling af X : σ N( μ, ) n Test statistik: X μ Z = σ / n : N(0, )

Statistik 7. gang 7 3. trin: Signifikansniveau α = 0.0 ( % sandsynlighed for type I fejl, dvs. at H 0 forkastes selvom den er sand) 4. trin: n Udfra n = 00 og X = x i = 39 : n i= Z X μ = = σ / n 39 35 6 / 00 = 3.75

Statistik 7. gang 8 5. trin: Der benyttes en enkeltsidet test, idet kun små værdier af Z er kritiske! Z = 3.75 Z = Φ ( α) = Φ (0.99) =.36 Z =. 36 α α 6. trin: H 0 forkastes, dvs. styrken er ikke acceptabel

Statistik 7. gang 9 EKSEMPEL Er forventningsværdien af indholdet i en flaske = ¾ liter?. trin: H 0 : μ = μ 0 = 3/ 4 liter H : μ μ 0 = 3/ 4 liter. trin: Hvis σ antages kendt fås: (husk sidste gang) σ X : N( μ, ) n Derved introduceres test statistikken: X μ Z = : N(0, ) σ / n

Statistik 7. gang 0 3. trin: Signifikansniveau α = 0.0 ( % sandsynlighed for type I fejl, dvs. at H 0 forkastes selvom den er sand) 4. trin: Forsøgsresultater: n = 30 n X = x i n = 0. 79 Med μ = 0. 75 og σ = 0. 05 fås: i= Z X μ = = σ / n 0.79 0.75 0.05 / 30 = 0.5

Statistik 7. gang 5. trin: Der vælges en dobbeltsidet test, idet både små og store værdier af Z er kritiske! Z = 0.5 Z α / = Φ ( α / ) = Φ (0.995) =.58 6. trin: H 0 accepteres, idet: Z α /.58 < < Z < 0.5 Z α / <.58

Statistik 7. gang 9.3. HYPOTESETEST AF MIDDELVÆRDIER UKENDT SPREDNING. trin: Hypotese: H 0 og H : formuleres som før. trin: statistisk model Middelværdi X og spredning S : stokastiske variabler Test statistik: X μ t = : tn S / n (t-fordeling med n- frihedsgrader) 3. trin: Signifikansniveau: som før, typisk α = 0.0 4. trin: Indsaml data og beregn test statistik t

Statistik 7. gang 3 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H 0 forkastes (område der er usandsynligt for test statistikken, hvis hypotesen er sand) 6. trin: Konklusion accept område: H : μ < μ0 forkast hvis t < tα,( n ) H : μ > μ0 forkast hvis t > tα,( n ) H : μ μ0 forkast hvis t < tα /,( n ) eller t > tα /,( n )

Statistik 7. gang 4

Statistik 7. gang 5 EKSEMPEL 9.3 Koncentration af ilt: Er forventningsværdien af koncentrationen af ilt over grænseværdien på 3 per million?. trin: Hypotese: H 0 : μ = μ 0 = 3 per million H : μ < μ 0 = 3 per million. trin: Test statistik: X μ t = : tn S / n (t-fordeling med n- frihedsgrader) 3. trin: Signifikansniveau: typisk α = 0.05 4. trin: Givet: n = 5 X =.8 S =0.3 t = X μ = S / n.8 3 0.3 / 5 =.398

Statistik 7. gang 6 5. trin: Enkeltsidet test t =.398 t =.3 (tabel A-) α,(5 ) 6. trin: H 0 accepteres, idet: -.398 > -.3

Statistik 7. gang 7 9.3.3 HYPOTESETEST AF MIDDELVÆRDIER UKENDT SPREDNING Population : X : N( μ, σ ): n samples med middelværdi X og spredning S Population : X : N( μ, σ ): n samples med middelværdi X og spredning S. trin: Hypotese: H 0 : middelværdier af de populationer er ens: μ = μ H : μ < μ eller H : μ > μ eller H : μ μ. trin: Test statistik: X X t = (t-fordeling med n + n - frihedsgrader) ( n ) S + ( n ) S + n + n n n 3. trin: Signifikansniveau: som før, typisk α = 0.0

Statistik 7. gang 8 4. trin: Indsaml data og beregn test statistik t 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H 0 forkastes 6. trin: Konklusion accept område: H : μ < μ forkast hvis t < tα H : μ > μ forkast hvis t > tα H : μ μ forkast hvis t < t α / eller t > t α /

Statistik 7. gang 9 EKSEMPEL 9-4 Udvikling af kvælstofindhold i én bæk - indhold før byudvikling: μ f - indhold efter byudvikling: μ e Er der sket en ændring?. trin: Hypotese: H 0 : middelværdier af de populationer er ens: μ f = μ e H : μ f < μ e. trin: Test statistik: X X t = (t-fordeling med n + n - frihedsgrader) ( n ) S + ( n ) S + n + n n n 3. trin: Signifikansniveau: α = 0.05

Statistik 7. gang 0 4. trin: Data: Før: n = X =0.78 S =0.36 Efter: n = 4 X =.37 S =0.87 0.78.37 t = = -.04 ( )0.36 + (4 )0.87 + + 4 4 5. trin: Definer forkastelsesområdet Enkeltsidet test t =.04 t =. 74 (tabel A-) 6. trin: Konklusion Da -.04 < -.74 forkastes H 0 H accepteres α,(+ 4 ) Dvs. kvælstodindholdet forøges efter byudvikling

Statistik 7. gang Alternativt: 3. trin: Signifikansniveau: α = 0.0 t =.04 t α,(+ 4 ) =-.500 (tabel A-) H 0 accepteres Dvs. kvælstodindholdet forøges ikke efter byudvikling med et signifikansniveau på % OBS: α = P( H 0 selvom H er sand) forkast 0 dvs. α større sværere at få hypotese accepteret (lettere at få hypotese forkastet)

Statistik 7. gang 9.4 HYPOTESETEST AF VARIANSER. trin: Hypotese: H 0 : ingen signifikant forskel mellem populationens varians og en forud valgt værdi af variansen σ : σ = σ 0 0 σ H : eller H : eller H : σ < σ 0 σ > σ 0 σ σ 0. trin: Test statistik: samplevarians: S : χ (chi-fordelt tabel A-3) ( n ) S test statistik: χ = σ 0 χ -fordelt med (n-) frihedsgrader 3. trin: Signifikansniveau: som før, typisk α = 0.0

Statistik 7. gang 3 4. trin: Indsaml data og beregn test statistik 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H 0 forkastes χ

Statistik 7. gang 4 6. trin: Konklusion accept område: H : σ < σ 0 forkast hvis χ < χ α,( n ) H : σ > σ 0 forkast hvis χ > χ α,( n ) H : σ σ 0 forkast hvis χ < χ α /,( n ) eller χ > χ α /,( n )

Statistik 7. gang 5

Statistik 7. gang 6 EKSEMPEL 9-5 Variansen af betons trykstyrke bør ikke være for stor. trin: Hypotese: H 0 : varians = H : σ > σ 0 σ = 0 3. trin: Signifikansniveau: α = 0.05 0.75 4. trin: Data: n= 5 S =.38 ( n ) S (5 ).38 χ = = = 0. 84 σ 0 0.75 5. trin: Definer forkastelsesområdet H : σ > σ 0 forkast hvis χ χ α,( n ) =9.49 (tabel A-3) 6. trin: Konklusion Da χ forkastes hypotesen > χ α,( n ) > χ α,( n )

Statistik 7. gang 7 9.4. HYPOTESETEST AF POPULATIONERS VARIANSER Varians af de populationer: S og S ( S > S ). trin: Hypotese: H 0 : ingen signifikant forskel mellem populationernes varianser σ = σ H : σ σ. trin: test statistik: S F = S F - fordelt med ( n -) frihedsgrader i tæller ( n -) frihedsgrader i nævner 3. trin: Signifikansniveau: typisk α = 0.0 4. trin: Indsaml data og beregn test statistik F 5. trin: Definer forkastelsesområdet H 0 accepteres på signifikansniveau α hvis F < F α, n, n 6. trin: Konklusion /

Statistik 7. gang 8

Statistik 7. gang 9 EKSEMPEL 9-6. trin: Hypotese: H 0 : σ = σ H : σ σ. trin: S test statistik: F = S 3. trin: Signifikansniveau: typisk α = 0.05 4. trin: Indsaml data og beregn test statistik F n =5 S =3.807 n =5 S 6.43 test statistik: F = = =.687 S 3.807 S =6.43 5. trin: Definer forkastelsesområdet F α =6.39 (tabel A-4) /, n, n 6. trin: Konklusion Da F < F α, n, n accepteres H 0 på signifikansniveau α =5% /

Statistik 7. gang 30