Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ hypotese, der må accepteres hvis H 0 forkastes Trin : Vælg statistisk model Test statistik og sampling fordeling fastsættes (vælges under hensyntagen til H 0 og H ) Trin 3: Vælg signifikansniveau Beslutning: H 0 er sand H 0 er ikke sand Accepter H 0 Korrekt beslutning Forkert beslutning Type II fejl Forkast H 0 Forkert beslutning Type I fejl Korrekt beslutning
Statistik 7. gang Beslutning: H 0 er sand H 0 er ikke sand Accepter H 0 Korrekt beslutning Forkert beslutning Type II fejl Forkast H 0 Forkert beslutning Type I fejl Korrekt beslutning Type I og II fejl er ikke uafhængige Normalt tages der mest hensyn til type I fejl! Signifikansniveau: α sandsynlighed for type I fejl β sandsynlighed for type II fejl Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.0 eller 0.05
Statistik 7. gang 3 Trin 4: Indsaml data og beregn test statistik Udfra en stikprøve med n udfald beregnes test statistikken Trin 5: Definer forkastelsesområdet Det område for test statistikken, der medfører at H 0 forkastes (område der er usandsynligt for test statistikken, hvis hypotesen er sand)
Statistik 7. gang 4 Området afhænger af: - Formuleringen af H - Fordelingsfunktionen for test statistikken - Signifikans-niveauet Trin 6: Konklusion H 0 accepteres hvis værdien af test statistikken ligger indenfor det acceptable område H 0 forkastes og derved accept af H hvis værdien af test statistikken ligger udenfor det acceptable område
Statistik 7. gang 5 9.3. HYPOTESETEST AF MIDDELVÆRDIER KENDT SPREDNING Eks: Test af stål trækstyrke: kan det konkluderes at forventningsværdien af trækstyrken er mindst 35 MPa? - spredningen er kendt: σ = 6 MPa. trin: Hypotese: H 0 : μ = μ 0 = 35 MPa H : μ < μ 0 = 35 MPa (eller H : μ > μ0) (eller H : μ μ0)
Statistik 7. gang 6 I dette tilfælde udføres en enkeltsidet test, små styrker betragtes som kritiske : H 0 accepteres hvis Z > Zα Hvis H 0 accepteres kan det ikke afvises, at middeltrækstyrken er 35 MPa eller større.. trin: statistisk model Fordeling af X : σ N( μ, ) n Test statistik: X μ Z = σ / n : N(0, )
Statistik 7. gang 7 3. trin: Signifikansniveau α = 0.0 ( % sandsynlighed for type I fejl, dvs. at H 0 forkastes selvom den er sand) 4. trin: n Udfra n = 00 og X = x i = 39 : n i= Z X μ = = σ / n 39 35 6 / 00 = 3.75
Statistik 7. gang 8 5. trin: Der benyttes en enkeltsidet test, idet kun små værdier af Z er kritiske! Z = 3.75 Z = Φ ( α) = Φ (0.99) =.36 Z =. 36 α α 6. trin: H 0 forkastes, dvs. styrken er ikke acceptabel
Statistik 7. gang 9 EKSEMPEL Er forventningsværdien af indholdet i en flaske = ¾ liter?. trin: H 0 : μ = μ 0 = 3/ 4 liter H : μ μ 0 = 3/ 4 liter. trin: Hvis σ antages kendt fås: (husk sidste gang) σ X : N( μ, ) n Derved introduceres test statistikken: X μ Z = : N(0, ) σ / n
Statistik 7. gang 0 3. trin: Signifikansniveau α = 0.0 ( % sandsynlighed for type I fejl, dvs. at H 0 forkastes selvom den er sand) 4. trin: Forsøgsresultater: n = 30 n X = x i n = 0. 79 Med μ = 0. 75 og σ = 0. 05 fås: i= Z X μ = = σ / n 0.79 0.75 0.05 / 30 = 0.5
Statistik 7. gang 5. trin: Der vælges en dobbeltsidet test, idet både små og store værdier af Z er kritiske! Z = 0.5 Z α / = Φ ( α / ) = Φ (0.995) =.58 6. trin: H 0 accepteres, idet: Z α /.58 < < Z < 0.5 Z α / <.58
Statistik 7. gang 9.3. HYPOTESETEST AF MIDDELVÆRDIER UKENDT SPREDNING. trin: Hypotese: H 0 og H : formuleres som før. trin: statistisk model Middelværdi X og spredning S : stokastiske variabler Test statistik: X μ t = : tn S / n (t-fordeling med n- frihedsgrader) 3. trin: Signifikansniveau: som før, typisk α = 0.0 4. trin: Indsaml data og beregn test statistik t
Statistik 7. gang 3 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H 0 forkastes (område der er usandsynligt for test statistikken, hvis hypotesen er sand) 6. trin: Konklusion accept område: H : μ < μ0 forkast hvis t < tα,( n ) H : μ > μ0 forkast hvis t > tα,( n ) H : μ μ0 forkast hvis t < tα /,( n ) eller t > tα /,( n )
Statistik 7. gang 4
Statistik 7. gang 5 EKSEMPEL 9.3 Koncentration af ilt: Er forventningsværdien af koncentrationen af ilt over grænseværdien på 3 per million?. trin: Hypotese: H 0 : μ = μ 0 = 3 per million H : μ < μ 0 = 3 per million. trin: Test statistik: X μ t = : tn S / n (t-fordeling med n- frihedsgrader) 3. trin: Signifikansniveau: typisk α = 0.05 4. trin: Givet: n = 5 X =.8 S =0.3 t = X μ = S / n.8 3 0.3 / 5 =.398
Statistik 7. gang 6 5. trin: Enkeltsidet test t =.398 t =.3 (tabel A-) α,(5 ) 6. trin: H 0 accepteres, idet: -.398 > -.3
Statistik 7. gang 7 9.3.3 HYPOTESETEST AF MIDDELVÆRDIER UKENDT SPREDNING Population : X : N( μ, σ ): n samples med middelværdi X og spredning S Population : X : N( μ, σ ): n samples med middelværdi X og spredning S. trin: Hypotese: H 0 : middelværdier af de populationer er ens: μ = μ H : μ < μ eller H : μ > μ eller H : μ μ. trin: Test statistik: X X t = (t-fordeling med n + n - frihedsgrader) ( n ) S + ( n ) S + n + n n n 3. trin: Signifikansniveau: som før, typisk α = 0.0
Statistik 7. gang 8 4. trin: Indsaml data og beregn test statistik t 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H 0 forkastes 6. trin: Konklusion accept område: H : μ < μ forkast hvis t < tα H : μ > μ forkast hvis t > tα H : μ μ forkast hvis t < t α / eller t > t α /
Statistik 7. gang 9 EKSEMPEL 9-4 Udvikling af kvælstofindhold i én bæk - indhold før byudvikling: μ f - indhold efter byudvikling: μ e Er der sket en ændring?. trin: Hypotese: H 0 : middelværdier af de populationer er ens: μ f = μ e H : μ f < μ e. trin: Test statistik: X X t = (t-fordeling med n + n - frihedsgrader) ( n ) S + ( n ) S + n + n n n 3. trin: Signifikansniveau: α = 0.05
Statistik 7. gang 0 4. trin: Data: Før: n = X =0.78 S =0.36 Efter: n = 4 X =.37 S =0.87 0.78.37 t = = -.04 ( )0.36 + (4 )0.87 + + 4 4 5. trin: Definer forkastelsesområdet Enkeltsidet test t =.04 t =. 74 (tabel A-) 6. trin: Konklusion Da -.04 < -.74 forkastes H 0 H accepteres α,(+ 4 ) Dvs. kvælstodindholdet forøges efter byudvikling
Statistik 7. gang Alternativt: 3. trin: Signifikansniveau: α = 0.0 t =.04 t α,(+ 4 ) =-.500 (tabel A-) H 0 accepteres Dvs. kvælstodindholdet forøges ikke efter byudvikling med et signifikansniveau på % OBS: α = P( H 0 selvom H er sand) forkast 0 dvs. α større sværere at få hypotese accepteret (lettere at få hypotese forkastet)
Statistik 7. gang 9.4 HYPOTESETEST AF VARIANSER. trin: Hypotese: H 0 : ingen signifikant forskel mellem populationens varians og en forud valgt værdi af variansen σ : σ = σ 0 0 σ H : eller H : eller H : σ < σ 0 σ > σ 0 σ σ 0. trin: Test statistik: samplevarians: S : χ (chi-fordelt tabel A-3) ( n ) S test statistik: χ = σ 0 χ -fordelt med (n-) frihedsgrader 3. trin: Signifikansniveau: som før, typisk α = 0.0
Statistik 7. gang 3 4. trin: Indsaml data og beregn test statistik 5. trin: Definer forkastelsesområdet Det område for test statistikken, der medfører at H 0 forkastes χ
Statistik 7. gang 4 6. trin: Konklusion accept område: H : σ < σ 0 forkast hvis χ < χ α,( n ) H : σ > σ 0 forkast hvis χ > χ α,( n ) H : σ σ 0 forkast hvis χ < χ α /,( n ) eller χ > χ α /,( n )
Statistik 7. gang 5
Statistik 7. gang 6 EKSEMPEL 9-5 Variansen af betons trykstyrke bør ikke være for stor. trin: Hypotese: H 0 : varians = H : σ > σ 0 σ = 0 3. trin: Signifikansniveau: α = 0.05 0.75 4. trin: Data: n= 5 S =.38 ( n ) S (5 ).38 χ = = = 0. 84 σ 0 0.75 5. trin: Definer forkastelsesområdet H : σ > σ 0 forkast hvis χ χ α,( n ) =9.49 (tabel A-3) 6. trin: Konklusion Da χ forkastes hypotesen > χ α,( n ) > χ α,( n )
Statistik 7. gang 7 9.4. HYPOTESETEST AF POPULATIONERS VARIANSER Varians af de populationer: S og S ( S > S ). trin: Hypotese: H 0 : ingen signifikant forskel mellem populationernes varianser σ = σ H : σ σ. trin: test statistik: S F = S F - fordelt med ( n -) frihedsgrader i tæller ( n -) frihedsgrader i nævner 3. trin: Signifikansniveau: typisk α = 0.0 4. trin: Indsaml data og beregn test statistik F 5. trin: Definer forkastelsesområdet H 0 accepteres på signifikansniveau α hvis F < F α, n, n 6. trin: Konklusion /
Statistik 7. gang 8
Statistik 7. gang 9 EKSEMPEL 9-6. trin: Hypotese: H 0 : σ = σ H : σ σ. trin: S test statistik: F = S 3. trin: Signifikansniveau: typisk α = 0.05 4. trin: Indsaml data og beregn test statistik F n =5 S =3.807 n =5 S 6.43 test statistik: F = = =.687 S 3.807 S =6.43 5. trin: Definer forkastelsesområdet F α =6.39 (tabel A-4) /, n, n 6. trin: Konklusion Da F < F α, n, n accepteres H 0 på signifikansniveau α =5% /
Statistik 7. gang 30