VIDEREGÅENDE STATISTIK



Relaterede dokumenter
VIDEREGÅENDE STATISTIK

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics)

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

VIDEREGÅENDE STATISTIK

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

En Introduktion til SAS. Kapitel 5.

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Statistisk forsøgsplanlægning. med benyttelse af Statgraphics

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Stastistik og Databehandling på en TI-83

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Løsning til eksamen d.27 Maj 2010

Statistik viden eller tilfældighed

Kapitel 7 Forskelle mellem centraltendenser

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Eksamen i Statistik for Biokemikere, Blok januar 2009

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Forelæsning 9: Inferens for andele (kapitel 10)

Løsning eksamen d. 15. december 2008

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Forsøgsplanlægning Stikprøvestørrelse

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Løsning til eksaminen d. 14. december 2009

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

1 Hb SS Hb Sβ Hb SC = , (s = )

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Modelkontrol i Faktor Modeller

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel.

Eksempler fra bogen Videregående Statistik løst ved anvendelse af programmet SAS-JMP

To-sidet varians analyse

Empirisk Miniprojekt 2

MPH specialmodul Epidemiologi og Biostatistik

Note til styrkefunktionen

(studienummer) (underskrift) (bord nr)

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Reeksamen i Statistik for Biokemikere 6. april 2009

Kapitel 12 Variansanalyse

Løsning til eksaminen d. 29. maj 2009

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Besvarelse af vitcap -opgaven

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Multiple choice opgaver

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Klasseøvelser dag 2 Opgave 1

Vejledende besvarelser til opgaver i kapitel 14

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

VIDEREGÅENDE STATISTIK

Kapitel 12 Variansanalyse

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Opgavebesvarelse, Basalkursus, uge 3

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

(studienummer) (underskrift) (bord nr)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Module 4: Ensidig variansanalyse

Epidemiologi og Biostatistik

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Personlig stemmeafgivning

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Produkt og marked - matematiske og statistiske metoder

Eksamen i Statistik for biokemikere. Blok

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Logistisk Regression - fortsat

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

VIDEREGÅENDE STATISTIK III Ikke parametriske test

Maple-oversigt til matematik B-niveau: Rungsted Gymnasium Definer en funktion og funktionsværdier. Tegn grafen for en funktion.

VIDEREGÅENDE STATISTIK

Normalfordelingen og Stikprøvefordelinger

Postoperative komplikationer

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Transkript:

MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK (med TI 89 og SAS - JMP) 5. udgave 011

FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske grundbegreber. Bogen er bygget op således, at de væsentligste begreber søges forklaret anskueligt og ved hjælp af et stort antal eksempler. I eksemplerne er beregningerne er i videst mulig omfang foretaget ved anvendelse af programmer i lommeregneren TI-89 og i statistikprogrammet SAS-JMP. I slutningen af nogle af kapitlerne er givet en oversigt over centrale formler eller fremgangsmåder. I et appendix sidst i bogen er givet en mere dybtgående statistisk forklaring på formlerne. Efter hvert kapitel er der nogle opgaver og en facitliste til opgaverne findes bagerst i bogen. Læsning: Bogen er opbygget således, at de tre hovedemner Faktorer på og flere niveauer : kapitel 3 til 6, Regressionsanalyse kapitel 7 og Kontrolteori : kapitel 8 og 9 kan læses uafhængigt af hinanden. Kan man af tidsmæssige grunde ikke nå alt, så kan man derfor overspringe en eller flere af disse emner. Et andet forslag er at overspringe en eller flere af delemner som Screeningsforsøg: kapitel 6, Multipel regression: afsnit 7.7 og 7.8 Statistisk godkendelseskontrol:kapitel 9: Skulle man i undervisningen benytter et andet statistikprogram end SAS.JMP, kan de studerende uden vanskelighed på basis af SAS.JMP udskrifterne tolke egne udskrifter, da disse næppeafviger væsentligt fra hinanden. På nedenstående adresse kan man således se bøger, hvor SAS-JMP er udskiftet med statistikprogrammet STATGRAPHICS. Data foreligger ofte som en fil i et regneark som eksempelvis Excel. Disse regneark har indbygget en del statistik bl.a. de almindeligste testfunktioner. I notatet Videregående statistik regnet med Excel er en række af disse statistiske muligheder gennemgået. Alle de nævnte bøger (og mange flere) kan findes på adressen www.larsen-net.dk Januar 01 Mogens Oddershede Larsen. -ii-

INDHOLD Indhold 1 REPETITION AF HYPOTESETEST FOR 1 VARIABEL 1.1 Indledning... 1 1. Normalfordelt variabel... 1 1.3 Binomialfordelt variabel... 5 Opgaver... 6 PLANLÆGNING AF FORSØG.1 Indledning... 8. Nomenklatur... 8.3 Krav til statistisk gyldigt forsøg... 9 3 1 FAKTOR PÅ NIVEAUER 3.1 Normalfordelte variable... 13 3.1.1 Test af differens mellem middelværdier... 13 3.5. Blokforsøg (parvise observationer)... 18 3. Binomialfordelte variable... 0 3.3 Poissonfordelte variable... 1 3.4 Fordeling ukendt (rangtest)... 3.5 Oversigt over centrale formler i kapitel 3... 3 3.5.1 Test og konfidensintervaller af differens mellem middelværdier for normalfordelte variable... 3 3.5. Test af differens mellem varians for normalfordelte variable... 5 3.5.3 Test og konfidensintervaller af p 1 - p for binomialfordelte variable... 6 3.5.4 Test og konfidensintervaller af µ µ for Poissonfordelte variable... 6 1 Opgaver... 7 4 1 FAKTOR PÅ MERE END NIVEAUER 4.1 Indledning... 3 4. Ensidet variansanalyse (normalfordelte variable)... 33 4..1 Indledning... 33 4.. Forklaring af metoder og formler... 34 4..3 Beregning af ensidet variansanalyse ved TI89 og SAS.JMP... 38 4.3 Fuldstændigt randomiseret blokforsøg... 4 4.4 Binomialfordelte variable... 46 4.5 Poissonfordelte variable... 47 4.6 Oversigt over centrale formler i kapitel 4... 48 -iii-

Indhold 4.6.1 Oversigt over fremgangsmåde ved ensidet variansanalyse... 48 4.6. Test af parametre p 1, p,..., p k for binomialfordelte variable... 49 4.6.3 Test af parametre µ 1, µ,..., µ k for Poissonfordelte variable... 49 Opgaver... 50 5 FAKTORER PÅ ELLER FLERE NIVEAUER. TOSIDET VARIANSANALYSE 5.1 Indledning... 53 5. Planlægning af forsøg... 53 5..1 Een faktor ad gangen... 53 5.. Fuldstændig faktorstruktur... 54 5.3 Formler og metode... 55 5.4 Beregning af tosidet variansanalyse... 57 5.5 Fuldstændigt randomiseret blokforsøg... 68 5.6 To binomialfordelte eller Poissonfordelte faktorer i et fuldstændigt faktorforsøg. 70 5.7 Oversigt over fremgangsmåde ved tosidet variansanalyse... 71 Opgaver... 74 6 FLERE END TO FAKTORER, SCREENINGSFORSØG 6.1 Indledning... 77 6. Nomenklatur... 80 6.3 Definitionsrelationer og aliasrelationer... 8 6.4 Planlægning af et partielt k faktorforsøg... 84 6.5 Beregning af et partielt k faktorforsøg... 87 6.6 Konfundering af blokke... 98 6.5 Sekventiel forsøgsstrategi... 103 6.8 Oversigt over fremgangsmåde ved partielt k faktorforsøg... 104 6.9 TI89 - program til beregning af k -faktorforsøg... 105 Opgaver... 106 7 ENKELT REGRESSIONSANALYSE 7.1 Indledning... 109 7. Bestemmelse af regressionsligning... 110 7.3 Vurdering af om regressionsligning beskriver data godt... 11 7.4 Test og konfidensintervaller... 119 7.5 Transformation af data... 13 7.6 Enkelt regressionsanalyse med flere y - observationer for hver x - værdi... 17 -iv-

Indhold 7.7 Multipel regressionsanalyse... 133 7.7.1 Indledning... 133 7.7. Analyse med én y - observation for hver x - værdi... 133 7.8 Polynomial regressionsanalyse... 137 7.8.1 Indledning... 137 7.8. Beregning af polynomial regressionsanalyse... 138 7.9 Oversigt over fremgangsmåde ved regressionsanalyse... 143 Opgaver... 144 8 STATISTISK PROCESKONTROL 8.1 Indledning... 151 8. Proces i statistisk kontrol... 15 8.3 Opbygning og alarmkriterier for kontrolkort... 153 8.4 Kontrolkortanalyse... 155 8.5 Tolerancegrænser og kapabilitet... 156 8.6 Procesvariablen er normalfordelt... 157 8.7 Procesvariablen X er diskret... 165 8.7.1 X er binomialfordelt... 165 8.7. X er Poissonfordelt... 167 Opgaver... 169 9 STATISTISK GODKENDELSESKONTROL 9.1 Indledning... 17 9. Enkelt stikprøveplan... 173 9.3 Rektificerende kontrol... 176 9.4 Dobbelt stikprøveplan... 177 Opgaver... 183 10 ANTALSTABELLER 10.1 Indledning... 185 10. En -vejs tabel... 186 10.3 To -vejs tabel... 188 Opgaver... 191 11 RANGTEST (FORDELING UKENDT) 11.1 Indledning... 194 11. Wilcoxons rangtest for 1 stikprøve... 195 -v-

Indhold 11.3 Wilcoxons rangtest for uafhængig stikprøver... 197 11.4 Kruskal Wallis test... 199 Opgaver... 0 APPENDIX 4.1 Formler til beregning af ensidet variansanalyse... 04 5.1 Formler til beregning af tosidet variansanalyse... 07 5.. Transformation af binomial-og Poissonfordelte variable til tosidet variansanalyse 10 7.1. Formler til beregning af enkelt regressionsanalyse uden gentagelser... 13 7. Formler til beregning af enkelt regressionsanalyse med lige mange gentagelser. 15 7.3 Transformation til lineær model... 16 7.4 Formler til beregning af multipel regressionsanalyse... 17 8.1 Begrundelse for grænserne for kontrolkort... 0 10.1. χ - test af hypotese i 1-vejs antalstabel.... 1 10.. χ - test af hypotese i - vejs antalstabel.... 4.4 Kruskal-Wallis rangtest for to eller flere variable... 3 GRUNDLÆGGENDE OPERATIONER PÅ TI89... 4 GRUNDLÆGGENDE OPERATIONER PÅ SAS.JMP... 6 TABEL... 30 FACITLISTE... 31 STIKORD... 34 -vi-

1. Normalfordelt variabel 1 REPETITION AF HYPOTESETEST FOR 1 VARIABEL 1.1. INDLEDNING De grundlæggende begreber vedrørende hypotesetest, konfidensintervaller og dimensionering af forsøg blev i Statistiske Grundbegreber grundigt beskrevet når vi havde én stikprøve. Beregningerne blev der udført ved anvendelse af lommeregneren TI89 og regnearket Excel. Vi vil i dette afsnit vise hvorledes beregningerne også kan udføres med statistikprogrammet SAS- JMP, samt vise, hvorledes man ved hjælp af SAS.JMP grafisk kan undersøge om data virkelig er normalfordelt. I Afsnittet Grundlæggende Operationer i SAS-JMP er beskrevet, hvorledes man indtaster data, import af data fra Excel og beregner de forskellige sandsynlighedsfunktioner. 1.. NORMALFORDELT VARIABEL Eksempel 1.1 Hypotesetest. Normalfordelt variabel. En fabrik der fremstiller plastikprodukter ønsker at evaluere holdbarheden af rektangulære støbte plastik blokke som anvendes i møbelfabrikationen. Der udtages tilfældigt 50 blokke, og deres hårhed måles (i Brinell enheder). Resultaterne var følgende 83.5 73.3 78.8 38.7 334.9 30.6 39.9 54.6 81.9 70.4 69.1 50.1 301.6 89. 40.8 67.5 79.3 8.4 65. 85.9 79.3 5.3 71.7 35.0 313. 77.8 43.8 95.5 49.3 8.7 55.3 67. 53.3 81.0 30.1 56.3 33.0 194.4 19.9 63.7 73.6 67.7 83.1 60.9 74.8 77.4 76.9 59.5 6.0 63.5 a) Undersøg om tallene er rimeligt normalfordelt ved i SAS-JMP at tegne et histogram, et boxplot og et normalfordelingsplot. Angiv endvidere gennemsnit og spredning. De følgende spørgsmål skal regnes såvel med SAS.JMP som med TI89. For at undgå indtastning af alle tal i TI89, forudsættes her, at man ved, at gennemsnit x = 66. og spredning s = 5.0. b) Hårheden bør være over 60 (brinell enheder). Test på et signifikansniveau på α = 5% om dette er tilfældet. c) Forudsat hårheden er signifikant over 60 brinell, skal angives et estimat for hårheden, samt et 95% konfidensinterval for denne. Løsning: a) Histogram: Lad data være indtastet og datasøjlen være benævnt holdbarhed På værktøjslinien vælg Analyze Distribution (eller Wiew, JMP-Starter vælg Basic Distribution ) I den fremkomne menu dobbeltklikkes på holdbarhed (under Selected Columns ) ok Der fremkommer et histogram, et boxplot og en række statistiske oplysninger. En almindelig fejl er her, at man i data har skrevet decimalpunktum frem for decimalpunktum. Ret dette, og i data, vælg kolonneoverskrift holdbarhed højre musetast Modelling type Continuous 1

1. Repetition af centrale begreber For at kunne sammenligne med en normalfordeling tegnes en normalfordelingskurve: Placer cursor på rød pil ved holdbarhed tryk på højre musetast og vælg Continuous Fit normal Der tegnes nu en normalfordelingskurve med samme middelværdi og spredning som fra data. Endvidere tegnes et normal kvartil plot Cursor placeres på holdbarhed og man trykker på højre musetast og vælger Normal Quantile Plot Der er nu bl.a. fremkommet følgende figur og tabel. Distributions holdbarhed 350 -,33-1,64-1,8-0, 67 0,0 0,67 1, 81,64,33 300 50 00 0, 0 0,1 0, 0,5 0,8 0,9 0,98 Norm al Quantile Plot Normal(66,18,5,0931) Quantiles 100,0 % maximum 334,90 99,5% 334,90 97,5% 38,93 90,0% 300,99 75,0% quartile 79,73 50,0% median 67,60 5,0% quartile 51,75 10,0% 33,0,5% 01,41 0,5% 194,40 0,0% minimum 194,40 Moments Mean 66,18 Std Dev 5,09313 Std Err Mean 3,5487045 Upper 95% Mean 73,34939 Lower 95% Mean 59,08661 N 50

1. Normalfordelt variabel Forklaring af figur og udskrift Histogram og normalfordelingskurven passer godt sammen, så det viser, at data er rimelig normalfordelt. Boxplot: Den næste figur er et såkaldt boxplot, hvor den midterste streg angiver medianen og kassens grænser angiver henholdsvis 1. og 3. kvartil. Det betyder, at hvis man opstillede de 50 tal i rækkefølge efter størrelse, så er tal nr 50/ =5 medianen 67.6 (aflæses i tabel under Quantiles 59% ) 1. kvartil 5.75 er tallet midt mellem tal nr 1 og tal nr 13, osv. Da boxplottet er nogenlunde symmetrisk om medianen, så kan man igen antage at data er rimelig normalfordelt. De isolerede prikker yderst viser, at der er et par værdier, som afviger kraftigt fra de øvrige, og muligvis er fejlmålinger (kaldes outliers). Rhomben inde i firkanten angiver et 95% konfidensinterval for middelværdien. Man ser, at den ligger lidt skævt i forhold til boxplottet, men dog ikke så meget, at det spiller nogen rolle, da median =67.6 er ca. = mean (gennemsnit) = 66.7 Normal Kvartil-plot. Her har man ud af x - aksen sørget for at skalaen er sådan, at punkterne burde ligge på den røde rette linie, hvis de fuldstændigt eksakt var normalfordelt. Den røde linie går gennem (0, mean) og har hældning = spredningen. De stiplede linier angiver 95% konfidensinterval for normalfordelingen. Som det ses, ligger punkterne indenfor konfidensintervallet og ligger tæt på linien for de midterste 75% af tallenene. De yderste punkter kan man ikke forvente ligger på linien Man må derfor igen antage, at data er tilnærmelsesvis normalfordelt. Det ses af udskriften, at gennemsnittet x = 66. og et estimat for spredningen er s = 5.09 b) X = holdbarheden af plastblokke X antages normalfordelt med ukendt middelværdi og. µ σ H 0 : =60 H: >60 µ µ Da spredningen ikke er kendt eksakt anvendes en t-test. TI 89: APPS, STAT/LIST F6 : t-test vælg Stats (da de oprindelige data ikke er kendt) ENTER Udfyld den fremkomne menu : µ 0 = 60, x = 66., s = 5.09 n = 50, Alternativ hypotese µ > µ 0 Calculate, Enter Vi får: P-værdi = 0.049 P- værdien = sandsynligheden for at begå en "type 1 fejl", dvs. påstå at µ > µ 0 =60 selv om det ikke er tilfældet. Da P-værdi = 4.9 % < 5%, forkastes H 0 (svagt). Konklusion: Vi har bevist, at holdbarheden i middel er over 60 brinell. 3

1. Repetition af centrale begreber SAS.JMP: Klik på rød pil ved "holdbarhed" og vælg "Test Mean". I den fremkomne menu skriv 60 ok Test Mean=value Hypothesized Value 60 Actual Estimate 66,18 DF 49 Std Dev 5,0931 t Test Test Statistic 1,75 Prob > t 0,0860 Prob > t 0,0430* Prob < t 0,9570 Da P-værdi = 0.0430 < 5%, dvs H 0 forkastes (svagt) Konklusion: Vi har bevist, at holdbarheden i middel er over 60 brinell. Da vi har en ensidet test er tegningen lidt misvisende Ønskes en mere anskuelig figur m.m. Sæt cursor på Test Mean, tryk på højre musetast og vælg Pvalue animation og vælg på figuren High Side Derved fremkommer en mere sigende figur Y 0,1 0,10 0,08 0,06 0,04 0,0 Esti mate d Me an 66,18 Hypothesized Mean 60 T Ratio 1,7519 P Value 0,043 0,00 40 50 60 70 80 X Sample Size = 50 c) TI 89: APPS, STAT/LIST F7 : t-inteval Stats ENTER Udfyld den fremkomne menu Calculate, Enter Et estimat for holdbarheden er 66. brinell Et 95% konfidensinterval [59.1 ; 73.3] SAS.JMP: Klik på rød pil ved "holdbarhed" "Confidence interval" 0.95. Der fremkommer følgende udskrift. Confidence Intervals Parameter Estimate Lower CI Upper CI 1-Alpha Mean 66,18 59,0866 73,3494 0,950 Std Dev 5,09313 0,96115 31,6939 0,950 Et estimat for holdbarheden er 66. brinell Et 95% konfidensinterval [59.1 ; 73.3] 4

1.3 Binomialfordelt variabel 1.3. BINOMIALFORDELT VARIABEL Eksempel 1.. Binomialtest En fabrikant af chip til computere reklamerer med, at højst % af en bestemt type chip, som fabrikken sender ud på markedet er defekte. Et stort computerfirma, vil købe et meget stort parti af disse chip, hvis påstanden er rigtigt. For at teste påstanden købes 1000 af dem. Det viser sig, at 33 ud af de 1000 er defekte. a) Kan fabrikantens påstand på denne baggrund forkastes på signifikansniveau 5%? b) Forudsat påstanden forkastes, skal angives et estimat for % defekte, samt et 95% konfidensinterval for denne. Løsning: X = antal defekte chips af 1000 X er binomialfordelt b(1000, p). Nulhypotese: H: p = 00. Alternativ hypotese Hp : > 00. TI89 a) P værdi = P( X 33) = binomcdf(1000,0.0,33,1000)=0.00433 Da P-værdi < 0.05 forkastes H 0, dvs. fabrikantens påstand om færre end % defekte forkastes. b) Da x = 33 >5 og 33 < 1000-5 kan approksimeres med normalfordelingen APPS, STAT/LIST F7 5: 1-Prop-Z-test udfyld menu Estimat for p: 3.3% 95% konfidensinterval : {.19% ; 4.41%] SAS.JMP a) P værdi = P( X 33) = 1 P( X 3) Kald en søjle for p, og indtast et tilfældigt tal i første række. Placer cursor i p's hoved højre musetast Formula skriv 1-(- vælges fra jmp tastatur) vælg Discrete Probability Binomial Distribution Udfyld pladserne Højre musetast Evaluate P-værdi = 0.00433 b) Estimat for p: 3.3% 0033. ± 0. 033 ( 1 0. 033) 1000 p radius Øvre grænse nedre grænse 0,00433168 0,0110718 0,0440718 0,0198 Af formlen for konfidensinterval og benyttelse af "Formula" fås 5

1. Repetition af centrale begreber OPGAVER Opgave 1.1 Færdselspolitiet overvejede, om der burde indføres en fartgrænse på 70 km/h på en bestemt landevejsstrækning, hvor der hidtil havde været fartgrænsen 80 km/h. Som et led i analysen af hensigtmæssigheden af den overvejede ændring observeredes inden for et bestemt tidsrum ved hjælp af radarkontrol de forbipasserende bilers fart. Resultatet af målingerne var: 50 observationer 64 50 59 75 98 7 63 49 74 55 8 35 55 64 85 5 60 99 74 80 60 77 65 6 78 95 41 76 70 53 86 47 76 85 96 70 88 68 73 71 63 6 51 93 84 48 66 80 65 103 Undersøg om tallene er rimeligt normalfordelt ved i SAS-JMP at tegne et histogram, et boxplot og et normalfordelingsplot. Angiv endvidere gennemsnit og spredning. Opgave 1. Under produktionen forekommer blandt en fabriks affaldsprodukter 1.5 mg/l af et stof A., som i større mængder kan være kræftfremkaldende. Man håber ved en ny og mere kostbar metode, at formindske indholdet af det pågældende stof. a) Ved en række kontrolmålinger efter tilsætning af additivet fandtes følgende resultater (i mg/l) 1.1 1.47 1.35 1.7 1.17 1.6 1.83 1.10 1.39 1.5 1.44 1.14 Test på 5% niveau, om målingerne beviser, at der er sket en formindskelse af middelindholdet af stoffet A. b) Forudsat middelindholdet er signifikant under 1.5 mg/l, skal angives et estimat for det nye middelindhold, samt et 95% konfidensinterval for denne. Opgave 1.3 Det forventes, at lovgivningen bliver strammet omkring mængden af skadelige partikler i bilers udstødningsgas. En person mener, at mere end 0% af forsvarets biler ikke vil opfylde de forventede nye krav. Ved en undersøgelse af 40 af forsvarets biler tilfældigt udvalgt, fandt man, at 13 af disse ikke kunne opfylde de nye krav. 1) Test om dette på et signifikansniveau på 5 % er et bevis for, at mere end 0% af forsvarets biler udsender flere skadelige partikler end ønskeligt. ) Under forudsætning af at det er signifikant, at 0% af bilerne ikke opfylder kravet, skal man angive et estimat for hvor mange procent af bilerne, der ikke opfylder de nye krav, samt angive et 95% konfidensinterval herfor. 6

Opgaver til kapitel 1 Opgave 1.4 Indenfor en stor virksomhed, der producerer udstyr til forsvaret, er der i middel 0 driftsuheld pr. måned. Da antallet efter indførelsen af nye arbejdsrutiner synes at være vokset målte man i 5 på hinanden følgende måneder antallet af driftsuheld. Resultaterne var måned nr. 1 3 4 5 antal/måned 3 19 3 7 4 Test, om disse data giver et eksperimentelt bevis for, at middelværdien er større end 0 µ driftsuheld/måned? 7

. Planlægning af forsøg PLANLÆGNING AF FORSØG.1. INDLEDNING Forsøg er en naturlig del af ingeniørmæssig og anden videnskabelig metode til at træffe beslutninger. Antag eksempelvis, at en ingeniør skal studere virkningerne af 4 hærdningsmetoder på trykstyrken af et materiale. Forsøget ville bestå i, at man fremstillede en række testmaterialer baseret på de 4 hærdningsmetoder, og derefter målte trykstyrken. På basis af disse data kunne man så anvende en statistisk metode til at finde den af de 4 metoder der i middel gav den største trykstyrke. Alle forsøg er planlagte forsøg, men desværre er nogle forsøg særdeles dårlig planlagt, og resulterer i at kostbare ressourcer bliver benyttet ineffektivt. Statistisk planlagte forsøg giver effektivitet og økonomi i den eksperimentelle proces, og brug af statistiske metoder i undersøgelsen af data resulterer i en videnskabelig objektivitet når man skal drage konklusioner. Statistisk baserede forsøg er særlig nyttige til at forbedre en fremstillingsproces eller til at udvikle nye metoder. Ved at benytte statistisk planlagte forsøg, kan ingeniøren bestemme hvilke af de mange procesvariable, såsom temperatur, tryk, hærdningsmetoder osv. der har den største betydning for udfaldet af processen. Brugen af statistisk baserede forsøg kan derfor resultere i produkter, der er lettere at producere, produkter der har en bedre performance og stabilitet (mindre spredning) end konkurrenternes produkter, og kan blive udviklet og produceret på mindre tid, hvilket reducerer udviklingsomkostningerne... NOMENKLATUR I de følgende kapitler benyttes ord, som faktor, niveauer, behandlinger osv. For at forstå hvad disse ord betyder, vil vi forklare dem ud fra følgende forsøg: Eksempel.1 I forbindelse med nogle brudstyrkebestemmelser for Portland-cement udføres et fuldstændigt randomiseret forsøg til undersøgelse af middelbrudstyrkens afhængighed af cementblandere og cementknusere. Med hver af 4 cementblandere udstøbtes efter blanding med vand 1 cementterninger, som efter en uges lagring underkastedes en brudstyrkeprøve ved hjælp af en af 3 cementknusere. Forsøgsresultaterne var: 8

.3.Krav til statistisk gyldigt forsøg Cementknusere B 1 B B 3 B 4 Cementblandere A 1 147 175 130 99 85 75 67 3 35 15 97 180 A 11 145 163 131 100 145 75 45 71 151 157 167 A 3 13 85 153 137 143 8 67 5 83 135 91 19 Beskriv forsøget. Løsning: Forsøget har to faktorer: Cementblander og Cementknuser. Faktoren Cementblander har 3 niveauer A 1,A, A 3. (niveau hedder på engelsk level ) Faktoren Cementknuser har 4 niveauer B 1,B, B 3., B 4 Forsøget har 1 behandlinger (engelsk treatment) A 1 B 1, A 1 B, A 1 B 3, A 1 B 4, A B 1, A B, A B 3, A B 4,A 3 B 1, A 3 B, A 3 B 3, A 3 B 4 da der er 1 kombinationer af niveauerne (1 celler) Hver behandling har 3 gentagelser, eksempelvis har behandlingen A 1 B 1 3 delforsøg, der resulterede i forsøgsresultaterne 147 175 130 Faktorer kan enten være kvalitative eller kvantitative. En faktor som temperatur er kvantitativ, da den jo er en talvariabel, der kan antage alle mulige talværdier (indenfor et givet talområde). En faktor som Cementblander i eksempel.1 er kvalitativ, da den kun har nogle fastlagte niveauer, og man ikke kan tale om eksempelvis cementblander 1.5..3 KRAV TIL STATISTISK GYLDIGT FORSØG For at nogle forsøgsresultater skal være statistisk gyldige, skal målingerne være statistisk uafhængige og være repræsentative for det man skal undersøge. Ved statistisk uafhængighed forstås, at resultatet af et delforsøg ikke må afhænge af hvad der skete i de øvrige delforsøg. Det er således ikke korrekt, hvis det arbejdshold, der foretager forsøgene først laver forsøgene med den ene cementblander- derved bliver dygtigere- og så laver forsøgene med de øvrige cementblandere. Det er heller ikke korrekt, at man eksempelvis i eksempel 1.1 først havde målt holdbarheden af 10 blokke, - derefter foretager en test-opdager at man ikke kan vise signifikans. Så havde taget 10 blokke mere - testet på de 0 blokke osv., indtil man opnåede signifikans. Dette er ikke "statistisk gyldige" forsøg. 9

. Planlægning af forsøg Til belysning af hvad der er et "statistisk" gyldigt forsøg tages udgangspunkt i følgende eksempel. Eksempel.. Planlægning af forsøg. En fabrik der producerer maling, har udviklet to nye additiver A 1 og A, som bevirker en kortere tørretid. Additiv A 1 er det dyreste, men man forventer også, at det giver den korteste tørretid. På grund af prisforskellen, skal tørretiden dog være mindst 10 minutter kortere for A 1, før man vil gå over til den. For at undersøge disse forhold produceres nogle liter maling, som derefter deles op i mindre portioner. Til nogle af portionerne tilsættes additiv A 1 og til andre additiv A. Tørretiden måles derefter. Generelt gælder, at hvert delforsøg i et forsøg udføres under en række forsøgsbetingelser. Alle andre delforsøgsbetingelser end behandlingerne sammenfattes i et begreb, der kaldes forsøgsenheden. I eksempel.1 er additiverne = behandlingerne og forsøgsenhederne er den enkelte portion maling, anvendt apparatur og personale, tidspunkt for delforsøget og de forhold med hensyn til temperatur, luftfugtighed osv., som gælder på forsøgstidspunktet. Bemærk, at forsøgsenhederne ofte indeholder faktorer, som ikke kan gøres ensartet fra delforsøg til delforsøg. Dette bevirker, at resultatet af de enkelte delforsøg varierer. Dette giver forsøgsvariablens variation eller kort forsøgets støj. Randomisering For at sikre et statistisk gyldigt forsøg foretager man en såkaldt fuldstændig randomisering. Dette betyder at man ved lodtrækning fordeler forsøgsenhederne tilfældigt på behandlingerne. Dette sker, for at man ikke ubevidst kommer til at favorisere en af de to behandlinger. Hvis man eksempelvis helt systematisk i eksempel 1.1 først laver alle delforsøg med additiv A 1, kunne dette bevirke en favorisering af A 1 nemlig hvis forsøgsomstændighederne (apparater, personale, luftfugtighed ) er mest gunstige ved begyndelsen af forsøgsperioden. For at anskueliggøre denne randomiseringsproces antager vi, at vi i eksempel 1.3 skal lave 4 delforsøg med hver additiv. Endvidere antages, at delforsøgene skal indgå i den almindelige produktionsgang, dvs. at man af tidsmæssige, personalemæssige og på grund af en begrænset mængde apparatur må lade forsøgene forløbe over flere dage. Man tror ikke, at dage, apparatur og laborant har nogen væsentlig betydning for forsøgsresultaterne. Der er sandsynligvis også andre forhold udenfor vor kontrol, og som tilsammen bevirker, at selv om man udfører gentagne delforsøg med samme behandling, så får vi afvigende resultater. For en sikkerheds skyld vælger vi imidlertid at randomisere dage, apparatur og laboranter Lad os antage at der gælder følgende: Mandag er det kun muligt at lave 1 delforsøg, idet apparatur nr. 1 og laborant A er de eneste der er ledige. Tirsdag er der kapacitet ledig til 3 delforsøg: Ét delforsøg hvor apparatur nr og laborant A benyttes Ét delforsøg hvor apparatur nr 1 og laborant B benyttes, og Ét delforsøg hvor apparatur nr 3 og laborant C benyttes. Onsdag kan der også laves 3 delforsøg osv. (se det følgende skema). 10

.3.Krav til statistisk gyldigt forsøg Forsøgsenheder Dag Apparatur Laborant mandag 1 A tirsdag A tirsdag 1 B tirsdag 3 C onsdag 3 B onsdag 4 C onsdag 1 A torsdag 3 B Behandlinger (apparater) Vi foretager nu randomiseringen, som kort sagt er en form for lodtrækning. Sædvanligvis vil man benytte et program, der kan generere tilfældige tal (mange lommeregnere har et sådant program). For at anskueliggøre randomiseringen vil vi mere primitivt foretage lodtrækningen på følgende måde. På 4 sedler skrives A 1, på andre 4 sedler skrives A. Hver seddel krølles sammen til en kugle og placeres i en dåse. Sedlerne blandes ved at dåsen rystes (se figur). Hvis den første seddel der udtrækkes er A så betyder det, at det delforsøg der mandag udføres med apparatur 1 og laborant A skal anvende additiv A. Hvis den næste seddel der udtrækkes er A 1 så betyder det, at det delforsøg der tirsdag udføres med apparatur og råvareleverance 1 skal anvende additiv A 1 osv. Resultaterne kunne eksempelvis være som angivet på følgende skema: Forsøgsenheder Behandlinger Dag Apparatur Laborant (apparater) mandag 1 A A tirsdag A A 1 tirsdag 1 B A 1 tirsdag 3 C A onsdag 3 B A onsdag 4 C A 1 onsdag 1 A A torsdag 3 B A 1 På denne måde sikrer man sig, at vi får et så vidt muligt "statistisk gyldigt" forsøg. Hvis vi derfor efter beregninger (som ses i de følgende kapitler ) konkluderer, at der er forskel på additiverne, så er det "korrekt", idet det ville være helt tilfældigt, hvis én af additiverne har været begunstiget med særlig gode forsøgsenheder. Herved har man også sikret sig, at de to stikprøver (variable) er statistisk uafhængige. 11

. Planlægning af forsøg Forsøg bør udføres, så alle behandlinger får lige mange gentagelser. Ved planlægningen af forsøget er det ganske klart, at hvis man eksempelvis har ressourcer til at lave 0 delforsøg, så ville det være en meget dårlig plan, hvis man lavede 18 delforsøg med A 1 og kun delforsøg med A. Der bør i naturligvis tilstræbes at lave 10 delforsøg med hver behandling. Delforsøg kan mislykkes, så målet i praksis ikke bliver opfyldt. I sådanne tilfælde kan de i de følgende kapitler anførte statistiske analyser dog stadig gennemføres. Testene bliver dog mindre robuste (dvs. mere afhængige af, at forudsætningerne gælder), og beregningerne mere komplicerede. Dimensionering Man kan fristes til at tro, at jo flere gentagelser jo bedre. s Da spredningen på et gennemsnit er, er det klart, at hvis antal forsøg n er stort bliver n spredningen lille, og så kan man finde, at der er en signifikant forskel selv om denne forskel er lille. Imidlertid risikerer man med mange gentagelser at opdage så små forskelle, at de ikke har praktisk betydning, og så er de mange delforsøg jo spild af arbejdskraft og penge. Endvidere gælder det jo, at hvis man laver 5 forsøg, så er spredningen formindsket med en faktor 5, mens hvis man laver 100 forsøg så er spredningen formindsket med en faktor 10. Der skal derfor særdeles mange forsøg til for alvor at formindske spredningen på gennemsnittet. Analogt med forklaringen i Statistiske Grundbegreber kan man under visse forudsætninger beregne hvor mange gentagelser (portioner) der skal anvendes for hver behandling, hvis P( fejl af type I) α og P( fejl af type II) β. Man skal naturligvis angive en bagatelgrænse, men desuden kræver beregningerne, at spredningerne ved de to behandlinger er (tilnærmelsesvis) ens, og at man kan give et nogenlunde realistisk skøn for denne fælles spredning σ. Det er naturligvis en svaghed ved dimensioneringen, at man inden forsøget er udført skal give et sådant skøn. En vurdering heraf kunne baseres på erfaringer fra tilsvarende forsøg. Findes sådanne erfaringer må man først lave nogle få delforsøg og derfra få et rimeligt gæt på spredningen σ. At spredningerne er nogenlunde ens vil i praksis ofte være tilfældet, da forsøgsenhederne jo er valgt ved randomisering. Når forsøget så er lavet, kan man (lidt sent) se, om man har skønnet rigtigt. Dimensioneringen har kun betydning hvis man får en accept, da man så ved, at en eventuel forskel ikke har praktisk betydning. Hvis man får en forkastelse, så ved man der er en signifikant forskel, men om den er af praktisk betydning må en nærmere undersøgelse vise. Formler for dimensionering af variable findes i oversigten i kapitel 3, afsnit 3.5.1 1

3. 1 Faktor på to niveauer 3.1 Normalfordelte variable 3.1. NORMALFORDELTE VARIABLE 3.1.1. Test af differens mellem middelværdier I dette afsnit benyttes et eksempel til at forklare metode, teststørrelse osv. Derefter vises hvorledes det samme eksempel regnes med først TI89 og derefter SAS.JMP. Eksempel 3.1. Sammenligning af normalfordelte variable To produktionsmetoder M1 og M ønskes sammenlignet. Der udvælges tilfældigt 0 personer, hvoraf de 10 bliver sat til at arbejde med den ene metode, og de 10 andre med den anden. Efter ugers forløb, beregnede man for hver person det gennemsnitlige tidsforbrug pr. enhed. Da metode 1 er mere kostbar end metode, ønsker man kun at gå over til den, hvis tidsforbruget pr. enhed ved metode 1 er mindst minutter mindre end ved metode. Man fik følgende resultater. M 1 87.8 91.9 89.8 89.0 9.6 89.4 91.4 88.7 90.1 9.4 M 9.4 94.6 93.0 94.0 9.4 9.9 96.4 9.1 9.8 93.4 Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises at tidsforbruget ved metode M 1 er minutter mindre end ved metode M. Løsning: a) Lad X 1 = udbyttet ved anvendelse af metode M 1 og X = udbyttet ved anvendelse af metode M. X 1 og X antages approksimativt normalfordelte med middelværdi og spredning henholdsvis µ, σ og µ, σ. 1 1 H 0 : µ µ 1 = H: µ µ 1 > Begrundelse: Nulhypotesen udtrykker jo, at intet er ændret (nul virkning), så den angiver, at differensen i middeltidsforbruget er præcist. Begrundelse: Den alternative metode udtrykker jo det vi ønsker at bevise, så den angiver, at differensen i middeltidsforbruget er større end. Såvel TI89 som SAS.JMP anvender et færdigt program, der anvender en testmetode (Satterthwaites metode), som er robust overfor mindre afvigelser fra kravet om normalitet, når blot antallet af gentagelser er den samme. Er det ikke tilfældet kan man stadig foretage testen, men så stilles der større krav til, at de variable X 1 og X virkelig er normalfordelte. Formlen for Satterthwaites metode kan findes i oversigten i kapitel 3.5.1. Er den beregnede P-værdi < signifikansniveauet α forkastes H 0, dvs. vi har bevist den alternative hypotese H er sand. (sandsynligheden for vi dermed kommer med en forkert konklusion er mindre end α. Er P-værdien > signifikansniveauet α accepters H 0, dvs. vi kan ikke på dette grundlag bevise, at H er sand. Får man en accept og er P - værdien ikke meget større end signifikansniveauet α, så er det muligt at en stærkere t - test kunne give en forkastelse. Denne t-test kræver imidlertid at de to spredninger kan antages at være ens. 13

3. 1 Faktor på niveauer Dette er ofte tilfældet på grund af randomiseringen, men er man i tvivl herom kan man først foretage en test af om spredningerne er ens. Får man en accept heraf, har man naturligvis ikke hermed vist, at varianserne er ens, men da den følgende t - test af middelværdier er robust overfor mindre forskelle i varianserne, blot vi har samme antal gentagelser, er det tilladeligt i den følgende test af middelværdierne, at antage at varianserne er ens. Forklaring på formler For hver af de metoder udføres en række delforsøg. Lad antallet af forsøg være henholdsvis n 1 og n. Vi antager, at X 1 og X er statistisk uafhængige normalfordelte variable med henholdsvis middelværdierne og spredningerne σ 1 og σ. H0: µ 1 µ = eller H :µ µ d =, Nulhypotese d (d er i eksemplet -). 0 1 0 µ 1 og µ Testproceduren baseres på fordelingen af differensen Y = X1 X d. Ifølge additionssætningen (se eventuelt Statistiske Grundbegreber) er Y normalfordelt og fra regnereglerne fås E( X1 X d) = E( X1) E( X) d = µ 1 µ d σ1 σ og V( X X d) V( X ) V( X ). 1 = 1 + = + n1 n Heraf følger, at U X X d 1 = er normeret normalfordelt. σ1 σ + n n 1 Teststørrelsen U X X d 1 = gælder kun, hvis spredningerne σ og er kendt eksakt. 1 σ σ1 σ + n n 1 s 1 s Kendes kun deres estimater og må der anvendes andre testprocedurer. Får man ved en F-test en accept af, at varianserne er ens, pooles varianserne sammen til en fælles gennemsnitlig 1 X1 X d varians ( se eventuelt oversigten i afsnit 3.5.1) og størrelsen t = = er nu t - fordelt. X X d s 0 s0 s0 + n n 1 s 0 1 1 + n n Hvis stikprøvestørrelserne er store (begge over 30) er det dog tilstrækkelig nøjagtigt at anvende U X X d 1 = som teststørrelse. s1 s + n n 1 I modsat fald kan anvendes en ret kompliceret procedure, der kaldes "Satterhwaite's metode". Denne er beskrevet i kapitel 3.5.1. Eksempel 3.1. fortsat- løst med TI89 Hypoteserne omskrives til : µ + = µ H: µ + < µ H 0 1 1 1 APPS, STAT/LIST, indtast data i list1 og list F6, 4: - SampTtest ENTER I den fremkomne menu vælg Data ok µ < µ I menu for list 1" skrives list1+, for alternative Hyp 1 og pooled til NO OK Man får P-værdi = 0.0609. Da P-værdi =6.09% > 0.05% accepteres H 0, dvs. det er ikke muligt på dette grundlag at bevise, at tidsforbruget ved metode M 1 er minutter mindre end ved metode M. 14

3.1 Normalfordelte variable Da P-værdien var så tæt ved 5%, vil vi nu forsøge med den stærkere t-test, hvor kravet er en fælles "poolet" spredning Vi gør som før, men retter nu poolet til YES Vi får som forventet en lidt mindre P-værdi = 0.0604, men det giver stadig en accept, så konklusionen er den samme. Da P-værdien er så tæt ved 5% er der en god mulighed for, at tidsforbruget ved metode 1 faktisk er minutter mindre end ved metode (begår en fejl af type ). Det ville derfor være rimeligt at bede om at få foretaget flere forsøg. Havde vi fået en P-værdi < 0.05, så ville næste træk være at teste om spredningerne var ens (se eventuelt eksempel 3. hvordan), da vi ellers ikke måtte have anvendt den sidste metode. Eksempel 3.1. fortsat- løst med SAS.JMP Data indtastes i søjler, idet vi lægger til alle tal fra metode 1. metode m1 89,8 m1 93,9 m1 91,8 m1 91,0 m1 94,6 m1 91,4 m1 93,4 m1 90,7 m1 9,1 m1 94.4 m 9.4 m 94,6 m 93,0 m 94,0 m 9,4 m 9,9 m 99,4 m 9,1 m 9,8 m 93,4 tidsforbrug Analyze Fit y by x Y-Response:Tidsforbrug,x-Grouping: Metode OK rød pil, t-test t Test m-m1 Assuming unequal variances Difference 1,0900t Ratio 1,68317 Std Err Dif 0,6694DF 16,99463 Upper CL Dif,504Prob > t 0,119 Lower CL Dif -0,34Prob > t 0,0609 Confidence 0,95Prob < t 0,9391 Da P - værdi = 0.0609 > 0.05 accepteres nulhypotesen, dvs. det er ikke muligt på dette grundlag at bevise, at tidsforbruget ved metode M 1 er minutter mindre end ved metode M. 15

3. 1 Faktor på niveauer Test af Varians Som det ses af eksempel 3.1 kan det sjældent blive nødvendig at benytte den lidt stærkere metode, da P-værdien nok bliver mindre, kun sjældent så meget, at det har betydning for konklusionen. Imidlertid vil det i de næste kapitler være nødvendigt at teste om spredningen på stikprøver er ens. Dette sker ved en såkaldt F - test hvor teststørrelsen er F = s s F-fordelingen er beskrevet i afsnit 3.5., hvor også fremgangsmåden ved testningen er angive. Som det fremgår af eksempel 3. har såvel TI89 som SAS.JMP færdige programmer til testningen, så det er ikke nødvendigt at anvende teststørrelsen direkte. Eksempel 3.. Test af varians Samme problem som i eksempel 3.1 Undersøg ved en test på signifikansniveau på 5% om de to metoders varians er ens. Løsning:TI89 H 0 :σ 1 = σ mod H:σ σ 1 F6 9: - SampFtest ENTER, I menuen vælg Data Input Method= Data ENTER Menuen udfyldes, og man vælger alternative Hyp =, ENTER σ1 σ I udskrift findes P - værdi = 0.4711 Da P - værdi =0.471 > 0.05 accepteres H 0, dvs. vi vil i den følgende test antage, at spredningerne er ens. Løsning: SAS.JMP Data indtastes i søjler (se eksempel 3.1) H 0 :σ 1 = σ mod H:σ σ 1 Analyze Fit y by x Response:Tidsforbrug, Factor: Metode OK Cursor på rød pil Un-Equal Variance Blandt en række udskrifter forekommer nedenstående Tests that the Variances are Equal Level Count Std Dev MeanAbsDif to Mean MeanAbsDif to Median m1 10 1,668965 1,41000 1,370000 m 10 1,30135 0,960000 0,880000 Test F Ratio DFNum DFDen p-value O'Brien[.5] 0,7193 1 18 0,4075 Brown-Forsythe 1,610 1 18 0,76 Levene 1,6453 1 18 0,159 Bartlett 0,5199 1. 0,4709 F Test -sided 1,648 9 9 0,4711 I udskrift for F - test findes P - værdi = 0.4711 Da P - værdi =0.694 > 0.05 accepteres H 0, dvs. vi vil i den følgende test antage, at spredningerne er ens. 16

3.1 Normalfordelte variable Dimensionering. Eksempel 3.3 (fortsættelse af eksempel.) En fabrik der producerer maling, har udviklet to nye additiver A 1 og A, som bevirker en kortere tørretid. Additiv A 1 er det dyreste, men man forventer også, at det giver den korteste tørretid. På grund af prisforskellen, skal tørretiden dog være mindst 10 minutter kortere for A 1, før man vil gå over til den. For at undersøge disse forhold produceres nogle liter maling, som derefter deles op i mindre portioner. Til nogle af portionerne tilsættes additiv A 1 og til andre additiv A. Tørretiden måles derefter. a) Hvor mange delforsøg skal anvendes ved forsøget, hvis man ønsker, at P( fejl af type I ) = α 005., P( fejl af type II ) = β 010. og bagatelgrænsen =10 minutter, idet man fra mange tilsvarende forsøg ved, at den fælles spredning er σ = 1 minutter. b) Samme spørgsmål og krav som i spørgsmål a), men nu antages, at man ikke kender spredningen, men ud fra nogle få delforsøg skønner, at den er ca. 1 minutter. a) Af formlerne i oversigten i kapitel 3.5.1 fås n u + u u + u + 1 α 1 β 095. 090. 1645. 18. = = = 4. 67 10 10 σ 1 1 17 dvs. der skal udføres i alt n = 5 delforsøg af hver behandling b) Idet første led er 4.67 fås t1 α ( n ) n = 4. 67 u1 α TI89: solve(x=4.67*(inv - t(0.95,(*x-))/invnorm(0.95))^,x) x > 4 Der kan nu gå 1 minut før lommeregneren finder en løsning x = 5.6 svarende til n 6 Eksempel 3.4. Data ikke opgivet På basis af dimensioneringen i eksempel 3.3 udførte man 6 delforsøg af hver behandling. Efter at forsøgsrækken var afsluttet, opdagede man, at et af forsøgene var mislykket og måtte kasseres. Der var følgelig kun 5 delforsøg med additiv A 1. For de to stikprøver fandt man, at Forsøgsrækken med A 1 : n = 6, x 1 = 118. 6 og s 1 = 113. Forsøgsrækken med A : n = 5 x = 19. og s = 14. a) Kan man ud fra disse data bevise på mindst signifikansniveau α = 0.05, at malingen med additivet A 1 tilsat har en mindre middeltørretid end konkurrentens? b) Hvad vil du anbefale virksomheden at gøre, hvis man som nævnt i eksempel 3.3 kun vil gå over til A 1 hvis middeltørretiden for A 1 er mindst 10 minutter kortere end for A (bagatelgrænsen). Løsning:TI89 X 1 = tørringstiden for maling tilsat additiv A 1. X = tørringstiden for maling tilsat additiv A. X 1 og X antages at være uafhængige normalfordelte variable med henholdsvis middelværdierne µ 1 og µ og spredningerne σ 1 og σ. a) Nulhypotese H 0 : µ 1 = µ, Alternativ hypotese: H:µ 1 < µ t - test: APPS STAT/LIST F6, 4 - SampTtest ENTER I den fremkomne menu vælg STATS OK (da forsøgsresultaterne resultater ikke er kendt) Menuen udfyldes bl.a. alternative Hyp µ 1 < µ og pooled til NO OK Da P-værdi = 0.0031 < 0.05 forkastes nulhypotesen Konklusion: Der er et stærkt statistisk bevis for at additiv A 1 i middel har en kortere tørringstid end additiv A.

3. 1 Faktor på niveauer b) Metode 1: Et 95% konfidensinterval for differensen: t - interval :APPS STAT/LIST F7, 4: - SampTint ENTER I den fremkomne menu vælg STATS OK (da forsøgsresultaterne resultater ikke er kendt) Menuen udfyldes bl.a. sættes pooled til NO OK Man får 95% konfidensinterval [ - 18.1 ; -3.15], dvs. tørretiden for A 1 er mellem 3 og 18 minutter kortere end for A. Konklusion: Da bagatelgrænsen er 10 minutter, og næsten 50% af konfidensintervallet ligger under 10, kan det ikke på baggrund af dette materiale anbefales at gå over til det mere kostbare additiv. Metode : Nulhypotese H 0 : µ 1 + 10 = µ, Alternativ hypotese: H: µ 1 + 10 < µ t - test: APPS STAT/LIST F6, 4 - SampTtest ENTER I den fremkomne menu vælg STATS OK Menuen udfyldes bl.a. x1 = 118,6+10 alternative Hyp µ < µ og pooled til NO OK 1 Man finder P-værdi = 43.6%, dvs., sandsynligheden for at begå en fejl, hvis man påstår, at additiv 1 har en 10 minutter kortere tørretid, er ca. 40%. Man vil derfor næppe gå over til additiv 1. Løsning:SAS.JMP SAS har ikke et særligt program for de tilfælde, hvor de oprindelige data ikke er kendt Man må benytte de formler der står i afsnit 3.5.1 til beregningerne. 3.1. Parvise observationer (blokforsøg) Hvis observationerne i stikprøven udviser meget stor spredning, kan en test sandsynligvis ikke vise signifikans. Imidlertid er det måske så muligt at nedsætte spredningen ved at sammenligne observationerne to og to ( i par). Man siger også, at man opdeler i blokke. Det følgende eksempel illustrerer fremgangsmåden Eksempel 3.5. Parvise observationer En producent af malervarer har laboratorieresultater, der tyder på, at en ny lak A, har en større slidstyrke end den sædvanlige lak B. Han ønsker en afprøvning i praksis og aftaler med ejerne af 6 bygninger med mange trapper, at han må lakere deres trapper. Da der er meget forskelligt hvor mange personer der går på trapperne i de forskellige bygninger (sammenlign blot sliddet på en skole og et plejehjem) vælger man at foretage et blokforsøg, med de 6 bygninger som 6 blokke. I hver bygning lakeres hverandet trin (valgt ved lodtrækning) med lak A og resten mad lak B. Efter 3 måneders forløb måles graden af slid (i %) i hver bygning. De målte værdier af slid efter valg af plan var Bygning nr 1 3 4 5 6 Ny lak 0.3 5.1 1.8 19.6 18.9 3.5 Sædvanlig lak 19.5 8.4 1.6.0 0.9 5.8 Undersøg om observationerne leverer et eksperimentelt bevis for, at den nye lak er mere slidstærk end den sædvanlige lak. 18

3.1 Normalfordelte variable Løsning Vi ser nu på differensen mellem sliddet i en bygning. (hvorved den store forskel mellem bygningerne elimineres) Lad D = X gammel - X ny Bygning nr 1 3 4 5 6 d = x gammel - x ny - 0.8 3.3-0..4.0,3 D antages normalfordelt n( µ, σ ), hvor såvel µ som σ er ukendte. Da vi ønsker at teste om ny lak er mere slidstærk end gammel lak, dvs. den mest slidstærke lak slides mindst, bliver testen en ensidet t - test. Nulhypotese H 0 : µ 0 Alternativ hypotese H : µ > 0. TI89 Differensdata indtastes APPS, STAT/LIST F6, : t-test vælg Data Man finder x = 15. og P - værdi = PT ( > 15. ) = 00363. Da P - værdi = 3.63% < 5% forkastes H 0 (svagt), dvs. den ny lak er mere slidstærk end den gamle. SAS.JMP Data indtastes Ny lak Gammel lak 0,3 19,5 5,1 8,4 1,8 1,6 19,6 18,9 0,9 3,5 5,8.. Vælg Analyze Matched Pairs Y: Paired response:ny lak og Gammel lak OK Rød pil Fjern markering ved "Plot Diff by Mean Matched Pairs Difference: Gammel lak-ny lak Gammel lak 3,0333 t-ratio,6819 Ny lak 1,5333 DF 5 Mean Difference 1,5 Prob > t 0,076 Std Error 0,66131 Prob > t 0,0363* Upper 95% 3,19996 Prob < t 0,9637 Lower 95% -0, N 6 Correlation 0,8950 Heraf ses, at P-værdi = 0.0363. H 0 forkastes, dvs. ny lak mere slidstærk end gammel lak 19

3. 1 Faktor på niveauer 3. BINOMIALFORDELTE VARIABLE. Man kan ofte approksimere en binomialfordeling med en normalfordeling. Det er en sådan approksimation, som såvel formlerne i oversigten i afsnit 3.5.3 bygger på som TI89's program: -Prop-Z-test. Forudsætningen er: X 1 og X er binomialfordelt henholdsvis bn ( 1, p1) og bn (, p) Observerede stikprøveværdier x 1 og x. x1 x x Lad p$, p$, 1 + x 1 = = $p =. Forudsætning: n1 p $ [ 5 ; n1 5], n [ ] p$ 5; n 5 n n n + n 1 1 I praksis vil disse forudsætninger for approksimation sædvanligvis være opfyldt. Vi belyser beregningerne ved følgende eksempel. Eksempel 3.6. Binomialfordelingstest. Ved et forsøg der skulle afgøre om C - vitamin har en forebyggende virkning mod forkølelse, fik halvdelen af en gruppe på 80 franske skiløbere C - vitamin mens de øvrige fik kalktabletter (placebobehandling). Fordelingen skete randomiseret, og forsøgspersonerne var uvidende om gruppeinddeling og hvilket medikament de fik. Efter en passende tid optaltes hvor mange af forsøgspersonerne der var forkølede. Resultaterne kan ses af følgende skema: Forkølet Ikke forkølet Total C-vitamin 17 1 139 Kalktabletter 31 109 140 Bemærk, at en enkelt forsøgsperson gled ud af forsøget, så grupperne blev ikke helt lige store. 1) Kan det på et signifikansniveau på 5% vises, at C - vitamin har en forebyggende virkning? ) I bekræftende fald angiv er 95% konfidensinterval for differensen mellem parametrene. Løsning TI89: X 1 = antal forkølede personer der har fået C-vitamin. X 1 er binomialfordelt b(139, p 1 ). X = antal forkølede personer der har fået Kalktabletter. X er binomialfordelt b(140, p ). 1) H0: p1 = pmod Hp : 1 < p (da vi ønsker at vise, at p1 < p). x1 17 x 31 x1 + x 17 + 31 48 $p 1 = =, $p = = og $p = = =. n1 139 n 140 n1 + n 139 + 140 79 Da n1 p$ = 139 48 = 39. [ 5139 ; 5] og n p$ = 140 48 = 41. [ 5140 ; 5] 79 79 er forudsætningerne for at approksimere med normalfordelingen opfyldt. F6, 6 -Prop-ZTest Udfylder menu: Succes x1=17, n1= 139, succes x=31, n = 140, Alt. hyp : p1 < p Udskrift giver P- værdi=0.0141 Da P - værdi = 0.0141 < 0.05 forkastes nulhypotesen (svagt) Konklusion: På signifikansniveau 5% er vist, at C-vitamin har en vis forebyggende virkning mod forkølelse, ) 95% konfidensinterval; F7, 6 -Prop-ZInt, menu udfyldes som under punkt 1. Udskrift viser C_int=[-0.187 ; -0.0111] 0

3.3 Poissonfordelte variable Løsning SAS.JMP: SAS.JMP benytter en såkaldt χ -test som først omtales i kapitel 9. Data indtastes: vitamin syg antal c forkølet 17 c ikke forkølet 1 kalk forkølet 31 kalk ikke forkølet 109 Vælg fra hovedmenu Analyze Fit y by x Response:Syg, Factor: vitamin Freq: Antal OK Resultat: Contingency Analysis of Syg By Vitamin Freq: Antal Tests Source DF -LogLike RSquare (U) Model 1,43585 0,0190 Error 77 15,65610 C. Total 78 18,09195 N 79 Test ChiSquare Prob>ChiSq Likelihood Ratio 4,87 0,073 Pearson 4,811 0,083 Fisher's Exact Test Prob Alternative Hypothesis Left 0,005 Prob(Syg=ikke forkølet) is greater for Vitamin=c than kalk Right 0,9910 Prob(Syg=ikke forkølet) is greater for Vitamin=kalk than c -Tail 0,0385 Prob(Syg=ikke forkølet) is different across Vitamin P-værdi = 0.083/ = 0.0141 (ud for Pearson) (kun ved ensidet test divideres med ) Konklusion: På signifikansniveau 5% er vist, at C-vitamin har en vis forebyggende virkning mod forkølelse, 3.3 POISSONFORDELTE VARIABLE. Man kan ofte approksimere en Poisonfordeling med en normalfordeling. Det er en sådan approksimation, som formlerne i oversigten i afsnit 3.5.4 bygger på. I praksis vil disse forudsætninger for approksimation sædvanligvis være opfyldt. Vi belyser anvendelsen af oversigten ved følgende eksempel (Hverken TI89 eller SAS.JMP har ikke et særligt program hertil). Eksempel 3.7. Poissonfordelingstest. En bestemt type TV-apparat produceres på fabrikker A og B. Man har mistanke om, at der er forskel på antallet af loddefejl der findes i apparater fra de to fabrikker. For at teste dette, udtages af den løbende produktion stikprøver på 0 TV-apparater, og man optalte antallet af loddefejl i de 0 apparater. Resultaterne blev: Fabrik A: På 0 apparater fandtes i alt 1 loddefejl Fabrik B: På 19 apparater fandtes i alt 7 loddefejl (et apparat måtte udskydes) Test på dette grundlag, om der er forskel på fejlintensiteten på de to fabrikker. Løsning. X 1 = antal loddefejl pr. apparat på fabrik A. X 1 antages Poissonfordelt p( µ 1 ). X = antal loddefejl pr. apparat på fabrik B. X antages Poissonfordelt p( µ ). H 0 :µ 1 = µ mod H:µ 1 µ (da vi ønsker at vise, at µ 1 µ ) Oversigten i kapitel 3.5.4 anvendes : 1, 7 0 1 + x 1 = x =, og +. 0 19 x = 0 19 7 19 1 7 19 = = 0 + 19 0 + 19 39 1

3. 1 Faktor på niveauer Da n1 x = 0 19 = 974. 5 og n x = 19 19 = 96. 5 39 39 er forudsætningerne for at approksimere med normalfordelingen opfyldt. Vi finder : 1 1 s= x + og n n = 19 1 + 1 1 7 = 0. 36 x1 x = = 0. 316 39 0 19 0 19 1 Da P-værdi = P(Y > 0.316) = normcdf(0.316,,0,0.36) = 0.1501 > 0.05 accepteres nulhypotesen. Konklusion: Man kan ikke på det grundlag vise, at der er forskel på fejlintensiteten på de to fabrikker, SAS.JMP kan kun foretage denne test ved at foretage beregningerne i FORMULA. 3.4. FORDELING UKENDT (Rangtest) De testprocedurer vi har benyttet i de forrige kapitler har alle været baseret på, at i det mindste approksimativt kendte fordelingen (normal-, binomial- eller Poisson-fordelt) og testen vedrørte parametre i fordelingen såsom µ, σ eller p. Denne form for statistik kunne kaldes parametrisk statistik. Kendes fordelingen ikke, og kan man heller ikke approksimere den til en kendt fordeling, så må man benytte de såkaldte ikke- parametriske test. Disse forudsætter ikke, at fordelingen er kendt, og kunne derfor også kaldes fordelingsfri test. Da det ligger udenfor denne bogs centrale emner, men der findes en beskrivelse heraf i appendix 4

3.5 Oversigt over centrale formler i kapitel 3 3.5. OVERSIGT OVER CENTRALE FORMLER I KAPITEL 3 3.5.1. Test og konfidensinterval af differens µ µ mellem middelværdier µ og µ for 1 normalfordelte variable. X 1 og X er normalfordelte henholdsvis n( µ 1, σ1) og n( µ, σ). 1 x 1 x Givet stikprøver af X 1 og X. Størrelse, gennemsnit og spredning henholdsvis n 1,, s 1 og n,, s. Signifikansniveau er α. Lad d være en given konstant. Satterthwaites test: Forudsætning σ 1 og σ ukendte s n 1 s n c Forkortelser: a =, b =, c = a + b, g = a b 1 n + 1 1 n 1 T er t - fordelt med frihedsgradstallet f. Forudsætninger σ, σ ukendte 1 x1 x d t = c f er det nærmeste hele tal, som er større end g Alternativ hypotese H P - værdi Beregning H 0 forkastes µ 1 > µ +d PT ( t) TI89: tcdf (, t, f ) eller F6: -sampttest,pooled, No P - værdi<α µ 1 < µ +d PT ( t) TI89: tcdf (, t, f ) eller F6: -sampttest,pooled, No µ 1 µ +d PT ( t) for x1 > x + d PT ( t) for x < x + d 1 som række 1 som række 100 ( 1 α )% konfidensinterval for differens µ 1 µ : x x t ( f ) c µ µ x x + t ( f ) c 1 α 1 1 1 TI89: F7, -SampTint,pooled, No α 1 P - værdi < 1 α dog hvis Ttest P - værdi<α U-test (eller Z-test):Forudsætning: σ 1 og σ kendt eksakt σ1 σ Forkortelser: x = x1 x d σ = + Y er normalfordelt n1 n n( µ, σ) Forudsætninger Alternativ hypotese H P - værdi Beregning H 0 forkastes σ1, σkendte µ 1 > µ +d PY ( x) TI89: normcdf ( x,, µ, σ) eller F6: -sampztest P - værdi<α µ 1 < µ +d PY ( x) TI89: normcdf (, x, µ, σ ) eller F6: -sampztest µ 1 µ +d PY ( x) for x1 > x + d PY ( x) for x < x + d 1 som række 1 som række 100 ( 1 α )% konfidensinterval for differens µ µ : x x u σ µ µ x x + u σ 1 α 1 1 1 TI89: F7, -SampZint Parvise observationer (blokforsøg) α 1 1 P - værdi < 1 α dog hvis Ztest P - værdi<α 3