VIDEREGÅENDE STATISTIK

Transkript

1 MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK (med TI 89 og SAS - JMP) 5. udgave 011

2 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske grundbegreber. Bogen er bygget op således, at de væsentligste begreber søges forklaret anskueligt og ved hjælp af et stort antal eksempler. I eksemplerne er beregningerne er i videst mulig omfang foretaget ved anvendelse af programmer i lommeregneren TI-89 og i statistikprogrammet SAS-JMP. I slutningen af nogle af kapitlerne er givet en oversigt over centrale formler eller fremgangsmåder. I et appendix sidst i bogen er givet en mere dybtgående statistisk forklaring på formlerne. Efter hvert kapitel er der nogle opgaver og en facitliste til opgaverne findes bagerst i bogen. Læsning: Bogen er opbygget således, at de tre hovedemner Faktorer på og flere niveauer : kapitel 3 til 6, Regressionsanalyse kapitel 7 og Kontrolteori : kapitel 8 og 9 kan læses uafhængigt af hinanden. Kan man af tidsmæssige grunde ikke nå alt, så kan man derfor overspringe en eller flere af disse emner. Et andet forslag er at overspringe en eller flere af delemner som Screeningsforsøg: kapitel 6, Multipel regression: afsnit 7.7 og 7.8 Statistisk godkendelseskontrol:kapitel 9: Skulle man i undervisningen benytter et andet statistikprogram end SAS.JMP, kan de studerende uden vanskelighed på basis af SAS.JMP udskrifterne tolke egne udskrifter, da disse næppeafviger væsentligt fra hinanden. På nedenstående adresse kan man således se bøger, hvor SAS-JMP er udskiftet med statistikprogrammet STATGRAPHICS. Data foreligger ofte som en fil i et regneark som eksempelvis Excel. Disse regneark har indbygget en del statistik bl.a. de almindeligste testfunktioner. I notatet Videregående statistik regnet med Excel er en række af disse statistiske muligheder gennemgået. Alle de nævnte bøger (og mange flere) kan findes på adressen Januar 01 Mogens Oddershede Larsen. -ii-

3 INDHOLD Indhold 1 REPETITION AF HYPOTESETEST FOR 1 VARIABEL 1.1 Indledning Normalfordelt variabel Binomialfordelt variabel... 5 Opgaver... 6 PLANLÆGNING AF FORSØG.1 Indledning Nomenklatur Krav til statistisk gyldigt forsøg FAKTOR PÅ NIVEAUER 3.1 Normalfordelte variable Test af differens mellem middelværdier Blokforsøg (parvise observationer) Binomialfordelte variable Poissonfordelte variable Fordeling ukendt (rangtest) Oversigt over centrale formler i kapitel Test og konfidensintervaller af differens mellem middelværdier for normalfordelte variable Test af differens mellem varians for normalfordelte variable Test og konfidensintervaller af p 1 - p for binomialfordelte variable Test og konfidensintervaller af µ µ for Poissonfordelte variable Opgaver FAKTOR PÅ MERE END NIVEAUER 4.1 Indledning Ensidet variansanalyse (normalfordelte variable) Indledning Forklaring af metoder og formler Beregning af ensidet variansanalyse ved TI89 og SAS.JMP Fuldstændigt randomiseret blokforsøg Binomialfordelte variable Poissonfordelte variable Oversigt over centrale formler i kapitel iii-

4 Indhold Oversigt over fremgangsmåde ved ensidet variansanalyse Test af parametre p 1, p,..., p k for binomialfordelte variable Test af parametre µ 1, µ,..., µ k for Poissonfordelte variable Opgaver FAKTORER PÅ ELLER FLERE NIVEAUER. TOSIDET VARIANSANALYSE 5.1 Indledning Planlægning af forsøg Een faktor ad gangen Fuldstændig faktorstruktur Formler og metode Beregning af tosidet variansanalyse Fuldstændigt randomiseret blokforsøg To binomialfordelte eller Poissonfordelte faktorer i et fuldstændigt faktorforsøg Oversigt over fremgangsmåde ved tosidet variansanalyse Opgaver FLERE END TO FAKTORER, SCREENINGSFORSØG 6.1 Indledning Nomenklatur Definitionsrelationer og aliasrelationer Planlægning af et partielt k faktorforsøg Beregning af et partielt k faktorforsøg Konfundering af blokke Sekventiel forsøgsstrategi Oversigt over fremgangsmåde ved partielt k faktorforsøg TI89 - program til beregning af k -faktorforsøg Opgaver ENKELT REGRESSIONSANALYSE 7.1 Indledning Bestemmelse af regressionsligning Vurdering af om regressionsligning beskriver data godt Test og konfidensintervaller Transformation af data Enkelt regressionsanalyse med flere y - observationer for hver x - værdi iv-

5 Indhold 7.7 Multipel regressionsanalyse Indledning Analyse med én y - observation for hver x - værdi Polynomial regressionsanalyse Indledning Beregning af polynomial regressionsanalyse Oversigt over fremgangsmåde ved regressionsanalyse Opgaver STATISTISK PROCESKONTROL 8.1 Indledning Proces i statistisk kontrol Opbygning og alarmkriterier for kontrolkort Kontrolkortanalyse Tolerancegrænser og kapabilitet Procesvariablen er normalfordelt Procesvariablen X er diskret X er binomialfordelt X er Poissonfordelt Opgaver STATISTISK GODKENDELSESKONTROL 9.1 Indledning Enkelt stikprøveplan Rektificerende kontrol Dobbelt stikprøveplan Opgaver ANTALSTABELLER 10.1 Indledning En -vejs tabel To -vejs tabel Opgaver RANGTEST (FORDELING UKENDT) 11.1 Indledning Wilcoxons rangtest for 1 stikprøve v-

6 Indhold 11.3 Wilcoxons rangtest for uafhængig stikprøver Kruskal Wallis test Opgaver... 0 APPENDIX 4.1 Formler til beregning af ensidet variansanalyse Formler til beregning af tosidet variansanalyse Transformation af binomial-og Poissonfordelte variable til tosidet variansanalyse Formler til beregning af enkelt regressionsanalyse uden gentagelser Formler til beregning af enkelt regressionsanalyse med lige mange gentagelser Transformation til lineær model Formler til beregning af multipel regressionsanalyse Begrundelse for grænserne for kontrolkort χ - test af hypotese i 1-vejs antalstabel χ - test af hypotese i - vejs antalstabel Kruskal-Wallis rangtest for to eller flere variable... 3 GRUNDLÆGGENDE OPERATIONER PÅ TI GRUNDLÆGGENDE OPERATIONER PÅ SAS.JMP... 6 TABEL FACITLISTE STIKORD vi-

7 1. Normalfordelt variabel 1 REPETITION AF HYPOTESETEST FOR 1 VARIABEL 1.1. INDLEDNING De grundlæggende begreber vedrørende hypotesetest, konfidensintervaller og dimensionering af forsøg blev i Statistiske Grundbegreber grundigt beskrevet når vi havde én stikprøve. Beregningerne blev der udført ved anvendelse af lommeregneren TI89 og regnearket Excel. Vi vil i dette afsnit vise hvorledes beregningerne også kan udføres med statistikprogrammet SAS- JMP, samt vise, hvorledes man ved hjælp af SAS.JMP grafisk kan undersøge om data virkelig er normalfordelt. I Afsnittet Grundlæggende Operationer i SAS-JMP er beskrevet, hvorledes man indtaster data, import af data fra Excel og beregner de forskellige sandsynlighedsfunktioner. 1.. NORMALFORDELT VARIABEL Eksempel 1.1 Hypotesetest. Normalfordelt variabel. En fabrik der fremstiller plastikprodukter ønsker at evaluere holdbarheden af rektangulære støbte plastik blokke som anvendes i møbelfabrikationen. Der udtages tilfældigt 50 blokke, og deres hårhed måles (i Brinell enheder). Resultaterne var følgende a) Undersøg om tallene er rimeligt normalfordelt ved i SAS-JMP at tegne et histogram, et boxplot og et normalfordelingsplot. Angiv endvidere gennemsnit og spredning. De følgende spørgsmål skal regnes såvel med SAS.JMP som med TI89. For at undgå indtastning af alle tal i TI89, forudsættes her, at man ved, at gennemsnit x = 66. og spredning s = 5.0. b) Hårheden bør være over 60 (brinell enheder). Test på et signifikansniveau på α = 5% om dette er tilfældet. c) Forudsat hårheden er signifikant over 60 brinell, skal angives et estimat for hårheden, samt et 95% konfidensinterval for denne. Løsning: a) Histogram: Lad data være indtastet og datasøjlen være benævnt holdbarhed På værktøjslinien vælg Analyze Distribution (eller Wiew, JMP-Starter vælg Basic Distribution ) I den fremkomne menu dobbeltklikkes på holdbarhed (under Selected Columns ) ok Der fremkommer et histogram, et boxplot og en række statistiske oplysninger. En almindelig fejl er her, at man i data har skrevet decimalpunktum frem for decimalpunktum. Ret dette, og i data, vælg kolonneoverskrift holdbarhed højre musetast Modelling type Continuous 1

8 1. Repetition af centrale begreber For at kunne sammenligne med en normalfordeling tegnes en normalfordelingskurve: Placer cursor på rød pil ved holdbarhed tryk på højre musetast og vælg Continuous Fit normal Der tegnes nu en normalfordelingskurve med samme middelværdi og spredning som fra data. Endvidere tegnes et normal kvartil plot Cursor placeres på holdbarhed og man trykker på højre musetast og vælger Normal Quantile Plot Der er nu bl.a. fremkommet følgende figur og tabel. Distributions holdbarhed 350 -,33-1,64-1,8-0, 67 0,0 0,67 1, 81,64, , 0 0,1 0, 0,5 0,8 0,9 0,98 Norm al Quantile Plot Normal(66,18,5,0931) Quantiles 100,0 % maximum 334,90 99,5% 334,90 97,5% 38,93 90,0% 300,99 75,0% quartile 79,73 50,0% median 67,60 5,0% quartile 51,75 10,0% 33,0,5% 01,41 0,5% 194,40 0,0% minimum 194,40 Moments Mean 66,18 Std Dev 5,09313 Std Err Mean 3, Upper 95% Mean 73,34939 Lower 95% Mean 59,08661 N 50

9 1. Normalfordelt variabel Forklaring af figur og udskrift Histogram og normalfordelingskurven passer godt sammen, så det viser, at data er rimelig normalfordelt. Boxplot: Den næste figur er et såkaldt boxplot, hvor den midterste streg angiver medianen og kassens grænser angiver henholdsvis 1. og 3. kvartil. Det betyder, at hvis man opstillede de 50 tal i rækkefølge efter størrelse, så er tal nr 50/ =5 medianen 67.6 (aflæses i tabel under Quantiles 59% ) 1. kvartil 5.75 er tallet midt mellem tal nr 1 og tal nr 13, osv. Da boxplottet er nogenlunde symmetrisk om medianen, så kan man igen antage at data er rimelig normalfordelt. De isolerede prikker yderst viser, at der er et par værdier, som afviger kraftigt fra de øvrige, og muligvis er fejlmålinger (kaldes outliers). Rhomben inde i firkanten angiver et 95% konfidensinterval for middelværdien. Man ser, at den ligger lidt skævt i forhold til boxplottet, men dog ikke så meget, at det spiller nogen rolle, da median =67.6 er ca. = mean (gennemsnit) = 66.7 Normal Kvartil-plot. Her har man ud af x - aksen sørget for at skalaen er sådan, at punkterne burde ligge på den røde rette linie, hvis de fuldstændigt eksakt var normalfordelt. Den røde linie går gennem (0, mean) og har hældning = spredningen. De stiplede linier angiver 95% konfidensinterval for normalfordelingen. Som det ses, ligger punkterne indenfor konfidensintervallet og ligger tæt på linien for de midterste 75% af tallenene. De yderste punkter kan man ikke forvente ligger på linien Man må derfor igen antage, at data er tilnærmelsesvis normalfordelt. Det ses af udskriften, at gennemsnittet x = 66. og et estimat for spredningen er s = 5.09 b) X = holdbarheden af plastblokke X antages normalfordelt med ukendt middelværdi og. µ σ H 0 : =60 H: >60 µ µ Da spredningen ikke er kendt eksakt anvendes en t-test. TI 89: APPS, STAT/LIST F6 : t-test vælg Stats (da de oprindelige data ikke er kendt) ENTER Udfyld den fremkomne menu : µ 0 = 60, x = 66., s = 5.09 n = 50, Alternativ hypotese µ > µ 0 Calculate, Enter Vi får: P-værdi = P- værdien = sandsynligheden for at begå en "type 1 fejl", dvs. påstå at µ > µ 0 =60 selv om det ikke er tilfældet. Da P-værdi = 4.9 % < 5%, forkastes H 0 (svagt). Konklusion: Vi har bevist, at holdbarheden i middel er over 60 brinell. 3

10 1. Repetition af centrale begreber SAS.JMP: Klik på rød pil ved "holdbarhed" og vælg "Test Mean". I den fremkomne menu skriv 60 ok Test Mean=value Hypothesized Value 60 Actual Estimate 66,18 DF 49 Std Dev 5,0931 t Test Test Statistic 1,75 Prob > t 0,0860 Prob > t 0,0430* Prob < t 0,9570 Da P-værdi = < 5%, dvs H 0 forkastes (svagt) Konklusion: Vi har bevist, at holdbarheden i middel er over 60 brinell. Da vi har en ensidet test er tegningen lidt misvisende Ønskes en mere anskuelig figur m.m. Sæt cursor på Test Mean, tryk på højre musetast og vælg Pvalue animation og vælg på figuren High Side Derved fremkommer en mere sigende figur Y 0,1 0,10 0,08 0,06 0,04 0,0 Esti mate d Me an 66,18 Hypothesized Mean 60 T Ratio 1,7519 P Value 0,043 0, X Sample Size = 50 c) TI 89: APPS, STAT/LIST F7 : t-inteval Stats ENTER Udfyld den fremkomne menu Calculate, Enter Et estimat for holdbarheden er 66. brinell Et 95% konfidensinterval [59.1 ; 73.3] SAS.JMP: Klik på rød pil ved "holdbarhed" "Confidence interval" Der fremkommer følgende udskrift. Confidence Intervals Parameter Estimate Lower CI Upper CI 1-Alpha Mean 66,18 59, ,3494 0,950 Std Dev 5, , ,6939 0,950 Et estimat for holdbarheden er 66. brinell Et 95% konfidensinterval [59.1 ; 73.3] 4

11 1.3 Binomialfordelt variabel 1.3. BINOMIALFORDELT VARIABEL Eksempel 1.. Binomialtest En fabrikant af chip til computere reklamerer med, at højst % af en bestemt type chip, som fabrikken sender ud på markedet er defekte. Et stort computerfirma, vil købe et meget stort parti af disse chip, hvis påstanden er rigtigt. For at teste påstanden købes 1000 af dem. Det viser sig, at 33 ud af de 1000 er defekte. a) Kan fabrikantens påstand på denne baggrund forkastes på signifikansniveau 5%? b) Forudsat påstanden forkastes, skal angives et estimat for % defekte, samt et 95% konfidensinterval for denne. Løsning: X = antal defekte chips af 1000 X er binomialfordelt b(1000, p). Nulhypotese: H: p = 00. Alternativ hypotese Hp : > 00. TI89 a) P værdi = P( X 33) = binomcdf(1000,0.0,33,1000)= Da P-værdi < 0.05 forkastes H 0, dvs. fabrikantens påstand om færre end % defekte forkastes. b) Da x = 33 >5 og 33 < kan approksimeres med normalfordelingen APPS, STAT/LIST F7 5: 1-Prop-Z-test udfyld menu Estimat for p: 3.3% 95% konfidensinterval : {.19% ; 4.41%] SAS.JMP a) P værdi = P( X 33) = 1 P( X 3) Kald en søjle for p, og indtast et tilfældigt tal i første række. Placer cursor i p's hoved højre musetast Formula skriv 1-(- vælges fra jmp tastatur) vælg Discrete Probability Binomial Distribution Udfyld pladserne Højre musetast Evaluate P-værdi = b) Estimat for p: 3.3% ± ( ) 1000 p radius Øvre grænse nedre grænse 0, , , ,0198 Af formlen for konfidensinterval og benyttelse af "Formula" fås 5

12 1. Repetition af centrale begreber OPGAVER Opgave 1.1 Færdselspolitiet overvejede, om der burde indføres en fartgrænse på 70 km/h på en bestemt landevejsstrækning, hvor der hidtil havde været fartgrænsen 80 km/h. Som et led i analysen af hensigtmæssigheden af den overvejede ændring observeredes inden for et bestemt tidsrum ved hjælp af radarkontrol de forbipasserende bilers fart. Resultatet af målingerne var: 50 observationer Undersøg om tallene er rimeligt normalfordelt ved i SAS-JMP at tegne et histogram, et boxplot og et normalfordelingsplot. Angiv endvidere gennemsnit og spredning. Opgave 1. Under produktionen forekommer blandt en fabriks affaldsprodukter 1.5 mg/l af et stof A., som i større mængder kan være kræftfremkaldende. Man håber ved en ny og mere kostbar metode, at formindske indholdet af det pågældende stof. a) Ved en række kontrolmålinger efter tilsætning af additivet fandtes følgende resultater (i mg/l) Test på 5% niveau, om målingerne beviser, at der er sket en formindskelse af middelindholdet af stoffet A. b) Forudsat middelindholdet er signifikant under 1.5 mg/l, skal angives et estimat for det nye middelindhold, samt et 95% konfidensinterval for denne. Opgave 1.3 Det forventes, at lovgivningen bliver strammet omkring mængden af skadelige partikler i bilers udstødningsgas. En person mener, at mere end 0% af forsvarets biler ikke vil opfylde de forventede nye krav. Ved en undersøgelse af 40 af forsvarets biler tilfældigt udvalgt, fandt man, at 13 af disse ikke kunne opfylde de nye krav. 1) Test om dette på et signifikansniveau på 5 % er et bevis for, at mere end 0% af forsvarets biler udsender flere skadelige partikler end ønskeligt. ) Under forudsætning af at det er signifikant, at 0% af bilerne ikke opfylder kravet, skal man angive et estimat for hvor mange procent af bilerne, der ikke opfylder de nye krav, samt angive et 95% konfidensinterval herfor. 6

13 Opgaver til kapitel 1 Opgave 1.4 Indenfor en stor virksomhed, der producerer udstyr til forsvaret, er der i middel 0 driftsuheld pr. måned. Da antallet efter indførelsen af nye arbejdsrutiner synes at være vokset målte man i 5 på hinanden følgende måneder antallet af driftsuheld. Resultaterne var måned nr antal/måned Test, om disse data giver et eksperimentelt bevis for, at middelværdien er større end 0 µ driftsuheld/måned? 7

14 . Planlægning af forsøg PLANLÆGNING AF FORSØG.1. INDLEDNING Forsøg er en naturlig del af ingeniørmæssig og anden videnskabelig metode til at træffe beslutninger. Antag eksempelvis, at en ingeniør skal studere virkningerne af 4 hærdningsmetoder på trykstyrken af et materiale. Forsøget ville bestå i, at man fremstillede en række testmaterialer baseret på de 4 hærdningsmetoder, og derefter målte trykstyrken. På basis af disse data kunne man så anvende en statistisk metode til at finde den af de 4 metoder der i middel gav den største trykstyrke. Alle forsøg er planlagte forsøg, men desværre er nogle forsøg særdeles dårlig planlagt, og resulterer i at kostbare ressourcer bliver benyttet ineffektivt. Statistisk planlagte forsøg giver effektivitet og økonomi i den eksperimentelle proces, og brug af statistiske metoder i undersøgelsen af data resulterer i en videnskabelig objektivitet når man skal drage konklusioner. Statistisk baserede forsøg er særlig nyttige til at forbedre en fremstillingsproces eller til at udvikle nye metoder. Ved at benytte statistisk planlagte forsøg, kan ingeniøren bestemme hvilke af de mange procesvariable, såsom temperatur, tryk, hærdningsmetoder osv. der har den største betydning for udfaldet af processen. Brugen af statistisk baserede forsøg kan derfor resultere i produkter, der er lettere at producere, produkter der har en bedre performance og stabilitet (mindre spredning) end konkurrenternes produkter, og kan blive udviklet og produceret på mindre tid, hvilket reducerer udviklingsomkostningerne... NOMENKLATUR I de følgende kapitler benyttes ord, som faktor, niveauer, behandlinger osv. For at forstå hvad disse ord betyder, vil vi forklare dem ud fra følgende forsøg: Eksempel.1 I forbindelse med nogle brudstyrkebestemmelser for Portland-cement udføres et fuldstændigt randomiseret forsøg til undersøgelse af middelbrudstyrkens afhængighed af cementblandere og cementknusere. Med hver af 4 cementblandere udstøbtes efter blanding med vand 1 cementterninger, som efter en uges lagring underkastedes en brudstyrkeprøve ved hjælp af en af 3 cementknusere. Forsøgsresultaterne var: 8

15 .3.Krav til statistisk gyldigt forsøg Cementknusere B 1 B B 3 B 4 Cementblandere A A A Beskriv forsøget. Løsning: Forsøget har to faktorer: Cementblander og Cementknuser. Faktoren Cementblander har 3 niveauer A 1,A, A 3. (niveau hedder på engelsk level ) Faktoren Cementknuser har 4 niveauer B 1,B, B 3., B 4 Forsøget har 1 behandlinger (engelsk treatment) A 1 B 1, A 1 B, A 1 B 3, A 1 B 4, A B 1, A B, A B 3, A B 4,A 3 B 1, A 3 B, A 3 B 3, A 3 B 4 da der er 1 kombinationer af niveauerne (1 celler) Hver behandling har 3 gentagelser, eksempelvis har behandlingen A 1 B 1 3 delforsøg, der resulterede i forsøgsresultaterne Faktorer kan enten være kvalitative eller kvantitative. En faktor som temperatur er kvantitativ, da den jo er en talvariabel, der kan antage alle mulige talværdier (indenfor et givet talområde). En faktor som Cementblander i eksempel.1 er kvalitativ, da den kun har nogle fastlagte niveauer, og man ikke kan tale om eksempelvis cementblander KRAV TIL STATISTISK GYLDIGT FORSØG For at nogle forsøgsresultater skal være statistisk gyldige, skal målingerne være statistisk uafhængige og være repræsentative for det man skal undersøge. Ved statistisk uafhængighed forstås, at resultatet af et delforsøg ikke må afhænge af hvad der skete i de øvrige delforsøg. Det er således ikke korrekt, hvis det arbejdshold, der foretager forsøgene først laver forsøgene med den ene cementblander- derved bliver dygtigere- og så laver forsøgene med de øvrige cementblandere. Det er heller ikke korrekt, at man eksempelvis i eksempel 1.1 først havde målt holdbarheden af 10 blokke, - derefter foretager en test-opdager at man ikke kan vise signifikans. Så havde taget 10 blokke mere - testet på de 0 blokke osv., indtil man opnåede signifikans. Dette er ikke "statistisk gyldige" forsøg. 9

16 . Planlægning af forsøg Til belysning af hvad der er et "statistisk" gyldigt forsøg tages udgangspunkt i følgende eksempel. Eksempel.. Planlægning af forsøg. En fabrik der producerer maling, har udviklet to nye additiver A 1 og A, som bevirker en kortere tørretid. Additiv A 1 er det dyreste, men man forventer også, at det giver den korteste tørretid. På grund af prisforskellen, skal tørretiden dog være mindst 10 minutter kortere for A 1, før man vil gå over til den. For at undersøge disse forhold produceres nogle liter maling, som derefter deles op i mindre portioner. Til nogle af portionerne tilsættes additiv A 1 og til andre additiv A. Tørretiden måles derefter. Generelt gælder, at hvert delforsøg i et forsøg udføres under en række forsøgsbetingelser. Alle andre delforsøgsbetingelser end behandlingerne sammenfattes i et begreb, der kaldes forsøgsenheden. I eksempel.1 er additiverne = behandlingerne og forsøgsenhederne er den enkelte portion maling, anvendt apparatur og personale, tidspunkt for delforsøget og de forhold med hensyn til temperatur, luftfugtighed osv., som gælder på forsøgstidspunktet. Bemærk, at forsøgsenhederne ofte indeholder faktorer, som ikke kan gøres ensartet fra delforsøg til delforsøg. Dette bevirker, at resultatet af de enkelte delforsøg varierer. Dette giver forsøgsvariablens variation eller kort forsøgets støj. Randomisering For at sikre et statistisk gyldigt forsøg foretager man en såkaldt fuldstændig randomisering. Dette betyder at man ved lodtrækning fordeler forsøgsenhederne tilfældigt på behandlingerne. Dette sker, for at man ikke ubevidst kommer til at favorisere en af de to behandlinger. Hvis man eksempelvis helt systematisk i eksempel 1.1 først laver alle delforsøg med additiv A 1, kunne dette bevirke en favorisering af A 1 nemlig hvis forsøgsomstændighederne (apparater, personale, luftfugtighed ) er mest gunstige ved begyndelsen af forsøgsperioden. For at anskueliggøre denne randomiseringsproces antager vi, at vi i eksempel 1.3 skal lave 4 delforsøg med hver additiv. Endvidere antages, at delforsøgene skal indgå i den almindelige produktionsgang, dvs. at man af tidsmæssige, personalemæssige og på grund af en begrænset mængde apparatur må lade forsøgene forløbe over flere dage. Man tror ikke, at dage, apparatur og laborant har nogen væsentlig betydning for forsøgsresultaterne. Der er sandsynligvis også andre forhold udenfor vor kontrol, og som tilsammen bevirker, at selv om man udfører gentagne delforsøg med samme behandling, så får vi afvigende resultater. For en sikkerheds skyld vælger vi imidlertid at randomisere dage, apparatur og laboranter Lad os antage at der gælder følgende: Mandag er det kun muligt at lave 1 delforsøg, idet apparatur nr. 1 og laborant A er de eneste der er ledige. Tirsdag er der kapacitet ledig til 3 delforsøg: Ét delforsøg hvor apparatur nr og laborant A benyttes Ét delforsøg hvor apparatur nr 1 og laborant B benyttes, og Ét delforsøg hvor apparatur nr 3 og laborant C benyttes. Onsdag kan der også laves 3 delforsøg osv. (se det følgende skema). 10

17 .3.Krav til statistisk gyldigt forsøg Forsøgsenheder Dag Apparatur Laborant mandag 1 A tirsdag A tirsdag 1 B tirsdag 3 C onsdag 3 B onsdag 4 C onsdag 1 A torsdag 3 B Behandlinger (apparater) Vi foretager nu randomiseringen, som kort sagt er en form for lodtrækning. Sædvanligvis vil man benytte et program, der kan generere tilfældige tal (mange lommeregnere har et sådant program). For at anskueliggøre randomiseringen vil vi mere primitivt foretage lodtrækningen på følgende måde. På 4 sedler skrives A 1, på andre 4 sedler skrives A. Hver seddel krølles sammen til en kugle og placeres i en dåse. Sedlerne blandes ved at dåsen rystes (se figur). Hvis den første seddel der udtrækkes er A så betyder det, at det delforsøg der mandag udføres med apparatur 1 og laborant A skal anvende additiv A. Hvis den næste seddel der udtrækkes er A 1 så betyder det, at det delforsøg der tirsdag udføres med apparatur og råvareleverance 1 skal anvende additiv A 1 osv. Resultaterne kunne eksempelvis være som angivet på følgende skema: Forsøgsenheder Behandlinger Dag Apparatur Laborant (apparater) mandag 1 A A tirsdag A A 1 tirsdag 1 B A 1 tirsdag 3 C A onsdag 3 B A onsdag 4 C A 1 onsdag 1 A A torsdag 3 B A 1 På denne måde sikrer man sig, at vi får et så vidt muligt "statistisk gyldigt" forsøg. Hvis vi derfor efter beregninger (som ses i de følgende kapitler ) konkluderer, at der er forskel på additiverne, så er det "korrekt", idet det ville være helt tilfældigt, hvis én af additiverne har været begunstiget med særlig gode forsøgsenheder. Herved har man også sikret sig, at de to stikprøver (variable) er statistisk uafhængige. 11

18 . Planlægning af forsøg Forsøg bør udføres, så alle behandlinger får lige mange gentagelser. Ved planlægningen af forsøget er det ganske klart, at hvis man eksempelvis har ressourcer til at lave 0 delforsøg, så ville det være en meget dårlig plan, hvis man lavede 18 delforsøg med A 1 og kun delforsøg med A. Der bør i naturligvis tilstræbes at lave 10 delforsøg med hver behandling. Delforsøg kan mislykkes, så målet i praksis ikke bliver opfyldt. I sådanne tilfælde kan de i de følgende kapitler anførte statistiske analyser dog stadig gennemføres. Testene bliver dog mindre robuste (dvs. mere afhængige af, at forudsætningerne gælder), og beregningerne mere komplicerede. Dimensionering Man kan fristes til at tro, at jo flere gentagelser jo bedre. s Da spredningen på et gennemsnit er, er det klart, at hvis antal forsøg n er stort bliver n spredningen lille, og så kan man finde, at der er en signifikant forskel selv om denne forskel er lille. Imidlertid risikerer man med mange gentagelser at opdage så små forskelle, at de ikke har praktisk betydning, og så er de mange delforsøg jo spild af arbejdskraft og penge. Endvidere gælder det jo, at hvis man laver 5 forsøg, så er spredningen formindsket med en faktor 5, mens hvis man laver 100 forsøg så er spredningen formindsket med en faktor 10. Der skal derfor særdeles mange forsøg til for alvor at formindske spredningen på gennemsnittet. Analogt med forklaringen i Statistiske Grundbegreber kan man under visse forudsætninger beregne hvor mange gentagelser (portioner) der skal anvendes for hver behandling, hvis P( fejl af type I) α og P( fejl af type II) β. Man skal naturligvis angive en bagatelgrænse, men desuden kræver beregningerne, at spredningerne ved de to behandlinger er (tilnærmelsesvis) ens, og at man kan give et nogenlunde realistisk skøn for denne fælles spredning σ. Det er naturligvis en svaghed ved dimensioneringen, at man inden forsøget er udført skal give et sådant skøn. En vurdering heraf kunne baseres på erfaringer fra tilsvarende forsøg. Findes sådanne erfaringer må man først lave nogle få delforsøg og derfra få et rimeligt gæt på spredningen σ. At spredningerne er nogenlunde ens vil i praksis ofte være tilfældet, da forsøgsenhederne jo er valgt ved randomisering. Når forsøget så er lavet, kan man (lidt sent) se, om man har skønnet rigtigt. Dimensioneringen har kun betydning hvis man får en accept, da man så ved, at en eventuel forskel ikke har praktisk betydning. Hvis man får en forkastelse, så ved man der er en signifikant forskel, men om den er af praktisk betydning må en nærmere undersøgelse vise. Formler for dimensionering af variable findes i oversigten i kapitel 3, afsnit

19 3. 1 Faktor på to niveauer 3.1 Normalfordelte variable 3.1. NORMALFORDELTE VARIABLE Test af differens mellem middelværdier I dette afsnit benyttes et eksempel til at forklare metode, teststørrelse osv. Derefter vises hvorledes det samme eksempel regnes med først TI89 og derefter SAS.JMP. Eksempel 3.1. Sammenligning af normalfordelte variable To produktionsmetoder M1 og M ønskes sammenlignet. Der udvælges tilfældigt 0 personer, hvoraf de 10 bliver sat til at arbejde med den ene metode, og de 10 andre med den anden. Efter ugers forløb, beregnede man for hver person det gennemsnitlige tidsforbrug pr. enhed. Da metode 1 er mere kostbar end metode, ønsker man kun at gå over til den, hvis tidsforbruget pr. enhed ved metode 1 er mindst minutter mindre end ved metode. Man fik følgende resultater. M M Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises at tidsforbruget ved metode M 1 er minutter mindre end ved metode M. Løsning: a) Lad X 1 = udbyttet ved anvendelse af metode M 1 og X = udbyttet ved anvendelse af metode M. X 1 og X antages approksimativt normalfordelte med middelværdi og spredning henholdsvis µ, σ og µ, σ. 1 1 H 0 : µ µ 1 = H: µ µ 1 > Begrundelse: Nulhypotesen udtrykker jo, at intet er ændret (nul virkning), så den angiver, at differensen i middeltidsforbruget er præcist. Begrundelse: Den alternative metode udtrykker jo det vi ønsker at bevise, så den angiver, at differensen i middeltidsforbruget er større end. Såvel TI89 som SAS.JMP anvender et færdigt program, der anvender en testmetode (Satterthwaites metode), som er robust overfor mindre afvigelser fra kravet om normalitet, når blot antallet af gentagelser er den samme. Er det ikke tilfældet kan man stadig foretage testen, men så stilles der større krav til, at de variable X 1 og X virkelig er normalfordelte. Formlen for Satterthwaites metode kan findes i oversigten i kapitel Er den beregnede P-værdi < signifikansniveauet α forkastes H 0, dvs. vi har bevist den alternative hypotese H er sand. (sandsynligheden for vi dermed kommer med en forkert konklusion er mindre end α. Er P-værdien > signifikansniveauet α accepters H 0, dvs. vi kan ikke på dette grundlag bevise, at H er sand. Får man en accept og er P - værdien ikke meget større end signifikansniveauet α, så er det muligt at en stærkere t - test kunne give en forkastelse. Denne t-test kræver imidlertid at de to spredninger kan antages at være ens. 13

20 3. 1 Faktor på niveauer Dette er ofte tilfældet på grund af randomiseringen, men er man i tvivl herom kan man først foretage en test af om spredningerne er ens. Får man en accept heraf, har man naturligvis ikke hermed vist, at varianserne er ens, men da den følgende t - test af middelværdier er robust overfor mindre forskelle i varianserne, blot vi har samme antal gentagelser, er det tilladeligt i den følgende test af middelværdierne, at antage at varianserne er ens. Forklaring på formler For hver af de metoder udføres en række delforsøg. Lad antallet af forsøg være henholdsvis n 1 og n. Vi antager, at X 1 og X er statistisk uafhængige normalfordelte variable med henholdsvis middelværdierne og spredningerne σ 1 og σ. H0: µ 1 µ = eller H :µ µ d =, Nulhypotese d (d er i eksemplet -) µ 1 og µ Testproceduren baseres på fordelingen af differensen Y = X1 X d. Ifølge additionssætningen (se eventuelt Statistiske Grundbegreber) er Y normalfordelt og fra regnereglerne fås E( X1 X d) = E( X1) E( X) d = µ 1 µ d σ1 σ og V( X X d) V( X ) V( X ). 1 = 1 + = + n1 n Heraf følger, at U X X d 1 = er normeret normalfordelt. σ1 σ + n n 1 Teststørrelsen U X X d 1 = gælder kun, hvis spredningerne σ og er kendt eksakt. 1 σ σ1 σ + n n 1 s 1 s Kendes kun deres estimater og må der anvendes andre testprocedurer. Får man ved en F-test en accept af, at varianserne er ens, pooles varianserne sammen til en fælles gennemsnitlig 1 X1 X d varians ( se eventuelt oversigten i afsnit 3.5.1) og størrelsen t = = er nu t - fordelt. X X d s 0 s0 s0 + n n 1 s n n Hvis stikprøvestørrelserne er store (begge over 30) er det dog tilstrækkelig nøjagtigt at anvende U X X d 1 = som teststørrelse. s1 s + n n 1 I modsat fald kan anvendes en ret kompliceret procedure, der kaldes "Satterhwaite's metode". Denne er beskrevet i kapitel Eksempel 3.1. fortsat- løst med TI89 Hypoteserne omskrives til : µ + = µ H: µ + < µ H APPS, STAT/LIST, indtast data i list1 og list F6, 4: - SampTtest ENTER I den fremkomne menu vælg Data ok µ < µ I menu for list 1" skrives list1+, for alternative Hyp 1 og pooled til NO OK Man får P-værdi = Da P-værdi =6.09% > 0.05% accepteres H 0, dvs. det er ikke muligt på dette grundlag at bevise, at tidsforbruget ved metode M 1 er minutter mindre end ved metode M. 14

21 3.1 Normalfordelte variable Da P-værdien var så tæt ved 5%, vil vi nu forsøge med den stærkere t-test, hvor kravet er en fælles "poolet" spredning Vi gør som før, men retter nu poolet til YES Vi får som forventet en lidt mindre P-værdi = , men det giver stadig en accept, så konklusionen er den samme. Da P-værdien er så tæt ved 5% er der en god mulighed for, at tidsforbruget ved metode 1 faktisk er minutter mindre end ved metode (begår en fejl af type ). Det ville derfor være rimeligt at bede om at få foretaget flere forsøg. Havde vi fået en P-værdi < 0.05, så ville næste træk være at teste om spredningerne var ens (se eventuelt eksempel 3. hvordan), da vi ellers ikke måtte have anvendt den sidste metode. Eksempel 3.1. fortsat- løst med SAS.JMP Data indtastes i søjler, idet vi lægger til alle tal fra metode 1. metode m1 89,8 m1 93,9 m1 91,8 m1 91,0 m1 94,6 m1 91,4 m1 93,4 m1 90,7 m1 9,1 m m 9.4 m 94,6 m 93,0 m 94,0 m 9,4 m 9,9 m 99,4 m 9,1 m 9,8 m 93,4 tidsforbrug Analyze Fit y by x Y-Response:Tidsforbrug,x-Grouping: Metode OK rød pil, t-test t Test m-m1 Assuming unequal variances Difference 1,0900t Ratio 1,68317 Std Err Dif 0,6694DF 16,99463 Upper CL Dif,504Prob > t 0,119 Lower CL Dif -0,34Prob > t 0,0609 Confidence 0,95Prob < t 0,9391 Da P - værdi = > 0.05 accepteres nulhypotesen, dvs. det er ikke muligt på dette grundlag at bevise, at tidsforbruget ved metode M 1 er minutter mindre end ved metode M. 15

22 3. 1 Faktor på niveauer Test af Varians Som det ses af eksempel 3.1 kan det sjældent blive nødvendig at benytte den lidt stærkere metode, da P-værdien nok bliver mindre, kun sjældent så meget, at det har betydning for konklusionen. Imidlertid vil det i de næste kapitler være nødvendigt at teste om spredningen på stikprøver er ens. Dette sker ved en såkaldt F - test hvor teststørrelsen er F = s s F-fordelingen er beskrevet i afsnit 3.5., hvor også fremgangsmåden ved testningen er angive. Som det fremgår af eksempel 3. har såvel TI89 som SAS.JMP færdige programmer til testningen, så det er ikke nødvendigt at anvende teststørrelsen direkte. Eksempel 3.. Test af varians Samme problem som i eksempel 3.1 Undersøg ved en test på signifikansniveau på 5% om de to metoders varians er ens. Løsning:TI89 H 0 :σ 1 = σ mod H:σ σ 1 F6 9: - SampFtest ENTER, I menuen vælg Data Input Method= Data ENTER Menuen udfyldes, og man vælger alternative Hyp =, ENTER σ1 σ I udskrift findes P - værdi = Da P - værdi =0.471 > 0.05 accepteres H 0, dvs. vi vil i den følgende test antage, at spredningerne er ens. Løsning: SAS.JMP Data indtastes i søjler (se eksempel 3.1) H 0 :σ 1 = σ mod H:σ σ 1 Analyze Fit y by x Response:Tidsforbrug, Factor: Metode OK Cursor på rød pil Un-Equal Variance Blandt en række udskrifter forekommer nedenstående Tests that the Variances are Equal Level Count Std Dev MeanAbsDif to Mean MeanAbsDif to Median m1 10 1, , , m 10 1, , , Test F Ratio DFNum DFDen p-value O'Brien[.5] 0, ,4075 Brown-Forsythe 1, ,76 Levene 1, ,159 Bartlett 0, ,4709 F Test -sided 1, ,4711 I udskrift for F - test findes P - værdi = Da P - værdi =0.694 > 0.05 accepteres H 0, dvs. vi vil i den følgende test antage, at spredningerne er ens. 16

23 3.1 Normalfordelte variable Dimensionering. Eksempel 3.3 (fortsættelse af eksempel.) En fabrik der producerer maling, har udviklet to nye additiver A 1 og A, som bevirker en kortere tørretid. Additiv A 1 er det dyreste, men man forventer også, at det giver den korteste tørretid. På grund af prisforskellen, skal tørretiden dog være mindst 10 minutter kortere for A 1, før man vil gå over til den. For at undersøge disse forhold produceres nogle liter maling, som derefter deles op i mindre portioner. Til nogle af portionerne tilsættes additiv A 1 og til andre additiv A. Tørretiden måles derefter. a) Hvor mange delforsøg skal anvendes ved forsøget, hvis man ønsker, at P( fejl af type I ) = α 005., P( fejl af type II ) = β 010. og bagatelgrænsen =10 minutter, idet man fra mange tilsvarende forsøg ved, at den fælles spredning er σ = 1 minutter. b) Samme spørgsmål og krav som i spørgsmål a), men nu antages, at man ikke kender spredningen, men ud fra nogle få delforsøg skønner, at den er ca. 1 minutter. a) Af formlerne i oversigten i kapitel fås n u + u u + u + 1 α 1 β = = = σ dvs. der skal udføres i alt n = 5 delforsøg af hver behandling b) Idet første led er 4.67 fås t1 α ( n ) n = u1 α TI89: solve(x=4.67*(inv - t(0.95,(*x-))/invnorm(0.95))^,x) x > 4 Der kan nu gå 1 minut før lommeregneren finder en løsning x = 5.6 svarende til n 6 Eksempel 3.4. Data ikke opgivet På basis af dimensioneringen i eksempel 3.3 udførte man 6 delforsøg af hver behandling. Efter at forsøgsrækken var afsluttet, opdagede man, at et af forsøgene var mislykket og måtte kasseres. Der var følgelig kun 5 delforsøg med additiv A 1. For de to stikprøver fandt man, at Forsøgsrækken med A 1 : n = 6, x 1 = og s 1 = 113. Forsøgsrækken med A : n = 5 x = 19. og s = 14. a) Kan man ud fra disse data bevise på mindst signifikansniveau α = 0.05, at malingen med additivet A 1 tilsat har en mindre middeltørretid end konkurrentens? b) Hvad vil du anbefale virksomheden at gøre, hvis man som nævnt i eksempel 3.3 kun vil gå over til A 1 hvis middeltørretiden for A 1 er mindst 10 minutter kortere end for A (bagatelgrænsen). Løsning:TI89 X 1 = tørringstiden for maling tilsat additiv A 1. X = tørringstiden for maling tilsat additiv A. X 1 og X antages at være uafhængige normalfordelte variable med henholdsvis middelværdierne µ 1 og µ og spredningerne σ 1 og σ. a) Nulhypotese H 0 : µ 1 = µ, Alternativ hypotese: H:µ 1 < µ t - test: APPS STAT/LIST F6, 4 - SampTtest ENTER I den fremkomne menu vælg STATS OK (da forsøgsresultaterne resultater ikke er kendt) Menuen udfyldes bl.a. alternative Hyp µ 1 < µ og pooled til NO OK Da P-værdi = < 0.05 forkastes nulhypotesen Konklusion: Der er et stærkt statistisk bevis for at additiv A 1 i middel har en kortere tørringstid end additiv A.

24 3. 1 Faktor på niveauer b) Metode 1: Et 95% konfidensinterval for differensen: t - interval :APPS STAT/LIST F7, 4: - SampTint ENTER I den fremkomne menu vælg STATS OK (da forsøgsresultaterne resultater ikke er kendt) Menuen udfyldes bl.a. sættes pooled til NO OK Man får 95% konfidensinterval [ ; -3.15], dvs. tørretiden for A 1 er mellem 3 og 18 minutter kortere end for A. Konklusion: Da bagatelgrænsen er 10 minutter, og næsten 50% af konfidensintervallet ligger under 10, kan det ikke på baggrund af dette materiale anbefales at gå over til det mere kostbare additiv. Metode : Nulhypotese H 0 : µ = µ, Alternativ hypotese: H: µ < µ t - test: APPS STAT/LIST F6, 4 - SampTtest ENTER I den fremkomne menu vælg STATS OK Menuen udfyldes bl.a. x1 = 118,6+10 alternative Hyp µ < µ og pooled til NO OK 1 Man finder P-værdi = 43.6%, dvs., sandsynligheden for at begå en fejl, hvis man påstår, at additiv 1 har en 10 minutter kortere tørretid, er ca. 40%. Man vil derfor næppe gå over til additiv 1. Løsning:SAS.JMP SAS har ikke et særligt program for de tilfælde, hvor de oprindelige data ikke er kendt Man må benytte de formler der står i afsnit til beregningerne Parvise observationer (blokforsøg) Hvis observationerne i stikprøven udviser meget stor spredning, kan en test sandsynligvis ikke vise signifikans. Imidlertid er det måske så muligt at nedsætte spredningen ved at sammenligne observationerne to og to ( i par). Man siger også, at man opdeler i blokke. Det følgende eksempel illustrerer fremgangsmåden Eksempel 3.5. Parvise observationer En producent af malervarer har laboratorieresultater, der tyder på, at en ny lak A, har en større slidstyrke end den sædvanlige lak B. Han ønsker en afprøvning i praksis og aftaler med ejerne af 6 bygninger med mange trapper, at han må lakere deres trapper. Da der er meget forskelligt hvor mange personer der går på trapperne i de forskellige bygninger (sammenlign blot sliddet på en skole og et plejehjem) vælger man at foretage et blokforsøg, med de 6 bygninger som 6 blokke. I hver bygning lakeres hverandet trin (valgt ved lodtrækning) med lak A og resten mad lak B. Efter 3 måneders forløb måles graden af slid (i %) i hver bygning. De målte værdier af slid efter valg af plan var Bygning nr Ny lak Sædvanlig lak Undersøg om observationerne leverer et eksperimentelt bevis for, at den nye lak er mere slidstærk end den sædvanlige lak. 18

25 3.1 Normalfordelte variable Løsning Vi ser nu på differensen mellem sliddet i en bygning. (hvorved den store forskel mellem bygningerne elimineres) Lad D = X gammel - X ny Bygning nr d = x gammel - x ny ,3 D antages normalfordelt n( µ, σ ), hvor såvel µ som σ er ukendte. Da vi ønsker at teste om ny lak er mere slidstærk end gammel lak, dvs. den mest slidstærke lak slides mindst, bliver testen en ensidet t - test. Nulhypotese H 0 : µ 0 Alternativ hypotese H : µ > 0. TI89 Differensdata indtastes APPS, STAT/LIST F6, : t-test vælg Data Man finder x = 15. og P - værdi = PT ( > 15. ) = Da P - værdi = 3.63% < 5% forkastes H 0 (svagt), dvs. den ny lak er mere slidstærk end den gamle. SAS.JMP Data indtastes Ny lak Gammel lak 0,3 19,5 5,1 8,4 1,8 1,6 19,6 18,9 0,9 3,5 5,8.. Vælg Analyze Matched Pairs Y: Paired response:ny lak og Gammel lak OK Rød pil Fjern markering ved "Plot Diff by Mean Matched Pairs Difference: Gammel lak-ny lak Gammel lak 3,0333 t-ratio,6819 Ny lak 1,5333 DF 5 Mean Difference 1,5 Prob > t 0,076 Std Error 0,66131 Prob > t 0,0363* Upper 95% 3,19996 Prob < t 0,9637 Lower 95% -0, N 6 Correlation 0,8950 Heraf ses, at P-værdi = H 0 forkastes, dvs. ny lak mere slidstærk end gammel lak 19

26 3. 1 Faktor på niveauer 3. BINOMIALFORDELTE VARIABLE. Man kan ofte approksimere en binomialfordeling med en normalfordeling. Det er en sådan approksimation, som såvel formlerne i oversigten i afsnit bygger på som TI89's program: -Prop-Z-test. Forudsætningen er: X 1 og X er binomialfordelt henholdsvis bn ( 1, p1) og bn (, p) Observerede stikprøveværdier x 1 og x. x1 x x Lad p$, p$, 1 + x 1 = = $p =. Forudsætning: n1 p $ [ 5 ; n1 5], n [ ] p$ 5; n 5 n n n + n 1 1 I praksis vil disse forudsætninger for approksimation sædvanligvis være opfyldt. Vi belyser beregningerne ved følgende eksempel. Eksempel 3.6. Binomialfordelingstest. Ved et forsøg der skulle afgøre om C - vitamin har en forebyggende virkning mod forkølelse, fik halvdelen af en gruppe på 80 franske skiløbere C - vitamin mens de øvrige fik kalktabletter (placebobehandling). Fordelingen skete randomiseret, og forsøgspersonerne var uvidende om gruppeinddeling og hvilket medikament de fik. Efter en passende tid optaltes hvor mange af forsøgspersonerne der var forkølede. Resultaterne kan ses af følgende skema: Forkølet Ikke forkølet Total C-vitamin Kalktabletter Bemærk, at en enkelt forsøgsperson gled ud af forsøget, så grupperne blev ikke helt lige store. 1) Kan det på et signifikansniveau på 5% vises, at C - vitamin har en forebyggende virkning? ) I bekræftende fald angiv er 95% konfidensinterval for differensen mellem parametrene. Løsning TI89: X 1 = antal forkølede personer der har fået C-vitamin. X 1 er binomialfordelt b(139, p 1 ). X = antal forkølede personer der har fået Kalktabletter. X er binomialfordelt b(140, p ). 1) H0: p1 = pmod Hp : 1 < p (da vi ønsker at vise, at p1 < p). x1 17 x 31 x1 + x $p 1 = =, $p = = og $p = = =. n1 139 n 140 n1 + n Da n1 p$ = = 39. [ 5139 ; 5] og n p$ = = 41. [ 5140 ; 5] er forudsætningerne for at approksimere med normalfordelingen opfyldt. F6, 6 -Prop-ZTest Udfylder menu: Succes x1=17, n1= 139, succes x=31, n = 140, Alt. hyp : p1 < p Udskrift giver P- værdi= Da P - værdi = < 0.05 forkastes nulhypotesen (svagt) Konklusion: På signifikansniveau 5% er vist, at C-vitamin har en vis forebyggende virkning mod forkølelse, ) 95% konfidensinterval; F7, 6 -Prop-ZInt, menu udfyldes som under punkt 1. Udskrift viser C_int=[ ; ] 0

27 3.3 Poissonfordelte variable Løsning SAS.JMP: SAS.JMP benytter en såkaldt χ -test som først omtales i kapitel 9. Data indtastes: vitamin syg antal c forkølet 17 c ikke forkølet 1 kalk forkølet 31 kalk ikke forkølet 109 Vælg fra hovedmenu Analyze Fit y by x Response:Syg, Factor: vitamin Freq: Antal OK Resultat: Contingency Analysis of Syg By Vitamin Freq: Antal Tests Source DF -LogLike RSquare (U) Model 1, ,0190 Error 77 15,65610 C. Total 78 18,09195 N 79 Test ChiSquare Prob>ChiSq Likelihood Ratio 4,87 0,073 Pearson 4,811 0,083 Fisher's Exact Test Prob Alternative Hypothesis Left 0,005 Prob(Syg=ikke forkølet) is greater for Vitamin=c than kalk Right 0,9910 Prob(Syg=ikke forkølet) is greater for Vitamin=kalk than c -Tail 0,0385 Prob(Syg=ikke forkølet) is different across Vitamin P-værdi = 0.083/ = (ud for Pearson) (kun ved ensidet test divideres med ) Konklusion: På signifikansniveau 5% er vist, at C-vitamin har en vis forebyggende virkning mod forkølelse, 3.3 POISSONFORDELTE VARIABLE. Man kan ofte approksimere en Poisonfordeling med en normalfordeling. Det er en sådan approksimation, som formlerne i oversigten i afsnit bygger på. I praksis vil disse forudsætninger for approksimation sædvanligvis være opfyldt. Vi belyser anvendelsen af oversigten ved følgende eksempel (Hverken TI89 eller SAS.JMP har ikke et særligt program hertil). Eksempel 3.7. Poissonfordelingstest. En bestemt type TV-apparat produceres på fabrikker A og B. Man har mistanke om, at der er forskel på antallet af loddefejl der findes i apparater fra de to fabrikker. For at teste dette, udtages af den løbende produktion stikprøver på 0 TV-apparater, og man optalte antallet af loddefejl i de 0 apparater. Resultaterne blev: Fabrik A: På 0 apparater fandtes i alt 1 loddefejl Fabrik B: På 19 apparater fandtes i alt 7 loddefejl (et apparat måtte udskydes) Test på dette grundlag, om der er forskel på fejlintensiteten på de to fabrikker. Løsning. X 1 = antal loddefejl pr. apparat på fabrik A. X 1 antages Poissonfordelt p( µ 1 ). X = antal loddefejl pr. apparat på fabrik B. X antages Poissonfordelt p( µ ). H 0 :µ 1 = µ mod H:µ 1 µ (da vi ønsker at vise, at µ 1 µ ) Oversigten i kapitel anvendes : 1, x 1 = x =, og x = = =

28 3. 1 Faktor på niveauer Da n1 x = 0 19 = og n x = = er forudsætningerne for at approksimere med normalfordelingen opfyldt. Vi finder : 1 1 s= x + og n n = = x1 x = = Da P-værdi = P(Y > 0.316) = normcdf(0.316,,0,0.36) = > 0.05 accepteres nulhypotesen. Konklusion: Man kan ikke på det grundlag vise, at der er forskel på fejlintensiteten på de to fabrikker, SAS.JMP kan kun foretage denne test ved at foretage beregningerne i FORMULA FORDELING UKENDT (Rangtest) De testprocedurer vi har benyttet i de forrige kapitler har alle været baseret på, at i det mindste approksimativt kendte fordelingen (normal-, binomial- eller Poisson-fordelt) og testen vedrørte parametre i fordelingen såsom µ, σ eller p. Denne form for statistik kunne kaldes parametrisk statistik. Kendes fordelingen ikke, og kan man heller ikke approksimere den til en kendt fordeling, så må man benytte de såkaldte ikke- parametriske test. Disse forudsætter ikke, at fordelingen er kendt, og kunne derfor også kaldes fordelingsfri test. Da det ligger udenfor denne bogs centrale emner, men der findes en beskrivelse heraf i appendix 4

29 3.5 Oversigt over centrale formler i kapitel OVERSIGT OVER CENTRALE FORMLER I KAPITEL Test og konfidensinterval af differens µ µ mellem middelværdier µ og µ for 1 normalfordelte variable. X 1 og X er normalfordelte henholdsvis n( µ 1, σ1) og n( µ, σ). 1 x 1 x Givet stikprøver af X 1 og X. Størrelse, gennemsnit og spredning henholdsvis n 1,, s 1 og n,, s. Signifikansniveau er α. Lad d være en given konstant. Satterthwaites test: Forudsætning σ 1 og σ ukendte s n 1 s n c Forkortelser: a =, b =, c = a + b, g = a b 1 n n 1 T er t - fordelt med frihedsgradstallet f. Forudsætninger σ, σ ukendte 1 x1 x d t = c f er det nærmeste hele tal, som er større end g Alternativ hypotese H P - værdi Beregning H 0 forkastes µ 1 > µ +d PT ( t) TI89: tcdf (, t, f ) eller F6: -sampttest,pooled, No P - værdi<α µ 1 < µ +d PT ( t) TI89: tcdf (, t, f ) eller F6: -sampttest,pooled, No µ 1 µ +d PT ( t) for x1 > x + d PT ( t) for x < x + d 1 som række 1 som række 100 ( 1 α )% konfidensinterval for differens µ 1 µ : x x t ( f ) c µ µ x x + t ( f ) c 1 α TI89: F7, -SampTint,pooled, No α 1 P - værdi < 1 α dog hvis Ttest P - værdi<α U-test (eller Z-test):Forudsætning: σ 1 og σ kendt eksakt σ1 σ Forkortelser: x = x1 x d σ = + Y er normalfordelt n1 n n( µ, σ) Forudsætninger Alternativ hypotese H P - værdi Beregning H 0 forkastes σ1, σkendte µ 1 > µ +d PY ( x) TI89: normcdf ( x,, µ, σ) eller F6: -sampztest P - værdi<α µ 1 < µ +d PY ( x) TI89: normcdf (, x, µ, σ ) eller F6: -sampztest µ 1 µ +d PY ( x) for x1 > x + d PY ( x) for x < x + d 1 som række 1 som række 100 ( 1 α )% konfidensinterval for differens µ µ : x x u σ µ µ x x + u σ 1 α TI89: F7, -SampZint Parvise observationer (blokforsøg) α 1 1 P - værdi < 1 α dog hvis Ztest P - værdi<α 3

Vis mere