MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics)



Relaterede dokumenter
VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

VIDEREGÅENDE STATISTIK

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Note til styrkefunktionen

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Forsøgsplanlægning Stikprøvestørrelse

Statistisk forsøgsplanlægning. med benyttelse af Statgraphics

Forelæsning 9: Inferens for andele (kapitel 10)

Vejledende besvarelser til opgaver i kapitel 14

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Løsning eksamen d. 15. december 2008

Kapitel 7 Forskelle mellem centraltendenser

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Stastistik og Databehandling på en TI-83

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Kapitel 12 Variansanalyse

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Løsning til eksaminen d. 14. december 2009

Opgaver til kapitel 3

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Reeksamen i Statistik for Biokemikere 6. april 2009

Kapitel 12 Variansanalyse

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Produkt og marked - matematiske og statistiske metoder

En Introduktion til SAS. Kapitel 5.

Statistik viden eller tilfældighed

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Tema. Dagens tema: Indfør centrale statistiske begreber.

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Multiple choice opgaver

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende løsninger kapitel 8 opgaver

To-sidet varians analyse

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK II Regressionsanalyse (TI-89 og Statgraphics)

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

1 Hb SS Hb Sβ Hb SC = , (s = )

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

(studienummer) (underskrift) (bord nr)

Module 4: Ensidig variansanalyse

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Eksamen i Statistik for biokemikere. Blok

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Normalfordelingen og Stikprøvefordelinger

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Personlig stemmeafgivning

MPH specialmodul Epidemiologi og Biostatistik

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

(studienummer) (underskrift) (bord nr)

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Estimation og konfidensintervaller

Nanostatistik: Opgavebesvarelser

Løsning til eksamen d.27 Maj 2010

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Forsøgsplanlægning Stikprøvestørrelse

Modelkontrol i Faktor Modeller

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Klasseøvelser dag 2 Opgave 1

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Susanne Ditlevsen Institut for Matematiske Fag susanne

Løsning til eksaminen d. 29. maj 2009

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

VIDEREGÅENDE STATISTIK III Ikke parametriske test

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Transkript:

MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics) DANMARKS TEKNISKE UNIVERSITET 6. udgave 005

FORORD Dette notat kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske grundbegreber. Notatet er bygget op således, at de væsentligste begreber søges forklaret anskueligt og ved hjælp af et stort antal eksempler. Det forudsættes, at man har en lommeregner med de statistiske fordelinger indlagt. Der vil derfor i ringe omfang blive benyttet statistiske tabeller. I Statistiske grundbegreber er der i appendix A en brugsanvisning på hvorledes dette kan gøres med bl.a lommeregnerne Ti-83 og HP48G. Sidst i dette notat (side 85) findes en tilsvarende brugsanvisning for TI-89. Sidst i hvert kapitel findes en oversigt over de vigtigste formler samt nogle opgaver. En facitliste til opgaverne findes bagerst i notatet. Fordelen ved direkte at bruge formlerne til løsning af eksemplerne er, at man derved opnår en større forståelse. De mere avancerede programmer bliver let en sort kasse, hvor der på mystisk vis dukker et facit op, som man ikke rigtig har noget forhold til. Imidlertid er det naturligvis også vigtigt, at man kender de muligheder mere avancerede regnemidler tilbyder. Lommeregneren TI-89 er en god statistiklommeregner, så i slutningen af hvert kapitel bliver de samme eksempler som i hovedteksten regnet ved benyttelse af dens indbyggede programmer. Ved behandling af store datamængder og ved mere regneteknisk komplicerede analyser er en lommeregner som TI - 89 ikke nok. Her et det nødvendigt at benytte en PC med et passende statistisk software. I dette notat er anvendt statistikprogrammet Statgraphics, således, at alle eksemplerne efter hvert kapitel også er regnet med dette program. Der findes mange andre udmærkede statistikprogrammer. I et ganske tilsvarende notat (som kan findes på nedenstående adresse) er Statgraphics eksemplerne således udskiftet med SAS-JUMP. Udskrifterne fra sådanne statistikprogrammer afviger ikke væsentligt fra hinanden, så skulle man i undervisningen benytter et tredie statistikprogram, kan de studerende uden vanskelighed på basis af disse udskrifter tolke egne udskrifter. Data foreligger ofte som en fil i et regneark som eksempelvis Excel. Disse regneark har indbygget en del statistik bl.a. de almindeligste testfunktioner. I notatet Videregående statistik regnet med Excel er en række af disse statistiske muligheder gennemgået. Andre notater i samme serie er noterne Videregående Statistik II: Regressionsanalyse Videregående Statistik III: Ikke parametriske metoder. Statistisk kvalitetskontrol Noterne (som både findes i en Statgraphics og en SAS-JUMP version) et søgt udarbejdet, så de kan læses uafhængigt af hinanden. Alle de nævnte noter kan i pdf-format findes på adressen www.larsen-net.dk August 006 Mogens Oddershede Larsen.

Indhold INDHOLD 0 HYPOTESETESTNING (TO STATISTISKE VARIABLE) 0. Indledning... 0. Planlægning af forsøg... 0.3 Test og konfidensintervaller - normalfordelte variable... 4 0.3. De eksakte spredninger er ukendte, men antages at være ens... 5 0.3. De eksakte spredninger er ukendte, men antages at være forskellige.. 7 0.3.3 De eksakte spredninger er kendte... 8 0.3.4 Store stikrøvestørrelser (over 30)... 9 0.4 Test og konfidensintervaller - binomialfordelte variable... 0 0.5 Test og konfidensintervaller - Poissonfordelte variable... Oversigter. 0. Test af middelværdier µ og µ og konfidensinterval for differens for σ σ normalfordelte variable ( )... 0.. Test af middelværdier µ og µ og konfidensinterval for differens for σ σ normalfordelte variable ( )... 3 0.3. Test af middelværdier µ og µ og konfidensinterval for differens for normalfordelte variable (spredninger kendte eller stor stikprøvestørrelse). 4 0.4. Test af varianser σ og σ og konfidensinterval for σ / σ for variable... 5 0.5. Oversigt over test af parametre p og p for binomialfordelte variable... 6 0.6. Oversigt over test af parametre µ og µ for Poissonfordelte variable... 7 0.7. Mapleprogram til dimensionering: og normalfordelte variable... 8 Appendix: Statistikprogrammer 0A Eksempler regnet med TI - 89... 9 B Eksempler regnet med Statgraphics... Opgaver... 6 VARIANSANALYSE. Indledning... 3. Ensidet variansanalyse... 3.. Forklaring af metoder og formler... 3.. Beregning af ensidet variansanalyse... 35.3 Tosidet variansanalyse... 36.3. Indledning... 36

Indhold.3. Planlægning af forsøg... 36.3.. Én faktor ad gangen... 37.3.. Fuldstændig faktorstruktur... 38.3.3 Formler og metode... 39.3.4 Beregning af tosidet variansanalyse... 40.3.4. Model med vekselvirkning... 40.3.4. Additiv model, model uden vekselvirkning... 4.4 Fuldstændigt randomiseret blokforsøg... 44 Oversigter. Formler til beregning af ensidet variansanalyse... 47. Formler til beregning af tosidet variansanalyse... 50 Appendix: Statistikprogrammer. A Eksempler regnet med TI - 89... 53 B Eksempler regnet med Statgraphics... 59 Opgaver... 69 FLERE END TO BINOMIAL- OG POISSONFORDELTE VARIABLE. Indledning... 74. Én faktor på mere end niveauer... 74.. Binomialfordelt variabel... 74.. Poissonfordelt variabel... 75.3 To faktorer i et fuldstændigt faktorforsøg... 75 Oversigter.. Oversigt over test af parametre p, p,..., p k for binomialfordelte variable... 78.. Oversigt over test af parametre µ, µ,..., µ k for Poissonfordelte variable... 78.3. Oversigt over transformation af binomial - eller Poissonfordelte variable til tosidet variansanalyse... 78 Appendix: Statistikprogrammer A Eksempler regnet med TI - 89... 79 B Eksempler regnet med Statgraphics... 8 Opgaver... 83 GRUNDLÆGGENDE OPERATIONER PÅ TI - 89... 85 STATISTISKE TABELLER TABEL. Fraktiler i U - fordelingen... 87 TABEL. Fraktiler i t - fordelingen... 88 TABEL 3. Dimensioneringstabel for variable... 89 FACITLISTE... 90 STIKORD... 9

0. Planlægning af forsøg 0 HYPOTESETESTNING (TO STATISTISKE VARIABLE) 0. Indledning Afsnit 0. giver en kort beskrivelse af hvorledes forsøg bedst planlægges ud fra et statistisk synspunkt. Hertil anvendes bl.a. den i tabel 3 angivne dimensioneringsstabel. I tilfælde som ikke dækkes af tabellen kan anvendes det i oversigt 0.7 angivne program skrevet i matematikprogrammet Maple. I afsnit 0.3 sammenlignes to normalfordelte variable, mens de variable i afsnit 0.4 og 0.5 forudsættes at være henholdsvis binomial - og Poisson - fordelte. De grundlæggende begreber vedrørende hypotesetest, konfidensintervaller og dimensionering af forsøg blev i Statistiske Grundbegreber grundigt beskrevet for én statistisk variabel. Da det er de samme begreber og analoge udledninger der anvendes, når det drejer sig om at sammenligne statistiske variable, vil de kun blive ganske kort blive gentaget i dette kapitel. Som det nævnes i forordet vil vi forudsætte, at man har en lommeregner (som eksempelvis TI - 83, TI - 89 eller HP48G). I appendix 0A og 0B vil de samme beregninger ses udført med mere avancerede statistikprogrammer. 0. Planlægning af forsøg Vi vil i dette afsnit som udgangspunkt tage følgende eksempel. Eksempel 0.. Hypotesetest. En fabrik der producerer maling, har udviklet to nye additiver A og A, som bevirker en kortere tørretid. Additiv A er det dyreste, men man forventer også, at det giver den korteste tørretid. På grund af prisforskellen, skal tørretiden dog være mindst 0 minutter kortere for A, før man vil gå over til den. For at undersøge disse forhold produceres nogle liter maling, som derefter deles op i mindre portioner. Til nogle af portionerne tilsættes additiv A og til andre additiv A. Tørretiden måles derefter. Generelt gælder, at hvert delforsøg i et forsøg udføres under en række forsøgsbetingelser. De betingelser som med forsæt varieres som led i forsøgets formål, kaldes forsøgsbehandlingerne eller blot behandlingerne (engelsk: treatment). Alle andre delforsøgsbetingelser sammenfattes i et begreb, der kaldes forsøgsenheden. I eksempel 0. er additiverne = behandlingerne og forsøgsenhederne er den enkelte portion maling, anvendt apparatur og personale, tidspunkt for delforsøget og de forhold med hensyn til temperatur, luftfugtighed osv., som gælder på forsøgstidspunktet. Bemærk, at forsøgsenhederne ofte indeholder faktorer, som ikke kan gøres ensartet fra delforsøg til delforsøg. Dette bevirker, at resultatet af de enkelte delforsøg varierer. Dette giver forsøgsvariablens variation eller kort forsøgets støj.

0. Hypotesetestning ( statistiske variable) Randomisering. For at sikre et statistisk gyldigt forsøg foretager man en såkaldt fuldstændig randomisering. Dette betyder at man ved lodtrækning fordeler forsøgsenhederne tilfældigt på behandlingerne. Dette sker, for at man ikke ubevidst kommer til at favorisere en af de to behandlinger. Hvis man eksempelvis helt systematisk i eksempel 0. først laver alle delforsøg med additiv A, kunne dette bevirke en favorisering af A nemlig hvis forsøgsomstændighederne (apparater, personale, luftfugtighed ) er mest gunstige ved begyndelsen af forsøgsperioden. For at anskueliggøre denne randomiseringsproces antager vi, at vi i eksempel 0. skal lave 4 delforsøg med hver additiv. Endvidere antages, at delforsøgene skal indgå i den almindelige produktionsgang, dvs. at man af tidsmæssige, personalemæssige og på grund af en begrænset mængde apparatur må lade forsøgene forløbe over flere dage. Man tror ikke, at dage, apparatur og laborant har nogen væsentlig betydning for forsøgsresultaterne. Der er sandsynligvis også andre forhold udenfor vor kontrol, og som tilsammen bevirker, at selv om man udfører gentagne delforsøg med samme behandling, så får vi afvigende resultater. For en sikkerheds skyld vælger vi imidlertid at randomisere dage, apparatur og laboranter Lad os antage at der gælder følgende: Mandag er det kun muligt at lave delforsøg, idet apparatur nr og laborant A er de eneste der er ledige. Tirsdag er der kapacitet ledig til 3 delforsøg: Ét delforsøg hvor apparatur nr og laborant A benyttes Ét delforsøg hvor apparatur nr og laborant B benyttes, og Ét delforsøg hvor apparatur nr 3 og laborant C benyttes. Onsdag kan der også laves 3 delforsøg osv. (se det følgende skema). Forsøgsenheder Behandlinger Dag Apparatur Laborant (apparater) mandag A tirsdag A tirsdag B tirsdag 3 C onsdag 3 B onsdag 4 C onsdag A torsdag 3 B Vi foretager nu randomiseringen, som kort sagt er en form for lodtrækning. Sædvanligvis vil man benytte et program, der kan generere tilfældige tal (mange lommeregnere har et sådant program). For at anskueliggøre randomiseringen vil vi mere primitivt foretage lodtrækningen på følgende måde. På 4 sedler skrives A, på andre 4 sedler skrives A. Hver seddel krølles sammen til en kugle og placeres i en dåse. Sedlerne blandes ved at dåsen rystes (se figur). Hvis den første seddel der udtrækkes er A så betyder det, at det delforsøg der mandag udføres med apparatur og laborant A skal anvende additiv A. Hvis den næste seddel der udtrækkes er A så betyder det, at det delforsøg der tirsdag udføres med apparatur og råvareleverance skal anvende additiv A osv. Resultaterne kunne eksempelvis være som angivet på følgende skema:

0. Planlægning af forsøg Forsøgsenheder Dag Apparatur Laborant Behandlinger (apparater) mandag A A tirsdag A A tirsdag B A tirsdag 3 C A onsdag 3 B A onsdag 4 C A onsdag A A torsdag 3 B A På denne måde sikrer man sig, at vi får et så vidt muligt "statistisk gyldigt" forsøg. Hvis vi derfor efter beregninger (som ses i de følgende kapitler ) konkluderer, at der er forskel på additiverne, så er det "korrekt", idet det ville være helt tilfældigt, hvis én af additiverne har været begunstiget med særlig gode forsøgsenheder. Herved har man også sikret sig, at de to stikprøver (variable) er statistisk uafhængige. Forsøg bør udføres, så alle behandlinger får lige mange gentagelser. Ved planlægningen af forsøget er det ganske klart, at hvis man eksempelvis har ressourcer til at lave 0 delforsøg, så ville det være en meget dårlig plan, hvis man lavede 8 delforsøg med A og kun delforsøg med A. Der bør i naturligvis tilstræbes at lave 0 delforsøg med hver behandling. Delforsøg kan mislykkes, så målet i praksis ikke bliver opfyldt. I sådanne tilfælde kan de i de følgende kapitler anførte statistiske analyser dog stadig gennemføres. Testene bliver dog mindre robuste (dvs. mere afhængige af at forudsætningerne gælder), og beregningerne mere komplicerede. Dimensionering Analogt med forklaringen i Statistiske Grundbegreber side 57 kan man under visse forudsætninger beregne hvor mange gentagelser (portioner) der skal anvendes for hver behandling, hvis P( fejl af type I) α og P( fejl af type II) β. Man skal naturligvis angive en bagatelgrænse, men desuden kræver beregningerne, at spredningerne ved de to behandlinger er (tilnærmelsesvis) ens, og at man kan give et nogenlunde realistisk skøn for denne fælles spredning σ. Det er naturligvis en svaghed ved dimensioneringen, at man inden forsøget er udført skal give et sådant skøn. En vurdering heraf kunne baseres på erfaringer fra tilsvarende forsøg. Findes sådanne erfaringer må man først lave nogle få delforsøg og derfra få et rimeligt gæt på spredningen σ. At spredningerne er nogenlunde ens vil i praksis ofte være tilfældet, da forsøgsenhederne jo er valgt ved randomisering. Når forsøget så er lavet, kan man (lidt sent) se, om man har skønnet rigtigt. Dimensioneringen skal jo bevirke, at man laver det rigtige antal gentagelser. Man kan fristes til at tro, at jo flere gentagelser jo bedre. Dette er imidlertid ikke tilfældet, idet man med for mange gentagelser kan risikere at opdage så små forskelle, at de ikke har praktisk betydning, og så er de mange delforsøg jo spild af arbejdskraft og penge. Formler for dimensionering af variable findes i oversigt 0. og 0.3, en tabel til dimensionering findes i tabel 3, ligesom der i oversigt 0.7 er angivet et Mapleprogram, som kan anvendes i de tilfælde, hvor man ikke kan finde resultatet i tabellen. 3

0. Hypotesetestning ( statistiske variable) Eksempel 0.. (fortsættelse af eksempel 0.) Dimensionering. a) Hvor mange portioner skal anvendes ved forsøget, hvis man ønsker, at P( fejl af type I ) = α 005., P( fejl af type II ) = β 00. og bagatelgrænsen =0 minutter, idet man fra mange tilsvarende forsøg ved, at den fælles spredning er σ = 5 minutter. b) Samme spørgsmål og krav som i spørgsmål a), men nu antages, at man ikke kender spredningen, men ud fra nogle få delforsøg skønner, at den er ca. 5 minutter. c) Samme spørgsmål og krav som i spørgsmål b), men nu antages P(fejl af type I) = α 0.0. LØSNING: u + u u + u + α β 095. 090. 645. 8. a) Af oversigt 0.3 fås n = = = 38, 55 0 0 σ 5 5 dvs. der skal udføres i alt n = 39 delforsøg af hver behandling b) Idet fås af tabel 3, at det største tal mindre end 0.67 er 0.66 svarende til σ 3 = 067. n 40 c) Tabellen dækker ikke tilfældet α = 0.0, så man må bruge Mapleprogrammet i oversigt 0.7. Da kravet er vanskeligere at opfylde, må n > 40. Vi sætter forsøgsvis n = 65. Gå ind i programmet under variable. restart; osv. tryk på enter for at udføre programmet. Ret dernæst i programmet under evalf(6.,3.0,0.05) tosidet test til > evalf(pt(65,0.667,0.005)) - evalf(pt(65,0.667,0.995)); #tosidet test og tryk på enter. Resultatet blev. Da resultatet er lidt større end 0. øges n til 67. > evalf(pt(67,0.667,0.005)) - evalf(pt(67,0.667,0.995)); #tosidet test Vi får nu. Vi øger nu n gradvist, og finder tilsidst, at for n = 69 er Resultatet er derfor, at vi skal udføre n = 69 delforsøg af hver behandling. 0.3 Test og konfidensintervaller for normalfordelte variable. Lad os igen betragte det i eksempel 0. og 0. angivne forsøg. For hver af de additiver udføres en række delforsøg. Forsøgsresultaterne kan generelt skrives: For additiv A : Statistisk variabel X. Stikprøve : x, x, x 3,... x n. For additiv A : Statistisk variabel X. Stikprøve : x, x, x 3,... x n. Vi antager, at X og X er statistisk uafhængige normalfordelte variable med henholdsvis middelværdierne µ og µ og spredningerne σ og σ. Sædvanligvis er man interesseret i at teste nulhypotesen H0:µ = µ + d (d er en given konstant). Denne omskrives til H0:µ µ d = 0, og testproceduren baseres på fordelingen af differensen X X d. Ifølge additionssætningen (se eventuelt Statistiske Grundbegreber side 34) er X X d normalfordelt og fra regnereglerne fås E X X d = E X E X d = µ µ d og ( ) ( ) ( ) σ σ V( X X d) V( X ) V( X ). = + = + n n Heraf følger, at U X X d = er normeret normalfordelt. σ σ + n n Desværre er σ og σ sjældent kendt eksakt. Kendes kun deres estimater s og s må der anvendes 4

0.3 Test og konfidensintervaller for normalfordelte variable andre testprocedurer. Hvis stikprøvestørrelserne er store (over 30) er det dog tilstrækkelig nøjagtigt at anvende en U - test. Analysen deles derfor op i 4 tilfælde. ) De eksakte spredninger σ og σ er ukendte, men antages at være ens (afsnit 0.3.) ) De eksakte spredningerne σ og σ er ukendte, men antages forskellige (afsnit 0.3.). 3) De eksakte spredningerne σ og σ er kendte.(afsnit 0.3.3) 4) Stikprøvestørrelserne er store (over 30) (afsnit 0.3.4) 0.3. De eksakte spredningerne er ukendte, men antages at være ens Forklaring af formler. I dette tilfælde må spredningerne estimeres ud fra forsøgsresultaterne. Det X X d ville være naturligt at betragte teststørrelsen,men denne har desværre ikke en kendt s s + n n fordeling. Da de to variable antages at have samme spredning s 0, beregnes et estimat for den fælles varians som et vægtet ( poolet) gennemsnit s 0 af de to estimater for varianserne s og s. Disse ( n ) s + ( n ) s vægtes i forhold til frihedsgraderne, dvs. s0 =. Frihedsgradstallet for s 0 er n+ n f0 = n + n. X X d X X d Teststørrelsen kan nu reduceres til t = = som kan vises at være t - fordelt. s0 s 0 + s0 + n n n n Testning af H0:µ = µ + d foretages derfor i følgende rækkefølge: ) Først undersøges om varianserne er ens (selvom det egentlige formål er at undersøge forskelle i middelværdier). Nulhypotesen testes mod den alternative hypotese ved en F - test. H 0 :σ = σ H:σ σ s Man beregner F = som er F- fordelt Fn (, n ). Vi får klart en accept af, hvis F s H 0 ligger tæt ved og en forkastelse, hvis F enten ligger tæt ved 0 eller er meget større end (se figuren) I oversigt 0.4 er denne test beskrevet, og kan ses udført i eksempel 0.3. Får man en accept af nulhypotesen, har man naturligvis ikke hermed vist at varianserne er ens, men da den følgende test af middelværdier er robust overfor mindre forskelle i varianserne, blot vi har samme antal gentagelser (mindre afvigelser kan dog accepteres), er det tilladeligt i den følgende test af middelværdierne, at antage at varianserne er ens. Vi antager her, at vi får en accept. Det tilfælde, hvor F - testen giver en forkastelse, bliver behandlet i det næste afsnit. 5

0. Hypotesetestning ( statistiske variable) X X d ) Nulhypotesen H 0 : µ = µ testes på basis af teststørrelsen t =, som er t - fordelt s0 + n n med f 0 frihedsgrader (jævnfør eksempel 0.3 og oversigt 0.). Hvis spredningerne kan antages ens, har man endvidere mulighed for at foretage en dimensionering, dvs. vælge antal gentagelser n, så P(fejl af type II) holdes under β (se eventuelt eksempel 0.). Eksempel 0.3. Accept af ens spredning. To katalysatorers indflydelse på udbyttet ved en kemisk proces skal undersøges. Den ene katalysator K er billigere end den anden katalysator K. Det påstås imidlertid, at K i middel giver et større udbytte. Kun hvis K i middel giver et udbytte som er mindst enheder større end det udbytte K giver, vil vi vælge katalysator K. Da forsøgene er både tidskrævende og kostbare, har man kun afsat midler til 8 forsøg med hver katalysator. Resultaterne blev: K 86.4 9.9 86.7 88.99 9.59 89.38 9.40 88.70 K 93.65 9.97 97.96 94.0 9.56 9.85 99.99 90.99 ) Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises at K giver et middeludbytte der er enheder større end K ) Angiv endvidere et 95% konfidensinterval for differensen mellem de to middeludbytter. Løsning. ) Lad X = udbyttet ved anvendelse af katalysator K og X = udbyttet ved anvendelse af katalysator K. X og X antages approksimativt normalfordelte med middelværdi og spredning henholdsvis µ, σ og µ, σ. Ved indtastning af forsøgsresultaterne i lommeregneren fås de tilsvarende estimater x = 89. 458, s =. 3873 og x = 943., s = 33.. 6 a) Først testes om varianserne er ens, dvs. H 0 :σ = σ mod H:σ σ. Vi anvender formlen i oversigt 0.4 række 3: s. 387 Teststørrelsen F = = = 055., er F - fordelt. s F( f, f) = F( 77, ) 33. Da P - værdi =P(F < 0.55)=FCdf(0, 0.55,7,7)= 0.57 > 0.05 accepteres nulhypotesen, dvs. vi vil i den følgende test antage, at spredningerne er ens. Et estimat for den fælles spredning er ( n s n s ) + ( ) ( 8 ). 387 + ( 8 ) 33. s0 = = = 80. med f 0 = 4 n + n 4 b) Vi tester nu om udbyttet ved katalysator K er større end ved katalysator K, dvs. opstiller nulhypotesen H 0 :µ µ + mod den alternative hypotese H:µ > µ +. x x 94. 89. 46 Af oversigt 0. fås teststørrelsen t = = = s0 + 80 88.. + n n 8 8 Da P - værdi = P(T>.88)= tcdf(.88,,4)=0.0405 < 0.05 forkastes nulhypotesen.

0.3 Test og konfidensintervaller for normalfordelte variable Konklusion: Der er (svagt) statistisk bevis for at K giver et udbytte der er enheder større end K (vi er dog tæt på en accept). ) 95% konfidensinterval: Af oversigt 0. fås x x t α ( f ) s + µ µ x x + t α ( f ) s + n n n n 0 0 0 0 89. 458 943. t0975. ( 4) 8. 0 + µ µ 89. 458 943. + t0975. ( 4) 8. 0 + 8 8 8 8 77. µ µ 6. Opgaven løst med TI-89 og Statgraphics findes i appendix 0A og 0B 0.3.. De eksakte spredninger er ukendte, men antages at være forskellige. Forklaring af formler. Forkastes nulhypotesen H 0 :σ = σ, benyttes Satterthwaite s approksimation (jævnfør eksempel 0.4 og oversigt 0.). Det skal bemærkes, at er spredningerne tilnærmelsesvis ens, har t -testen i afsnit 0.3. større styrke end Satterthwaite s approksimation, og må derfor foretrækkes. Hvis der er stor forskel på stikprøvestørrelserne, er det meget vigtigt for anvendelsen af t - testen, at forudsætningen om, at varianserne er ens er holdbar. Til gengæld er det også i sådanne tilfælde, man virkelig ser den store forbedring ved at benytte t - testen fremfor Satterthwaite s approksimation. Eksempel 0.4. Forkastelse af ens spredning. Lad os antage, at vi har samme problemstilling som i eksempel 0.3, men at vi denne gang anvender to andre katalysatorer A og B. Der planlægges med 0 delforsøg men desværre mislykkedes to af forsøgene med katalysator A, så der ikke er lige mange gentagelser. Stikprøverne giver estimaterne A: xa = 939., sa = 506. na =8 og B: xb = 89. 46, sb =. 9, nb = 0. Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises, at A giver et udbytte der er enheder større end B. Løsning: ) Lad X A = udbyttet ved anvendelse af katalysator A og X B = udbyttet ved anvendelse af katalysator B. X A og X B antages approksimativt normalfordelte med middelværdi og spredning henholdsvis µ, σ og µ, σ. A A B B a) Først testes om varianserne er ens, dvs. H0:σ A = σb mod H:σ A σ B. Vi danner teststørrelsen F s A 506. = = =. 488. sb 9. Idet P - værdi = FCdf(4.88,,7,9)=0.057 < 0.05 forkastes nulhypotesen, dvs. vi kan ikke tillade os at antage, at spredningerne er ens. b) Vi tester nu om udbyttet ved katalysator A er større end ved katalysator B, hvilket betyder, at vi opstiller nulhypotesen H0:µ A µ B + mod H:µ A > µ B +. Af oversigt 0. fås teststørrelsen En test har større styrke end en anden, hvis den med givne data og et givet signifikansniveau giver den største sandsynlighed for at forkaste nulhypotesen. 7

0. Hypotesetestning ( statistiske variable) xa xb s A sb 506. 9. t = hvor c = + = + = 3749. c n A nb 8 0 xa xb 939. 89. 46 t = = = 75. c 3749. Frihedsgradstallet f beregnes ved Satterthwaite s metode som det nærmeste hele tal, som er c 3749. større end g = = = 99. 0 s A s B 506. 9. n A n B n A + 8 0 + nb 8 0 P - værdi = P(T>.75)=tCdf(.75,,0)=0.56 > 0.05 accepteres nulhypotesen. Konklusion: Vi kan ikke på dette grundlag vise, at udbyttet ved katalysator A er større end ved katalysator B. Opgaven løst med TI-89 og Statgraphics findes i appendix 0A og 0B 0.3.3. De eksakte spredninger er kendte Der kan i visse tilfælde ske, at man ad andre veje kender spredningerne eksakt. I disse tilfælde kan man foretage en U - test, dvs. bruge testfunktionen U X X d =. σ σ + n n Følgende eksempel illustrerer dette Eksempel 0.5. eksakt spredning. På basis af dimensioneringen i eksempel 0. udførte man 40 delforsøg af hver behandling. Efter at forsøgsrækken var afsluttet, opdagede man, at et af forsøgene var mislykket og måtte kasseres. Der var følgelig kun 39 delforsøg med additiv A. Det vides, at spredningerne eksakt er σ A = 3. og σ A = 4. ) Man beregner gennemsnittene af de to stikprøver til x A = 8. 6 og x A = 9. Kan man ud fra disse data bevise på mindst signifikansniveau α = 0.05, at malingen med additivet A tilsat har en mindre middeltørretid end konkurrentens? ) Hvad vil du anbefale virksomheden at gøre, hvis man som nævnt i eksempel 0. kun vil gå over til A hvis tørretiden for A er mindst 0 minutter kortere end for A (bagatelgrænsen). Løsning: X = tørringstiden for maling tilsat additiv A. X = tørringstiden for maling tilsat additiv A. X og X antages at være uafhængige normalfordelte variable med henholdsvis middelværdierne µ og µ og spredningerne σ og σ. Nulhypotese H 0 :µ µ, Alternativ hypotese: H:µ < µ Da spredningerne er kendt eksakt anvendes en U - test (se eventuelt oversigt 0.3). x x 0 8. 6 9. u = σ n σ + n = 3 39 4 40.. + = 357. Da normcdf(,-3.57,0,)=0.0008 < 0.00 forkastes nulhypotesen (3-stjernet) 8

0.3 Test og konfidensintervaller for normalfordelte variable Konklusion: Der er et stærkt statistisk bevis for at additiv A i middel har en kortere tørringstid end additiv A. ) Et 95% konfidensinterval for differensen: s s x x u0 975 8 6 9 96 3. 4. ±. + =.. ±. + = 0. 6 ± 58. n n 39 40 [ ] Konfidensintervallet er 6. 43; 4. 78. (se eventuelt oversigt 0.3 ) Konklusion: Da bagatelgrænsen er 0, og næsten 50% af konfidensintervallet ligger under 0, kan det ikke på baggrund af dette materiale anbefales at gå over til det mere kostbare additiv. Bemærk, at dimensioneringen reelt kun har betydning i en acceptsituation, hvor man så med stor sikkerhed kan konkludere, at muligvis giver additiv A en kortere størkningstid, men ikke så meget kortere, at det har praktisk betydning. 0.3.4. Store stikprøvestørrelser (over 30) Er stikprøvestørrelserne store, viser erfaringen, at det er tilstrækkeligt nøjagtigt at anvende en U - test fremfor de mere præcise metoder der er beskrevet i afsnit 0-3. og 0.3.. Følgende eksempel illustrerer dette Eksempel 0.6. Stor stikprøvestørrelse (over 30) På basis af dimensioneringen i eksempel 0. udførte man 40 delforsøg af hver behandling. Efter at forsøgsrækken var afsluttet, opdagede man, at et af forsøgene var mislykket og måtte kasseres. Der var følgelig kun 39 delforsøg med additiv A. Man fik følgende resultater (i minutter) A 7,0 30,7 7,4 4,4 06,8 5,7 6,5 86,7 4,7 7,9 03,0 33,4 03,6 4,4 3,0 30, 0,5 9,4 7, 5,6 6,5 94,0,7 06,0 4,0 35, 4, 07,9 3,4 6, 3,9 3,4 5,6 8,0 0,6 97, 4,4 34, 5,7 A 6,7, 33,7 08,9,6 57,6 4, 4,9 0,6 4, 58,6 36,9 7,4 7,5 38,9,7 0,5 33,,4 43,0 35,6 35,4 36,8,4 6, 35,7 8,, 3,7 07,0 38,,6 3, 57,3 6,5 30, 6,0 38,6 38,5 06,5 Kan man ud fra disse data bevise på mindst signifikansniveau additivet A tilsat har en mindre middeltørretid end konkurrentens? Løsning: X = tørringstiden for maling tilsat additiv A. X = tørringstiden for maling tilsat additiv A. α = 0.05, at malingen med X og X antages at være uafhængige normalfordelte variable med henholdsvis middelværdierne µ og µ og spredningerne σ og σ. For de to stikprøver har man at x = 8. 6 og x = 9. s = 3. og s = 4. Vi ser, at vi har de samme værdier som i eksempel 0.5, bortset fra at spredningerne nu ikke er kendt. Det bliver derfor samme regninger og dermed samme konklusion. For sammenligningens skyld er i appendix 0A opgaven regnet ved en t - test, og man får ikke overraskende samme resultat. 9

0. Hypotesetestning ( statistiske variable) 0.4 Test og konfidensintervaller for binomialfordelte variable. Som nævnt i bind kan man ofte approksimere en binomialfordeling med en normalfordeling. Det er en sådan approksimation, som formlerne i oversigt 0.5 bygger på. I praksis vil disse forudsætninger for approksimation sædvanligvis være opfyldt. Vi belyser anvendelsen af oversigten ved følgende eksempel. Eksempel 0.7. Binomialfordelingstest. Ved et forsøg der skulle afgøre om C - vitamin har en forebyggende virkning mod forkølelse, fik halvdelen af en gruppe på 80 franske skiløbere C - vitamin mens de øvrige fik kalktabletter (placebobehandling). Fordelingen skete randomiseret, og forsøgspersonerne var uvidende om gruppeinddeling og hvilket medikament de fik.efter en passende tid optaltes hvor mange af forsøgspersonerne der var forkølede. Resultaterne kan ses af følgende skema: Forkølet Ikke forkølet Total u = C-vitamin 7 39 Kalktabletter 3 09 40 Bemærk, at en enkelt forsøgsperson gled ud af forsøget, så grupperne blev ikke helt lige store. ) Kan det på et signifikansniveau på 5% vises, at C - vitamin har en forebyggende virkning? ) I bekræftende fald angiv er 95% konfidensinterval for differensen mellem parametrene. Løsning: X = antal forkølede personer der har fået C-vitamin. X er binomialfordelt b(39, p ). X = antal forkølede personer der har fået Kalktabletter. X er binomialfordelt b(40, p ). ) Da vi ønsker at vise, at p < pbliver nulhypotesen H0: p pmod Hp : < p. Oversigt 0.5 anvendes : x 7 x 3 x + x 7 + 3 48 $p = =, $p = = og $p = = =. n 39 n 40 n + n 39 + 40 79 Da n p$ = 39 48 = 39. [ 539 ; 5] og n p$ = 40 48 = 4. [ 540 ; 5] 79 79 er forudsætningerne for at approksimere med normalfordelingen opfyldt. Vi finder af formel () 7 3 39 40 p$ p$ p$ ( p$) + n n = 48 + 79 48 79 39 40 = 0099. = 93. 0045. Da P(U < -.93) = normcdf(,-.93,0,)=0.045 < 0.05 forkastes nulhypotesen (-stjernet) Konklusion: På signifikansniveau 5% er vist, at C-vitamin har en vis forebyggende virkning mod forkølelse, ) Et 95% konfidensinterval for differensen p per ifølge oversigt 0.5: p$ ( p$ ) p$ ( p$ ) p$ ( p$ ) p$ ( p$ ) p$ p$ u α + p p p$ p$ + u α + n n n n 0

0. 0. 960. 0.5 Test og konfidensintervaller for Poissonfordelte variable ( ) 0 ( 0 ) 0. ( 0. ) 0. ( 0. ) 0. 0... + 39 40 p p 0. 0. + 960. 0. 099 0. 08773 p p 0. 099+ 0. 08773 0869. p p 0. 04 39 + 40 0.5 Test og konfidensintervaller for Poissonfordelte variable. Som nævnt i bind kan man ofte approksimere en Poisonfordeling med en normalfordeling. Det er en sådan approksimation, som formlerne i oversigt 0.6 bygger på. I praksis vil disse forudsætninger for approksimation sædvanligvis være opfyldt. Vi belyser anvendelsen af oversigten ved følgende eksempel. Eksempel 0.8. Poissonfordelingstest. En bestemt type TV-apparat produceres på fabrikker A og B. Man har mistanke om, at der er forskel på antallet af loddefejl der findes i apparater fra de to fabrikker. For at teste dette, udtages af den løbende produktion stikprøver på 5 TV-apparater, og man optalte antallet af loddefejl i de 5 apparater. Resultaterne blev: Fabrik A: På 0 apparater fandtes i alt loddefejl Fabrik B: På 9 apparater fandtes i alt 7 loddefejl (et apparat måtte udskydes) Test på dette grundlag, om der er forskel på fejlintensiteten på de to fabrikker. Løsning. X = antal loddefejl pr. apparat på fabrik A. X antages Poissonfordelt p( µ ). X = antal loddefejl pr. apparat på fabrik B. X antages Poissonfordelt p( µ ). Da vi ønsker at vise, at µ µ bliver nulhypotesen H 0 :µ = µ mod H:µ µ. Oversigt 0.6 række 3 anvendes : x x 7 x + x + 7 9 x,, og. = = x = = x = = = n 0 n 9 n + n 0 + 9 39 Da n x = 0 9 = 974. 5 og n x = 9 9 = 96. 5 39 39 er forudsætningerne for at approksimere med normalfordelingen opfyldt. 7 Vi finder : x x u = = 0 9 0. 36 = = 9 0 36 036.. x + + n n 39 0 9 Da P(U >.036) = normcdf(.036,,0,) = 0.50 > 0.05 accepteres nulhypotesen. Konklusion: Man kan ikke på det grundlag vise, at der er forskel på fejlintensiteten på de to fabrikker,

Oversigt 0. Oversigt 0.. Test af middelværdier µ og µ og konfidensinterval for differens µ µ for normalfordelte variable. X og X er normalfordelte henholdsvis n( µ, σ) og n( µ, σ ). σ σ Givet stikprøver af X og X. med størrelse, gennemsnit og spredning henholdsvis n, x, s og n, x, s. Signifikansniveau er α. x x d Lad d være en given konstant. t = n s n s hvor s,. 0 ( ) + ( ) = f0 = n + n n n s0 + + n n T er en statistisk variabel der er t - fordelt med frihedsgradstallet f 0. Forudsætning. σ og σ ukendte H 0 :σ = σ accepteres ved F - test H 0 : Nulhypotese H: Alternativ hypotese H :µ µ + 0 H:µ > µ + d d H0:µ µ + d H:µ < µ + d H :µ = µ + 0 H:µ µ + d d P - værdi = PT ( t) P - værdi = PT ( t) P - værdi = PT ( t) for P - værdi = PT ( ) for 00 ( α )% Konfidensinterval for differens µ µ : Beregning H 0 forkastes Dimensionering x > x + d t x < x + d P - værdi<α P - værdi < α x x t α ( f0) s0 + µ µ x x + t α ( f0) s0 + n n n n = µ µ d er den mindste ændring i µ der har praktisk interesse. β = P(type II fejl) Antal gentagelser for hver af de to variable findes af dimensioneringstabel 8 For værdier der ikke står i tabellen benyt Mapleprogrammet i oversigt 0.7

Oversigt 0. OVERSIGT 0.. Test af middelværdier µ og µ og konfidensinterval for differens µ µ for normalfordelte variable σ σ. X og X er normalfordelte henholdsvis n( µ, σ) og n( µ, σ ). Givet stikprøver af X og X. Størrelse, gennemsnit og spredning henholdsvis n, x, s og n, x, s. Signifikansniveau er α. Lad d være en given konstant. x x d s s t = c, hvor c = + Frihedsgradstallet f er det nærmeste hele tal, som er større end g =. c n n s s n n + n n T er en statistisk variabel der er t - fordelt med frihedsgradstallet f. Forudsætning H 0 : Nulhypotese Beregning H: Alternativ hypotese Approksimativ metode (Satterthwaites test) σ og σ ukendte σ σ dvs. H 0 :σ = σ forkastes ved F - test H :µ µ + d 0 H:µ > µ + d H :µ µ + 0 H:µ < µ + d H :µ = µ + 0 H:µ µ + d d d P - værdi = PT ( t) P - værdi = PT ( t) P - værdi = x > x + d t x < x + d PT ( t) for P - værdi = PT ( ) for 00 ( α )% Konfidensinterval for differens µ µ : x x t α ( f ) c µ µ x x + t α ( f ) c P - værdi<α H 0 forkastes P - værdi < α 3

Oversigt 0.3 µ og µ n( µ, σ) n( µ, σ ) OVERSIGT 0.3. Test af middelværdier for normalfordelte variable (spredninger kendte eller stor stikprøvestørrelse) X og X er normalfordelte henholdsvis og. Givet stikprøver af X og X. Størrelse, gennemsnit og spredning henholdsvis n, x, s x x d og n, x, s. Signifikansniveau er α. Lad d være en konstant, og u =. Y en normeret normalfordelt variabel n( 0, ). σ σ + n n Forudsætn. σ og σ kendte eller n 30 og n 30 σ og σ erstattes så af s og s H 0 : Nulhypotese H: Alternativ hypotese H :µ µ + d 0 H:µ > µ + d H :µ µ + 0 H:µ < µ + d H :µ = µ + 0 H:µ µ + d d d P-værdi = PY ( u) P-værdi = PY ( u) P-værdi = PY ( u) for P-værdi = PY ( ) for Beregning H 0 forkastes Dimensionering x > x + d u x < x + d P - værdi <α P - værdi σ σ σ σ 00 ( α )% konfidensinterval for differens µ µ : x x u α + µ µ x x + u α + n n n n < α = µ µ d er den mindste ændring i µ der har praktisk interesse. β = P(type II fejl) u n + u α β σ σ = max{ σ, σ } Betegnelser som ovenfor: u + u α β n σ 4

Oversigt 0.4 σ OVERSIGT 0.4. Test af varianser σ og σ og konfidensinterval for for variable. σ X og X er normalfordelte henholdsvis n( µ, σ ) og n( µ, σ ). Givet stikprøver af X og X. Størrelse, gennemsnit og spredning henholdsvis n, x, s og n, x, s. Signifikansniveau er α. F s, Q er F - fordelt Fn ( n, ) s Forudsætn. og µ µ ukendte = H 0 : Nulhypotese H: Alternativ hypotese H 0 :σ σ H:σ > σ H 0 :σ σ H:σ < σ H 0 :σ = σ H:σ σ P - værdi = PQ P - værdi = PQ σ 00 ( α)% Konfidensinterval for forhold : σ Specialtilfælde: (( ) + ( µ ) ) µ µ (( ) ( µ ) ) n s n x n n s + n x n Beregning ( F) ( F) P - værdi < α P - værdi = PQ ( F) for F > P - værdi < α P - værdi = PQ ( F) for F < F F α n n og kendte: F =, Q er F - fordelt Fn (, n). Forudsætn. Nulhypotese H: Alternativ hypotese H 0 forkastes σ F F n n α (, ) (, ) σ Beregning H 0 forkastes og µ µ H 0 :σ σ H:σ > σ P - værdi = PQ ( F) P - værdi < α kendte H 0 :σ σ H:σ < σ P - værdi = PQ ( F) H 0 :σ = σ H:σ σ P - værdi = PQ ( F) for F > P - værdi = PQ ( F) for F < P - værdi < α ( n ) s + n ( x µ ) µ kendt og µ ukendt: F =, Q er F - fordelt s n Fn (, n ) Forudsætn. Nulhypotese Beregning H 0 forkastes µ kendt H 0 :σ σ H:σ > σ P - værdi = PQ ( F) P - værdi < α ukendt µ H 0 :σ σ H:σ < σ P - værdi = PQ ( F) H 0 :σ = σ H:σ σ P - værdi = PQ ( F) for F > P - værdi = PQ ( F) for F < P - værdi < α 5

Oversigt 0.5 OVERSIGT 0.5. Oversigt over test af parametre p og p for binomialfordelte variable. X og X er binomialfordelt henholdsvis bn (, p) og bn (, p), hvor n og n er kendte og p og p ukendte. Observerede stikprøveværdier x og x. x x x + x p$ Signifikansniveau er α.lad p$, $, p$ = p = $p = og u =. Y en normeret normalfordelt variabel n( 0, ). n n n + n p$ ( p$) + n n Forudsætning: H 0 : Nulhypotese H: Alternativ hypotese Beregning H 0 forkastes Approksimativ metode p og p ukendte. n p$ [ 5; n 5] n p$ 5; n 5 [ ] H0: p p H p > p : H0: p p H p < p : P-værdi = PY ( > u) P-værdi = PY ( < u) P-værdi < α H0: p = p H p p : Hvis p$ p$ så P-værdi = PY ( > u) Hvis p$ < p$ så P-værdi = PY ( < u) P-værdi < α [ ; ] [ ] Forudsætning: x 5 n 5 x 5; n 5 : 00 ( α)% konfidensinterval for differens p p $ $ p p u α p$ ( p$ ) p$ ( p$ ) p$ ( p$ ) p$ ( p$ ) + p p p$ p$ + u α + n n n n 6

Oversigt 0.6 µ µ OVERSIGT 0.6. Oversigt over test af parameter og for Poissonfordelt variable. X og X er Poissonfordelte variable fordelt p( µ ) og p( µ ) hvor µ og µ er ukendte. Der foreligger to stikprøver af størrelsen n med gennemsnit x og n n med gennemsnit x x+ n x x. Signifikansniveau er α. Lad x = og x u =.. Y en normeret normalfordelt variabel n( 0, ). n+ n x + n n Forudsætning H 0 : Nulhypotese H: Alternativ hypotese Beregning H 0 forkastes Approksimativ metode µ og µ ukendte. n x 5 og n x 5 H 0 :µ µ H: µ > µ H 0 :µ µ H: µ < µ P-værdi = PY ( > u) P-værdi = PY ( < u) P-værdi < α H 0 : µ = µ H: µ µ Hvis x x så P-værdi = PY ( > u) Hvis x < x så P-værdi = PY ( < u) P-værdi < α Forudsætning: n x og n x : 0 0 x x x x 00 ( α )% konfidensinterval for differens µ µ x x u x x u α + µ µ + α + n n n n 7

Oversigt 0.7 OVERSIGT 0.7. Mapleprogram til dimensionering i og variable. > restart; > with(stats); MAPLE angiver her funktioner i stats > pt:=proc(n,c,a) # variabel (ensidet test) med samme stikprøvestørrelse og samme (ukendte) spredning > local b,d,f,t,cf,gam,x,y; > f:=n-; > gam:=x->int(z^(x-)*exp(-z),z=0..infinity); > cf:=evalf(/(gam(f/)*^((f-)/)));t:=statevalf[icdf,studentst[f]](-a); > y:=cf*int(statevalf [cdf,normald](t/sqrt(f)*u-c*sqrt(n))*u^(f-)*exp(-(u^)/),u=0..infinity); > y > end proc; > MAPLE GENTAGER HER PROGRAM > evalf(pt(6,.87,0.05)); #ensidet test >.08858088 > evalf(pt(6,.87,0.05))-evalf(pt(6,.,0.975)); #tosidet test 0.040476830 > restart;# variable (ensidet test) med samme stikprøvestørrelse og samme(ukendte) spredning > with(stats); > pt:=proc(n,c,a) > local b,d,f,t,cf,gam,x,y,n; > n:=*n-;f:=*n-; > gam:=x->int(z^(x-)*exp(-z),z=0..infinity); > cf:=evalf(/(gam(f/)*^((f-)/)));t:=statevalf[icdf,studentst[f]](-a); > y:=cf*int(statevalf [cdf,normald](t/sqrt(f)*u-c*sqrt(n/))*u^(f-)*exp(-(u^)/),u=0..infinity); > y > end proc; > MAPLE GENTAGER HER PROGRAM > evalf(pt(6,.05,0.05));# ensidet test 0.049754649 > evalf(pt(6,.3,0.05))-evalf(pt(6,.3,0.975)); #tosidet test 0.04947586837 8

. Indledning Appendix 0A Eksempler regnet på TI - 89..Indledning. Det forudsættes, at man kender de grundlæggende operationer på lommeregneren. I Appendix Vejledning i TI - 89" er beskrevet, hvorledes man beregner sandsynligheden for forskellige fordelinger, beregner gennemsnit og spredning, samt hvorledes man tester og beregner konfidensintervaller for funktion af variabel.dette forudsættes ligeledes bekendt.. Hypotesetest og konfidensintervaller for variable. Eksempel 0.3. Accept af ens spredning. Udbyttet ved anvendelse af katalysatorer sammenlignes. Resultaterne blev: K 86.4 9.9 86.7 88.99 9.59 89.38 9.40 88.70 K 93.65 9.97 97.96 94.0 9.56 9.85 99.99 90.99 ) Undersøg, om det på et signifikansniveau på 5% kan påvises, at K giver et udbytte der er enheder større end K ) Angiv endvidere et 95% konfidensinterval for differensen mellem de to middeludbytter. Løsning. APPS, STAT/LIST, indtast data i list og list eller navngiv to kolonner tilhøjre for list 6 med eksempelvis k og k. og indtast data her. Det sidste antages gjort. ) a) H 0 :σ = σ mod H:σ σ F6,9: - SampFtest, ENTER, I menuen vælg Data Input Mathod= Data, ENTER I menu for list " skrives k og for list" skrives k.(benyt evt. VAR-LINK) alternative Hyp = σ σ, ENTER I udskrift findes P - værdi = 0.454 Da P - værdi =0.454 >0.05 accepteres H 0, dvs. vi vil i den følgende test antage, at spredningerne er ens. b) H 0 :µ µ + mod H:µ > µ + F6, 4: - SampTtest.ENTER I menu for list " skrives k+, for alternative Hyp µ < µ og pooled til YES I udskrift findes P - værdi = 0.0403 Da P - værdi = 0.04 < 0.05 forkastes nulhypotesen (svagt) Konklusion: Der er (svagt) statistisk bevis for at K giver et udbytte der er enheder større end K (vi er dog tæt på en accept). ) Konfidensinterval:F7, 3: -SampTInt Menu er selvforklarende 95% konfidensinterval for differens : C-int=[-7.7; -.6] Ved tosiddede test beregnes summen af begge haler og derfor skal sammenlignes med α og ikke med α / 9

Appendix 0A. Eksempler regnet med Ti-89 Eksempel 0.4. Forkastelse af ens spredning. Der laves forsøg med katalysatorer A og B. Stikprøverne giver estimaterne A: xa = 939., sa = 506. na =8 og B: xb = 89. 46, sb =. 9, nb = 0. Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises, at A giver et udbytte der er enheder større end B. Løsning: APPS, STAT/LIST ) a) H 0 :σ = σ mod H:σ σ F6,9: - SampFtest, ENTER, I menuen vælg Data Input Mathod= Stats, ENTER Udfyld menu s = 506. n =8, s =. 9, n = 0 alternative Hyp = σ σ, ENTER I udskrift findes P - værdi = 0.033 Da P - værdi =0.033 < 0.05 forkastes H 0, dvs. vi vil i den følgende test antage, at spredningerne ikke er ens. b) H0:µ A µ B + mod H:µ A > µ B +. F6, 4: - SampTtest.Data Input Mathod= Stats., ENTER, Udfyld menu: x = 939., s = 506. n =8 x = 89. 46 +, s =. 9, n = 0, alternative Hyp µ > µ, pooled = no I udskrift findes P - værdi = 0.67 Da P - værdi = 0.67> 0.05 accepteres nulhypotesen. Konklusion: Vi kan ikke på dette grundlag vise, at udbyttet ved katalysator A er større end ved katalysator B. Eksempel 0.5. eksakt spredning. Der udføres 39 forsøg med additiv A og 40 forsøg med additiv B. Det vides, at spredningerne eksakt er σ A = 3. og σ A = 4. ) Man beregner gennemsnittene af de to stikprøver til x A = 8. 6 og x A = 9. Kan man på mindst signifikansniveau α = 0.05 bevise, at malingen med additivet A tilsat har en mindre middeltørretid end konkurrentens? ) Hvad vil du anbefale virksomheden at gøre, hvis man som nævnt i eksempel 0. kun vil gå over til A hvis tørretiden for A er mindst 0 minutter kortere end for A (bagatelgrænsen) Løsning: ) Nulhypotese, Alternativ hypotese: < H 0 :µ µ H:µ µ F6, 3: - SampZtest.Data Input Mathod= Stats., ENTER, Udfyld menu: σ = 3., σ = 4., x = 8. 6, n = 39, x = 9., n B = 40, alternative Hyp µ < µ I udskrift findes P - værdi = 0.00078 Da P - værdi = 0.00078 < 0.00 forkastes nulhypotesen (stærkt) Konklusion: Der er et stærkt statistisk bevis for at additiv A i middel har en kortere tørringstid end additiv A. B B Ved tosiddede test beregnes summen af begge haler og derfor skal sammenlignes med α og ikke med α / 0

Hypotesetest og konsidensintervaller for variable ) F7, 3: - SampZInt. Udfyld menu (er selvforklarende) C-int=[6.4; -4.77] Konklusion: Da bagatelgrænsen er 0, og næsten 50% af konfidensintervallet ligger under 0, kan det ikke på baggrund af dette materiale anbefales at gå over til det mere kostbare additiv. Eksempel 0.6. Stor stikprøvestørrelse (over 30) Problem som eksempel 0.5, men nu er data opgivet. Vi regner derfor som en sædvanlig t-test, hvor spredningerne ikke er eksakt kendt. Løsning. a) H 0 :σ = σ mod H:σ σ F6,9: - SampFtest, Data Input Mathod= Stats., Menu udfyldes P - værdi = 0.797 Da P - værdi =0.797> 0.05 accepteres H 0, dvs. vi vil i den følgende test antage, at spredningerne er ens. b) Nulhypotese H 0 :µ µ, Alternativ hypotese: H:µ < µ F6, 4: - SampTtest.Data Input Mathod= Stats., Menu udfyldes herunder pooled=yes Resultat: P - værdi = 0.00036 Da P - værdi = 0.0003 < 0.00 forkastes nulhypotesen (stærkt) Ved sammenligning med resultatet i eksempel 0.5 ses, som forventet, at selv om man anvender en u - test fremfor en t - test, giver det ingen større ændring i P-værdien, da n 30. Konklusion: Der er et stærkt statistisk bevis for at additiv A i middel har en kortere tørringstid end additiv A. Eksempel 0.7. Binomialfordelingstest. Halvdelen af en gruppe på 80 franske skiløbere fik C - vitamin mens de øvrige fik kalktabletter.efter en passende tid optaltes hvor mange af forsøgspersonerne der var forkølede. Resultaterne kan ses af følgende skema: Forkølet Ikke forkølet Total C-vitamin 7 39 Kalktabletter 3 09 40 ) Kan det på et signifikansniveau på 5% vises, at C - vitamin har en forebyggende virkning? ) I bekræftende fald angiv er 95% konfidensinterval for differensen mellem parametrene. Løsning: ) H0: p pmod Hp : < p. Forudsætningerne for at approksimere med normalfordelingen er opfyldt (se tidligere) F6, 6: -Prop-ZTest Udfylder menu: Succes x=7, n= 39, succes x=3, n = 40,Alt. hyp : p < p Udskrift giver P- værdi=0.04 Da P - værdi = 0.04 < 0.05 forkastes nulhypotesen (svagt) Konklusion: På signifikansniveau 5% er vist, at C-vitamin har en vis forebyggende virkning mod forkølelse, ) 95% konfidensinterval; F7, 6: -Prop-ZInt, menu udfyldes som under punkt. Udskrift viser C_int=[-0.87 ; -0.0] Eksempel 0.8. Poissonfordelingstest. TI - 89 har ikke dette program

Appendix 0B Eksempler regnet på Statgraphics Appendix 0B Eksempler regnet på Statgraphics.. Indledning I Grundlæggende begreber Appendix A er beskrevet hvorledes man beregner sandsynligheden for forskellige fordelinger og beregner gennemsnit og spredning. Dette forudsættes bekendt.. Hypotesetest og konfidensintervaller for variable. Eksempel 0.3. Accept af ens spredning. Udbyttet ved anvendelse af katalysatorer sammenlignes. Resultaterne blev: K 86.4 9.9 86.7 88.99 9.59 89.38 9.40 88.70 K 93.65 9.97 97.96 94.0 9.56 9.85 99.99 90.99 ) Undersøg, om det på et signifikansniveau på 5% kan påvises, at K giver et udbytte der er enheder større end K ) Angiv endvidere et 95% konfidensinterval for differensen mellem de to middeludbytter. Løsning: ) a) H : σ = σ H: σ σ 0 Vælg (Compare\ Two Samples\ Two Samples Comparison). I den fremkomne tabel: Vælg ( K\tryk på ved Sample \K\tryk på ved Sample \ OK) Vælg( gul ikon=tabular options\comparison of Standard Deviations\OK) Resultat: Comparison of Standard Deviations --------------------------------- K K ------------------------------------------------------------ Standard deviation,38733 3,37667 Variance 5,69936,409 Df 7 7 Ratio of Variances = 0,49986 95,0% Confidence Intervals Standard deviation of K: [,57844;4,85887] Standard deviation of K: [,357;6,8744] Ratio of Variances: [0,00074;,49676] F-test to Compare Standard Deviations Null hypothesis: sigma = sigma Alt. hypothesis: sigma NE sigma F = 0,49986 P-value = 0,38055 Da P - value = 0.454 > 0.05 accepteres nulhypotesen, dvs. man kan i den følgende analyse antage, at spredningerne er ens. b) H 0 :µ µ + mod H:µ > µ +. eller hvis H skrives H:µ > µ + µ µ <. Vælg (Compare\ Two Samples\ Two Samples Comparison). I den fremkomne tabel: Vælg ( K\tryk på ved Sample \K\tryk på ved Sample \ OK) Vælg (gul ikon = Tabular Options\Comparison of Means OK ) Vi får en udskrift, som ikke er relevant.

Hypotesetest og konfidensintervaller for variable Vælg ( Cursoren på udskrift, højre musetast\ Pane options\null Hyphothesis =- \ alt. hypothesis til Lesser than \ OK ). Markering ved Asume Equal Sigmas Comparison of Means ------------------- 95,0% confidence bound for mean of K: 89,4575 +,599 [9,0566] 95,0% confidence bound for mean of K: 94,5 +,55 [96,747] 95,0% confidence bound for the difference between the means assuming equal variances: -4,665 +,496 [-,738] t test to compare means Null hypothesis: mean - mean = -,0 Alt. hypothesis: less than assuming equal variances: t = -,883 P-value = 0,04034 Da P - værdi = 0.04 < 0.05 forkastes nulhypotesen (svagt) Konklusion: Der er (svagt) statistisk bevis for at K giver et udbytte der er enheder større end K (vi er dog tæt på en accept). ) 95% konfidensinterval: Her beregnes (se ovenstående udskrift) kun et ensidet interval, hvoraf vi kan slutte, at µ µ < 738. µ > µ + 738. Ved ensidede test er et 95% konfidensinterval for differensen også ensidet den nedre grænse g er bestemt ved 95% fraktilen: g = x x t0. 95( 4) s + = 94. 89. 46 76. 8. 0 + = 467. 49. =.8 n n 8 8 At dette er mere korrekt, ses også af, at dette konfidensinterval ikke indeholder [ g ; [ Eksempel 0.4. Forkastelse af ens spredning. Der laves forsøg med katalysatorer A og B. Stikprøverne giver estimaterne A: xa = 939., sa = 506. na =8 og B: xb = 89. 46, sb =. 9, nb = 0. Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises, at A giver et udbytte der er enheder større end B. Løsning: a) Vælg (Compare\ Two Samples\ Hypothesis tests). I tabel Vælg (Normal Sigmas\Sample Sigma = 5,06\Sample Sigma =,9 \ Sample Size = 8, Sample Size = 0\ OK ) Udskrift: Hypothesis Tests ---------------- Sample standard deviations = 5,06 and,9 Sample sizes = 8 and 0 95,0% confidence interval for ratio of variances: [,639;3,5487] Null Hypothesis: ratio of variances =,0 Alternative: not equal Computed F statistic = 4,8836, P-Value = 0,0338 Reject the null hypothesis for alpha = 0,05 Nulhypotesen forkastes b) Test :µ > µ +. H A B Vælg (Compare\ Two Samples\ Hypothesis tests). Vælg (rød ikon = Input Dialog\ I tabel vælg Normal Means \Null Hypothesis for Difference =, Sample Mean = 93,9\ osv.\ OK ) Vi får en udskrift, som ikke er relevant. Vælg ( Cursoren på udskrift, højre musetast\analysis Options\ alt. hypothesis til Greater than \Ved Asume Equal Sigmas afhænger markeringen af resultatet af en test, her antages de er forskellige \ OK ). hvor 3