Statistisk forsøgsplanlægning. med benyttelse af Statgraphics

Størrelse: px
Starte visningen fra side:

Download "Statistisk forsøgsplanlægning. med benyttelse af Statgraphics"

Transkript

1 MOGENS ODDERSHEDE LARSEN Statistisk forsøgsplanlægning med benyttelse af Statgraphics Vekselvirkning CD 10 8 C 1 udbytte D 11 udgave 00, DTU

2 FORORD Dette notat er baseret på at de studerende både under kurset og ved evalueringen har nem adgang til at benytte statistikprogrammet Statgraphics (version 4 eller senere) Dette er således tilfældet i det nuværende kursus i forsøgsplanlægning for diplomstuderende i kemi og levnedsmiddelingeniørstuderende på DTU. Eksempler og øvelser er for manges vedkommende eksamensopgaver stillet ved DTU s eksaminer i forsøgsplanlægning for diplomstuderende. Sammen med notatet tænkes anvendt et hefte over tidligere eksamensopgaver. Brugen af statistikprogrammel bevirker, at undervisning og træning i lommeregnermetoder (eksempelvis Yates metode og ortogonale polynomier) kan undlades. Der bliver derved mere tid til model- og begrebsdannelser end tidligere. Efter hvert større emne er der anbefalet en øvelse (en samlet oversigt kan findes i stikordsregisteret). En studerende som regner disse øvelser har været igennem nogenlunde de samme problemer, som gennemgås i notatets eksempler. Jeg vil gerne takke L. Brøndum og J. D. Monrad for de mange gode råd de er kommet med gennem årene. Enkelte eksempler er således hentet fra deres lærebogssystem Statistisk Forsøgsplanlægning Bind I, II, III. En særlig tak fortjener lektor Bjarne Hellesen, som har anvendt de tidligere udgaver af notatet i undervisningen og i den forbindelse er kommet med mange konstruktive kommentarer og forslag til forbedringer samt været en stor hjælp ved korrekturlæsning. Han har endvidere udarbejdet eksempel 3.8 side 90, eksempel 3.9 side 95, samt appendix 1.3 og 3.. Desuden har han udarbejdet det program til konstruktion af varianskomponenter EMSwin.exe, som udleveres i forbindelse med undervisningen. I forhold til 10. udgave er der i kapitel 1 ændret nogle sider, foretaget enkelte rettelser i det øvrige notat, og tilsidst tilføjet nogle tabeller over t- og F-fordelingen. 11 udgave juli 00 Mogens Oddershede Larsen i

3 Indholdsfortegnelse INDHOLD 1. GRUNDLÆGGENDE BEGREBER 1.1 Indledning Forsøgsplan med 1 faktor Indledning Forsøg, behandlinger, forsøgsenheder og fuldstændig randomisering Ensidet variansanalyse Modelformulering Anskuelig forklaring på den teoretiske baggrund for variansanalyse Beregning af ensidet variansanalyse ved Statgraphics Dimensionering af forsøg Forsøgsplan med to faktorer Indledning Een faktor ad gangen Fuldstændig faktorstruktur Forsøg, behandlinger, forsøgsenheder og fuldstændig randomisering Tosidet variansanalyse Modelformulering Anskuelig forklaring på hvorledes man kan beregne vekselvirkning Beregning af tosidet variansanalyse ved Statgraphics Andre eksempler på -sidet variansanalyse Model uden vekselvirkning (additiv model) Model uden gentagelser Hvis forudsætningerne for variansanalyse ikke er opfyldt Manglende observationer (ubalancerede forsøg) Dimensionering Forsøgsplan med 4 faktorer Fuldstændigt randomiseret blokforsøg Romersk kvadratforsøg k FAKTORFORSØG.1 Screeningsforsøg Forklaring af nomenklatur og formler ud fra et taleksempel Fuldstændigt k faktorforsøg Fuldstændigt 4 faktorforsøg regnet med Experimental Design Fuldstændigt 3 faktorforsøg med fuldstændige blokke ii

4 Indholdsfortegnelse.4 Partielt k faktorforsøg Indledning Definitionsrelationer og aliasrelationer Konstruktion af partiel forsøgsplan ved Statgraphics Analyse af et partielt k faktorforsøg Sekventiel forsøgsstrategi Konfunderet partielt k faktorforsøg Indledning Konfundering af ufuldstændige blokke Analyse af et konfunderet partielt k faktorforsøg FIXED, RANDOM, SIDEDELT,TRINVIS OG MIXED FACTOR ANALYSER 3.1 Indledning Definitioner Symbolik Varianskomponentmetoden Split- Plot forsøg Problemstilling Opstilling af model og beregning af et Split-plot forsøg Split-Plot forsøg med blokfaktor Satterthwaites metode REGRESSIONSANALYSE 4.1 Indledning Regresionsanalyse med 1 faktor Enkelt Regressionsanalyse Regressionsanalyse med gentagelser Regressionsanalyse uden gentagelser, transformation Polynomial Regressionsanalyse Indledning Polynomial regressionsanalyse med gentagelser Polynomial regressionsanalyse uden gentagelser Multipel Regressionsanalyse Indledning Modeller hvor de variable indgår lineært Fuldstændig faktorstruktur Partiel faktorstruktur med gentagelser Partiel faktorstruktur uden gentagelser iii

5 Indholdsfortegnelse Polynomiale modeller Indledning Polynomial model med gentagelser MODELLER MED BÅDE KVANTITATIVE OG KVALITATIVE FAKTORERER 5.1 Indledning k - faktorforsøg med mindst 1 kvalitiv faktor Faktorforsøg med faktorer på mere end niveauer KOVARIANSANALYSEFORSØG 6.1 Indledning Ensidet kovariansanalyse med en kvalitativ faktor Tosidet kovariansanalyse med to kvalitive faktorer Tosidet kovariansanalyse med to kvalitive faktorer og en blokfaktor APPENDIX 1.1 OC-kurver for Fixed factor variansanlyse Beregning af tosidet variansanalyse ved brug af lommeregner Hvordan udregnes SAK type I og type II Varianskomponentmetoden beregnet manuelt Maple program til beregning af varianskomponenter Beregning af størrelserne i trinvis variansanalyse Væsentlige formler i multipel regressionsanalyse Sammenhæng mellem virkninger og regressionskoefficienter A Typiske ordrer i Statgraphics... 0 a1 Indledning... 0 a Generelle forhold ved opstart... 0 a.1 Indtastning af data... 1 a3 Compare... 1 a3.1 Ensidet variansanalyse... 1 a3. Flersidet variansanalyse... a4 Experimental Design... 5 a4.1 Indtastning af data... 5 a4. Bestemmelse af model... 6 a4.3 Optimal indstiling af faktorerne... 6 a4.4 Bestemmelse af optimal værdi og dertil hørende konfidensinterval... 6 a4.5 Kontrol af model... 6 iv

6 Indholdsfortegnelse a5 GLM (General Linear Models)... 7 a5.1 Indtastning af data... 7 a5. Bestemmelse af model... 7 a5..1 Split-Plot forsøg... 7 a5.. Forsøg med både kvantitative og kvalitative faktorer... 8 a5.3 Kontrol af model... 8 a6 Relate... 9 a6.1 Indtastning af data... 9 a6. Regressionsanalyse med 1 faktor... 9 a6..1 Enkelt Regressionsanalyse... 9 a6.. Polynomial Regressionsanalyse... 9 a6.3 Multipel Regressionsanalyse a6.3.1 Lineær model a6.3. Polynomial model a7 Describe a7.1 Beregning af P - værdier a7. Beregning af en t-fraktil STATISTISKE TABELLER Tabel 1. Fraktiler i t-fordeling... 3 Tabel. Fraktiler i F-fordeling OPGAVER STIKORD v

7 1. Forsøgsplan med èn faktor 1 GRUNDLÆGGENDE BEGREBER 1.1 Indledning Et forsøg kan opspaltes i fem trin: 1) Problemformulering. ) Udformning af forsøgsplan 3) Udførelse af forsøg 4) Analyse af forsøgsresultater 5) Konklusion Statistisk forsøgsplanlægning drejer sig kort sagt om trinene, 4 og 5. Formål med statistisk forsøgsplanlægning: At udarbejde en forsøgsplan, som med mindst mulig eksperimentel indsats og med anvendelsen af relevante statiske analysemetoder fortrinsvis varians- og regressionsanalyse giver den ønskede information. En gylden regel er, at man skal ikke anvende mere end højst 5% af det afsatte forsøgsbudget på det første forsøg. Endvidere skal man ud fra sin erfaring, studier af litteraturen, eventuelt ved nogle indledende forsøg på forhånd have en fornemmelse af, hvad man kan finde af betydende effekter og hvor store usikkerhederne er. Hvis man ikke har det, er man for tidligt ude. Begreberne i forsøgsplanlægning gennemgås i det følgende på basis af nogle eksempler. 1.. Forsøgsplan med 1 faktor 1..1 Indledning I dette afsnit benyttes følgende eksempel som illustration af begreberne. Eksempel 1.1 (én faktor). Virkningerne af 4 tilsætningsstoffer T 1, T, T 3, T 4 på mængden af urenheder ved en kemisk proces ønskes sammenlignet. For hvert tilsætningsstof måles mængden af uønsket stof gange. Forsøgsplanen fremgår af følgende skema: T 1 T T 3 T 4 Forsøget har 1 faktor: tilsætningsstof. Faktoren er på 4 niveauer T 1, T, T 3, T 4. Hvert niveau har gentagelser. I dette kapitel vil vi kun betragte faktorer, der er såkaldte fixed faktorer. Det er faktorer hvis niveauer man har valgt fordi man er specielt interesseret i netop disse. Eksempelvis har vi 4 tilsætningsstoffer, og vi er interesseret i at finde ud af hvilke af disse fire der resulterer i mindst urenhed. 1

8 1.Grundlæggende begreber Havde vi i stedet for haft et stort antal tilsætningsstoffer, og var interesseret i om tilsætningsstoffer som helhed giver anledning til en variation i resultaterne, så er tilsætningsstoffer en random faktor. Man ville så tilfældigt udtaget 4 af de mange stoffer, foretage forsøg med disse, og ud fra disse resultater have draget nogle konklusioner om tilsætningsstoffer generelt. Man vil her ikke være specielt interesseret i virkningen af en bestemt af de 4 tilfældigt udtagne stoffer Forsøg, behandlinger, forsøgsenheder og fuldstændig randomisering. Forsøg: Et forsøg er opbygget af en række delforsøg, som hver giver en værdi (et forsøgsresultat) af den betragtede forsøgsvariabel. I eksemplet udføres for hvert tilsætningsstof delforsøg, dvs. i alt 8 delforsøg. Den betragtede forsøgsvariabel er mængden af uønsket stof. Hvert delforsøg i et forsøg udføres under en række forsøgsbetingelser (tilsætningsstoffer, tidspunkt, benyttet apparatur, benyttet råvareleverance, tryk, temperatur osv.). Behandlinger: De betingelser, der med forsæt varieres med henblik på en vurdering af deres indflydelse på forsøgsvariablen. I eksemplet er behandlingen : tilsætningsstof som er på 4 niveauer (4 stoffer) Forsøgsenheder: Alle andre delforsøgsbetingelser (tidspunkt benyttet apparatur, benyttet råvareleverance osv.) Der skal i eksemplet anvendes 8 forsøgsenheder svarende til de 8 delforsøg. Randomisering. Ved en randomisering (lodtrækning) tilordnes behandlingerne til forsøgsenhederne på tilfældig måde. Herved sikres at virkningen af forsøgsenhederne fordeles tilfældigt på de forskellige behandlinger. En sammenligning mellem behandlingerne bliver derved ikke behæftet med systematiske fejl (et tilsætningsstof bliver ikke favoriseret ved at blive udsat for særlig gunstige forsøgsenheder). Herved sikrer man sig, et statistisk gyldigt forsøg. Eksempel 1. (fortsættelse af eksempel 1.1) (fuldstændig randomisering). De 8 delforsøg skal indgå i den almindelige produktionsgang. når der er ledig kapacitet. Dette betyder, at man umuligt kan foretage delforsøgene på samme dag, med samme apparatur og med samme råvareleverance, hvilket ellers var ønskeligt. Angiv hvad der kunne tænkes at være forsøgsenheder. Forklar endvidere hvorledes en randomisering kan foretages mellem forsøgsenhederne og behandlingerne. LØSNING: I forsøgsenhederne må indgå hvilken dag, hvilket apparatur og hvilken råvareleverance der skal anvendes. I forsøgsenhederne indgår sandsynligvis også andre forhold udenfor vor kontrol, og som tilsammen bevirker, at selv om man udfører gentagne forsøg med samme behandling, så får vi afvigende resultater. Lad os antage at der gælder følgende: Mandag er det kun muligt at lave 1 forsøg, idet apparatur nr 1 og råvareleverance nr 1 kan benyttes. Tirsdag er der kapacitet ledig til 3 forsøg: 1 forsøg hvor apparatur nr og råvareleverance 1 benyttes 1 forsøg hvor apparatur nr 1 og råvareleverance benyttes, og 1 forsøg hvor apparatur nr 3 og råvareleverance 3 benyttes. Onsdag kan der også laves 3 forsøg osv. (se det følgende skema).

9 1. Forsøgsplan med èn faktor Forsøgsenheder Behandlinger Dag Apparatur Råvareleverance mandag 1 1 tirsdag 1 tirsdag 1 tirsdag 3 3 onsdag 3 4 onsdag 4 5 onsdag 1 6 torsdag 3 6 Randomisering : Vi foretager nu en lodtrækning. Dette kan eksempelvis ske ved, at man har lavet 8 sedler hvor der på sedler er skrevet T 1, på sedler er skrevet T osv. Sedlerne placeres i en dåse, f. eks. en tom kagedåse, og hver seddel kan eventuelt krølles sammen til en kugle. Sedlerne blandes ved at dåsen rystes (se figur). Hvis den første seddel der udtrækkes er T så betyder det, at det delforsøg der mandag udføres med apparatur 1 og råvareleverance 1 skal anvende tilsætningsstof T (se ovenstående skema). Hvis den næste seddel der udtrækkes er T 4 så betyder det, at det delforsøg der tirsdag udføres med apparatur og råvareleverance 1 skal anvende tilsætningsstof T 4 osv. Man siger, der er foretaget et fuldstændigt randomiseret forsøg. E fuldstændigt randomiseret forsøg sikrer at der udføres et "statistisk gyldigt" forsøg. Hvis vi derfor efter beregninger (ensidet variansanalyse ) konkluderer, at der er forskel på tilsætningsstofferne, så er det "korrekt", idet det ville være helt tilfældigt, hvis én af tilsætningsstofferne har været begunstiget med særlig gode forsøgsenheder Ensidet variansanalyse. Den statistiske metode til at analysere forsøget i eksempel 1.1 vil være ensidet variansanalyse. Eksemplet vil blive benyttet dels til en kort repetition af teorien bag en ensidet variansanalyse, dels til at gennemgå udskrifterne fra Statgraphics. I appendix A kan man finde hvilke menupunkter, tasttryk osv. der skal benyttes for at udføre en typisk Statgraphics beregning. I resten af notatet, vil man sædvanligvis blive henvist til dette appendix medmindre der er tale om specielle ordrer. 3

10 1.Grundlæggende begreber Eksempel 1.3 (fortsættelse af eksempel 1.) (ensidet variansanalyse). Efter at have foretaget et fuldstændigt randomiseret forsøg blev forsøgsresultaterne følgende: T 1 T T 3 T Foretag en statistisk analyse af disse resultater med henblik på at kunne angive hvilket tilsætningsstof der giver den mindste urenhed Modelformulering Et forsøg med 1 faktor på r niveauer og med n gentagelser af hvert niveau kan generelt beskrives i følgende skema: Niveauer Observationer Gennemsnit Middelværdi R 1 x 11, x 1,...., x 1n x 1. µ 1 R x 1, x,...., x n x. µ R r x r1, x r,...., x rn x r. µ r Hvert af de r faktorniveauer har n gentagelser. I skemaet indgår også gennemsnittet af de n observationer, og middelværdien af de r faktorniveauer. I eksempel 1.1 er r = 4 og n =. En model for forsøget skrives x = µ + R + ε hvor i = 1,,..., r og j = 1,,..., n. ij i ij r µ i i Her er den totale middelværdi µ = = 1 gennemsnittet af de r niveau-middelværdier, r rækkevirkningen R i = µ i µ, og ε ij er forsøgsfejlen ( støjen ), som indbefatter alle andre former for variation (stammende fra forsøgsenhederne m. m.). En forudsætning for ved en variansanalyse at kunne teste forskellige relevante nulhypoteser. er at forsøgsfejlene er uafhængige og normalfordelte variable med middelværdi 0 og varians ε ij σ. Variansen σ antages at være den samme for alle faktorens niveauer. Man siger kort, at der er varianshomogenitet. Ovennævnte forudsætninger medfører, at observationerne x ij er uafhængige, og normalfordelte n( µ +, σ ), dvs med middelværdi µ + R i og samme varians σ. R i Vi vil i afsnit vise, hvorledes man grafisk og ved hjælp af passende test kan undersøge om forudsætningerne er rimeligt opfyldt. 4

11 1. Forsøgsplan med èn faktor Anskuelig forklaring på den teoretiske baggrund for ensidet variansanalyse. I eksempel 1.3 antages forudsætningerne for en variansanalyse at være tilstede. Det er så relativt besværligt at foretage beregningerne med lommeregner at man sædvanligvis vil benytte et passende statistikprogram. For at forstå den teoretiske baggrund for analysen, vil vi dog undtagelsesvis i dette eksempel starte med at foretage beregningerne i hånden. For at få et skøn for mængden af urenheder, udregnes gennemsnittene for hvert tilsætningsstof. Disse er angivet i nedenstående skema. Umiddelbart ud fra gennemsnit synes T 4 at adskille sig fra de tre øvrige, men hvis der er stor spredning, kan det måske blot være et tilfælde. Det er derfor naturligt at udregne spredningerne, hvilket derfor også er anført i skemaet. Eksempel på beregning af spredning for en behandling: ( ) + ( ) s T = = T 1 T T 3 T 4 Gennemsnit ,5 109,5 118 Spredning ,113 1,414 Idet hver varians er baseret på n = målinger, har hver varians 1 frihedsgrad (f = n - 1 = - 1). Ifølge forudsætningen om varianshomogenitet antages de 4 varianser antages at være nogenlunde ens. Man beregner derfor et vægtet gennemsnit af disse (foretager en pooling ). f s f s s s0 = = = 55. med f 0 = 4 frihedsgrader. f + f f Indtastes de fire gennemsnit i en lommeregner findes =. 5. Et gennemsnit af n tal har en varians, der er n gange mindre end variansen på den enkelte måling. I dette tilfælde er n =. Lad s = s = 5. = 45. R Forudsættes de 4 tilsætningsstoffer at have samme virkning, burde derfor de er forskellige er forholdet signifikant større end 1. sr 45 Vi får F = = = s0 55. Resultaterne samles i en variansanlysetabel, hvor også Variation SAK f s x s x SAK = f s sr F = s indgår. 0 1 SAK = F f Tilsætningsstof 135 r - 1 = Gentagelser Total n r - 1 = 7, mens hvis Forholdet mellem de to varianser er F - fordelt F(3,4). Ved opslag i en F - tabel (tabel ) findes F 095. (,) 34 = Heraf ses, at sandsynligheden for at få en F - værdi på 8.57 forudsat H 0 : µ 1 = µ = µ 3 = µ 4 er sand, er mindre end 5%. Nulhypotesen må derfor forkastes på et signifikansniveau på 5%. = s s R 0 5

12 1.Grundlæggende begreber I stedet for at slå op i en F-tabel kunne man have beregnet P - værdien = P( F > 6.69). Benyttes eksempelvis Statgraphics (jævnfør appendix A, afsnit a7) fås P-værdi = 3.%, dvs igen under 5 %. Konklusion:, De fire tilsætningsstoffer har ikke samme virkning Beregning af ensidet variansanalyse ved Statgraphics. I appendix A er beskrevet, hvilke ordrer man skal give i Statgraphics,for at kunne få de ønskede udskrifter frem. Der vil derfor i det følgende blive henvist hertil. Data indtastes på sædvanlig måde (jævnfør appendix A afsnit a.) Resultatet ser således ud: Stof Urenhed T1 108 T1 110 T 105 T 110 T3 108 T3 111 T4 117 T4 119 Husk at gemme datafilen inden man går videre. Analyse af data Der vælges menupunktet Compare (se appendix A afsnit a3) Der fremkommer følgende variansanalysetabel med tilhørende kommentar. ANOVA Table for urenhed by stof Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Between groups 135,0 3 45,0 8,57 0,034 Within groups 1,0 4 5,5 Total (Corr.) 156,0 7 The StatAdvisor The ANOVA table decomposes the variance of urenhed into two components: a between-group component and a within-group component. The F-ratio, which in this case equals 8,57143, is a ratio of the between-group estimate to the within-group estimate. Since the P-value of the F-test is less than 0,05, there is a statistically significant difference between the mean urenhed from one level of stof to another at the 95,0% confidence level. To determine which means are significantly different from which others, select Multiple Range Tests from the list of Tabular Options. Det ses, at vi får samme tabel som før, og at man her ikke behøver at slå op i en F tabel, idet P - value direkte fortæller, at nulhypotesen forkastes 1 stjernet (3,4%). Vi har derfor samme konklusion. Som det ses, giver The StatAdvisor ingen oplysninger, som ikke burde være kendt i forvejen. Den vil derfor sædvanligvis blive udeladt i det følgende. 6

13 1. Forsøgsplan med èn faktor Konfidensintervaller Føst må det understreges, at havde vi fået en accept af nulhypotesen, havde vi konkluderet, at der ingen signifikant virkning var af de forskellige stoffer, og derfor havde vi højst beregnet et fælles gennemsnit og et fælles konfidensinterval. Er der en signifikant forskel ved vi, at der er en reel forskel mellem det tilsætningsstof T med det laveste gennemsnit og T 4 med det højeste gennemsnit. En nøjere undersøgelse kan ske ved at beregne 95% konfidensintervaller: s0 x ± t0. 975( f0). (t - værdien fås fra tabel 1.1 eller evt. fra Statgraphics:Appendix a afsnit n a7. I vort tilfælde fås: x ± t ( ) = x ± = x ± Heraf ses, at forskellen mellem gennemsnit skal være mindst r = 450. = 900. Ud fra gennemsnittene ses derfor, at T 4 er signifikant større end de øvrige tilsætningsstoffer, som ikke kan adskilles. Følgende tabel angiver konfidensintervallerne: T 1 T T 3 T 4 Gennemsnit ,5 109, % Konfidensinterval [104.5 ; 113.5] [103.0 ; 11.0] [105.0 ; 114.0] [113.5 ; 1.5] Konklusion: Man skal ikke vælge tilsætningsstof T 4, hvorimod de tre øvrige tilsætningsstoffer giver nogenlunde den samme mængde urenhed. LSD = Least Signifikans Differens. Det er meget populært i stedet at foretage parvise sammenligninger, og på det grundlag danne konfidensintervaller. Metoden er eksempelvis beskrevet i M. Oddershede Larsen: Videregående Statistik, afsnit 10, hvor den benyttes til at sammenligne niveauer. Man beregner et konfidensinterval for differensen mellem de to middelværdier. Mens det som tidligere nævnt kræver en forskel på mindst mellem to gennemsnit, kræver denne metode kun en forskel på mindst. I vort r r 45. tilfælde altså kun = 6.36 mod før 9.0. Problemet ved denne metode er, at har man mange niveauer, der skal sammenlignes (10 metoder giver 45 sammenligninger) kan det let ske, at man begår en fejl af type (konstatere en forskel der ikke er der). Derfor skal man være lidt forsigtig med at benytte den. Beregning af konfidensintervaller med Statgraphics. I appendix a3.1 vises hvorledes man får såvel LSD-intervaller som de sædvanlige konfidensintervaller. I sidstnævnte tilfælde fås følgende udskrift: Table of Means for urenhed by stof with 95,0 percent confidence intervals --- Stnd. error stof Count Mean (pooled s) Lower limit Upper limit --- T1 109,0 1, ,50 113,498 T 107,5 1, ,00 111,998 T3 109,5 1, ,00 113,998 T4 118,0 1, ,50 1, Total 8 111,0 Det ses, at konfidensintervallerne er de samme som vi fik ved den manuelle beregning. 7

14 1.Grundlæggende begreber De følgende plot af de to typer konfidensintervaller giver et godt overblik. urenhed Means and 95,0 Percent LSD Intervals T1 T T3 T4 stof Means and 95,0 Percent Confidence Intervals (pooled urenhed T1 T T3 T4 stof Øvelse 1.1. (ensidet variansanalyse). Regn opgave 1 i notatets opgavesamling side Dimensionering af forsøg. Fejl af type I og type II: Ved enhver test kan der være to typer fejl. For bedre at forstå problemstillingen vil vi se på følgende skema. Beslutning H 0 accepteres H 0 forkastes Forudsætning H 0 er sand Rigtig beslutning Forkert beslutning Type I fejl H 0 er falsk Forkert beslutning Type II fejl Rigtig beslutning Det må være et krav til en god test, at der kun er en lille sandsynlighed for at begå en fejl af type I eller type II. I eksempel 1.1 ville en type I fejl være, hvis man konkluderer at mindst 1 tilsætningsstof afviger fra de øvrige selv om det ikke er tilfældet. Virksomheden bruger måske millionbeløb på at omlægge produktionen, og det er ganske forgæves. En type II fejl ville være, at man ikke opdager, at et bestemt tilsætningsstof giver mindre urenhed. Dette er naturligvis uheldigt, men hvis det skyldes, at dette ikke blev opdaget fordi forskellen er ganske ringe har det muligvis ingen praktisk betydning. Hvis en test har signifikansniveau α så vides, at P(type I fejl) α, dvs. forkastes H o, så er vi rimelig sikre på, at have foretaget en korrekt beslutning. Hvis vi accepterer H o er det blot udtryk for, at vi ikke kan forkaste(svag konklusion: "H o frikendes på grund af bevisets stilling"). Man kan have begået en type II fejl, dvs. accepteret en falsk nulhypotese. Lad os antage, at man finder, at hvis forskellen i mængden af uønsket stof mellem tilsætningsstoffer er mindre end enheder, så har det ingen praktisk interesse ( er bagatelgrænsen) og derfor gør det intet, hvis man ikke opdager det (begår en type II fejl). Hvis derimod forskellen er større end enheder, så har det en væsentlig betydning, og sandsynligheden for at begå en type II fejl må derfor være lille, dvs. P(type II fejl) β, hvor β eksempelvis 8

15 1. Forsøgsplan med èn faktor kunne være 10%. Ved en dimensionering af forsøget søger man at angive, hvor stor en stikprøvestørrelse n af hvert faktorniveau,der mindst skal udføres, for at ovennævnte krav er opfyldt. Udfører man det ud fra en dimensionering nødvendige antal forsøg, vil en accept af nulhypotesen nu betyde, at nok kan udbyttet være steget, men ikke så meget, at det har praktisk interesse. Man kan dog ikke omvendt slutte, at fordi man for en forkastelse af nulhypotesen, så er forskellen større end. Et stort antal gentagelser af hvert niveau kan koste mange penge. Uden en passende planlægning kan disse penge være spildt, idet man jo risikerer at få signifikans for selv små forskelle. Disse har måske ved nærmere eftersyn ingen praktisk betydning. En dimensionering vil altid være behæftet med nogen usikkerhed, da den bl.a. kræver, at man nogenlunde kan angive hvor stor forsøgsfejlens spredning σ ( støjen ) er. Det er klart, at jo mere støj jo flere forsøg kræves for at kunne overdøve støjen. Da man jo endnu ikke har lavet forsøget, må man basere sin vurdering af σ på erfaringer fra tilsvarende forsøg, eller man må lave nogle få indledende forsøg for at få et estimat for den. Det gør også en forskel hvordan niveauernes middelværdier fordeler sig. Hvis man i eksempel 1.1 tror de tre middelværdier ligger tæt sammen, mens den fjerde er placeret et stykke derfra, så giver det et andet resultat end hvis man mener de alle fordeler sig jævnt hen over et interval. I komplicerede tilfælde, så er det bedste råd nok at simulere forsøget. Man kan ved hjælp af et EDB-program (som Statgraphics) konstruere en model, med de ønskede niveauer, med normalfordelte data som har de forventede middelværdier og den forventede spredning. For forskellige værdier af n kan man så statistisk vurdere resultatet, og på det grundlag finde ud af, hvad den optimale værdi for n er. Til brug ved dimensionering i mindre komplicerede tilfælde er der konstrueret nogle OC - kurver. Disse findes afbildet i appendix 1.1 hvor de er hentet fra et større tabelværk. Ud af den vandrette akse er afsat en størrelse Φ, som beregnes af formlen: Φ r n R i= 1 = r σ i hvor R i = µ i µ Hvorledes formlen skal tolkes, fremgår af følgende eksempel: Eksempel 1.4 Illustration af beregning af Φ Lad r være antal niveauer for den betragtede faktor. Betragtes tilfældet på figuren hvor afstanden mellem de to yderste er, og de øvrige er placeret lige midt imellem, så fås r + n R n i 1 Φ = = = i= n r σ r σ σ r Betragtes dernæst det andet ydertilfælde, hvor halvdelen af middelværdierne er placeret i det ene endepunkt, og den anden halvdel i det andet endepunkt, (der antages et lige antal niveauer), så fås 9

16 1.Grundlæggende begreber Φ r n R n r i i= 1 = = = r σ r σ σ n Formlen kræver altså, at man har en forestilling om hvor store de enkelte virkninger er. Dette er sjældent tilfældet, så i stedet anvendes en formel, som gør, at man er på den sikre side, dvs. formlen giver sædvanligvis flere gentagelser end strengt nødvendigt. Det kan vises, at de to tilfælde i eksempel 1.4 netop var ydertilfælde, og man derfor har formlerne n (1) Φ flest og () Φ færrest n. σ r σ Ved beregningerne benyttes derfor altid formel (1) Tallene ν 1 og ν på kurverne er frihedsgraderne for den F - fordeling, som man anvender ved testen. Vi illustrerer anvendelsen af formlen på problemet i eksempel 1.1. Eksempel 1.5 (fortsættelse af eksempel 1.1) (dimensionering) Lad os antage, at vi ønsker at bagatelgrænsen i forsøget er ca. = 9, og at variansen σ =5. Lad os endvidere dimensionere efter, at α = 5% og β = 10%. Idet der er i alt r = 4 niveauer fås Φ 9 n 9 = n = 143. Startes med n = fås Φ 01. Vi danner nu følgende lille variansanlysetabel: f Tilsætningsstoffer r - 1 = 3 ν 1 Gentagelser n r (r - 1) = r (n - 1) = 7-3 = 4 ν Total n r - 1 = 4-1 = 7 Kurvesystem V, har for α = 0.05 ikke en kurve svarende til ν = 4, men det er dog klart, at β er over 35%, altså langt over 10%. Vi laver nu en tabel for forskellige n værdier. n Φ flest 143. n ν 1 ν = νt ν1 = r ( n 1) β > <10 Vi ser, at med de nævnte krav, så burde der foretages 3 gentagelser pr. niveau. n Øvelse 1.. (dimensionering). Regn opgave i notatets opgavesamling side

17 1.3 Forsøgsplan med to faktorer 1.3. Forsøgsplan med faktorer Indledning I dette afsnit benyttes følgende eksempel som illustration af begreberne. Eksempel 1.6 (to faktorer). En bilfabrikant ønsker at finde ud af, hvorledes 3 olieblandinger O 1, O, og O 3, og karburatortyper K 1 og K påvirker benzinforbruget. Vi siger, at vi har et forsøg med faktorer: olieblanding og karburator. Faktoren "olieblanding" er på 3 niveauer O 1, O, og O 3, mens faktoren "karburator" har niveauer nemlig K 1 og K. For at forsøget kan have tilstrækkelig "styrke", har man ved en dimensionering af forsøget (se senere) at der skal være mindst 4 gentagelser af hvert niveau Een faktor ad gangen I mange forsøgsvejledninger står, at man bør kun variere en faktor ad gangen. Alle andre faktorer end den udvalgte fastholdes på et bestemt niveau. En forsøgsplan efter disse retningslinier kunne eksempelvis være som skitseret nedenfor, hvor hvert delforsøg er markeret med et : Karburator K 1 K Olieblanding O 1 O O 3 I dette eksempel, hvor der kun er faktorer, vælger vi først at variere olieblandingen, mens den anden faktor fastholdes. Idet vi har valgt først at fastholde karburatoren på niveauet K 1, kan forsøget udføres således: 1 af de 16 biler, som skal anvendes, udstyres med karburator K 1, og derefter (randomiseret) får 4 af disse biler olieblanding O 1, 4 andre biler olieblanding O, og de sidste 4 biler olieblanding O 3. Efter at have kørt en udvalgt strækning måles benzinforbruget. Derefter varieres den anden faktor ( her karburator), mens olieblandingen fastholdes på O, dvs. de sidste 4 biler udstyres med karburator K og olieblanding O. Igen gennemkøres den udvalgte strækning, og benzinforbruget måles. Det er vigtigt, at hver behandling har lige mange gentagelser. Hver af de 4 behandlinger er her gentaget 4 gange, så der er i alt 16 delforsøg. Indtegnes for hver karburator det gennemsnitlige benzinforbrug mod olie-blandingen, fremkommer tegningen på figur 1. 11

18 1.Grundlæggende begreber Umiddelbart ses, at K 1 giver lavest benzinforbrug, og O 1 (eller O 3 ) skal foretrækkes. Hvad med benzinforbruget i karburator K, hvis vi anvender olieblanding O 1 eller O 3? Kan man slutte, at benzinforbruget ved olieblanding O 1 og O 3 er lavere, når man bruger karburator K 1, end når man bruger karburator K? Kun, hvis man ud fra tekniske eller andre grunde mener at vide, at "karburatorkurven" for K er parallel med kurven for K 1 (ingen vekselvirkning), så er forsøgsplanen anvendelig, men ikke den bedste. Fig. 1. En forsøgsplan hvor der er mulighed for at undersøge, om der er vekselvirkning, og som sædvanligvis er mindre ressourcekrævende, er følgende: Fuldstændig faktorstruktur Denne plan består i, at hvert niveau af den ene faktor kombineres med ethvert niveau af den anden. Planen kan skitseres således: Karburator K 1 K Olieblanding O 1 O O 3 Her er hver af de 6 behandlinger gentaget gange, dvs. i alt er der udført 1 delforsøg. Endvidere er hvert niveau som ønsket gentaget mindst 4 gange. I " en faktor ad gangen" var vi tvunget til at udføre 16 delforsøg, mens vi kun skal lave 1 delforsøg i det "fuldstændige faktorforsøg". Vi kan altså nøjes med færre delforsøg, når vi laver et fuldstændigt faktorforsøg. Indtegnes for hver karburator det gennemsnitlige benzinforbrug mod olie-blandingen, viser det sig, at man får figur. Vi ser i modstrid med hvad vi troede ud fra "en faktor ad gangen forsøget", at kombinationen af katalysator K og olieblanding O 1 giver det laveste benzinforbrug. Det ses, at de to kurver ikke er parallelle, så der må være en vis "vekselvirkning". En model uden vekselvirkning (kurverne tilnærmelsesvis parallelle) siges at være additiv. 1 Fig.

19 1.3 Forsøgsplan med to faktorer Forsøg, behandlinger, forsøgsenheder og fuldstændig randomisering. Begreberne blev defineret i afsnit 1... Vi benytter nu det følgende eksempel til at repetere begreberne i tilfældet med faktorer. Eksempel 1.7.(fortsættelse af eksempel 1.6) En bilfabrikant ønsker at finde ud af, hvorledes 3 olieblandinger O 1, O, og O 3, og karburatortyper K 1 og K påvirker benzinforbruget. Forsøget planlægges som et fuldstændigt faktorforsøg idet hvert niveau skal gentages mindst 4 gange. 1) Angiv behandlingerne, antal gentagelser og antal forsøgsenheder. Et delforsøg med én bil tager 1 dag.(1 tank = 40 liter: Kører ca 15 km/l så 40 liter = 600 km, hvilket giver ca. 7 timer med 80 km/time). Anvendes forskellige biler (med tilhørende chauffør) kan det frygtes at give systematisk forskellige resultater. Der foretages et fuldstændigt randomiseret forsøg med samme bil og chauffør. Forsøgsenhederne bliver dage med tilhørende mandskab der installerer den korrekte karburator, olieblanding og vedligeholder bilen. ) Angiv fordele og ulemper ved denne forsøgsplan 3) Angiv hvorledes randomiseringen i praksis kunne tænkes foretaget. LØSNING: 1) Planen kan som beskrevet i afsnit skitseres således: Karburator K 1 K Olieblanding O 1 O O 3 Forsøget har 6 behandlinger: O 1 K 1, O 1 K, O K 1, O K, O 3 K 1, O 3 K. Hver behandling er gentaget gange. I alt skal der udføres 1 delforsøg, så der kræves 1 forsøgsenheder. ) Fordele: Få delforsøg og en ret enkel forsøgsplan. Ulemper: Forsøgsenheder måske for heterogene (stor spredning), da vejret og dermed vejforholdene kan skifte meget på 1 dage. Dette kan bevirke, at man ikke kan påvise selv ret store forskelle (stor støj kræver mange gentagelser for at man kan påvise en forskel) 3) Randomisering: Behandlingen O 1 K 1 skrives på sedler, behandlingen O 1 K skrives på sedler osv. De 1 sedler placeres i en dåse. Det vedtages, at den første seddel der trækkes op af tromlen skal udføres på dag 1, den næste seddel på dag osv. Resultatet blev: dag 1 dag dag 3 dag 4 dag 5 dag 6 dag 7 dag 8 dag 9 dag 10 dag 11 dag 1 O K O 1 K O 3 K O 1 K O 3 K 1 O K 1 O 1 K 1 O K O 1 K 1 O 3 K O K 1 O 3 K 1 13

20 1.Grundlæggende begreber Tosidet variansanalyse. Den statistiske metode til at analysere et forsøg med faktorer som i eksempel 1.6 kaldes tosidet variansanalyse. Som illustration af fremgangsmåden benyttes følgende eksempel: Eksempel 1.8 (eksempel 1.6 og 1.7 fortsat). Lad forsøgsresultaterne være følgende: Karburator Olieblanding K 1 K O O O Angiv hvilke kombinationer af karburator og olieblanding der giver det laveste forbrug, og giv et estimat for dette forbrug. I undersøgelsen skal indgå en grafisk kontrol af den fundne model, og af om forudsætningerne for variansanalysen er tilfredsstillende opfyldt Modelformulering Skal man mere generelt på formelform beskrive forsøget, så omdøber vi nu rækkefaktoren olieblanding til R og søjlefaktoren karburator til C (column) I nedenstående skema er også i hver celle angivet gennemsnit angivet gennemsnit x og middelværdi :, ligesom der er angivet de marginale gennemsnit og middelværdier. C : Karburator R Olieblanding C 1 C R 1 x 111 = 830, x 11 = 860 x 11 = 810,x 1 =840 x 1.. =835 x 11. =845 µ 11 x 1. =85 µ 1 µ 1. R x 11 = 940, x 1 = 990 x 1 =1050, x =100 x.. =1000 x 1. =965 µ 1 x. =1035 µ µ. R 3 x 311 = 855, x 31 = 815 x 31 = 930, x 3 = 910 x 3.. = x 31. = 835 µ 31 x 3. = 90 µ 3 µ 3. x.. 1 = µ.1 x.. = µ. x... = µ.. 14

21 1.3 Forsøgsplan med to faktorer Mere generelt kan et forsøg med to faktorer R og C i et fuldstændigt (r q) faktorstruktur med n gentagelser af hver behandling skrives: C C 1 C... C q R 1 x 111,x 11,... x 11n x 11,x 1,... x 1n... x 1q1,x 1q,... x 1qn x 1.. x 11. µ 11 x 1. µ 1 x 1 q. µ 1q µ 1. R R x 11,x 1,... x 1n x 1,x,... x n... x q1,x q,... x qn x.. x 1. µ 1 x. µ x q. µ q µ. R r x r11,x r1,... x r1n x r1. µ r1 x r1,x r,... x rn x r. µ r1... x rq1,x rq,... x rqn x rq. µ rq x r.. µ q. x.. 1 µ.1 x.. µ.... x. q. µ.q x... i = 1,,..., r En model for forsøget skrives ~ xijk = µ + Ri + Cj + ( RC) ij + εijk hvor j = 1,,..., q. k = 1,,..., n r µ i i Her er den totale middelværdi µ = = 1 gennemsnittet af de r q n niveau-middelværdier, r hovedvirkningen = µ µ (også kaldet rækkevirkningen) R i i. hovedvirkningen = µ. µ ( også kaldet søjlevirkningen ), vekselvirkningen C j j ( RC) = µ µ R C ij ij i j og ε ij er forsøgsfejlen ( støjen ), som indbefatter alle andre former for variation (stammende fra forsøgsenhederne m. m.). Der gælder de samme variansanalyseforudsætninger som ved den ensidede variansanalyse (se evt. side 4), dvs. forsøgsfejlene er uafhængige og normalfordelte variable med middelværdi 0 og konstant varians σ. ε ij Betragtes tallene i eksempel 1.8 fremgår det umiddelbart, hvordan man estimerer de forskellige virkninger. Eksempelvis er et estimat for hovedvirkningen R 1 = µ 1. µ bestemt som ~ R1 = x1. x... = = Ved variansanlysen testes først H0: RC = 0 mod H: RC 0, dvs. det testes om der er en signifikant vekselvirkning. Er dette tilfældet søger man ud fra gennemsnit og konfidensintervaller, at bestemme de niveauer for de to faktorer som giver optimale resultater. µ.. 15

22 1.Grundlæggende begreber Er der ikke en signifikant vekselvirkning testes hypoteserne H0: R = 0 mod H: R 0 H0: C = 0 mod H: C 0 dvs. om de hovedvirkninger har en signifikant virkning Anskuelig forklaring på hvorledes man kan beregne vekselvirkning. Da det kan være vanskeligt at forstå vekselvirkningsbegrebet, og hvordan man beregner det, gives her en kort forklaring. I nedenstående skema er skitseret et forsøg med faktorer R og C. R er på 3 niveauer, og C er på 4 niveauer. Der er gentagelser af hver "behandling"(treatment). C 1 C C 3 C 4 R R R For hver af de 1 celler kan man udregne et skøn for spredningen. Hvis man forudsætter at spredningen er nogenlunde den samme i alle 1 tilfælde, kan man poole de 1 s sammen til et fælles skøn s 0 for spredningen på forsøgsfejlen (støjen). Den vil have 1 frihedsgrader, da hvert enkelt s har 1 frihedsgrad. I nedenstående skema er beregnet gennemsnit for hver celle, hver række, hver søjle og totalt. C 1 C C 3 C 4 Gennemsnit R R R Gennemsnit Tallene er konstrueret således, at vi har en helt præcis model uden vekselvirkning (Tallene i række fremgår af tallene i række og tallene i række 3 fremgår af tallene i række 1 + ). Man siger, at modellen er additiv. For en sådan model gælder helt præcist, at resultatet i celle (i, j) fås af række i s gennemsnit + søjle j s gennemsnit - totale gennemsnit. Eksempel: I celle (,3) står 10. Række 's gennemsnit + søjle j s gennemsnit - totale gennemsnit = = 10. I praksis vil dette naturligvis aldrig være tilfældet på grund af den tilfældige variation (støj), men udregnes kvadratet på afvigelserne (SAK), og disse afvigelser ikke er større end hvad er rimeligt i forhold til støjen (s 0 ), vil vi kunne konkludere at der ikke kan konstateres nogen vekselvirkning. 16

23 1.3 Forsøgsplan med to faktorer Beregning af tosidet variansanlyse ved Statgraphics. Analysen vil typisk ske i følgende rækkefølge: a) Indtastning af data b) Opstilling af model med tilhørende variansanalysetabel. På grundlag heraf eventuelt reducere modellen, igen opstille tabel osv., indtil man når den endelige model. c) Grafisk kontrol af den i spørgsmål b fundne model, samt af forudsætninger for analysen. d) Eventuelt på basis af den fundne model opstille relevante konfidensintervaller og derefter uddrage konklusion. a) Data (fra eksempel 1.8) indtastes på sædvanlig måde (jævnfør appendix A afsnit a.) Resultatet ser således ud: Karburator oliebland benzinforb k1 o1 830 k1 o1 860 k1 o 940 k1 o 990 k1 o3 855 k1 o3 815 k o1 810 k o1 840 k o 1050 k o 100 k o3 930 k o3 910 b) Opstille model med tilhørende variansanalysetabel, og eventuelt reducere model. Vi starter med en model med faktorer K (karburator) og O(olieblanding), og med mulighed for vekselvirkning mellem de to faktorer. Der fremkommer først en variansanalysetabel uden vekselvirkning. Vi sætter Maximum Order Interaction til hvorved der fremkommer følgende variansanalysetabel: Analysis of Variance for benzinforb - Type III Sums of Squares --- Source Sum of Squares Df Mean Square F-Ratio P-Value --- MAIN EFFECTS A:karburator 6075, ,0 10,1 0,0190 B:oliebland 58716,7 9358,3 48,93 0,000 INTERACTIONS AB 6450,0 35,0 5,37 0,0460 RESIDUAL 3600, ,0 --- TOTAL (CORRECTED) 74841, All F-ratios are based on the residual mean square error. 17

24 1.Grundlæggende begreber En sådan variansanalysetabel er opbygget efter følgende skema, hvor beregningen af frihedsgradstallet er angivet: Variation SAK (eller SS) A: Rækkefaktor r - 1 = - 1 B: Søjlefaktor q - 1 = 3-1 ( r 1)( q 1) = 1 AB:Vekselvirkning = Residual: (støj) r q ( n 1) = 3 ( 1) f SAK s = F = f s s R 0 Total r q n 1 Bemærk: Da de faktorer har en virkning i form af en vekselvirkning, har det ingen mening at teste hovedvirkninger. c) Grafisk kontrol af den i spørgsmål b fundne model, samt af forudsætninger for - analysen. For at testene skal være statistisk holdbare, må man 1) være rimelig sikre på, at forsøgsresultaterne bliver rimelig beskrevet ved den fundne model, ) kontrollere at forsøgsfejlene ε ij er uafhængige og normalfordelte variable med middelværdi 0 og konstant varians σ. Undersøgelser heraf udføres sædvanligvis ved på forskellig måde at studere de såkaldte residualer. Disse er forskellen mellem de målte forsøgsresultater og de værdier som er beregnet ved anvendelse af den fundne model: ~ x11 = µ + R + C1 + ( RC) 1 Da modellen er den mest omfattende (da den ogaå indeholder vekselvirkningsleddet) bliver et estimat for de beregnede værdier gennemsnittene af værdierne i hver celle. Eksempelvis er residual = x 11 - ~ x11 = (se tabel side 14) = r 11 Beregning af residual i en simplificeret model. Antages modellen ikke at have vekselvirkning, er modellen ~x = µ + R + C Et estimat for forsøgsfejlens varians fås ud for residualen. Vi får med frihedsgrad- stallet f 0 = 6. Bidraget fra en eventuel vekselvirkning (AB) er 35, altså væsentlig større. Forholdet mellem de to varianser er F = 5.375, og sandsynligheden for at få dette tal, hvis der ingen vekselvirkning var, er under 5% (4.60%). Anvender vi som sædvanlig et 5% signifikansniveau, så slutter vi, at der er et svagt bevis for en vekselvirkning mellem karburator og olieblanding. s Estimat for rækkevirkning er R ~ = x. x.. = = Estimat for søjlevirkning er C ~ 1 = x1. x.. = =. 40 Heraf fås ~ x 11 = = og dermed residualen r 1 = = =

25 1.3 Forsøgsplan med to faktorer 1) I eksempel 1.8 var modellen den mest omfattende (da den også indeholder vekselvirkningsleddet), og man kan derfor ikke forbedre den. Imidlertid kan modellen være misvisende, hvis der findes såkaldte outliers, dvs. af om nogle forsøgsresultater afviger mistænkeligt meget fra hvad man ville forvente ud fra modellen, og derfor måske skyldes fejlmålinger. Resultater der afviger mere end 3 σ må være under mistanke. Dette kan undersøges ved at tegne et såkaldt residualplot. Endvidere er det vigtigt at residualerne fordeler sig tilfældigt omkring 0, dvs. der må ikke være en tendens til at de eksempelvis mest ligger under 0-linien omkring midten og over på begge sider. Vælges Residual versus Predicted fås følgende tegning: 5 15 Residual Plot for benzinforb residual predicted benzinforb På grund af gentagelserne er der symmetri omkring 0. Af variansanalysetabellen fremgår at σ Da alle residualerne ligger indenfor 3 σ (endda indenfor σ ) er der ingen outliers. a) De observerede resultater er værdier af uafhængige variable. Dette kan man sædvanligvis sikre ved en fornuftig forsøgsplan (randomisering). b) forsøgsfejlene ε ij er normalfordelte variable med middelværdi 0 og konstant varians σ. 1) Kravet om normalfordeling undersøges grafisk ved at se på residualerne tegnet i et normal probability plot (manuelt kunne man have tegnet residualerne på et normalfordelingspapir). Residualerne bør så tilnærmelsesvis fordele sig omkring en ret linie. Det kræver dog et betydeligt antal målinger, for at man med rimelighed kan vurdere om normalfordelingskravet er opfyldt. Konklusionerne i variansanalyserne har dog stadig gyldighed, selv om der er nogen afvigelse fra normalitet (man siger de er robuste overfor normalitetskravet). 19

26 1.Grundlæggende begreber En grafisk test for normalitet (se appendix A) giver: Normal Probability Plot for RESIDUALS percentage 99, , RESIDUALS På grund af gentagelserne er der igen symmetri. Støjen synes nogenlunde normalfordelt, men antallet af målinger er for lille til, at man kan give en nogenlunde sikker vurdering (residualerne burde ligge symmetrisk og tæt ved en ret linie). ) Kravet om varianshomogenitet ( konstant varians σ ) kan hvis der er gentagelser dels vurderes ved at betragte et residualplot, dels ved at foretage en mere formel test. Da vi i eksempel 1.8 har gentagelser i hver af de 6 celler, ligger residualerne to og to symmetrisk omkring 0-linien. På det på forrige side dannede residualplot ses, at afstanden mellem disse 6 punktpar er nogenlunde den samme. Man kan derfor godt tillade sig at konkludere, at der er en rimelig varianshomogenitet. Til at foretage en mere formel testning af nulhypotesen H 0 : σ 1 = σ =... = σ6 er der udviklet forskellige metoder. En meget benyttet metode er Bartletts test som imidlertid har den svaghed, at den i langt højere grad end selve variansanlysen er følsom overfor afvigelser fra normalitet. Der er derfor udviklet andre metoder, hvoraf specielt Cochrans og Levine test kan nævnes, da de ikke er så følsomme overfor normalitetskravet. Til gengæld kan Levines test ikke anvendes, hvis man kun har gentagelser, hvilket jo ofte er tilfældet i praksis. I Statgraphics foretages en test af varianserne som beskrevet i appendix A, afsnit a3. Der fremkommer følgende udskrift med forklaring: Variance Check Cochran's C test: 0,347 P-Value = 0, Bartlett's test: 1,16961 P-Value = 0,98417 Hartley's test: 6,5 The StatAdvisor The three statistics displayed in this table test the null hypothesis that the standard deviations of benzinforb within each of the 6 levels of behandlinger is the same. Of particular interest are the two P-values. Since the smaller of the P-values is greater than or equal to 0,05, there is not a statistically significant difference amongst the standard deviations at the 95,0% confidence level. Som det ses, kan man ikke forkaste nulhypotesen, dvs ikke forkaste, at de 6 varianser er ens. Vi vil derfor ved variansanalysen forudsætte, at der er varianshomogenitet. 0

27 1.3 Forsøgsplan med to faktorer d) Opstille relevante konfidensintervaller og drage konklusion Vi ønsker nu for en given olieblanding at finde hvilken karburator, der giver det laveste benzinforbrug. Dette opnås lettest ved at beregne 95% konfidensintervaller for hver af de 6 behandlinger. Vælges i den fundne model, Tables of Means fås følgende udskrift : Table of Least Squares Means for benzinforb with 95,0 Percent Confidence Intervals --- Stnd. Lower Upper Level Count Mean Error Limit Limit --- GRAND MEAN 1 904,167 karburator k ,667 10,0 857, ,136 k 6 96,667 10,0 90, ,136 oliebland o ,0 1, , ,969 o ,0 1, , ,97 o ,5 1, , ,469 karburator by oliebland k1 o1 845,0 17,305 80, ,38 k1 o 965,0 17,305 9, ,38 k1 o3 835,0 17,305 79, ,38 k o1 85,0 17,305 78, ,38 k o 1035,0 17,305 99, ,38 k o3 90,0 17, ,618 96, Mere anskueligt er det nok at se på en tegning, så vi vælger at få tegnet et interaction-plot med afsatte konfidensintervaller: Idet man som second Factor vælger den faktor med flest niveauer, fås følgende figur: Interactions and 95,0 Percent Confidence Intervals benzinforb karburator k1 k 780 o1 o o3 oliebland Konklusion: Vi ser af tabel og figur, at man ikke bør vælge olieblanding O 3. Umidelbart giver kombinationen K O 1 det laveste benzinforbrug (85), men af konfidensintervallerne ses, at der ingen signifikant forskel er mellem K O 1, K 1 O 3 og K 1 O 1. 1

28 1.Grundlæggende begreber Andre eksempler på -sidet variansanalyse I det forrige afsnit blev gennemgået et eksempel med vekselvirkning og lige mange gentagelser af hver behandling. Vi vil her se på nogle eksempler hvor dette ikke er tilfældet Model uden vekselvirkning.(additiv model). a) Eksempel 1.9 (additiv model) Lad forsøgsresultaterne være følgende: Karburator Olieblanding K 1 K O O O (I forhold til eksempel 1.8 er det de samme data pånær i tilfældet O 1,K hvor tallet 810 er rettet til 850). Angiv hvilke kombinationer af karburator og olieblanding der giver det laveste forbrug, og giv et estimat for dette forbrug. Løsning: Med samme fremgangsmåde som før fås i dette tilfælde variansanalysetabellen : Analysis of Variance for benzinforb - Type III Sums of Squares --- Source Sum of Squares Df Mean Square F-Ratio P-Value --- MAIN EFFECTS A:karburator 8008, ,33 15,0 0,008 B:oliebland 53450,0 675,0 50,11 0,000 INTERACTIONS AB 4116,67 058,33 3,86 0,0837 RESIDUAL 300, , TOTAL (CORRECTED) 68775, Da P - value er 8.37% for vekselvirkningen AB, og dette er over vort signifikansniveau på 5%, tillader vi os i det følgende at antage, at vekselvirkningen er forsvindende. I Statgraphics foretages nu en pooling ved at rette "Maximum order interaction" fra til 1, 1 hvorved AB "pooles" ned i Residualen". Vi får følgende tabel: Analysis of Variance for benzinforb - Type III Sums of Squares --- Source Sum of Squares Df Mean Square F-Ratio P-Value --- MAIN EFFECTS A:karburator 8008, ,33 8,76 0,018 B:oliebland 53450,0 675,0 9, 0,000 RESIDUAL 7316, , TOTAL (CORRECTED) 68775, Trykkes i stedet på Exclude,fås et lille vindue med kolonner ( Include og Exclude ), hvor man ved dobbeltklik på en vekselvirkning flytter den til den modsatte kolonne.

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics)

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics) MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics) DANMARKS TEKNISKE UNIVERSITET 6. udgave 005 FORORD Dette notat kan læses på

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Eksempel , opg. 2

Eksempel , opg. 2 Faktorer En faktor er en gruppering/inddeling af målinger/observationer pga. Tilsigtede variationer i en eller flere forsøgsparametre Nødvendige (potentielle) blok-effekter såsom gentagne målinger på samme

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

Intro Design of Experiments

Intro Design of Experiments Intro Design of Experiments OH no: 1 Faktorer, niveauer, behandlinger og gentagelser Styrbare faktorer Faktorer Styrbare (controllable) faktorer Støjfaktorer (nuisance factors) Kvalitative Kvantitative

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet

Læs mere

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK II Regressionsanalyse (TI-89 og Statgraphics)

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK II Regressionsanalyse (TI-89 og Statgraphics) MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK II Regressionsanalyse (TI-89 og Statgraphics) DANMARKS TEKNISKE UNIVERSITET 6 udgave 005 FORORD Dette notat kan læses på baggrund af en statistisk viden

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen Kursus 02402/02323 Introducerende Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Oversigt 1 Intro: Regneeksempel og TV-data fra B&O 2 Model og hypotese Per Bruun Brockhoff DTU Compute, Statistik

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance Plot af B j + ǫ ij (Y ij µ α i )): Program: res 4 2 0 2 B1 B2 B3 B4 B5 1. vi starter med at gennemgå opgave 3 side 513. 2. nyt: to-sidet variansanalyse 1 2 3 4 5 block σ 2 : within blocks variance σb 2

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Kapitel 13 Reliabilitet og enighed

Kapitel 13 Reliabilitet og enighed Kapitel 13 Reliabilitet og enighed Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 Version 11. april 2011 1 / 23 Indledning En observation er sammensat af en sand værdi og en målefejl

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion VARIANSANALYSE 2 Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: (Analysis of variance) med interaktion Problem: Hvordan håndterer vi forsøg, hvor effekten er forårsaget af to faktorer og en evt.

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X. Opgave I I en undersøgelse af et potentielt antibiotikum har man dyrket en kultur af en bestemt mikroorganisme og tilført prøver af organismen til 20 prøverør med et vækstmedium og samtidig har man tilført

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 30. maj 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK (med TI-Nspire og TI 89 ) 7. udgave 013 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Program 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Dæktyper og brændstofforbrug Data fra opgave 10.43, side 360: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

En intro til radiologisk statistik. Erik Morre Pedersen

En intro til radiologisk statistik. Erik Morre Pedersen En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK (med TI 89 og SAS - JMP) 5. udgave 011 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Statistik viden eller tilfældighed

Statistik viden eller tilfældighed MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1 Mikro-kursus i statistik 2. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er hypotesetestning? I sundhedsvidenskab:! Hypotesetestning = Test af nulhypotesen Hypotese-testning anvendes til at vurdere,

Læs mere

2 0.9245. Multiple choice opgaver

2 0.9245. Multiple choice opgaver Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere