Forsøgsplanlægning og Variansanalyse

Relaterede dokumenter
Forsøgsplanlægning og Variansanalyse Henrik Spliid ISCC, IMM Statistical Consulting Center April 2011

eksaminand nr Opgavesættet består af 3 sædvanlige (essay) opgaver samt et antal opgaver af multiple choice typen.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Opgavesættet består af 3 sædvanlige (essay) opgaver samt et antal opgaver af multiple choice typen.

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Intro Design of Experiments

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Module 12: Mere om variansanalyse

Eksamen i Statistik for biokemikere. Blok

Danmarks Farmaceutiske Universitet Side 1 af 18 sider. eksaminant nr

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

To-sidet varians analyse

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Eksempel , opg. 2

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance

Program. Flersidet variansanalyse og hierarkiske modeller. Eksempel: iltoptag for krabber. Eksempel: iltoptag for krabber.

1 Hb SS Hb Sβ Hb SC = , (s = )

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Forsøgsplanlægning Stikprøvestørrelse

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Module 4: Ensidig variansanalyse

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Løsning eksamen d. 15. december 2008

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

Forelæsning 11: Envejs variansanalyse, ANOVA

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Reeksamen i Statistik for Biokemikere 6. april 2009

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Kapitel 13 Reliabilitet og enighed

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Om hypoteseprøvning (1)

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Restsaltmængdernes afhængighed af trafikken,

Epidemiologi og Biostatistik

Løsning til eksaminen d. 14. december 2009

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Tema. Dagens tema: Indfør centrale statistiske begreber.

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

(studienummer) (underskrift) (bord nr)

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

1 Regressionsproblemet 2

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

(studienummer) (underskrift) (bord nr)

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Modelkontrol i Faktor Modeller

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Løsning til eksamen d.27 Maj 2010

(studienummer) (underskrift) (bord nr)

Module 12: Mere om variansanalyse

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Anvendelse af ufuldstændige blokforsøg

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Modul 7: Forsøgsplanlægning

Analyse af Saltdata. Henrik Spliid

Kapitel 7 Forskelle mellem centraltendenser

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Statistik Lektion 4. Variansanalyse Modelkontrol

Analyse af måledata II

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

Reeksamen i Statistik for biokemikere. Blok

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. 1. Flersidet variansanalyse 1/11

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Modul 11: Simpel lineær regression

Multipel Lineær Regression

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Kapitel 11 Lineær regression

Transkript:

Om Forsøgsplanlægning og Variansanalyse Henrik Spliid IMM Informatik og Matematisk Modellering Danmarks Tekniske Universitet Maj 2009 1

1 Problematik Måledata behæftede med meget større usikkerhed, end ventet, således, at man ikke kan udtale sig særligt præcist om, hvad forsøgene viser. Hvordan analyseres data? Er der en egnet model for, hvordan resultaterne og de forskellige forsøgsbetingelser naturligt knyttes sammen. Det variationsområde, man har benyttet for forsøgsbetingelserne, har ikke resulteret i særligt interessante data (ramt ved siden af!) Man har måske udført et meget større forsøg, end det egentlig var nødvendigt, eller der er måske behov for at udføre et meget større forsøg, end der er praktisk eller økonomisk mulighed for. Statistisk forsøgsplanlægning tilstræber at overkomme sådanne problemer. 2

2 Nogle begreber - set fra et eksempel Vi ønsker at bestemme hvorledes de to variable Temperatur (A) og Behandlingstid (B) influerer på Måleværdien (Y) fra en måling på en prøve med kendt koncentration. Temperatur og Behandlingstid er variable, man kan fastsætte, og det er deres indflydelse, man ønsker at bedømme. De kaldes under faktorer. Måleværdien er den egenskab eller det resultat, man er interesseret i at kunne bedømme, eventuelt i forbindelse med senere målinger udført på ukendte prøver. Den kaldes ofte for forsøgets respons eller afhængige variabel. Resultaterne fra det simplest tænkelige forsøg kunne se ud som følger: 3

Y=målt værdi: A=120 o C A=140 o C Ialt B=30 min 97.0 84.1 94.0 78.1 353.2 B=60 min 63.2 52.0 56.8 48.0 220.0 Ialt 311.0 262.2 573.2 En model for sådanne data kunne være: Kaldes tosidet variansanalyse model. µ er niveau Y ijk = µ + α i + β j + αβ ij + E ijk (1) α i og β j er faktorernes hovedeffekter og αβ ij er vekselvirkningen (synergi eller hæmning). E ijk angiver forsøgsfejlen (usikkerheden). 4

110 100 90 80 B=30 minutter Respons 70 60 50 40 30 B=60 minutter 20 10 0 110 115 120 125 130 135 140 145 150 Temperatur Plottet viser data og de to linier angiver temperatureffekterne ved de to behandlingstider. 5

Variansanalyseskemaet benyttes til at vurdere modellen: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi A=temperatur 297.680 2 1 297.680 23.36 B=behandlingstid 2217.781 2 1 2217.781 174.01 AB=vekselvirkning 9.680 (2 1)(2 1) 9.680 0.76 Rest 50.980 4 12.745 Total 2576.120 7 Hovedeffekterne for faktorerne A og B er signifikante, men vekselvirkningen er ikke. 6

0.7 0.6 0.5 0.4 0.3 Det sorte område er 5% 0.2 0.1 0 0 1 2 3 4 5 6 F(4,15) fordeling for test i ANOVA Princip for test i variansanalyse (ANOVA) 7

2.1 Randomisering Antag rækkefølge, de enkelte målinger blev udført i, er som angivet i følgende tabel: Forsøgsrækkefølge A=120 o C A=140 o C B=30 min 1 5 2 6 B=60 min 3 7 4 8 Y ijk,t = θ φ(t)+µ+α i +β j +αβ ij + E ijk φ(t) er en (ukendt) funktion af forsøgstidspunktet, og θ er en konstant. φ(t) være et lille, men jævnt fald. 8

Løsning: Forsøget skal randomiseres. En randomiseret forsøgsplan kunne være: Randomiseret forsøgsplansplan Forsøgsrækkefølge A=120 o C A=140 o C B=30 min 5 1 8 3 B=60 min 4 7 6 2 Man udfører (A=140 o C, B=30min) først, derefter (A=140 o C, B=60min), osv. 9

Vi kan så formulere modellen for responset som: Y ijk,t = µ + α i + β j + αβ ij +(θ φ(t ijk )+Z ijk ) (2) hvor nu Z ijk repræsenterer rene forsøgsfejl. En god model for variansen af de samlede forsøgsfejl er så Var(E ijk )=Var(θ φ(t ijk )+Z ijk )=θ 2 Var(φ(T ijk )) + Var(Z ijk ) Hvis funktionen φ(t ijk ) varierer meget under forsøget, kan variansen af den samlede forsøgsfejl blive utilladeligt stor. 10

Eksempel: Analyse med kovariat = forbedret nøjagtighed Tungmetal i prøver inden rensningen (Raw soil) er (b 1 og b 2 ) Indholdet i de behandlede prøver (Processed soil) er (y 1 og y 2 ) Treatment 1 Treatment 2 Raw Soil Proc. soil Raw Soil Proc. soil b 1 y 1 b 2 y 2 28.3 5.2 28.7 8.3 31.3 7.9 33.0 10.2 28.9 5.7 29.4 9.6 30.7 8.0 28.8 6.6 30.3 6.0 26.6 7.7 30.8 5.1 31.4 11.6 Sammenligning af to rensemetoder. b kaldes baseline. 11

14 12 o Content in processed soil 10 8 6 4 o x o o x o x x x x o 2 x : Treatment 1 o : Treatment 2 0 25 26 27 28 29 30 31 32 33 34 35 Content in raw soil = baseline Y i,j = µ + α i + β i b i,j + E i,j 12

Alternative modeller: Interessante modeller µ α 1 α 2 β 1 β 2 SSQ df s 2 1 Y i,j = µ + α i + β i b i,j + E i,j 11.38 2.68 +2.68 0.68 0.60 12.82 8 1.27 2 2 Y i,j = µ + α i + β b i,j + E i,j 10.69 1.46 1.46 0.61 12.86 9 1.20 2 3 Y i,j = µ + β b i,j + E i,j 7.49 0 0 0.51 38.22 10 1.96 2 4 Y i,j = µ + α i + E i,j 7.66 1.34 1.34 0 25.05 10 1.58 2 5 Y i,j = µ + E i,j 7.66 0 0 0 46.64 11 2.06 2 13

Et variansanalyseskema for de viste data: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi β 1 β 2 0.04 1 0.04 0.03 α 1 α 2 25.36 1 25.36 15.82 Rest 12.82 8 1.60 Total 38.22 10 Konklusion: β 1 = β 2,menα 1 α 2, og man antager derfor model 2. Ser man bort fra kovariaten (baseline) får man variansanalysen: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi α 1 α 2 11.62 1 11.62 4.65 Rest 25.02 10 2.50 Total 46.64 11 14

2.2 Faktorforsøg og blokke Målinger over to dage Y=målt værdi A=120 o C A=140 o C B=30 min 97.0 84.1 94.0 78.1 B=60 min 63.2 52.0 56.8 48.0 Udføres Dag I Dag II En rimelig model for disse data kunne nu være: Y ijk = µ + D i + α i + β j + αβ ij + E ijk (3) Dage og temperatur er konfunderede (sammenblandede) = man kan ikke stole på temperatur estimatet. 15

Det rigtige alternativ Forsøg dag I Y=målt værdi A=120 o C A=140 o C B=30 min 97.0 84.1 B=60 min 63.2 52.0 Forsøg Dag II Y=målt værdi A=120 o C A=140 o C B=30 min 94.0 78.1 B=60 min 56.8 48.0 Y ijk = µ + D l + α i + β j + αβ ij + E ijk (4) hvor D l nu angiver afvigelsen fra middelniveauet µ på dag l. En forsøgsomstændighed som en dag i eksemplet kaldes en blok. 16

Variansanalyseskemaet for de viste data med den anførte model er: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi D=dage=blokke 47.045 2 1 47.045 35.86 A=temperatur 297.680 2 1 297.680 226.95 B=behandlingstid 2217.781 2 1 2217.781 1690.80 AB=vekselvirkning 9.680 (2 1)(2 1) 9.680 7.38 Rest 3.935 3 1.312 Total 2576.120 7 For illustrationens skyld kan den viste variansanalyse sammenlignes med variansanalyseskemaet side 6. Man ser, at restvariationen (50.980) nu er opdelt i en variation mellem blokke (47.045 med 1 frihedsgrad) og en ny restvariation inden for blokke (3.935 med 3 frihedsgrader). Den sidste repræsenterer usikkerheden i forsøget, som nu er meget mindre! 17

Forsøget er forudsat randomiseret inden for blokkene, f.eks. som vist i følgende plan: Forsøg dag I Randomisering A=120 o C A=140 o C B=30 min 3 2 B=60 min 1 4 Forsøg Dag II Randomisering A=120 o C A=140 o C B=30 min 4 2 B=60 min 3 1 18

3 Blokforsøg 3.1 Fuldstændige blokke Fire alternative behandlingsmetoder, C1, C2, C3, C4, og antag, at 4 behandlinger kan foretages i samme kørsel = en blok = en fuldstændig blok. Kørsel nr C1 C2 C3 C4 1 X 11 X 12 X 13 X 14 2 X 21 X 22 X 23 X 24 3 X 31 X 32 X 33 X 34 4 X 41 X 42 X 43 X 44 En matematisk model er en tosidet variansanalysemodel: X ij = µ + α i + β j + E ij (5) 19

3.2 Romersk Kvadratforsøg Ovn med plads til netop de 4 prøveemner, svarende til behandlingerne C1, C2, C3 og C4. De 4 fire pladser er 4 bestemte positioner i ovnen. Forsøget kan udføres i et romersk kvadrat: Forsøgs- Placering angivet plan ved I, II, III og IV Kørsel nr C1 C2 C3 C4 1 I II IV III 2 IV III II I 3 II I III IV 4 III IV I II X ijk = µ + α i + β j + γ k + E ijk (6) Begge de to blok-kriterier, kørsler og placering, repræsenterer fuldstændige blokke. 20

3.3 Ufuldstændige blokke 4 alternative behandlinger A1, A2, A4 og A3, men blokstørrelsen=2. Kaldes en ufuldstændig blok: Prøveemne nr A1 A2 A3 A4 1 X X 2 X X 3 X X 4 X X 5 X X 6 X X X ij = µ + α i + β j + E ij (7) Prøveemnerne må gerne være mere eller mindre forskellige (som i praksis). 21

Prøveemnerne har en overside (o) og en underside (u): Prøveemne nr A1 A2 A3 A4 1 o u 2 o u 3 u o 4 o u 5 o u 6 o u Alle behandlinger burde placeres lige ofte på en overside og på en underside. 22

To gange det samme forsøg med ombytning af o/u: Forsøgsplan med et ufuldstændigt blokforsøg gentaget 2 gange Forsøg d. 19/12 1994 Forsøg d. 24/12 1994 Prøveemne nr A1 A2 A3 A4 Prøveemne nr A1 A2 A3 A4 1 o u 12 u o 2 o u 8 u o 3 u o 10 o u 4 o u 7 u o 5 u o 11 o u 6 o u 9 u o Analyseres med en variansanalysemodel. 23

Følgende data er fra et svampe-dyrkningsforsøg, hvor 6 varianter af en ny stamme (A F) og den tidligere mest brugte stamme (STD) er dyrket på nogle bakker. Hver bakke har netop plads til 3 svampetyper og der er 3 dyrkningsområder (positioner) på én bakke, benævnt α, β og γ. De målte værdier angiver udbredelsesarealerne for vækstområderne for de pågældende svampe. Designet er som følger, og de fundne data ses i næste tabel. Svampetype Bakke STD A B C D E F 1 α β γ 2 β α γ 3 β γ α 4 α β γ 5 γ α β 6 α β γ 7 γ β α 24

Data Vækst arealer Bakke STD A B C D E F Sum 1 51.3 57.1 56.3 164.7 2 53.9 56.2 54.9 165.0 3 49.1 54.2 54.3 157.6 4 55.8 56.6 55.7 168.1 5 49.3 53.5 55.2 158.0 6 52.9 54.7 54.3 161.9 7 57.0 57.5 55.1 169.6 Sum 149.7 167.0 166.0 167.9 163.1 165.2 166.0 1144.9 Q -10.40 1.60 0.07 3.83 1.47 2.67 0.77 0.0 Totaler for positioner: T α = 379.1, T β = 384.1, T γ = 381.7 Et balanceret ufuldstændigt blokforsøg, med yderligere en balanceret blokvariabel (positioner) (et Youden square). Når forskellige behandlinger er på samme bakke, bliver sammenligningen mellem dem nøjagtig (princippet ved blokning). Model : Y ijk = µ + τ i + Bakke j + Pos k +ɛ 25

Kilde SSQ d.f. s 2 F-værdi Bakker 43.22 6 - - Svampetyper 57.97 6 9.66 13.57 Positioner 1.79 2 0.90 1.26 Rest 4.27 6 0.71 Total 107.25 21-1 F(6,6) 0.05 =4.28. Variation mellem bakker ser stor ud! Ny model Y ijk = µ + τ i + Bakke j + ɛ τ STD = Q STD k/(λ t) = 10.40 3/(1 7) = 4.46, σ 2 ɛ =(1.79+4.27)/(2+6) = 0.87 2 Kontrast = 6 Q STD (Q 1 +... + Q 6 )=6 ( 10.40) (10.40) = 72.8, SSQ=72.8 2 3/(1 7(36 + 6)) = 54.08, d.f.=1. Stærkt signifikant. SSQ mellem τ 1,..., τ 6 =57.97-54.08=3.89 med 6 1=5 frihedsgrader. Ikke signifikant. 26

4 Forsøg med mange faktorer Et ruggedness test er et forsøg, som har til formål at vurdere, om forskellige faktorer, f.eks. i en måleprocedure, har indflydelse på det endelige måleresultat. Man prøver altså at vurdere, om en iøvrigt uvedkommende faktor påvirker måleresultatet på en uhensigtsmæssig måde. En god og robust procedure vil være kendetegnet ved, at den eller de undersøgte faktorer ikke påvirker resultatet i væsentlig grad. Følgende eksempel er konstrueret, men realistisk. En måleproces omfatter bl.a., at der skal oparbejdes nogle prøver. Ved oparbejdelsen er der i eksemplet mulighed for at variere på følgende faktorer: 27

Faktor Lavt niveau -1: Højt niveau A: Temperatur ved ekstraktion -1: 20 o C +1: 24 o C B: Ph-justering af prøve -1: 7.00 +1: 7.20 C: Ekstraktionsmiddel -1: Methylalkohol +1: Ethylalkohol D: Kolonne i apparat -1: Ny kolonne +1: Brugt kolonne E: Forfiltrering for urenheder -1: Ingen filtrering +1: Filtrering F: Ekstraktionstid -1: 1 time +1: 2 timer G: Bestråling af ampuller med prøve -1: nej +1: ja Man tror, at A, B, C og D (dem, man har valgt som de første) har mest betydning, I forsøget indgik, 7 faktorer, og målingerne blev udført på toråvarebatche af produktet ( -1 og 1 ). 28

Fractional factorial design and block confounding Batch= A B C D E=BCD F=ACD G=ABC ABCD Response Code -1-1 -1-1 -1-1 -1 1 17.48 (1) 1-1 -1-1 -1 1 1-1 18.19 afg -1 1-1 -1 1-1 1-1 13.96 beg 1 1-1 -1 1 1-1 1 16.37 ab ef -1-1 1-1 1 1 1-1 13.24 cefg 1-1 1-1 1-1 -1 1 32.20 ac e -1 1 1-1 -1 1-1 1 16.81 bc f 1 1 1-1 -1-1 1-1 18.52 abc g -1-1 -1 1 1 1-1 -1 8.23 def 1-1 -1 1 1-1 1 1 27.96 ad eg -1 1-1 1-1 1 1 1 15.43 bd fg 1 1-1 1-1 -1-1 -1 16.44 abd -1-1 1 1-1 -1 1 1 21.07 cd g 1-1 1 1-1 1-1 -1 18.98 acd f -1 1 1 1 1-1 -1-1 14.78 bcd e 1 1 1 1 1 1 1 1 17.61 abcd efg Ét af enkelt-forsøgene er angivet som : ace = A=24 o C, B=7.00, C=Ethylal., D= ny kol., E=filtr., F=1 time, G= ej bestr. Det viste forsøg (under ét) kaldes et 2 7 3 faktorforsøg i 2 blokke (batchene). 29

Man tænker sig, at følgende begrebsmodel kan benyttes: Y = µ + A + B + AB + C + AC + BC + D + E + F + G + Batch + ɛ Modellen udmærker sig (i dette eksempel) ved, at man antager, at der ud over hovedvirkningerne højst er to-faktorvekselvirkninger og kun mellem faktorerne A, B og C. Beregning, eksempelvis for faktoren A: Kontrast = [A] = 17.48+18.19 13.96 + 16.37 13.24 +... +17.61 = 45.27 Kvadratsum = SSQ A = [A] 2 /2 7 3 = 128.086 30

Term Contrast SSQ [ I ] 287.27 [ A ] 45.27 128.086 [ B ] -27.43 47.025 [ AB ] -29.35 53.839 [ C ] 19.15 22.920 [ AC ] -2.45 0.375 [ BC ] -8.11 4.111 [ ABC = G ] 4.69 1.375 [ D ] -6.27 2.457 [ (AD) ] -2.31 0.334 [ (BD) ] 3.47 0.753 [ (ABD) ] 1.75 0.191 [ (CD) ] -10.39 6.747 [ ACD = F ] -37.55 88.125 [ BCD = E ] 1.43 0.128 [ ABCD = Batch ] 42.59 113.369 31

2 1.5 Normal probability plot 0.9 1 0.5 Normal scores Normal probabilities 0.8 0.7 0.6 0 0.5 0.4 0.5 0.3 1 0.2 0.1 1.5 2 50 40 30 20 10 0 10 20 30 40 50 Contrasts sorted Plottet peger på modellen Y = µ + A + B + AB + C + F + Batch + ɛ 32

ANOVA: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi ABCD=Batch 113.369 1 113.369 56.51 A=temperatur 128.086 1 128.086 (sign) 63.84 B=pH juster. 47.025 1 47.025 (sign) 23.43 AB=vekselv. 53.839 1 53.839 (sign) 26.83 C=Ekstrakt.middel 22.920 1 22.920 (sign) 11.42 AC=vekselv. 0.375 1 0.375 0.18 BC=vekselv. 4.111 1 4.111 2.04 D=Kolonne 2.457 1 2.457 1.22 E=Filtrering 0.128 1 0.128 0.06 F=Ekstrakt.tid 88.125 1 88.125 (sign) 43.92 G=Bestråling 1.375 1 1.375 0.68 Rest 8.025 4 2.006 Total 471.147 15 Kritisk værdi for F(1,4) (α =0.05) er7.71. 33

Reduceret ANOVA: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi ABCD=Batch 113.369 1 113.369 61.95 A=temperatur 128.086 1 128.086 69.99 B=pH juster. 47.025 1 47.025 25.70 AB=vekselv. 53.839 1 53.839 29.42 C=Ekstrakt.middel 22.920 1 22.920 12.52 F=Ekstrakt.tid 88.125 1 88.125 48.15 Rest 16.471 9 1.830 Total 471.147 15 Kritisk værdi for F(1,9) (α =0.05) er5.12. Forsøgsusikkerheden, hvis man kan kontrollere de fundne betydende variable, beregnes til s 2 =1.83 = 1.35 2, dvs at spredningen er 1.35. 34

Eksemplet illustrerer de potentielle muligheder, der er for at behandle mange faktorer i reducerede forsøg og for at lægge enkeltforsøgene ud i mindre (og derved mere nøjagtige) blokke. Små blokke, alt andet lige, er mere homogene og dermed mere nøjagtige end store blokke. Det fuldstændige er på 2*2*2*2*2*2*2 = 128 enkeltmålinger, vi benytter kun 16. Det samme forsøg kan omfatte indtil 8 faktorer. 2 8 = 256 reduceres til kun 16 forsøg. Et meget godt og hyppigt anvendt design. 35

5 Taguchi metoder Omkring 1980 introducerede Genichi Taguchi en række ideer, hvor han benyttede forholdsvis traditionelle forsøgplaner til at forbedre kvaliteten, karakteriseret ved ensartetheden, af produktionsprocesser, målemetoder og produkter. Formålet var 1. Design af processer, så de er robuste overfor ydre (ikke kontrollerbare) betingelser (ruggedness). 2. Design og udvikling af produkter, så de er robuste overfor komponentvariation (f.eks. nye kolonner i målemetoder). 3. Nedsættelse af den tilfældige variation i forhold til den ønskede værdi (nøjagtighed eller kvalitetsegenskab). De tre aktiviteter kaldes under ét parameter design. 36

For en robust proces gælder, at faktorer, som er vanskelige at kontrollere, har lille indflydelse på det måleresultat eller den proces eller det produkt, man har for sig. Mange af Taguchi s idéer er grundlæggende gode, men en række af de nye statistiske metoder og de forsøgsplaner, han anbefaler er unødigt komplicerede, kræver mange data, eller er ineffektive. En central tanke er ønsket om reduktion af variabilitet i forhold til en target værdi. I forhold til de tre ovennævnte formål indfører Taguchi statistisk forsøgsplanlægning til punkt 2., hvor han generelt som respons benytter en tabsfunktion: L = k(y T ) 2,hvoryer produktegenskaben, T er target, og k er en faktor. Taguchi s metoder repræsenterer altså ikke nye forsøgsplaner eller mere effektive forsøgsplaner (mange mener tværtimod), men derimod en mere systematisk tænkemåde, der retter sig mod kvalitetsforbedring og forbedret produkt- og procesdesign. 37

5.1 En Taguchi forsøgsplan De betragtede faktorer opdeles i kontrollerbare og ikke kontrollerbare faktorer. Følgende liste kunne repræsentere et sådant problem for et produkt. For mange målemetoder kan man selvfølgelig opstille lignende lister. Faktorer og faktorniveauer for Taguchi forsøg Kontrollerbare faktorer niveauer A. Tykkelse af beskyttelsesfilm Lav Mellem Høj B. Tykkelse af samleplade Tynd Mellem Tyk C. Prægningsdybde Lille Mellem Stor D. Koncentration af adhæsiv i lim 5% 10% 15% Ukontrollerbare faktorer E. Hærdetid på lager 24 timer 48 timer F. Hærdetemperatur 18 grader 24 grader G. Fugtighed under hærdning 40% 80% 38

De 4 faktorer A D lægges i et 3 3 græsk-romersk kvadratforsøg, dvs en forsøgsplan med 9 observationer, som er konstrueret ud fra to romerske kvadrater, der lagt oven i hinanden. Denne plan er dybest set et (1/9) 3 4 faktorforsøg. De 3 faktorer E, F og G kan lægges i et 2 2 2 faktorforsøg, som er et fuldstændigt 2 3 faktorforsøg. Dette sidste forsøg udføres for hver af de 9 kombinationer i det romerske kvadrat, hvilket i alt giver anledning til 9 8=72 enkeltforsøg. Designet kunne se ud som nedenstående. De 3 niveauer for faktorerne A - D benævnes 0, 1 og 2. Tilsvarende er niveauerne for faktorerne E, F og G benævnt 0 og 1. Det romerske kvadratforsøg med de kontrollerbare faktorer kaldes det indre array og 2 3 faktorforsøget kaldes det ydre array. 39

Taguchi design med et indre og et ydre array Ydre array E 0 0 0 0 1 1 1 1 F 0 0 1 1 0 0 1 1 Indre array G 0 1 0 1 0 1 0 1 Run A B C D 1 0 0 0 0 x x x x x x x x 2 0 1 1 1 x x x x x x x x 3 0 2 2 2 x x x x x x x x 4 1 0 1 2 x x x x x x x x 5 1 1 2 0 x x x x x x x x 6 1 2 0 1 x x x x x x x x 7 2 0 2 1 x x x x x x x x 8 2 1 0 2 x x x x x x x x 9 2 2 1 0 x x x x x x x x Meningen med det ydre array er at fremprovokere variation. Den kombination af faktorer i det indre array, som giver anledning til mindst variation, er at foretrække. 40

Responsfunktion, er eksempelvis SN =10 log hvor ȳ angiver gennemsnittet af den målte egenskab i forsøgene, og S 2 angiver forsøgenes spredning. Forsøget vil, som sagt, omfatte i alt 9 8=72forsøg. Problemet med dette design er især, at det er helt uoverskueligt, hvorledes de kontrollerbare og de ikke kontrollerbare faktorer eventuelt vekselvirker. Dvs. at man risikerer at overse betydningsfulde muligheder for at finde det bedste produktdesign. ȳ S 2 41

Ydre array E 0 0 0 0 1 1 1 1 F 0 0 1 1 0 0 1 1 Indre array G 0 1 0 1 0 1 0 1 Vurdering Run A B C D Eksperimentelle resultater Mean Std SN 1 0 0 0 0 33.3 31.3 33.9 36.2 33.5 32.5 35.2 33.9 33.72 1.51 26.93 2 0 1 1 2 32.8 41.3 35.6 36.4 35.2 38.1 33.7 31.3 35.55 3.15 12.76 3 0 2 2 1 40.5 38.5 41.2 36.3 39.1 37.3 32.4 38.5 37.97 2.75 16.14 4 1 0 1 1 30.2 32.0 32.3 29.0 30.1 31.3 36.2 28.8 31.24 2.38 17.07 5 1 1 2 0 42.4 42.9 40.3 38.3 38.7 40.6 39.3 40.1 40.32 1.64 27.06 6 1 2 0 2 42.6 40.3 40.0 37.7 43.0 45.5 42.4 40.8 41.54 2.36 20.12 7 2 0 2 2 47.5 42.2 47.8 39.8 43.8 37.7 52.2 41.1 44.01 4.82 6.37 8 2 1 0 1 42.4 43.2 44.0 47.4 42.2 42.0 41.4 44.2 43.35 1.91 24.80 9 2 2 1 0 45.1 46.5 41.8 45.2 46.9 46.6 44.6 45.8 45.31 1.64 28.29 Kon = 11.10, A=[-1.21 1.6 0 ], B=[-4.73 0.02 0], C=[-7.42 2.85 0], D=[14.34 6.25 0] Optimal SN = 29.91; Den bedste setting er : (1,1,1,0)= (Mellem film, Mellem samleplade, Mellem imp. dybde, Lav lim konc.) 42

I det konkrete eksempel kunne et forsøg, hvor alle 7 faktorer indgår i en bruden 2 7 forsøgsplan, være et enklere og måske bedre alternativ. Et (1/4) 2 7 faktorforsøg omfatter 32 målinger, og man kan heri opnå, at alle hovedeffekter kan vurderes uden indflydelse af to-faktor-vekselvirkninger, og at tofaktor-vekselvirkninger mellem kontrollerbare og ikke-kontrollerbare faktorer kan undersøges. Dette design vil være klart at foretrække for Taguchi s forslag. Et andet problem er Taguchi s statistiske analysemetoder, som i visse tilfælde giver mystiske resultater. For eksempel ses ovenstående responsfunktion at medføre en uheldig sammenblanding af target værdien (målt ved ȳ) og variabiliteten (målt ved S 2 ). Det vil være tilfældet, hvis de ukontrollérbare faktorer indfluerer både påprocessens middelværdi og spredning, hvilket bestemt ikke er ualmindeligt. Afslutningsvis kan Taguchi s metoder kritiseres for en række statistiske og tekniske problemer, men selve ideen om robust parameterdesign er god. 43