Forsøgsplanlægning og Variansanalyse

Størrelse: px
Starte visningen fra side:

Download "Forsøgsplanlægning og Variansanalyse"

Transkript

1 Om Forsøgsplanlægning og Variansanalyse Henrik Spliid IMM Informatik og Matematisk Modellering Danmarks Tekniske Universitet Maj

2 1 Problematik Måledata behæftede med meget større usikkerhed, end ventet, således, at man ikke kan udtale sig særligt præcist om, hvad forsøgene viser. Hvordan analyseres data? Er der en egnet model for, hvordan resultaterne og de forskellige forsøgsbetingelser naturligt knyttes sammen. Det variationsområde, man har benyttet for forsøgsbetingelserne, har ikke resulteret i særligt interessante data (ramt ved siden af!) Man har måske udført et meget større forsøg, end det egentlig var nødvendigt, eller der er måske behov for at udføre et meget større forsøg, end der er praktisk eller økonomisk mulighed for. Statistisk forsøgsplanlægning tilstræber at overkomme sådanne problemer. 2

3 2 Nogle begreber - set fra et eksempel Vi ønsker at bestemme hvorledes de to variable Temperatur (A) og Behandlingstid (B) influerer på Måleværdien (Y) fra en måling på en prøve med kendt koncentration. Temperatur og Behandlingstid er variable, man kan fastsætte, og det er deres indflydelse, man ønsker at bedømme. De kaldes under faktorer. Måleværdien er den egenskab eller det resultat, man er interesseret i at kunne bedømme, eventuelt i forbindelse med senere målinger udført på ukendte prøver. Den kaldes ofte for forsøgets respons eller afhængige variabel. Resultaterne fra det simplest tænkelige forsøg kunne se ud som følger: 3

4 Y=målt værdi: A=120 o C A=140 o C Ialt B=30 min B=60 min Ialt En model for sådanne data kunne være: Kaldes tosidet variansanalyse model. µ er niveau Y ijk = µ + α i + β j + αβ ij + E ijk (1) α i og β j er faktorernes hovedeffekter og αβ ij er vekselvirkningen (synergi eller hæmning). E ijk angiver forsøgsfejlen (usikkerheden). 4

5 B=30 minutter Respons B=60 minutter Temperatur Plottet viser data og de to linier angiver temperatureffekterne ved de to behandlingstider. 5

6 Variansanalyseskemaet benyttes til at vurdere modellen: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi A=temperatur B=behandlingstid AB=vekselvirkning (2 1)(2 1) Rest Total Hovedeffekterne for faktorerne A og B er signifikante, men vekselvirkningen er ikke. 6

7 Det sorte område er 5% F(4,15) fordeling for test i ANOVA Princip for test i variansanalyse (ANOVA) 7

8 2.1 Randomisering Antag rækkefølge, de enkelte målinger blev udført i, er som angivet i følgende tabel: Forsøgsrækkefølge A=120 o C A=140 o C B=30 min B=60 min Y ijk,t = θ φ(t)+µ+α i +β j +αβ ij + E ijk φ(t) er en (ukendt) funktion af forsøgstidspunktet, og θ er en konstant. φ(t) være et lille, men jævnt fald. 8

9 Løsning: Forsøget skal randomiseres. En randomiseret forsøgsplan kunne være: Randomiseret forsøgsplansplan Forsøgsrækkefølge A=120 o C A=140 o C B=30 min B=60 min Man udfører (A=140 o C, B=30min) først, derefter (A=140 o C, B=60min), osv. 9

10 Vi kan så formulere modellen for responset som: Y ijk,t = µ + α i + β j + αβ ij +(θ φ(t ijk )+Z ijk ) (2) hvor nu Z ijk repræsenterer rene forsøgsfejl. En god model for variansen af de samlede forsøgsfejl er så Var(E ijk )=Var(θ φ(t ijk )+Z ijk )=θ 2 Var(φ(T ijk )) + Var(Z ijk ) Hvis funktionen φ(t ijk ) varierer meget under forsøget, kan variansen af den samlede forsøgsfejl blive utilladeligt stor. 10

11 Eksempel: Analyse med kovariat = forbedret nøjagtighed Tungmetal i prøver inden rensningen (Raw soil) er (b 1 og b 2 ) Indholdet i de behandlede prøver (Processed soil) er (y 1 og y 2 ) Treatment 1 Treatment 2 Raw Soil Proc. soil Raw Soil Proc. soil b 1 y 1 b 2 y Sammenligning af to rensemetoder. b kaldes baseline. 11

12 14 12 o Content in processed soil o x o o x o x x x x o 2 x : Treatment 1 o : Treatment Content in raw soil = baseline Y i,j = µ + α i + β i b i,j + E i,j 12

13 Alternative modeller: Interessante modeller µ α 1 α 2 β 1 β 2 SSQ df s 2 1 Y i,j = µ + α i + β i b i,j + E i,j Y i,j = µ + α i + β b i,j + E i,j Y i,j = µ + β b i,j + E i,j Y i,j = µ + α i + E i,j Y i,j = µ + E i,j

14 Et variansanalyseskema for de viste data: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi β 1 β α 1 α Rest Total Konklusion: β 1 = β 2,menα 1 α 2, og man antager derfor model 2. Ser man bort fra kovariaten (baseline) får man variansanalysen: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi α 1 α Rest Total

15 2.2 Faktorforsøg og blokke Målinger over to dage Y=målt værdi A=120 o C A=140 o C B=30 min B=60 min Udføres Dag I Dag II En rimelig model for disse data kunne nu være: Y ijk = µ + D i + α i + β j + αβ ij + E ijk (3) Dage og temperatur er konfunderede (sammenblandede) = man kan ikke stole på temperatur estimatet. 15

16 Det rigtige alternativ Forsøg dag I Y=målt værdi A=120 o C A=140 o C B=30 min B=60 min Forsøg Dag II Y=målt værdi A=120 o C A=140 o C B=30 min B=60 min Y ijk = µ + D l + α i + β j + αβ ij + E ijk (4) hvor D l nu angiver afvigelsen fra middelniveauet µ på dag l. En forsøgsomstændighed som en dag i eksemplet kaldes en blok. 16

17 Variansanalyseskemaet for de viste data med den anførte model er: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi D=dage=blokke A=temperatur B=behandlingstid AB=vekselvirkning (2 1)(2 1) Rest Total For illustrationens skyld kan den viste variansanalyse sammenlignes med variansanalyseskemaet side 6. Man ser, at restvariationen (50.980) nu er opdelt i en variation mellem blokke ( med 1 frihedsgrad) og en ny restvariation inden for blokke (3.935 med 3 frihedsgrader). Den sidste repræsenterer usikkerheden i forsøget, som nu er meget mindre! 17

18 Forsøget er forudsat randomiseret inden for blokkene, f.eks. som vist i følgende plan: Forsøg dag I Randomisering A=120 o C A=140 o C B=30 min 3 2 B=60 min 1 4 Forsøg Dag II Randomisering A=120 o C A=140 o C B=30 min 4 2 B=60 min

19 3 Blokforsøg 3.1 Fuldstændige blokke Fire alternative behandlingsmetoder, C1, C2, C3, C4, og antag, at 4 behandlinger kan foretages i samme kørsel = en blok = en fuldstændig blok. Kørsel nr C1 C2 C3 C4 1 X 11 X 12 X 13 X 14 2 X 21 X 22 X 23 X 24 3 X 31 X 32 X 33 X 34 4 X 41 X 42 X 43 X 44 En matematisk model er en tosidet variansanalysemodel: X ij = µ + α i + β j + E ij (5) 19

20 3.2 Romersk Kvadratforsøg Ovn med plads til netop de 4 prøveemner, svarende til behandlingerne C1, C2, C3 og C4. De 4 fire pladser er 4 bestemte positioner i ovnen. Forsøget kan udføres i et romersk kvadrat: Forsøgs- Placering angivet plan ved I, II, III og IV Kørsel nr C1 C2 C3 C4 1 I II IV III 2 IV III II I 3 II I III IV 4 III IV I II X ijk = µ + α i + β j + γ k + E ijk (6) Begge de to blok-kriterier, kørsler og placering, repræsenterer fuldstændige blokke. 20

21 3.3 Ufuldstændige blokke 4 alternative behandlinger A1, A2, A4 og A3, men blokstørrelsen=2. Kaldes en ufuldstændig blok: Prøveemne nr A1 A2 A3 A4 1 X X 2 X X 3 X X 4 X X 5 X X 6 X X X ij = µ + α i + β j + E ij (7) Prøveemnerne må gerne være mere eller mindre forskellige (som i praksis). 21

22 Prøveemnerne har en overside (o) og en underside (u): Prøveemne nr A1 A2 A3 A4 1 o u 2 o u 3 u o 4 o u 5 o u 6 o u Alle behandlinger burde placeres lige ofte på en overside og på en underside. 22

23 To gange det samme forsøg med ombytning af o/u: Forsøgsplan med et ufuldstændigt blokforsøg gentaget 2 gange Forsøg d. 19/ Forsøg d. 24/ Prøveemne nr A1 A2 A3 A4 Prøveemne nr A1 A2 A3 A4 1 o u 12 u o 2 o u 8 u o 3 u o 10 o u 4 o u 7 u o 5 u o 11 o u 6 o u 9 u o Analyseres med en variansanalysemodel. 23

24 Følgende data er fra et svampe-dyrkningsforsøg, hvor 6 varianter af en ny stamme (A F) og den tidligere mest brugte stamme (STD) er dyrket på nogle bakker. Hver bakke har netop plads til 3 svampetyper og der er 3 dyrkningsområder (positioner) på én bakke, benævnt α, β og γ. De målte værdier angiver udbredelsesarealerne for vækstområderne for de pågældende svampe. Designet er som følger, og de fundne data ses i næste tabel. Svampetype Bakke STD A B C D E F 1 α β γ 2 β α γ 3 β γ α 4 α β γ 5 γ α β 6 α β γ 7 γ β α 24

25 Data Vækst arealer Bakke STD A B C D E F Sum Sum Q Totaler for positioner: T α = 379.1, T β = 384.1, T γ = Et balanceret ufuldstændigt blokforsøg, med yderligere en balanceret blokvariabel (positioner) (et Youden square). Når forskellige behandlinger er på samme bakke, bliver sammenligningen mellem dem nøjagtig (princippet ved blokning). Model : Y ijk = µ + τ i + Bakke j + Pos k +ɛ 25

26 Kilde SSQ d.f. s 2 F-værdi Bakker Svampetyper Positioner Rest Total F(6,6) 0.05 =4.28. Variation mellem bakker ser stor ud! Ny model Y ijk = µ + τ i + Bakke j + ɛ τ STD = Q STD k/(λ t) = /(1 7) = 4.46, σ 2 ɛ =( )/(2+6) = Kontrast = 6 Q STD (Q Q 6 )=6 ( 10.40) (10.40) = 72.8, SSQ= /(1 7(36 + 6)) = 54.08, d.f.=1. Stærkt signifikant. SSQ mellem τ 1,..., τ 6 = =3.89 med 6 1=5 frihedsgrader. Ikke signifikant. 26

27 4 Forsøg med mange faktorer Et ruggedness test er et forsøg, som har til formål at vurdere, om forskellige faktorer, f.eks. i en måleprocedure, har indflydelse på det endelige måleresultat. Man prøver altså at vurdere, om en iøvrigt uvedkommende faktor påvirker måleresultatet på en uhensigtsmæssig måde. En god og robust procedure vil være kendetegnet ved, at den eller de undersøgte faktorer ikke påvirker resultatet i væsentlig grad. Følgende eksempel er konstrueret, men realistisk. En måleproces omfatter bl.a., at der skal oparbejdes nogle prøver. Ved oparbejdelsen er der i eksemplet mulighed for at variere på følgende faktorer: 27

28 Faktor Lavt niveau -1: Højt niveau A: Temperatur ved ekstraktion -1: 20 o C +1: 24 o C B: Ph-justering af prøve -1: : 7.20 C: Ekstraktionsmiddel -1: Methylalkohol +1: Ethylalkohol D: Kolonne i apparat -1: Ny kolonne +1: Brugt kolonne E: Forfiltrering for urenheder -1: Ingen filtrering +1: Filtrering F: Ekstraktionstid -1: 1 time +1: 2 timer G: Bestråling af ampuller med prøve -1: nej +1: ja Man tror, at A, B, C og D (dem, man har valgt som de første) har mest betydning, I forsøget indgik, 7 faktorer, og målingerne blev udført på toråvarebatche af produktet ( -1 og 1 ). 28

29 Fractional factorial design and block confounding Batch= A B C D E=BCD F=ACD G=ABC ABCD Response Code (1) afg beg ab ef cefg ac e bc f abc g def ad eg bd fg abd cd g acd f bcd e abcd efg Ét af enkelt-forsøgene er angivet som : ace = A=24 o C, B=7.00, C=Ethylal., D= ny kol., E=filtr., F=1 time, G= ej bestr. Det viste forsøg (under ét) kaldes et faktorforsøg i 2 blokke (batchene). 29

30 Man tænker sig, at følgende begrebsmodel kan benyttes: Y = µ + A + B + AB + C + AC + BC + D + E + F + G + Batch + ɛ Modellen udmærker sig (i dette eksempel) ved, at man antager, at der ud over hovedvirkningerne højst er to-faktorvekselvirkninger og kun mellem faktorerne A, B og C. Beregning, eksempelvis for faktoren A: Kontrast = [A] = = Kvadratsum = SSQ A = [A] 2 /2 7 3 =

31 Term Contrast SSQ [ I ] [ A ] [ B ] [ AB ] [ C ] [ AC ] [ BC ] [ ABC = G ] [ D ] [ (AD) ] [ (BD) ] [ (ABD) ] [ (CD) ] [ ACD = F ] [ BCD = E ] [ ABCD = Batch ]

32 2 1.5 Normal probability plot Normal scores Normal probabilities Contrasts sorted Plottet peger på modellen Y = µ + A + B + AB + C + F + Batch + ɛ 32

33 ANOVA: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi ABCD=Batch A=temperatur (sign) B=pH juster (sign) AB=vekselv (sign) C=Ekstrakt.middel (sign) AC=vekselv BC=vekselv D=Kolonne E=Filtrering F=Ekstrakt.tid (sign) G=Bestråling Rest Total Kritisk værdi for F(1,4) (α =0.05) er

34 Reduceret ANOVA: Variations Kvadrataf Friheds F test kilde vigelsessum grader s 2 værdi ABCD=Batch A=temperatur B=pH juster AB=vekselv C=Ekstrakt.middel F=Ekstrakt.tid Rest Total Kritisk værdi for F(1,9) (α =0.05) er5.12. Forsøgsusikkerheden, hvis man kan kontrollere de fundne betydende variable, beregnes til s 2 =1.83 = , dvs at spredningen er

35 Eksemplet illustrerer de potentielle muligheder, der er for at behandle mange faktorer i reducerede forsøg og for at lægge enkeltforsøgene ud i mindre (og derved mere nøjagtige) blokke. Små blokke, alt andet lige, er mere homogene og dermed mere nøjagtige end store blokke. Det fuldstændige er på 2*2*2*2*2*2*2 = 128 enkeltmålinger, vi benytter kun 16. Det samme forsøg kan omfatte indtil 8 faktorer. 2 8 = 256 reduceres til kun 16 forsøg. Et meget godt og hyppigt anvendt design. 35

36 5 Taguchi metoder Omkring 1980 introducerede Genichi Taguchi en række ideer, hvor han benyttede forholdsvis traditionelle forsøgplaner til at forbedre kvaliteten, karakteriseret ved ensartetheden, af produktionsprocesser, målemetoder og produkter. Formålet var 1. Design af processer, så de er robuste overfor ydre (ikke kontrollerbare) betingelser (ruggedness). 2. Design og udvikling af produkter, så de er robuste overfor komponentvariation (f.eks. nye kolonner i målemetoder). 3. Nedsættelse af den tilfældige variation i forhold til den ønskede værdi (nøjagtighed eller kvalitetsegenskab). De tre aktiviteter kaldes under ét parameter design. 36

37 For en robust proces gælder, at faktorer, som er vanskelige at kontrollere, har lille indflydelse på det måleresultat eller den proces eller det produkt, man har for sig. Mange af Taguchi s idéer er grundlæggende gode, men en række af de nye statistiske metoder og de forsøgsplaner, han anbefaler er unødigt komplicerede, kræver mange data, eller er ineffektive. En central tanke er ønsket om reduktion af variabilitet i forhold til en target værdi. I forhold til de tre ovennævnte formål indfører Taguchi statistisk forsøgsplanlægning til punkt 2., hvor han generelt som respons benytter en tabsfunktion: L = k(y T ) 2,hvoryer produktegenskaben, T er target, og k er en faktor. Taguchi s metoder repræsenterer altså ikke nye forsøgsplaner eller mere effektive forsøgsplaner (mange mener tværtimod), men derimod en mere systematisk tænkemåde, der retter sig mod kvalitetsforbedring og forbedret produkt- og procesdesign. 37

38 5.1 En Taguchi forsøgsplan De betragtede faktorer opdeles i kontrollerbare og ikke kontrollerbare faktorer. Følgende liste kunne repræsentere et sådant problem for et produkt. For mange målemetoder kan man selvfølgelig opstille lignende lister. Faktorer og faktorniveauer for Taguchi forsøg Kontrollerbare faktorer niveauer A. Tykkelse af beskyttelsesfilm Lav Mellem Høj B. Tykkelse af samleplade Tynd Mellem Tyk C. Prægningsdybde Lille Mellem Stor D. Koncentration af adhæsiv i lim 5% 10% 15% Ukontrollerbare faktorer E. Hærdetid på lager 24 timer 48 timer F. Hærdetemperatur 18 grader 24 grader G. Fugtighed under hærdning 40% 80% 38

39 De 4 faktorer A D lægges i et 3 3 græsk-romersk kvadratforsøg, dvs en forsøgsplan med 9 observationer, som er konstrueret ud fra to romerske kvadrater, der lagt oven i hinanden. Denne plan er dybest set et (1/9) 3 4 faktorforsøg. De 3 faktorer E, F og G kan lægges i et faktorforsøg, som er et fuldstændigt 2 3 faktorforsøg. Dette sidste forsøg udføres for hver af de 9 kombinationer i det romerske kvadrat, hvilket i alt giver anledning til 9 8=72 enkeltforsøg. Designet kunne se ud som nedenstående. De 3 niveauer for faktorerne A - D benævnes 0, 1 og 2. Tilsvarende er niveauerne for faktorerne E, F og G benævnt 0 og 1. Det romerske kvadratforsøg med de kontrollerbare faktorer kaldes det indre array og 2 3 faktorforsøget kaldes det ydre array. 39

40 Taguchi design med et indre og et ydre array Ydre array E F Indre array G Run A B C D x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x Meningen med det ydre array er at fremprovokere variation. Den kombination af faktorer i det indre array, som giver anledning til mindst variation, er at foretrække. 40

41 Responsfunktion, er eksempelvis SN =10 log hvor ȳ angiver gennemsnittet af den målte egenskab i forsøgene, og S 2 angiver forsøgenes spredning. Forsøget vil, som sagt, omfatte i alt 9 8=72forsøg. Problemet med dette design er især, at det er helt uoverskueligt, hvorledes de kontrollerbare og de ikke kontrollerbare faktorer eventuelt vekselvirker. Dvs. at man risikerer at overse betydningsfulde muligheder for at finde det bedste produktdesign. ȳ S 2 41

42 Ydre array E F Indre array G Vurdering Run A B C D Eksperimentelle resultater Mean Std SN Kon = 11.10, A=[ ], B=[ ], C=[ ], D=[ ] Optimal SN = 29.91; Den bedste setting er : (1,1,1,0)= (Mellem film, Mellem samleplade, Mellem imp. dybde, Lav lim konc.) 42

43 I det konkrete eksempel kunne et forsøg, hvor alle 7 faktorer indgår i en bruden 2 7 forsøgsplan, være et enklere og måske bedre alternativ. Et (1/4) 2 7 faktorforsøg omfatter 32 målinger, og man kan heri opnå, at alle hovedeffekter kan vurderes uden indflydelse af to-faktor-vekselvirkninger, og at tofaktor-vekselvirkninger mellem kontrollerbare og ikke-kontrollerbare faktorer kan undersøges. Dette design vil være klart at foretrække for Taguchi s forslag. Et andet problem er Taguchi s statistiske analysemetoder, som i visse tilfælde giver mystiske resultater. For eksempel ses ovenstående responsfunktion at medføre en uheldig sammenblanding af target værdien (målt ved ȳ) og variabiliteten (målt ved S 2 ). Det vil være tilfældet, hvis de ukontrollérbare faktorer indfluerer både påprocessens middelværdi og spredning, hvilket bestemt ikke er ualmindeligt. Afslutningsvis kan Taguchi s metoder kritiseres for en række statistiske og tekniske problemer, men selve ideen om robust parameterdesign er god. 43

Forsøgsplanlægning og Variansanalyse Henrik Spliid ISCC, IMM Statistical Consulting Center April 2011

Forsøgsplanlægning og Variansanalyse Henrik Spliid ISCC, IMM Statistical Consulting Center April 2011 IMM Informatik og Matematisk Modellering Danmarks Tekniske Universitet file:foredrag2.tex Forsøgsplanlægning og Variansanalyse af Henrik Spliid ISCC, IMM Statistical Consulting Center April 2011 Henrik

Læs mere

eksaminand nr Opgavesættet består af 3 sædvanlige (essay) opgaver samt et antal opgaver af multiple choice typen.

eksaminand nr Opgavesættet består af 3 sædvanlige (essay) opgaver samt et antal opgaver af multiple choice typen. Københavns Universitet Det Farmaceutiske Fakultet Side 1 af 18 sider Skriftlig prøve: Den 12. januar 2009 Kursus navn og nr: Statistisk Forsøgsplanlægning, A-343 Tilladte hjælpemidler: Alle sædvanlige

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Opgavesættet består af 3 sædvanlige (essay) opgaver samt et antal opgaver af multiple choice typen.

Opgavesættet består af 3 sædvanlige (essay) opgaver samt et antal opgaver af multiple choice typen. Danmarks Farmaceutiske Højskole Side 1 af 19 sider Skriftlig prøve den: 6. januar 2003 Kursus navn og nr: Forsøgsplanlægning F343 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af eksaminant

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Intro Design of Experiments

Intro Design of Experiments Intro Design of Experiments OH no: 1 Faktorer, niveauer, behandlinger og gentagelser Styrbare faktorer Faktorer Styrbare (controllable) faktorer Støjfaktorer (nuisance factors) Kvalitative Kvantitative

Læs mere

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al Program Tosidet variansanalyse og forsøgsplanlægning Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Ensidet ANOVA: repetition og Collinge eksempel. Additiv tosidet ANOVA (blokforsøg) Tosidet ANOVA

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Danmarks Farmaceutiske Universitet Side 1 af 18 sider. eksaminant nr

Danmarks Farmaceutiske Universitet Side 1 af 18 sider. eksaminant nr Danmarks Farmaceutiske Universitet Side 1 af 18 sider Skriftlig prøve den: 9 januar 2006 Kursus navn og nr: Statistisk Forsøgsplanlægning, F-343 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X. Opgave I I en undersøgelse af et potentielt antibiotikum har man dyrket en kultur af en bestemt mikroorganisme og tilført prøver af organismen til 20 prøverør med et vækstmedium og samtidig har man tilført

Læs mere

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

2 X 2 = Antal mygstik på enpersoniløbetaf1minut Opgave I I mange statistiske undersøgelser bygger man analysen på anvendelse af normalfordelingen til (eventuelt tilnærmelsesvist) at beskrive den tilfældige variation. Spørgsmål I.1 (1): Forén af følgende

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet

Læs mere

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot Program Residualanalyse Flersidet variansanalyse Helle Sørensen Modelkontrol (residualanalyse) i tosidet ANOVA med vekselvirkning. Test og konklusion i tosidet ANOVA (repetition) Tresidet ANOVA: the works

Læs mere

Eksempel , opg. 2

Eksempel , opg. 2 Faktorer En faktor er en gruppering/inddeling af målinger/observationer pga. Tilsigtede variationer i en eller flere forsøgsparametre Nødvendige (potentielle) blok-effekter såsom gentagne målinger på samme

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance Plot af B j + ǫ ij (Y ij µ α i )): Program: res 4 2 0 2 B1 B2 B3 B4 B5 1. vi starter med at gennemgå opgave 3 side 513. 2. nyt: to-sidet variansanalyse 1 2 3 4 5 block σ 2 : within blocks variance σb 2

Læs mere

Program. Flersidet variansanalyse og hierarkiske modeller. Eksempel: iltoptag for krabber. Eksempel: iltoptag for krabber.

Program. Flersidet variansanalyse og hierarkiske modeller. Eksempel: iltoptag for krabber. Eksempel: iltoptag for krabber. Program Flersidet variansanalyse og hierarkiske modeller Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 50, mandag) Flersidet ANOVA 1 / 19 StatBK (Uge 50, mandag) Flersidet ANOVA 2 / 19 Eksempel:

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion VARIANSANALYSE 2 Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: (Analysis of variance) med interaktion Problem: Hvordan håndterer vi forsøg, hvor effekten er forårsaget af to faktorer og en evt.

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter Opgave I I mange statistiske undersøgelser benytter man binomialfordelingen til at beskrive den tilfældige variation. Spørgsmål I.1 (1): For hvilken af følgende 5 stokastiske variable kunne binomialfordelingen

Læs mere

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345) Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Kapitel 13 Reliabilitet og enighed

Kapitel 13 Reliabilitet og enighed Kapitel 13 Reliabilitet og enighed Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 Version 11. april 2011 1 / 23 Indledning En observation er sammensat af en sand værdi og en målefejl

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Om hypoteseprøvning (1)

Om hypoteseprøvning (1) E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2005 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Restsaltmængdernes afhængighed af trafikken,

Restsaltmængdernes afhængighed af trafikken, Restsaltmængdernes afhængighed af trafikken, Thomas Glue, marts 2. Trafikintensitet...2 Indledende definitioner...2 Regressionsanalyser på trafikintensiteten...6 Justering af restsaltmængder i henhold

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8 Landmålingens fejlteori Repetition - Fordeling af slutfejl Lektion 8 - tvede@math.aau.dk http://www.math.aau.dk/ tvede/teaching/l4 Institut for Matematiske Fag Aalborg Universitet 15. maj 2008 1/13 Fordeling

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ). Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression

Læs mere

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/36 Estimation af varians/spredning Antag X 1,...,X n stokastiske

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1 Tag-hjem prøve 1. juli 2010 24 timer Alle hjælpemidler er tilladt. Det er tilladt at skrive med blyant og benytte viskelæder,

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Mathematical Statistics ST06: Linear Models Bent Jørgensen og Pia Larsen Module 2: Mere om variansanalyse 2. Parreded observationer................................ 2.2 Faktor med 2 niveauer (0- variabel)........................

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Anvendelse af ufuldstændige blokforsøg

Anvendelse af ufuldstændige blokforsøg Anvendelse af ufuldstændige blokforsøg Kristian Kristensen 1, Jakob Willas 2, Lise Nistrup Jørgensen 3 og Rene Gislum 4 1 Forskergruppe for Biometri, Afd. for Husdyravl og Genetik, DJF 2 Afd. for Sortsafprøvning,

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Modul 7: Forsøgsplanlægning

Modul 7: Forsøgsplanlægning Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Forsøgsplanlægning 7.1 Lidt om forsøgsplanlægning............................. 1 7.1.1 Sammenligning af grupper..........................

Læs mere

Analyse af Saltdata. Henrik Spliid

Analyse af Saltdata. Henrik Spliid Analyse af Saltdata Henrik Spliid December 1999 0 Analyse af restsalt ved udspredning af fugtsalt og saltlage Page 1 of 12 Indledning Nrvrende rapport beskriver kort resultaterne af en statistisk analyse

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Analyse af måledata II

Analyse af måledata II Analyse af måledata II Usikkerhedsberegning og grafisk repræsentation af måleusikkerhed Af Michael Brix Pedersen, Birkerød Gymnasium Forfatteren gennemgår grundlæggende begreber om måleusikkerhed på fysiske

Læs mere

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde... Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 13: Exercises 13.1 Substrat........................................ 1 13.2 Polynomiel regression................................

Læs mere

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde... Modul 13: Exercises 13.1 Substrat.......................... 1 13.2 Polynomiel regression.................. 3 13.3 Biomasse.......................... 4 13.4 Kreatinin.......................... 7 13.5 Læsefærdighed......................

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Program. 1. Flersidet variansanalyse 1/11

Program. 1. Flersidet variansanalyse 1/11 Program 1. Flersidet variansanalyse 1/11 To-sidet variansanalyse Eksempel: (opgave 14.2 side 587) vitamin indhold i frossen juice målt for ialt 9 kombinationer af mærke (Rich food, Sealed-sweet, Minute

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere