VIDEREGÅENDE STATISTIK

Størrelse: px
Starte visningen fra side:

Download "VIDEREGÅENDE STATISTIK"

Transkript

1 MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK (med TI 89 og SAS - JMP) 5. udgave 011

2 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske grundbegreber. Bogen er bygget op således, at de væsentligste begreber søges forklaret anskueligt og ved hjælp af et stort antal eksempler. I eksemplerne er beregningerne er i videst mulig omfang foretaget ved anvendelse af programmer i lommeregneren TI-89 og i statistikprogrammet SAS-JMP. I slutningen af nogle af kapitlerne er givet en oversigt over centrale formler eller fremgangsmåder. I et appendix sidst i bogen er givet en mere dybtgående statistisk forklaring på formlerne. Efter hvert kapitel er der nogle opgaver og en facitliste til opgaverne findes bagerst i bogen. Læsning: Bogen er opbygget således, at de tre hovedemner Faktorer på og flere niveauer : kapitel 3 til 6, Regressionsanalyse kapitel 7 og Kontrolteori : kapitel 8 og 9 kan læses uafhængigt af hinanden. Kan man af tidsmæssige grunde ikke nå alt, så kan man derfor overspringe en eller flere af disse emner. Et andet forslag er at overspringe en eller flere af delemner som Screeningsforsøg: kapitel 6, Multipel regression: afsnit 7.7 og 7.8 Statistisk godkendelseskontrol:kapitel 9: Skulle man i undervisningen benytter et andet statistikprogram end SAS.JMP, kan de studerende uden vanskelighed på basis af SAS.JMP udskrifterne tolke egne udskrifter, da disse næppeafviger væsentligt fra hinanden. På nedenstående adresse kan man således se bøger, hvor SAS-JMP er udskiftet med statistikprogrammet STATGRAPHICS. Data foreligger ofte som en fil i et regneark som eksempelvis Excel. Disse regneark har indbygget en del statistik bl.a. de almindeligste testfunktioner. I notatet Videregående statistik regnet med Excel er en række af disse statistiske muligheder gennemgået. Alle de nævnte bøger (og mange flere) kan findes på adressen Januar 01 Mogens Oddershede Larsen. -ii-

3 INDHOLD Indhold 1 REPETITION AF HYPOTESETEST FOR 1 VARIABEL 1.1 Indledning Normalfordelt variabel Binomialfordelt variabel... 5 Opgaver... 6 PLANLÆGNING AF FORSØG.1 Indledning Nomenklatur Krav til statistisk gyldigt forsøg FAKTOR PÅ NIVEAUER 3.1 Normalfordelte variable Test af differens mellem middelværdier Blokforsøg (parvise observationer) Binomialfordelte variable Poissonfordelte variable Fordeling ukendt (rangtest) Oversigt over centrale formler i kapitel Test og konfidensintervaller af differens mellem middelværdier for normalfordelte variable Test af differens mellem varians for normalfordelte variable Test og konfidensintervaller af p 1 - p for binomialfordelte variable Test og konfidensintervaller af µ µ for Poissonfordelte variable Opgaver FAKTOR PÅ MERE END NIVEAUER 4.1 Indledning Ensidet variansanalyse (normalfordelte variable) Indledning Forklaring af metoder og formler Beregning af ensidet variansanalyse ved TI89 og SAS.JMP Fuldstændigt randomiseret blokforsøg Binomialfordelte variable Poissonfordelte variable Oversigt over centrale formler i kapitel iii-

4 Indhold Oversigt over fremgangsmåde ved ensidet variansanalyse Test af parametre p 1, p,..., p k for binomialfordelte variable Test af parametre µ 1, µ,..., µ k for Poissonfordelte variable Opgaver FAKTORER PÅ ELLER FLERE NIVEAUER. TOSIDET VARIANSANALYSE 5.1 Indledning Planlægning af forsøg Een faktor ad gangen Fuldstændig faktorstruktur Formler og metode Beregning af tosidet variansanalyse Fuldstændigt randomiseret blokforsøg To binomialfordelte eller Poissonfordelte faktorer i et fuldstændigt faktorforsøg Oversigt over fremgangsmåde ved tosidet variansanalyse Opgaver FLERE END TO FAKTORER, SCREENINGSFORSØG 6.1 Indledning Nomenklatur Definitionsrelationer og aliasrelationer Planlægning af et partielt k faktorforsøg Beregning af et partielt k faktorforsøg Konfundering af blokke Sekventiel forsøgsstrategi Oversigt over fremgangsmåde ved partielt k faktorforsøg TI89 - program til beregning af k -faktorforsøg Opgaver ENKELT REGRESSIONSANALYSE 7.1 Indledning Bestemmelse af regressionsligning Vurdering af om regressionsligning beskriver data godt Test og konfidensintervaller Transformation af data Enkelt regressionsanalyse med flere y - observationer for hver x - værdi iv-

5 Indhold 7.7 Multipel regressionsanalyse Indledning Analyse med én y - observation for hver x - værdi Polynomial regressionsanalyse Indledning Beregning af polynomial regressionsanalyse Oversigt over fremgangsmåde ved regressionsanalyse Opgaver STATISTISK PROCESKONTROL 8.1 Indledning Proces i statistisk kontrol Opbygning og alarmkriterier for kontrolkort Kontrolkortanalyse Tolerancegrænser og kapabilitet Procesvariablen er normalfordelt Procesvariablen X er diskret X er binomialfordelt X er Poissonfordelt Opgaver STATISTISK GODKENDELSESKONTROL 9.1 Indledning Enkelt stikprøveplan Rektificerende kontrol Dobbelt stikprøveplan Opgaver ANTALSTABELLER 10.1 Indledning En -vejs tabel To -vejs tabel Opgaver RANGTEST (FORDELING UKENDT) 11.1 Indledning Wilcoxons rangtest for 1 stikprøve v-

6 Indhold 11.3 Wilcoxons rangtest for uafhængig stikprøver Kruskal Wallis test Opgaver... 0 APPENDIX 4.1 Formler til beregning af ensidet variansanalyse Formler til beregning af tosidet variansanalyse Transformation af binomial-og Poissonfordelte variable til tosidet variansanalyse Formler til beregning af enkelt regressionsanalyse uden gentagelser Formler til beregning af enkelt regressionsanalyse med lige mange gentagelser Transformation til lineær model Formler til beregning af multipel regressionsanalyse Begrundelse for grænserne for kontrolkort χ - test af hypotese i 1-vejs antalstabel χ - test af hypotese i - vejs antalstabel Kruskal-Wallis rangtest for to eller flere variable... 3 GRUNDLÆGGENDE OPERATIONER PÅ TI GRUNDLÆGGENDE OPERATIONER PÅ SAS.JMP... 6 TABEL FACITLISTE STIKORD vi-

7 1. Normalfordelt variabel 1 REPETITION AF HYPOTESETEST FOR 1 VARIABEL 1.1. INDLEDNING De grundlæggende begreber vedrørende hypotesetest, konfidensintervaller og dimensionering af forsøg blev i Statistiske Grundbegreber grundigt beskrevet når vi havde én stikprøve. Beregningerne blev der udført ved anvendelse af lommeregneren TI89 og regnearket Excel. Vi vil i dette afsnit vise hvorledes beregningerne også kan udføres med statistikprogrammet SAS- JMP, samt vise, hvorledes man ved hjælp af SAS.JMP grafisk kan undersøge om data virkelig er normalfordelt. I Afsnittet Grundlæggende Operationer i SAS-JMP er beskrevet, hvorledes man indtaster data, import af data fra Excel og beregner de forskellige sandsynlighedsfunktioner. 1.. NORMALFORDELT VARIABEL Eksempel 1.1 Hypotesetest. Normalfordelt variabel. En fabrik der fremstiller plastikprodukter ønsker at evaluere holdbarheden af rektangulære støbte plastik blokke som anvendes i møbelfabrikationen. Der udtages tilfældigt 50 blokke, og deres hårhed måles (i Brinell enheder). Resultaterne var følgende a) Undersøg om tallene er rimeligt normalfordelt ved i SAS-JMP at tegne et histogram, et boxplot og et normalfordelingsplot. Angiv endvidere gennemsnit og spredning. De følgende spørgsmål skal regnes såvel med SAS.JMP som med TI89. For at undgå indtastning af alle tal i TI89, forudsættes her, at man ved, at gennemsnit x = 66. og spredning s = 5.0. b) Hårheden bør være over 60 (brinell enheder). Test på et signifikansniveau på α = 5% om dette er tilfældet. c) Forudsat hårheden er signifikant over 60 brinell, skal angives et estimat for hårheden, samt et 95% konfidensinterval for denne. Løsning: a) Histogram: Lad data være indtastet og datasøjlen være benævnt holdbarhed På værktøjslinien vælg Analyze Distribution (eller Wiew, JMP-Starter vælg Basic Distribution ) I den fremkomne menu dobbeltklikkes på holdbarhed (under Selected Columns ) ok Der fremkommer et histogram, et boxplot og en række statistiske oplysninger. En almindelig fejl er her, at man i data har skrevet decimalpunktum frem for decimalpunktum. Ret dette, og i data, vælg kolonneoverskrift holdbarhed højre musetast Modelling type Continuous 1

8 1. Repetition af centrale begreber For at kunne sammenligne med en normalfordeling tegnes en normalfordelingskurve: Placer cursor på rød pil ved holdbarhed tryk på højre musetast og vælg Continuous Fit normal Der tegnes nu en normalfordelingskurve med samme middelværdi og spredning som fra data. Endvidere tegnes et normal kvartil plot Cursor placeres på holdbarhed og man trykker på højre musetast og vælger Normal Quantile Plot Der er nu bl.a. fremkommet følgende figur og tabel. Distributions holdbarhed 350 -,33-1,64-1,8-0, 67 0,0 0,67 1, 81,64, , 0 0,1 0, 0,5 0,8 0,9 0,98 Norm al Quantile Plot Normal(66,18,5,0931) Quantiles 100,0 % maximum 334,90 99,5% 334,90 97,5% 38,93 90,0% 300,99 75,0% quartile 79,73 50,0% median 67,60 5,0% quartile 51,75 10,0% 33,0,5% 01,41 0,5% 194,40 0,0% minimum 194,40 Moments Mean 66,18 Std Dev 5,09313 Std Err Mean 3, Upper 95% Mean 73,34939 Lower 95% Mean 59,08661 N 50

9 1. Normalfordelt variabel Forklaring af figur og udskrift Histogram og normalfordelingskurven passer godt sammen, så det viser, at data er rimelig normalfordelt. Boxplot: Den næste figur er et såkaldt boxplot, hvor den midterste streg angiver medianen og kassens grænser angiver henholdsvis 1. og 3. kvartil. Det betyder, at hvis man opstillede de 50 tal i rækkefølge efter størrelse, så er tal nr 50/ =5 medianen 67.6 (aflæses i tabel under Quantiles 59% ) 1. kvartil 5.75 er tallet midt mellem tal nr 1 og tal nr 13, osv. Da boxplottet er nogenlunde symmetrisk om medianen, så kan man igen antage at data er rimelig normalfordelt. De isolerede prikker yderst viser, at der er et par værdier, som afviger kraftigt fra de øvrige, og muligvis er fejlmålinger (kaldes outliers). Rhomben inde i firkanten angiver et 95% konfidensinterval for middelværdien. Man ser, at den ligger lidt skævt i forhold til boxplottet, men dog ikke så meget, at det spiller nogen rolle, da median =67.6 er ca. = mean (gennemsnit) = 66.7 Normal Kvartil-plot. Her har man ud af x - aksen sørget for at skalaen er sådan, at punkterne burde ligge på den røde rette linie, hvis de fuldstændigt eksakt var normalfordelt. Den røde linie går gennem (0, mean) og har hældning = spredningen. De stiplede linier angiver 95% konfidensinterval for normalfordelingen. Som det ses, ligger punkterne indenfor konfidensintervallet og ligger tæt på linien for de midterste 75% af tallenene. De yderste punkter kan man ikke forvente ligger på linien Man må derfor igen antage, at data er tilnærmelsesvis normalfordelt. Det ses af udskriften, at gennemsnittet x = 66. og et estimat for spredningen er s = 5.09 b) X = holdbarheden af plastblokke X antages normalfordelt med ukendt middelværdi og. µ σ H 0 : =60 H: >60 µ µ Da spredningen ikke er kendt eksakt anvendes en t-test. TI 89: APPS, STAT/LIST F6 : t-test vælg Stats (da de oprindelige data ikke er kendt) ENTER Udfyld den fremkomne menu : µ 0 = 60, x = 66., s = 5.09 n = 50, Alternativ hypotese µ > µ 0 Calculate, Enter Vi får: P-værdi = P- værdien = sandsynligheden for at begå en "type 1 fejl", dvs. påstå at µ > µ 0 =60 selv om det ikke er tilfældet. Da P-værdi = 4.9 % < 5%, forkastes H 0 (svagt). Konklusion: Vi har bevist, at holdbarheden i middel er over 60 brinell. 3

10 1. Repetition af centrale begreber SAS.JMP: Klik på rød pil ved "holdbarhed" og vælg "Test Mean". I den fremkomne menu skriv 60 ok Test Mean=value Hypothesized Value 60 Actual Estimate 66,18 DF 49 Std Dev 5,0931 t Test Test Statistic 1,75 Prob > t 0,0860 Prob > t 0,0430* Prob < t 0,9570 Da P-værdi = < 5%, dvs H 0 forkastes (svagt) Konklusion: Vi har bevist, at holdbarheden i middel er over 60 brinell. Da vi har en ensidet test er tegningen lidt misvisende Ønskes en mere anskuelig figur m.m. Sæt cursor på Test Mean, tryk på højre musetast og vælg Pvalue animation og vælg på figuren High Side Derved fremkommer en mere sigende figur Y 0,1 0,10 0,08 0,06 0,04 0,0 Esti mate d Me an 66,18 Hypothesized Mean 60 T Ratio 1,7519 P Value 0,043 0, X Sample Size = 50 c) TI 89: APPS, STAT/LIST F7 : t-inteval Stats ENTER Udfyld den fremkomne menu Calculate, Enter Et estimat for holdbarheden er 66. brinell Et 95% konfidensinterval [59.1 ; 73.3] SAS.JMP: Klik på rød pil ved "holdbarhed" "Confidence interval" Der fremkommer følgende udskrift. Confidence Intervals Parameter Estimate Lower CI Upper CI 1-Alpha Mean 66,18 59, ,3494 0,950 Std Dev 5, , ,6939 0,950 Et estimat for holdbarheden er 66. brinell Et 95% konfidensinterval [59.1 ; 73.3] 4

11 1.3 Binomialfordelt variabel 1.3. BINOMIALFORDELT VARIABEL Eksempel 1.. Binomialtest En fabrikant af chip til computere reklamerer med, at højst % af en bestemt type chip, som fabrikken sender ud på markedet er defekte. Et stort computerfirma, vil købe et meget stort parti af disse chip, hvis påstanden er rigtigt. For at teste påstanden købes 1000 af dem. Det viser sig, at 33 ud af de 1000 er defekte. a) Kan fabrikantens påstand på denne baggrund forkastes på signifikansniveau 5%? b) Forudsat påstanden forkastes, skal angives et estimat for % defekte, samt et 95% konfidensinterval for denne. Løsning: X = antal defekte chips af 1000 X er binomialfordelt b(1000, p). Nulhypotese: H: p = 00. Alternativ hypotese Hp : > 00. TI89 a) P værdi = P( X 33) = binomcdf(1000,0.0,33,1000)= Da P-værdi < 0.05 forkastes H 0, dvs. fabrikantens påstand om færre end % defekte forkastes. b) Da x = 33 >5 og 33 < kan approksimeres med normalfordelingen APPS, STAT/LIST F7 5: 1-Prop-Z-test udfyld menu Estimat for p: 3.3% 95% konfidensinterval : {.19% ; 4.41%] SAS.JMP a) P værdi = P( X 33) = 1 P( X 3) Kald en søjle for p, og indtast et tilfældigt tal i første række. Placer cursor i p's hoved højre musetast Formula skriv 1-(- vælges fra jmp tastatur) vælg Discrete Probability Binomial Distribution Udfyld pladserne Højre musetast Evaluate P-værdi = b) Estimat for p: 3.3% ± ( ) 1000 p radius Øvre grænse nedre grænse 0, , , ,0198 Af formlen for konfidensinterval og benyttelse af "Formula" fås 5

12 1. Repetition af centrale begreber OPGAVER Opgave 1.1 Færdselspolitiet overvejede, om der burde indføres en fartgrænse på 70 km/h på en bestemt landevejsstrækning, hvor der hidtil havde været fartgrænsen 80 km/h. Som et led i analysen af hensigtmæssigheden af den overvejede ændring observeredes inden for et bestemt tidsrum ved hjælp af radarkontrol de forbipasserende bilers fart. Resultatet af målingerne var: 50 observationer Undersøg om tallene er rimeligt normalfordelt ved i SAS-JMP at tegne et histogram, et boxplot og et normalfordelingsplot. Angiv endvidere gennemsnit og spredning. Opgave 1. Under produktionen forekommer blandt en fabriks affaldsprodukter 1.5 mg/l af et stof A., som i større mængder kan være kræftfremkaldende. Man håber ved en ny og mere kostbar metode, at formindske indholdet af det pågældende stof. a) Ved en række kontrolmålinger efter tilsætning af additivet fandtes følgende resultater (i mg/l) Test på 5% niveau, om målingerne beviser, at der er sket en formindskelse af middelindholdet af stoffet A. b) Forudsat middelindholdet er signifikant under 1.5 mg/l, skal angives et estimat for det nye middelindhold, samt et 95% konfidensinterval for denne. Opgave 1.3 Det forventes, at lovgivningen bliver strammet omkring mængden af skadelige partikler i bilers udstødningsgas. En person mener, at mere end 0% af forsvarets biler ikke vil opfylde de forventede nye krav. Ved en undersøgelse af 40 af forsvarets biler tilfældigt udvalgt, fandt man, at 13 af disse ikke kunne opfylde de nye krav. 1) Test om dette på et signifikansniveau på 5 % er et bevis for, at mere end 0% af forsvarets biler udsender flere skadelige partikler end ønskeligt. ) Under forudsætning af at det er signifikant, at 0% af bilerne ikke opfylder kravet, skal man angive et estimat for hvor mange procent af bilerne, der ikke opfylder de nye krav, samt angive et 95% konfidensinterval herfor. 6

13 Opgaver til kapitel 1 Opgave 1.4 Indenfor en stor virksomhed, der producerer udstyr til forsvaret, er der i middel 0 driftsuheld pr. måned. Da antallet efter indførelsen af nye arbejdsrutiner synes at være vokset målte man i 5 på hinanden følgende måneder antallet af driftsuheld. Resultaterne var måned nr antal/måned Test, om disse data giver et eksperimentelt bevis for, at middelværdien er større end 0 µ driftsuheld/måned? 7

14 . Planlægning af forsøg PLANLÆGNING AF FORSØG.1. INDLEDNING Forsøg er en naturlig del af ingeniørmæssig og anden videnskabelig metode til at træffe beslutninger. Antag eksempelvis, at en ingeniør skal studere virkningerne af 4 hærdningsmetoder på trykstyrken af et materiale. Forsøget ville bestå i, at man fremstillede en række testmaterialer baseret på de 4 hærdningsmetoder, og derefter målte trykstyrken. På basis af disse data kunne man så anvende en statistisk metode til at finde den af de 4 metoder der i middel gav den største trykstyrke. Alle forsøg er planlagte forsøg, men desværre er nogle forsøg særdeles dårlig planlagt, og resulterer i at kostbare ressourcer bliver benyttet ineffektivt. Statistisk planlagte forsøg giver effektivitet og økonomi i den eksperimentelle proces, og brug af statistiske metoder i undersøgelsen af data resulterer i en videnskabelig objektivitet når man skal drage konklusioner. Statistisk baserede forsøg er særlig nyttige til at forbedre en fremstillingsproces eller til at udvikle nye metoder. Ved at benytte statistisk planlagte forsøg, kan ingeniøren bestemme hvilke af de mange procesvariable, såsom temperatur, tryk, hærdningsmetoder osv. der har den største betydning for udfaldet af processen. Brugen af statistisk baserede forsøg kan derfor resultere i produkter, der er lettere at producere, produkter der har en bedre performance og stabilitet (mindre spredning) end konkurrenternes produkter, og kan blive udviklet og produceret på mindre tid, hvilket reducerer udviklingsomkostningerne... NOMENKLATUR I de følgende kapitler benyttes ord, som faktor, niveauer, behandlinger osv. For at forstå hvad disse ord betyder, vil vi forklare dem ud fra følgende forsøg: Eksempel.1 I forbindelse med nogle brudstyrkebestemmelser for Portland-cement udføres et fuldstændigt randomiseret forsøg til undersøgelse af middelbrudstyrkens afhængighed af cementblandere og cementknusere. Med hver af 4 cementblandere udstøbtes efter blanding med vand 1 cementterninger, som efter en uges lagring underkastedes en brudstyrkeprøve ved hjælp af en af 3 cementknusere. Forsøgsresultaterne var: 8

15 .3.Krav til statistisk gyldigt forsøg Cementknusere B 1 B B 3 B 4 Cementblandere A A A Beskriv forsøget. Løsning: Forsøget har to faktorer: Cementblander og Cementknuser. Faktoren Cementblander har 3 niveauer A 1,A, A 3. (niveau hedder på engelsk level ) Faktoren Cementknuser har 4 niveauer B 1,B, B 3., B 4 Forsøget har 1 behandlinger (engelsk treatment) A 1 B 1, A 1 B, A 1 B 3, A 1 B 4, A B 1, A B, A B 3, A B 4,A 3 B 1, A 3 B, A 3 B 3, A 3 B 4 da der er 1 kombinationer af niveauerne (1 celler) Hver behandling har 3 gentagelser, eksempelvis har behandlingen A 1 B 1 3 delforsøg, der resulterede i forsøgsresultaterne Faktorer kan enten være kvalitative eller kvantitative. En faktor som temperatur er kvantitativ, da den jo er en talvariabel, der kan antage alle mulige talværdier (indenfor et givet talområde). En faktor som Cementblander i eksempel.1 er kvalitativ, da den kun har nogle fastlagte niveauer, og man ikke kan tale om eksempelvis cementblander KRAV TIL STATISTISK GYLDIGT FORSØG For at nogle forsøgsresultater skal være statistisk gyldige, skal målingerne være statistisk uafhængige og være repræsentative for det man skal undersøge. Ved statistisk uafhængighed forstås, at resultatet af et delforsøg ikke må afhænge af hvad der skete i de øvrige delforsøg. Det er således ikke korrekt, hvis det arbejdshold, der foretager forsøgene først laver forsøgene med den ene cementblander- derved bliver dygtigere- og så laver forsøgene med de øvrige cementblandere. Det er heller ikke korrekt, at man eksempelvis i eksempel 1.1 først havde målt holdbarheden af 10 blokke, - derefter foretager en test-opdager at man ikke kan vise signifikans. Så havde taget 10 blokke mere - testet på de 0 blokke osv., indtil man opnåede signifikans. Dette er ikke "statistisk gyldige" forsøg. 9

16 . Planlægning af forsøg Til belysning af hvad der er et "statistisk" gyldigt forsøg tages udgangspunkt i følgende eksempel. Eksempel.. Planlægning af forsøg. En fabrik der producerer maling, har udviklet to nye additiver A 1 og A, som bevirker en kortere tørretid. Additiv A 1 er det dyreste, men man forventer også, at det giver den korteste tørretid. På grund af prisforskellen, skal tørretiden dog være mindst 10 minutter kortere for A 1, før man vil gå over til den. For at undersøge disse forhold produceres nogle liter maling, som derefter deles op i mindre portioner. Til nogle af portionerne tilsættes additiv A 1 og til andre additiv A. Tørretiden måles derefter. Generelt gælder, at hvert delforsøg i et forsøg udføres under en række forsøgsbetingelser. Alle andre delforsøgsbetingelser end behandlingerne sammenfattes i et begreb, der kaldes forsøgsenheden. I eksempel.1 er additiverne = behandlingerne og forsøgsenhederne er den enkelte portion maling, anvendt apparatur og personale, tidspunkt for delforsøget og de forhold med hensyn til temperatur, luftfugtighed osv., som gælder på forsøgstidspunktet. Bemærk, at forsøgsenhederne ofte indeholder faktorer, som ikke kan gøres ensartet fra delforsøg til delforsøg. Dette bevirker, at resultatet af de enkelte delforsøg varierer. Dette giver forsøgsvariablens variation eller kort forsøgets støj. Randomisering For at sikre et statistisk gyldigt forsøg foretager man en såkaldt fuldstændig randomisering. Dette betyder at man ved lodtrækning fordeler forsøgsenhederne tilfældigt på behandlingerne. Dette sker, for at man ikke ubevidst kommer til at favorisere en af de to behandlinger. Hvis man eksempelvis helt systematisk i eksempel 1.1 først laver alle delforsøg med additiv A 1, kunne dette bevirke en favorisering af A 1 nemlig hvis forsøgsomstændighederne (apparater, personale, luftfugtighed ) er mest gunstige ved begyndelsen af forsøgsperioden. For at anskueliggøre denne randomiseringsproces antager vi, at vi i eksempel 1.3 skal lave 4 delforsøg med hver additiv. Endvidere antages, at delforsøgene skal indgå i den almindelige produktionsgang, dvs. at man af tidsmæssige, personalemæssige og på grund af en begrænset mængde apparatur må lade forsøgene forløbe over flere dage. Man tror ikke, at dage, apparatur og laborant har nogen væsentlig betydning for forsøgsresultaterne. Der er sandsynligvis også andre forhold udenfor vor kontrol, og som tilsammen bevirker, at selv om man udfører gentagne delforsøg med samme behandling, så får vi afvigende resultater. For en sikkerheds skyld vælger vi imidlertid at randomisere dage, apparatur og laboranter Lad os antage at der gælder følgende: Mandag er det kun muligt at lave 1 delforsøg, idet apparatur nr. 1 og laborant A er de eneste der er ledige. Tirsdag er der kapacitet ledig til 3 delforsøg: Ét delforsøg hvor apparatur nr og laborant A benyttes Ét delforsøg hvor apparatur nr 1 og laborant B benyttes, og Ét delforsøg hvor apparatur nr 3 og laborant C benyttes. Onsdag kan der også laves 3 delforsøg osv. (se det følgende skema). 10

17 .3.Krav til statistisk gyldigt forsøg Forsøgsenheder Dag Apparatur Laborant mandag 1 A tirsdag A tirsdag 1 B tirsdag 3 C onsdag 3 B onsdag 4 C onsdag 1 A torsdag 3 B Behandlinger (apparater) Vi foretager nu randomiseringen, som kort sagt er en form for lodtrækning. Sædvanligvis vil man benytte et program, der kan generere tilfældige tal (mange lommeregnere har et sådant program). For at anskueliggøre randomiseringen vil vi mere primitivt foretage lodtrækningen på følgende måde. På 4 sedler skrives A 1, på andre 4 sedler skrives A. Hver seddel krølles sammen til en kugle og placeres i en dåse. Sedlerne blandes ved at dåsen rystes (se figur). Hvis den første seddel der udtrækkes er A så betyder det, at det delforsøg der mandag udføres med apparatur 1 og laborant A skal anvende additiv A. Hvis den næste seddel der udtrækkes er A 1 så betyder det, at det delforsøg der tirsdag udføres med apparatur og råvareleverance 1 skal anvende additiv A 1 osv. Resultaterne kunne eksempelvis være som angivet på følgende skema: Forsøgsenheder Behandlinger Dag Apparatur Laborant (apparater) mandag 1 A A tirsdag A A 1 tirsdag 1 B A 1 tirsdag 3 C A onsdag 3 B A onsdag 4 C A 1 onsdag 1 A A torsdag 3 B A 1 På denne måde sikrer man sig, at vi får et så vidt muligt "statistisk gyldigt" forsøg. Hvis vi derfor efter beregninger (som ses i de følgende kapitler ) konkluderer, at der er forskel på additiverne, så er det "korrekt", idet det ville være helt tilfældigt, hvis én af additiverne har været begunstiget med særlig gode forsøgsenheder. Herved har man også sikret sig, at de to stikprøver (variable) er statistisk uafhængige. 11

18 . Planlægning af forsøg Forsøg bør udføres, så alle behandlinger får lige mange gentagelser. Ved planlægningen af forsøget er det ganske klart, at hvis man eksempelvis har ressourcer til at lave 0 delforsøg, så ville det være en meget dårlig plan, hvis man lavede 18 delforsøg med A 1 og kun delforsøg med A. Der bør i naturligvis tilstræbes at lave 10 delforsøg med hver behandling. Delforsøg kan mislykkes, så målet i praksis ikke bliver opfyldt. I sådanne tilfælde kan de i de følgende kapitler anførte statistiske analyser dog stadig gennemføres. Testene bliver dog mindre robuste (dvs. mere afhængige af, at forudsætningerne gælder), og beregningerne mere komplicerede. Dimensionering Man kan fristes til at tro, at jo flere gentagelser jo bedre. s Da spredningen på et gennemsnit er, er det klart, at hvis antal forsøg n er stort bliver n spredningen lille, og så kan man finde, at der er en signifikant forskel selv om denne forskel er lille. Imidlertid risikerer man med mange gentagelser at opdage så små forskelle, at de ikke har praktisk betydning, og så er de mange delforsøg jo spild af arbejdskraft og penge. Endvidere gælder det jo, at hvis man laver 5 forsøg, så er spredningen formindsket med en faktor 5, mens hvis man laver 100 forsøg så er spredningen formindsket med en faktor 10. Der skal derfor særdeles mange forsøg til for alvor at formindske spredningen på gennemsnittet. Analogt med forklaringen i Statistiske Grundbegreber kan man under visse forudsætninger beregne hvor mange gentagelser (portioner) der skal anvendes for hver behandling, hvis P( fejl af type I) α og P( fejl af type II) β. Man skal naturligvis angive en bagatelgrænse, men desuden kræver beregningerne, at spredningerne ved de to behandlinger er (tilnærmelsesvis) ens, og at man kan give et nogenlunde realistisk skøn for denne fælles spredning σ. Det er naturligvis en svaghed ved dimensioneringen, at man inden forsøget er udført skal give et sådant skøn. En vurdering heraf kunne baseres på erfaringer fra tilsvarende forsøg. Findes sådanne erfaringer må man først lave nogle få delforsøg og derfra få et rimeligt gæt på spredningen σ. At spredningerne er nogenlunde ens vil i praksis ofte være tilfældet, da forsøgsenhederne jo er valgt ved randomisering. Når forsøget så er lavet, kan man (lidt sent) se, om man har skønnet rigtigt. Dimensioneringen har kun betydning hvis man får en accept, da man så ved, at en eventuel forskel ikke har praktisk betydning. Hvis man får en forkastelse, så ved man der er en signifikant forskel, men om den er af praktisk betydning må en nærmere undersøgelse vise. Formler for dimensionering af variable findes i oversigten i kapitel 3, afsnit

19 3. 1 Faktor på to niveauer 3.1 Normalfordelte variable 3.1. NORMALFORDELTE VARIABLE Test af differens mellem middelværdier I dette afsnit benyttes et eksempel til at forklare metode, teststørrelse osv. Derefter vises hvorledes det samme eksempel regnes med først TI89 og derefter SAS.JMP. Eksempel 3.1. Sammenligning af normalfordelte variable To produktionsmetoder M1 og M ønskes sammenlignet. Der udvælges tilfældigt 0 personer, hvoraf de 10 bliver sat til at arbejde med den ene metode, og de 10 andre med den anden. Efter ugers forløb, beregnede man for hver person det gennemsnitlige tidsforbrug pr. enhed. Da metode 1 er mere kostbar end metode, ønsker man kun at gå over til den, hvis tidsforbruget pr. enhed ved metode 1 er mindst minutter mindre end ved metode. Man fik følgende resultater. M M Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises at tidsforbruget ved metode M 1 er minutter mindre end ved metode M. Løsning: a) Lad X 1 = udbyttet ved anvendelse af metode M 1 og X = udbyttet ved anvendelse af metode M. X 1 og X antages approksimativt normalfordelte med middelværdi og spredning henholdsvis µ, σ og µ, σ. 1 1 H 0 : µ µ 1 = H: µ µ 1 > Begrundelse: Nulhypotesen udtrykker jo, at intet er ændret (nul virkning), så den angiver, at differensen i middeltidsforbruget er præcist. Begrundelse: Den alternative metode udtrykker jo det vi ønsker at bevise, så den angiver, at differensen i middeltidsforbruget er større end. Såvel TI89 som SAS.JMP anvender et færdigt program, der anvender en testmetode (Satterthwaites metode), som er robust overfor mindre afvigelser fra kravet om normalitet, når blot antallet af gentagelser er den samme. Er det ikke tilfældet kan man stadig foretage testen, men så stilles der større krav til, at de variable X 1 og X virkelig er normalfordelte. Formlen for Satterthwaites metode kan findes i oversigten i kapitel Er den beregnede P-værdi < signifikansniveauet α forkastes H 0, dvs. vi har bevist den alternative hypotese H er sand. (sandsynligheden for vi dermed kommer med en forkert konklusion er mindre end α. Er P-værdien > signifikansniveauet α accepters H 0, dvs. vi kan ikke på dette grundlag bevise, at H er sand. Får man en accept og er P - værdien ikke meget større end signifikansniveauet α, så er det muligt at en stærkere t - test kunne give en forkastelse. Denne t-test kræver imidlertid at de to spredninger kan antages at være ens. 13

20 3. 1 Faktor på niveauer Dette er ofte tilfældet på grund af randomiseringen, men er man i tvivl herom kan man først foretage en test af om spredningerne er ens. Får man en accept heraf, har man naturligvis ikke hermed vist, at varianserne er ens, men da den følgende t - test af middelværdier er robust overfor mindre forskelle i varianserne, blot vi har samme antal gentagelser, er det tilladeligt i den følgende test af middelværdierne, at antage at varianserne er ens. Forklaring på formler For hver af de metoder udføres en række delforsøg. Lad antallet af forsøg være henholdsvis n 1 og n. Vi antager, at X 1 og X er statistisk uafhængige normalfordelte variable med henholdsvis middelværdierne og spredningerne σ 1 og σ. H0: µ 1 µ = eller H :µ µ d =, Nulhypotese d (d er i eksemplet -) µ 1 og µ Testproceduren baseres på fordelingen af differensen Y = X1 X d. Ifølge additionssætningen (se eventuelt Statistiske Grundbegreber) er Y normalfordelt og fra regnereglerne fås E( X1 X d) = E( X1) E( X) d = µ 1 µ d σ1 σ og V( X X d) V( X ) V( X ). 1 = 1 + = + n1 n Heraf følger, at U X X d 1 = er normeret normalfordelt. σ1 σ + n n 1 Teststørrelsen U X X d 1 = gælder kun, hvis spredningerne σ og er kendt eksakt. 1 σ σ1 σ + n n 1 s 1 s Kendes kun deres estimater og må der anvendes andre testprocedurer. Får man ved en F-test en accept af, at varianserne er ens, pooles varianserne sammen til en fælles gennemsnitlig 1 X1 X d varians ( se eventuelt oversigten i afsnit 3.5.1) og størrelsen t = = er nu t - fordelt. X X d s 0 s0 s0 + n n 1 s n n Hvis stikprøvestørrelserne er store (begge over 30) er det dog tilstrækkelig nøjagtigt at anvende U X X d 1 = som teststørrelse. s1 s + n n 1 I modsat fald kan anvendes en ret kompliceret procedure, der kaldes "Satterhwaite's metode". Denne er beskrevet i kapitel Eksempel 3.1. fortsat- løst med TI89 Hypoteserne omskrives til : µ + = µ H: µ + < µ H APPS, STAT/LIST, indtast data i list1 og list F6, 4: - SampTtest ENTER I den fremkomne menu vælg Data ok µ < µ I menu for list 1" skrives list1+, for alternative Hyp 1 og pooled til NO OK Man får P-værdi = Da P-værdi =6.09% > 0.05% accepteres H 0, dvs. det er ikke muligt på dette grundlag at bevise, at tidsforbruget ved metode M 1 er minutter mindre end ved metode M. 14

21 3.1 Normalfordelte variable Da P-værdien var så tæt ved 5%, vil vi nu forsøge med den stærkere t-test, hvor kravet er en fælles "poolet" spredning Vi gør som før, men retter nu poolet til YES Vi får som forventet en lidt mindre P-værdi = , men det giver stadig en accept, så konklusionen er den samme. Da P-værdien er så tæt ved 5% er der en god mulighed for, at tidsforbruget ved metode 1 faktisk er minutter mindre end ved metode (begår en fejl af type ). Det ville derfor være rimeligt at bede om at få foretaget flere forsøg. Havde vi fået en P-værdi < 0.05, så ville næste træk være at teste om spredningerne var ens (se eventuelt eksempel 3. hvordan), da vi ellers ikke måtte have anvendt den sidste metode. Eksempel 3.1. fortsat- løst med SAS.JMP Data indtastes i søjler, idet vi lægger til alle tal fra metode 1. metode m1 89,8 m1 93,9 m1 91,8 m1 91,0 m1 94,6 m1 91,4 m1 93,4 m1 90,7 m1 9,1 m m 9.4 m 94,6 m 93,0 m 94,0 m 9,4 m 9,9 m 99,4 m 9,1 m 9,8 m 93,4 tidsforbrug Analyze Fit y by x Y-Response:Tidsforbrug,x-Grouping: Metode OK rød pil, t-test t Test m-m1 Assuming unequal variances Difference 1,0900t Ratio 1,68317 Std Err Dif 0,6694DF 16,99463 Upper CL Dif,504Prob > t 0,119 Lower CL Dif -0,34Prob > t 0,0609 Confidence 0,95Prob < t 0,9391 Da P - værdi = > 0.05 accepteres nulhypotesen, dvs. det er ikke muligt på dette grundlag at bevise, at tidsforbruget ved metode M 1 er minutter mindre end ved metode M. 15

22 3. 1 Faktor på niveauer Test af Varians Som det ses af eksempel 3.1 kan det sjældent blive nødvendig at benytte den lidt stærkere metode, da P-værdien nok bliver mindre, kun sjældent så meget, at det har betydning for konklusionen. Imidlertid vil det i de næste kapitler være nødvendigt at teste om spredningen på stikprøver er ens. Dette sker ved en såkaldt F - test hvor teststørrelsen er F = s s F-fordelingen er beskrevet i afsnit 3.5., hvor også fremgangsmåden ved testningen er angive. Som det fremgår af eksempel 3. har såvel TI89 som SAS.JMP færdige programmer til testningen, så det er ikke nødvendigt at anvende teststørrelsen direkte. Eksempel 3.. Test af varians Samme problem som i eksempel 3.1 Undersøg ved en test på signifikansniveau på 5% om de to metoders varians er ens. Løsning:TI89 H 0 :σ 1 = σ mod H:σ σ 1 F6 9: - SampFtest ENTER, I menuen vælg Data Input Method= Data ENTER Menuen udfyldes, og man vælger alternative Hyp =, ENTER σ1 σ I udskrift findes P - værdi = Da P - værdi =0.471 > 0.05 accepteres H 0, dvs. vi vil i den følgende test antage, at spredningerne er ens. Løsning: SAS.JMP Data indtastes i søjler (se eksempel 3.1) H 0 :σ 1 = σ mod H:σ σ 1 Analyze Fit y by x Response:Tidsforbrug, Factor: Metode OK Cursor på rød pil Un-Equal Variance Blandt en række udskrifter forekommer nedenstående Tests that the Variances are Equal Level Count Std Dev MeanAbsDif to Mean MeanAbsDif to Median m1 10 1, , , m 10 1, , , Test F Ratio DFNum DFDen p-value O'Brien[.5] 0, ,4075 Brown-Forsythe 1, ,76 Levene 1, ,159 Bartlett 0, ,4709 F Test -sided 1, ,4711 I udskrift for F - test findes P - værdi = Da P - værdi =0.694 > 0.05 accepteres H 0, dvs. vi vil i den følgende test antage, at spredningerne er ens. 16

23 3.1 Normalfordelte variable Dimensionering. Eksempel 3.3 (fortsættelse af eksempel.) En fabrik der producerer maling, har udviklet to nye additiver A 1 og A, som bevirker en kortere tørretid. Additiv A 1 er det dyreste, men man forventer også, at det giver den korteste tørretid. På grund af prisforskellen, skal tørretiden dog være mindst 10 minutter kortere for A 1, før man vil gå over til den. For at undersøge disse forhold produceres nogle liter maling, som derefter deles op i mindre portioner. Til nogle af portionerne tilsættes additiv A 1 og til andre additiv A. Tørretiden måles derefter. a) Hvor mange delforsøg skal anvendes ved forsøget, hvis man ønsker, at P( fejl af type I ) = α 005., P( fejl af type II ) = β 010. og bagatelgrænsen =10 minutter, idet man fra mange tilsvarende forsøg ved, at den fælles spredning er σ = 1 minutter. b) Samme spørgsmål og krav som i spørgsmål a), men nu antages, at man ikke kender spredningen, men ud fra nogle få delforsøg skønner, at den er ca. 1 minutter. a) Af formlerne i oversigten i kapitel fås n u + u u + u + 1 α 1 β = = = σ dvs. der skal udføres i alt n = 5 delforsøg af hver behandling b) Idet første led er 4.67 fås t1 α ( n ) n = u1 α TI89: solve(x=4.67*(inv - t(0.95,(*x-))/invnorm(0.95))^,x) x > 4 Der kan nu gå 1 minut før lommeregneren finder en løsning x = 5.6 svarende til n 6 Eksempel 3.4. Data ikke opgivet På basis af dimensioneringen i eksempel 3.3 udførte man 6 delforsøg af hver behandling. Efter at forsøgsrækken var afsluttet, opdagede man, at et af forsøgene var mislykket og måtte kasseres. Der var følgelig kun 5 delforsøg med additiv A 1. For de to stikprøver fandt man, at Forsøgsrækken med A 1 : n = 6, x 1 = og s 1 = 113. Forsøgsrækken med A : n = 5 x = 19. og s = 14. a) Kan man ud fra disse data bevise på mindst signifikansniveau α = 0.05, at malingen med additivet A 1 tilsat har en mindre middeltørretid end konkurrentens? b) Hvad vil du anbefale virksomheden at gøre, hvis man som nævnt i eksempel 3.3 kun vil gå over til A 1 hvis middeltørretiden for A 1 er mindst 10 minutter kortere end for A (bagatelgrænsen). Løsning:TI89 X 1 = tørringstiden for maling tilsat additiv A 1. X = tørringstiden for maling tilsat additiv A. X 1 og X antages at være uafhængige normalfordelte variable med henholdsvis middelværdierne µ 1 og µ og spredningerne σ 1 og σ. a) Nulhypotese H 0 : µ 1 = µ, Alternativ hypotese: H:µ 1 < µ t - test: APPS STAT/LIST F6, 4 - SampTtest ENTER I den fremkomne menu vælg STATS OK (da forsøgsresultaterne resultater ikke er kendt) Menuen udfyldes bl.a. alternative Hyp µ 1 < µ og pooled til NO OK Da P-værdi = < 0.05 forkastes nulhypotesen Konklusion: Der er et stærkt statistisk bevis for at additiv A 1 i middel har en kortere tørringstid end additiv A.

24 3. 1 Faktor på niveauer b) Metode 1: Et 95% konfidensinterval for differensen: t - interval :APPS STAT/LIST F7, 4: - SampTint ENTER I den fremkomne menu vælg STATS OK (da forsøgsresultaterne resultater ikke er kendt) Menuen udfyldes bl.a. sættes pooled til NO OK Man får 95% konfidensinterval [ ; -3.15], dvs. tørretiden for A 1 er mellem 3 og 18 minutter kortere end for A. Konklusion: Da bagatelgrænsen er 10 minutter, og næsten 50% af konfidensintervallet ligger under 10, kan det ikke på baggrund af dette materiale anbefales at gå over til det mere kostbare additiv. Metode : Nulhypotese H 0 : µ = µ, Alternativ hypotese: H: µ < µ t - test: APPS STAT/LIST F6, 4 - SampTtest ENTER I den fremkomne menu vælg STATS OK Menuen udfyldes bl.a. x1 = 118,6+10 alternative Hyp µ < µ og pooled til NO OK 1 Man finder P-værdi = 43.6%, dvs., sandsynligheden for at begå en fejl, hvis man påstår, at additiv 1 har en 10 minutter kortere tørretid, er ca. 40%. Man vil derfor næppe gå over til additiv 1. Løsning:SAS.JMP SAS har ikke et særligt program for de tilfælde, hvor de oprindelige data ikke er kendt Man må benytte de formler der står i afsnit til beregningerne Parvise observationer (blokforsøg) Hvis observationerne i stikprøven udviser meget stor spredning, kan en test sandsynligvis ikke vise signifikans. Imidlertid er det måske så muligt at nedsætte spredningen ved at sammenligne observationerne to og to ( i par). Man siger også, at man opdeler i blokke. Det følgende eksempel illustrerer fremgangsmåden Eksempel 3.5. Parvise observationer En producent af malervarer har laboratorieresultater, der tyder på, at en ny lak A, har en større slidstyrke end den sædvanlige lak B. Han ønsker en afprøvning i praksis og aftaler med ejerne af 6 bygninger med mange trapper, at han må lakere deres trapper. Da der er meget forskelligt hvor mange personer der går på trapperne i de forskellige bygninger (sammenlign blot sliddet på en skole og et plejehjem) vælger man at foretage et blokforsøg, med de 6 bygninger som 6 blokke. I hver bygning lakeres hverandet trin (valgt ved lodtrækning) med lak A og resten mad lak B. Efter 3 måneders forløb måles graden af slid (i %) i hver bygning. De målte værdier af slid efter valg af plan var Bygning nr Ny lak Sædvanlig lak Undersøg om observationerne leverer et eksperimentelt bevis for, at den nye lak er mere slidstærk end den sædvanlige lak. 18

25 3.1 Normalfordelte variable Løsning Vi ser nu på differensen mellem sliddet i en bygning. (hvorved den store forskel mellem bygningerne elimineres) Lad D = X gammel - X ny Bygning nr d = x gammel - x ny ,3 D antages normalfordelt n( µ, σ ), hvor såvel µ som σ er ukendte. Da vi ønsker at teste om ny lak er mere slidstærk end gammel lak, dvs. den mest slidstærke lak slides mindst, bliver testen en ensidet t - test. Nulhypotese H 0 : µ 0 Alternativ hypotese H : µ > 0. TI89 Differensdata indtastes APPS, STAT/LIST F6, : t-test vælg Data Man finder x = 15. og P - værdi = PT ( > 15. ) = Da P - værdi = 3.63% < 5% forkastes H 0 (svagt), dvs. den ny lak er mere slidstærk end den gamle. SAS.JMP Data indtastes Ny lak Gammel lak 0,3 19,5 5,1 8,4 1,8 1,6 19,6 18,9 0,9 3,5 5,8.. Vælg Analyze Matched Pairs Y: Paired response:ny lak og Gammel lak OK Rød pil Fjern markering ved "Plot Diff by Mean Matched Pairs Difference: Gammel lak-ny lak Gammel lak 3,0333 t-ratio,6819 Ny lak 1,5333 DF 5 Mean Difference 1,5 Prob > t 0,076 Std Error 0,66131 Prob > t 0,0363* Upper 95% 3,19996 Prob < t 0,9637 Lower 95% -0, N 6 Correlation 0,8950 Heraf ses, at P-værdi = H 0 forkastes, dvs. ny lak mere slidstærk end gammel lak 19

26 3. 1 Faktor på niveauer 3. BINOMIALFORDELTE VARIABLE. Man kan ofte approksimere en binomialfordeling med en normalfordeling. Det er en sådan approksimation, som såvel formlerne i oversigten i afsnit bygger på som TI89's program: -Prop-Z-test. Forudsætningen er: X 1 og X er binomialfordelt henholdsvis bn ( 1, p1) og bn (, p) Observerede stikprøveværdier x 1 og x. x1 x x Lad p$, p$, 1 + x 1 = = $p =. Forudsætning: n1 p $ [ 5 ; n1 5], n [ ] p$ 5; n 5 n n n + n 1 1 I praksis vil disse forudsætninger for approksimation sædvanligvis være opfyldt. Vi belyser beregningerne ved følgende eksempel. Eksempel 3.6. Binomialfordelingstest. Ved et forsøg der skulle afgøre om C - vitamin har en forebyggende virkning mod forkølelse, fik halvdelen af en gruppe på 80 franske skiløbere C - vitamin mens de øvrige fik kalktabletter (placebobehandling). Fordelingen skete randomiseret, og forsøgspersonerne var uvidende om gruppeinddeling og hvilket medikament de fik. Efter en passende tid optaltes hvor mange af forsøgspersonerne der var forkølede. Resultaterne kan ses af følgende skema: Forkølet Ikke forkølet Total C-vitamin Kalktabletter Bemærk, at en enkelt forsøgsperson gled ud af forsøget, så grupperne blev ikke helt lige store. 1) Kan det på et signifikansniveau på 5% vises, at C - vitamin har en forebyggende virkning? ) I bekræftende fald angiv er 95% konfidensinterval for differensen mellem parametrene. Løsning TI89: X 1 = antal forkølede personer der har fået C-vitamin. X 1 er binomialfordelt b(139, p 1 ). X = antal forkølede personer der har fået Kalktabletter. X er binomialfordelt b(140, p ). 1) H0: p1 = pmod Hp : 1 < p (da vi ønsker at vise, at p1 < p). x1 17 x 31 x1 + x $p 1 = =, $p = = og $p = = =. n1 139 n 140 n1 + n Da n1 p$ = = 39. [ 5139 ; 5] og n p$ = = 41. [ 5140 ; 5] er forudsætningerne for at approksimere med normalfordelingen opfyldt. F6, 6 -Prop-ZTest Udfylder menu: Succes x1=17, n1= 139, succes x=31, n = 140, Alt. hyp : p1 < p Udskrift giver P- værdi= Da P - værdi = < 0.05 forkastes nulhypotesen (svagt) Konklusion: På signifikansniveau 5% er vist, at C-vitamin har en vis forebyggende virkning mod forkølelse, ) 95% konfidensinterval; F7, 6 -Prop-ZInt, menu udfyldes som under punkt 1. Udskrift viser C_int=[ ; ] 0

27 3.3 Poissonfordelte variable Løsning SAS.JMP: SAS.JMP benytter en såkaldt χ -test som først omtales i kapitel 9. Data indtastes: vitamin syg antal c forkølet 17 c ikke forkølet 1 kalk forkølet 31 kalk ikke forkølet 109 Vælg fra hovedmenu Analyze Fit y by x Response:Syg, Factor: vitamin Freq: Antal OK Resultat: Contingency Analysis of Syg By Vitamin Freq: Antal Tests Source DF -LogLike RSquare (U) Model 1, ,0190 Error 77 15,65610 C. Total 78 18,09195 N 79 Test ChiSquare Prob>ChiSq Likelihood Ratio 4,87 0,073 Pearson 4,811 0,083 Fisher's Exact Test Prob Alternative Hypothesis Left 0,005 Prob(Syg=ikke forkølet) is greater for Vitamin=c than kalk Right 0,9910 Prob(Syg=ikke forkølet) is greater for Vitamin=kalk than c -Tail 0,0385 Prob(Syg=ikke forkølet) is different across Vitamin P-værdi = 0.083/ = (ud for Pearson) (kun ved ensidet test divideres med ) Konklusion: På signifikansniveau 5% er vist, at C-vitamin har en vis forebyggende virkning mod forkølelse, 3.3 POISSONFORDELTE VARIABLE. Man kan ofte approksimere en Poisonfordeling med en normalfordeling. Det er en sådan approksimation, som formlerne i oversigten i afsnit bygger på. I praksis vil disse forudsætninger for approksimation sædvanligvis være opfyldt. Vi belyser anvendelsen af oversigten ved følgende eksempel (Hverken TI89 eller SAS.JMP har ikke et særligt program hertil). Eksempel 3.7. Poissonfordelingstest. En bestemt type TV-apparat produceres på fabrikker A og B. Man har mistanke om, at der er forskel på antallet af loddefejl der findes i apparater fra de to fabrikker. For at teste dette, udtages af den løbende produktion stikprøver på 0 TV-apparater, og man optalte antallet af loddefejl i de 0 apparater. Resultaterne blev: Fabrik A: På 0 apparater fandtes i alt 1 loddefejl Fabrik B: På 19 apparater fandtes i alt 7 loddefejl (et apparat måtte udskydes) Test på dette grundlag, om der er forskel på fejlintensiteten på de to fabrikker. Løsning. X 1 = antal loddefejl pr. apparat på fabrik A. X 1 antages Poissonfordelt p( µ 1 ). X = antal loddefejl pr. apparat på fabrik B. X antages Poissonfordelt p( µ ). H 0 :µ 1 = µ mod H:µ 1 µ (da vi ønsker at vise, at µ 1 µ ) Oversigten i kapitel anvendes : 1, x 1 = x =, og x = = =

28 3. 1 Faktor på niveauer Da n1 x = 0 19 = og n x = = er forudsætningerne for at approksimere med normalfordelingen opfyldt. Vi finder : 1 1 s= x + og n n = = x1 x = = Da P-værdi = P(Y > 0.316) = normcdf(0.316,,0,0.36) = > 0.05 accepteres nulhypotesen. Konklusion: Man kan ikke på det grundlag vise, at der er forskel på fejlintensiteten på de to fabrikker, SAS.JMP kan kun foretage denne test ved at foretage beregningerne i FORMULA FORDELING UKENDT (Rangtest) De testprocedurer vi har benyttet i de forrige kapitler har alle været baseret på, at i det mindste approksimativt kendte fordelingen (normal-, binomial- eller Poisson-fordelt) og testen vedrørte parametre i fordelingen såsom µ, σ eller p. Denne form for statistik kunne kaldes parametrisk statistik. Kendes fordelingen ikke, og kan man heller ikke approksimere den til en kendt fordeling, så må man benytte de såkaldte ikke- parametriske test. Disse forudsætter ikke, at fordelingen er kendt, og kunne derfor også kaldes fordelingsfri test. Da det ligger udenfor denne bogs centrale emner, men der findes en beskrivelse heraf i appendix 4

29 3.5 Oversigt over centrale formler i kapitel OVERSIGT OVER CENTRALE FORMLER I KAPITEL Test og konfidensinterval af differens µ µ mellem middelværdier µ og µ for 1 normalfordelte variable. X 1 og X er normalfordelte henholdsvis n( µ 1, σ1) og n( µ, σ). 1 x 1 x Givet stikprøver af X 1 og X. Størrelse, gennemsnit og spredning henholdsvis n 1,, s 1 og n,, s. Signifikansniveau er α. Lad d være en given konstant. Satterthwaites test: Forudsætning σ 1 og σ ukendte s n 1 s n c Forkortelser: a =, b =, c = a + b, g = a b 1 n n 1 T er t - fordelt med frihedsgradstallet f. Forudsætninger σ, σ ukendte 1 x1 x d t = c f er det nærmeste hele tal, som er større end g Alternativ hypotese H P - værdi Beregning H 0 forkastes µ 1 > µ +d PT ( t) TI89: tcdf (, t, f ) eller F6: -sampttest,pooled, No P - værdi<α µ 1 < µ +d PT ( t) TI89: tcdf (, t, f ) eller F6: -sampttest,pooled, No µ 1 µ +d PT ( t) for x1 > x + d PT ( t) for x < x + d 1 som række 1 som række 100 ( 1 α )% konfidensinterval for differens µ 1 µ : x x t ( f ) c µ µ x x + t ( f ) c 1 α TI89: F7, -SampTint,pooled, No α 1 P - værdi < 1 α dog hvis Ttest P - værdi<α U-test (eller Z-test):Forudsætning: σ 1 og σ kendt eksakt σ1 σ Forkortelser: x = x1 x d σ = + Y er normalfordelt n1 n n( µ, σ) Forudsætninger Alternativ hypotese H P - værdi Beregning H 0 forkastes σ1, σkendte µ 1 > µ +d PY ( x) TI89: normcdf ( x,, µ, σ) eller F6: -sampztest P - værdi<α µ 1 < µ +d PY ( x) TI89: normcdf (, x, µ, σ ) eller F6: -sampztest µ 1 µ +d PY ( x) for x1 > x + d PY ( x) for x < x + d 1 som række 1 som række 100 ( 1 α )% konfidensinterval for differens µ µ : x x u σ µ µ x x + u σ 1 α TI89: F7, -SampZint Parvise observationer (blokforsøg) α 1 1 P - værdi < 1 α dog hvis Ztest P - værdi<α 3

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK (med TI-Nspire og TI 89 ) 7. udgave 013 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics)

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics) MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics) DANMARKS TEKNISKE UNIVERSITET 6. udgave 005 FORORD Dette notat kan læses på

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 10.b 015 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen :

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 10a 015 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen :

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 11 016 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK med Excel. udgave 004 i FORORD Denne bog er en fortsættelse af lærebogen M. Oddershede Larsen : Statistiske grundbegreber. Det forudsættes, at man har rådighed

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Statistisk forsøgsplanlægning. med benyttelse af Statgraphics

Statistisk forsøgsplanlægning. med benyttelse af Statgraphics MOGENS ODDERSHEDE LARSEN Statistisk forsøgsplanlægning med benyttelse af Statgraphics Vekselvirkning CD 10 8 C 1 udbytte 6 4 0 1 3 4 D 11 udgave 00, DTU FORORD Dette notat er baseret på at de studerende

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Stastistik og Databehandling på en TI-83

Stastistik og Databehandling på en TI-83 Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen (jonas@imf.au.dk). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Statistik viden eller tilfældighed

Statistik viden eller tilfældighed MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 2. juni 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel.

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel. Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel. Kapitel Deskriptiv statistik Indhold 1. Generelle forhold... 1 Kapitel : Deskriptiv Statistik... 1 Kapitel 4: Normalfordelingen...

Læs mere

Eksempler fra bogen Videregående Statistik løst ved anvendelse af programmet SAS-JMP

Eksempler fra bogen Videregående Statistik løst ved anvendelse af programmet SAS-JMP 1 Generelle forhold ved opstart Eksempler fra bogen Videregående Statistik løst ved anvendelse af programmet SAS-JMP Indhold 1. Generelle forhold... 1 2. Beregning af sandsynlighedsfordelinger... 2 3.

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Empirisk Miniprojekt 2

Empirisk Miniprojekt 2 Empirisk Miniprojekt 2 Michael Bejer-Andersen, Thomas Thulesen og Emil Holmegaard Gruppe 5 26. November 2010 Indhold 1 Introduktion 2 1.1 Bane og Robot..................................... 2 1.2 Counter

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

2 0.9245. Multiple choice opgaver

2 0.9245. Multiple choice opgaver Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 30. maj 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 1 016 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M Oddershede Larsen : Statistiske

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X. Opgave I I en undersøgelse af et potentielt antibiotikum har man dyrket en kultur af en bestemt mikroorganisme og tilført prøver af organismen til 20 prøverør med et vækstmedium og samtidig har man tilført

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

VIDEREGÅENDE STATISTIK III Ikke parametriske test

VIDEREGÅENDE STATISTIK III Ikke parametriske test MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK III Ikke parametriske test Statistisk Kvalitetsstyring (Statgraphics) DANMARKS TEKNISKE UNIVERSITET 6. udgave 004 i FORORD Dette notat kan læses på baggrund

Læs mere

Maple-oversigt til matematik B-niveau: Rungsted Gymnasium Definer en funktion og funktionsværdier. Tegn grafen for en funktion.

Maple-oversigt til matematik B-niveau: Rungsted Gymnasium Definer en funktion og funktionsværdier. Tegn grafen for en funktion. Maple-oversigt til matematik B-niveau: Rungsted Gymnasium 2011 Definer en funktion og funktionsværdier (1.1) 32 (1.2) (1.3) Tegn grafen for en funktion (2.1) 250 200 150 100 50 0 5 10 8 6 4 2 0 1 2 0 y

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 1 016 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere