VIDEREGÅENDE STATISTIK

Størrelse: px
Starte visningen fra side:

Download "VIDEREGÅENDE STATISTIK"

Transkript

1 MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 10.b 015

2 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske grundbegreber. Læsning: Bogen er bygget op således, at de væsentligste begreber søges forklaret anskueligt og ved hjælp af et stort antal eksempler. I slutningen af nogle af kapitlerne er givet en oversigt over centrale formler eller fremgangsmåder. I et appendix sidst i bogen er givet en mere dybtgående statistisk forklaring på formlerne. Efter hvert kapitel er der nogle opgaver og en facitliste til opgaverne findes bagerst i bogen. Hypotesetest for 1 variabel er en repetition De tre hovedemner Faktorer på eller flere niveauer : kapitel 3, 6 og 7 Regressionsanalyse kapitel 8 og Kontrolteori : kapitel 4 og 5 kan læses stort set uafhængigt af hinanden. Kan man af tidsmæssige grunde ikke nå alt, så kan man overspringe en eller flere af delemner som Screeningsforsøg: kapitel 9, Multipel regression: afsnit 8.7 og 8.8 Statistisk godkendelseskontrol:kapitel 5. Regnemidler I eksemplerne er beregningerne er i videst mulig omfang foretaget ved anvendelse af PCprogrammet TI-Nspire idet dog der også er angivet ordrerne i lommeregnerne TI-nspire og TI-89. Man kan på min hjemmeside under statistik 3" finde bøger hvor der er anvendt statistikprogrammet STATGRAPHICS og regnearket EXCEL. Ønskes bøger indenfor grundlæggende statistik findes de også på ovenstående adresse under statistik " 14. august 015 Mogens Oddershede Larsen. -ii-

3 INDHOLD Indhold 1 REPETITION AF HYPOTESETEST FOR 1 VARIABEL 1.1 Indledning Normalfordelt variabel Binomialfordelt variabel... 3 Opgaver... 4 PLANLÆGNING AF FORSØG.1 Indledning Nomenklatur Krav til statistisk gyldigt forsøg FAKTOR PÅ NIVEAUER 3.1 Normalfordelte variable Test af differens mellem middelværdier Parvise observationer (blokforsøg) Binomialfordelte variable Poissonfordelte variable Fordeling ukendt (rangtest) Oversigt over centrale formler i kapitel Test og konfidensintervaller af differens mellem middelværdier for normalfordelte variable Test af differens mellem varians for normalfordelte variable Test og konfidensintervaller af p 1 - p for binomialfordelte variable Test og konfidensintervaller af for Poissonfordelte variable... 1 Opgaver STATISTISK PROCESKONTROL 4.1 Indledning Proces i statistisk kontrol Opbygning og alarmkriterier for kontrolkort Kontrolkortanalyse Procesvariablen er normalfordelt Stikprøvestørrelse større end Stikprøvestørrelse n = Tolerancegrænser og kapabilitet Procesvariablen X er diskret iii-

4 Indhold X er binomialfordelt X er Poissonfordelt... 4 Opgaver STATISTISK GODKENDELSESKONTROL 5.1 Indledning Enkelt stikprøveplan Rektificerende kontrol Dobbelt stikprøveplan... 5 Opgaver FAKTOR PÅ MERE END NIVEAUER 6.1 Indledning Ensidet variansanalyse (normalfordelte variable) Indledning Forklaring af metoder og formler Beregning af ensidet variansanalyse Fuldstændigt randomiseret blokforsøg Binomialfordelte variable Poissonfordelte variable Oversigt over centrale formler i kapitel Oversigt over fremgangsmåde ved ensidet variansanalyse Test af parametre p 1, p,..., p k for binomialfordelte variable Test af parametre 1,,..., k for Poissonfordelte variable Opgaver FAKTORER PÅ ELLER FLERE NIVEAUER. TOSIDET VARIANSANALYSE 7.1 Indledning Planlægning af forsøg Een faktor ad gangen Fuldstændig faktorstruktur Formler og metode Beregning af tosidet variansanalyse Fuldstændigt randomiseret blokforsøg To binomialfordelte eller Poissonfordelte faktorer i et fuldstændigt faktorforsøg Oversigt over fremgangsmåde ved tosidet variansanalyse iv-

5 Indhold Opgaver ENKELT REGRESSIONSANALYSE 8.1 Indledning Bestemmelse af regressionsligning Vurdering af om regressionsligning beskriver data godt Test og konfidensintervaller Transformation af data Enkelt regressionsanalyse med flere y - observationer for hver x - værdi Multipel regressionsanalyse Indledning Analyse med én y - observation for hver x - værdi Polynomial regressionsanalyse Indledning Beregning af polynomial regressionsanalyse Oversigt over fremgangsmåde ved regressionsanalyse... 1 Opgaver FLERE END TO FAKTORER, SCREENINGSFORSØG 9.1 Indledning Nomenklatur Definitionsrelationer og aliasrelationer Planlægning af et partielt k faktorforsøg Beregning af et partielt k faktorforsøg Konfundering af blokke Sekventiel forsøgsstrategi Oversigt over fremgangsmåde ved partielt k faktorforsøg Opgaver RANGTEST (FORDELING UKENDT) 10.1 Indledning Wilcoxons rangtest for 1 stikprøve Wilcoxons rangtest for uafhængig stikprøver Kruskal Wallis test Opgaver APPENDIX -v-

6 Indhold 4.1 Begrundelse for grænserne for kontrolkort Formler til beregning af ensidet variansanalyse Formler til beregning af tosidet variansanalyse Transformation af binomial-og Poissonfordelte variable til tosidet variansanalyse Formler til beregning af enkelt regressionsanalyse uden gentagelser Formler til beregning af enkelt regressionsanalyse med lige mange gentagelser Transformation til lineær model Formler til beregning af multipel regressionsanalyse Kruskal-Wallis rangtest for to eller flere variable GRUNDLÆGGENDE OPERATIONER PÅ TI89 og TI-Nspire FACITLISTE STIKORD vi-

7 1. Normalfordelt variabel 1 REPETITION AF HYPOTESETEST FOR 1 VARIABEL 1.1. INDLEDNING De grundlæggende begreber vedrørende hypotesetest, konfidensintervaller og dimensionering af forsøg blev i Statistiske Grundbegreber grundigt beskrevet når vi havde én stikprøve. Beregningerne blev der udført ved anvendelse af pc-programmet TI-Nspire og regnearket Excel. Vi vil i dette afsnit vise hvorledes beregningerne også kan udføres med statistikprogrammet SAS- JMP, samt vise, hvorledes man ved hjælp af SAS.JMP grafisk kan undersøge om data virkelig er normalfordelt. I Afsnittet Grundlæggende Operationer i SAS-JMP er beskrevet, hvorledes man indtaster data, import af data fra Excel og beregner de forskellige sandsynlighedsfunktioner. 1.. NORMALFORDELT VARIABEL Eksempel 1.1 Hypotesetest. Normalfordelt variabel. En fabrik der fremstiller plastikprodukter ønsker at evaluere hårheden af rektangulære støbte plastik blokke som anvendes i møbelfabrikationen. Der udtages tilfældigt 50 blokke, og deres hårhed måles (i Brinell enheder). Resultaterne var følgende a) Undersøg om tallene er rimeligt normalfordelt ved at tegne et histogram, et boxplot og et normalfordelingsplot. Angiv endvidere gennemsnit og spredning. b) Hårheden bør være over 60 (brinell enheder). Test på et signifikansniveau på = 5% om dette er tilfældet. c) Forudsat hårheden er signifikant over 60 brinell, skal angives et estimat for hårheden, samt et 95% konfidensinterval for denne. Løsning: a) Lister og regneark kald liste eksempelvis for x, og indtast data. Da vi ønsker at tegne et histogram, med lige store intervaller, og med ca intervaller, vælges Indsæt noter matematikfelt beregninger statistik listematematik maksimum osv. 1

8 1. Repetition af centrale begreber Histogram: Marker listen ved at trykke på listebogstav (A), højre musetast vælg Data hurtiggraf højre musetast på graf vælg histogram Der fremkommer nu et histogram Højre musetast på figur vælg søjleindstillinger lige store intervaller vælg bredde og start vælg bredde 0 søjlestart 190 skala procent. Histogrammet ser nogenlunde symmetrisk ud med et enkelt maksimum, så det tyder på at data er normalfordelt Boxplot Gentag, men vælg nu boxplot fremfor histogram. Den midterste streg angiver medianen og kassens grænser angiver henholdsvis 1. og 3. kvartil. Det betyder, at hvis man opstillede de 50 tal i rækkefølge efter størrelse, så er tal nr 50/ =5 medianen. Peger man på linien fremgår det, at median er kvartil er osv. Da boxplottet er nogenlunde symmetrisk om medianen, så kan man igen antage at data er rimelig normalfordelt. De isolerede prikker yderst viser, at der er et par værdier, som afviger kraftigt fra de øvrige, og muligvis er fejlmålinger (kaldes outliers). Normalfordelingsplot Gentag, men vælg nu normalfordelingsplot. Her har man ud af y - aksen sørget for at skalaen er sådan, at punkterne burde ligge på den rette linie, hvis de fuldstændigt eksakt var normalfordelt. Den rette linie går gennem (mean, 0) Som det ses, ligger punkterne tæt på linien for de midterste 75% af tallenene. De yderste punkter kan man ikke forvente ligger på linien

9 Man må derfor igen antage, at data er tilnærmelsesvis normalfordelt. I noter vælges som da man fandt maksimum Gennemsnittet x = Spredningen s = 5.11 b) X = holdbarheden af plastblokke X antages normalfordelt med ukendt middelværdi og. H 0 : =60 H: >60 Da spredningen ikke er kendt eksakt anvendes en t-test. 1.3 Binomialfordelt variabel TI-Nspire: Beregner Statistik Statistiske test t-test for 1 middelværdi statistik data menu udfyldes ENTER TI 89: APPS, STAT/LIST F6 : t-test vælg data ENTER menu udfyldes,enter Vi får: P-værdi = P- værdien = sandsynligheden for at begå en "type 1 fejl", dvs. påstå at 0 =60 selv om det ikke er tilfældet. Da P-værdi = 4.9 % < 5%, forkastes H 0 (svagt). Konklusion: Vi har bevist, at holdbarheden i middel er over 60 brinell. c) TI-Nspire: Beregner Statistik konfidensintervaller t-interval for 1 middelværdi statistik menu udfyldes ENTER TI 89: APPS, STAT/LIST F7 : t-inteval Stats ENTER Udfyld den fremkomne menu Calculate, Enter Et estimat for holdbarheden er 66. brinell Et 95% konfidensinterval [59.1 ; 73.3] 1.3. BINOMIALFORDELT VARIABEL Eksempel 1.. Binomialtest En fabrikant af chip til computere reklamerer med, at højst % af en bestemt type chip, som fabrikken sender ud på markedet er defekte. Et stort computerfirma, vil købe et meget stort parti af disse chip, hvis påstanden er rigtigt. For at teste påstanden købes 1000 af dem. Det viser sig, at 33 ud af de 1000 er defekte. a) Kan fabrikantens påstand på denne baggrund forkastes på signifikansniveau 5%? b) Forudsat påstanden forkastes, skal angives et estimat for % defekte, samt et 95% konfidensinterval for denne. Løsning: X = antal defekte chips af 1000 X er binomialfordelt b(1000, p). Nulhypotese: H: p 00. Alternativ hypotese Hp : 00. TI89+ TI-Nspire a) Pværdi P( X 33) = binomcdf(1000,0.0,33,1000)= Da P-værdi < 0.05 forkastes H 0, dvs. fabrikantens påstand om færre end % defekte forkastes. b) Da x = 33 >5 og 33 < kan approksimeres med normalfordelingen TI-Nspire:Beregner Statistik konfidensintervaller z-interval for 1 andel menu udfyldes ENTER TI89: APPS, STAT/LIST F7 5: 1-Prop-Z-interval udfyld menu Estimat for p: 3.3% 95% konfidensinterval : {.19% ; 4.41%] 3

10 1. Repetition af centrale begreber OPGAVER Opgave 1.1 Færdselspolitiet overvejede, om der burde indføres en fartgrænse på 70 km/h på en bestemt landevejsstrækning, hvor der hidtil havde været fartgrænsen 80 km/h. Som et led i analysen af hensigtmæssigheden af den overvejede ændring observeredes inden for et bestemt tidsrum ved hjælp af radarkontrol de forbipasserende bilers fart. Resultatet af målingerne var: 50 observationer Undersøg om tallene er rimeligt normalfordelt ved i TI-Nspire, at tegne et histogram, et boxplot og et normalfordelingsplot. Angiv endvidere gennemsnit og spredning. Opgave 1. Under produktionen forekommer blandt en fabriks affaldsprodukter 1.5 mg/l af et stof A., som i større mængder kan være kræftfremkaldende. Man håber ved en ny og mere kostbar metode, at formindske indholdet af det pågældende stof. a) Ved en række kontrolmålinger efter tilsætning af additivet fandtes følgende resultater (i mg/l) Test på 5% niveau, om målingerne beviser, at der er sket en formindskelse af middelindholdet af stoffet A. b) Forudsat middelindholdet er signifikant under 1.5 mg/l, skal angives et estimat for det nye middelindhold, samt et 95% konfidensinterval for denne. Opgave 1.3 Det forventes, at lovgivningen bliver strammet omkring mængden af skadelige partikler i bilers udstødningsgas. En person mener, at mere end 0% af forsvarets biler ikke vil opfylde de forventede nye krav. Ved en undersøgelse af 40 af forsvarets biler tilfældigt udvalgt, fandt man, at 13 af disse ikke kunne opfylde de nye krav. 1) Test om dette på et signifikansniveau på 5 % er et bevis for, at mere end 0% af forsvarets biler udsender flere skadelige partikler end ønskeligt. ) Under forudsætning af at det er signifikant, at 0% af bilerne ikke opfylder kravet, skal man angive et estimat for hvor mange procent af bilerne, der ikke opfylder de nye krav, samt angive et 95% konfidensinterval herfor. 4

11 Opgaver til kapitel 1 Opgave 1.4 Indenfor en stor virksomhed, der producerer udstyr til forsvaret, er der i middel 0 driftsuheld pr. måned. Da antallet efter indførelsen af nye arbejdsrutiner synes at være vokset målte man i 5 på hinanden følgende måneder antallet af driftsuheld. Resultaterne var måned nr antal/måned Test, om disse data giver et eksperimentelt bevis for, at middelværdien er større end 0 driftsuheld/måned? 5

12 . Planlægning af forsøg PLANLÆGNING AF FORSØG.1. INDLEDNING Forsøg er en naturlig del af ingeniørmæssig og anden videnskabelig metode til at træffe beslutninger. Antag eksempelvis, at en ingeniør skal studere virkningerne af 4 hærdningsmetoder på trykstyrken af et materiale. Forsøget ville bestå i, at man fremstillede en række testmaterialer baseret på de 4 hærdningsmetoder, og derefter målte trykstyrken. På basis af disse data kunne man så anvende en statistisk metode til at finde den af de 4 metoder der i middel gav den største trykstyrke. Alle forsøg er planlagte forsøg, men desværre er nogle forsøg særdeles dårlig planlagt, og resulterer i at kostbare ressourcer bliver benyttet ineffektivt. Statistisk planlagte forsøg giver effektivitet og økonomi i den eksperimentelle proces, og brug af statistiske metoder i undersøgelsen af data resulterer i en videnskabelig objektivitet når man skal drage konklusioner. Statistisk baserede forsøg er særlig nyttige til at forbedre en fremstillingsproces eller til at udvikle nye metoder. Ved at benytte statistisk planlagte forsøg, kan ingeniøren bestemme hvilke af de mange procesvariable, såsom temperatur, tryk, hærdningsmetoder osv. der har den største betydning for udfaldet af processen. Brugen af statistisk baserede forsøg kan derfor resultere i produkter, der er lettere at producere, produkter der har en bedre performance og stabilitet (mindre spredning) end konkurrenternes produkter, og kan blive udviklet og produceret på mindre tid, hvilket reducerer udviklingsomkostningerne... NOMENKLATUR I de følgende kapitler benyttes ord, som faktor, niveauer, behandlinger osv. For at forstå hvad disse ord betyder, vil vi forklare dem ud fra følgende forsøg: Eksempel.1 Nomenklatur I forbindelse med nogle brudstyrkebestemmelser for Portland-cement udføres et fuldstændigt randomiseret forsøg til undersøgelse af middelbrudstyrkens afhængighed af cementblandere og cementknusere. Med hver af 3 cementblandere udstøbtes efter blanding med vand 1 cementterninger, som efter en uges lagring underkastedes en brudstyrkeprøve ved hjælp af en af 4 cementknusere. Forsøgsresultaterne var: 6

13 .3.Krav til statistisk gyldigt forsøg Cementknusere B 1 B B 3 B 4 Cementblandere A A A Beskriv forsøget. Løsning: Forsøget har to faktorer: Cementblander og Cementknuser. Faktoren Cementblander har 3 niveauer A 1,A, A 3. (niveau hedder på engelsk level ) Faktoren Cementknuser har 4 niveauer B 1,B, B 3., B 4 Forsøget har 1 behandlinger (engelsk treatment) A 1 B 1, A 1 B, A 1 B 3, A 1 B 4, A B 1, A B, A B 3, A B 4,A 3 B 1, A 3 B, A 3 B 3, A 3 B 4 da der er 1 kombinationer af niveauerne (1 celler) Hver behandling har 3 gentagelser, eksempelvis har behandlingen A 1 B 1 3 delforsøg, der resulterede i forsøgsresultaterne Faktorer kan enten være kvalitative eller kvantitative. En faktor som temperatur er kvantitativ, da den jo er en talvariabel, der kan antage alle mulige talværdier (indenfor et givet talområde). En faktor som Cementblander i eksempel.1 er kvalitativ, da den kun har nogle fastlagte niveauer, og man ikke kan tale om eksempelvis cementblander KRAV TIL STATISTISK GYLDIGT FORSØG For at nogle forsøgsresultater skal være statistisk gyldige, skal målingerne være statistisk uafhængige og være repræsentative for det man skal undersøge. Ved statistisk uafhængighed forstås, at resultatet af et delforsøg ikke må afhænge af hvad der skete i de øvrige delforsøg. Det er således ikke korrekt, hvis det arbejdshold, der foretager forsøgene først laver forsøgene med den ene cementblander- derved bliver dygtigere- og så laver forsøgene med de øvrige cementblandere. Det er heller ikke korrekt, at man eksempelvis i eksempel 1.1 først havde målt holdbarheden af 10 blokke, - derefter foretager en test-opdager at man ikke kan vise signifikans. Så tager man 10 blokke mere - testet på de 0 blokke osv., indtil man opnåede signifikans. Dette er ikke "statistisk gyldige" forsøg. 7

14 . Planlægning af forsøg Til belysning af hvad der er et "statistisk" gyldigt forsøg tages udgangspunkt i følgende eksempel. Eksempel.. Planlægning af forsøg. En fabrik der producerer maling, har udviklet to nye additiver A 1 og A, som bevirker en kortere tørretid. Additiv A 1 er det dyreste, men man forventer også, at det giver den korteste tørretid. På grund af prisforskellen, skal tørretiden dog være mindst 10 minutter kortere for A 1, før man vil gå over til den. For at undersøge disse forhold produceres nogle liter maling, som derefter deles op i mindre portioner. Til nogle af portionerne tilsættes additiv A 1 og til andre additiv A. Tørretiden måles derefter. Generelt gælder, at hvert delforsøg i et forsøg udføres under en række forsøgsbetingelser. Alle andre delforsøgsbetingelser end behandlingerne sammenfattes i et begreb, der kaldes forsøgsenheden. I eksempel. er additiverne = behandlingerne og forsøgsenhederne er den enkelte portion maling, anvendt apparatur og personale, tidspunkt for delforsøget og de forhold med hensyn til temperatur, luftfugtighed osv., som gælder på forsøgstidspunktet. Bemærk, at forsøgsenhederne ofte indeholder faktorer, som ikke kan gøres ensartet fra delforsøg til delforsøg. Dette bevirker, at resultatet af de enkelte delforsøg varierer. Dette giver forsøgsvariablens variation eller kort forsøgets støj. Randomisering For at sikre et statistisk gyldigt forsøg foretager man en såkaldt fuldstændig randomisering. Dette betyder at man ved lodtrækning fordeler forsøgsenhederne tilfældigt på behandlingerne. Dette sker, for at man ikke ubevidst kommer til at favorisere en af de to behandlinger. Hvis man eksempelvis helt systematisk i eksempel. først laver alle delforsøg med additiv A 1, kunne dette bevirke en favorisering af A 1 nemlig hvis forsøgsomstændighederne (apparater, personale, luftfugtighed ) er mest gunstige ved begyndelsen af forsøgsperioden. For at anskueliggøre denne randomiseringsproces antager vi, at vi i eksempel. skal lave 4 delforsøg med hver additiv. Endvidere antages, at delforsøgene skal indgå i den almindelige produktionsgang, dvs. at man af tidsmæssige, personalemæssige og på grund af en begrænset mængde apparatur må lade forsøgene forløbe over flere dage. Man tror ikke, at dage, apparatur og laborant har nogen væsentlig betydning for forsøgsresultaterne. Der er sandsynligvis også andre forhold udenfor vor kontrol, og som tilsammen bevirker, at selv om man udfører gentagne delforsøg med samme behandling, så får vi afvigende resultater. For en sikkerheds skyld vælger vi imidlertid at randomisere dage, apparatur og laboranter Lad os antage at der gælder følgende: Mandag er det kun muligt at lave 1 delforsøg, idet apparatur nr. 1 og laborant A er de eneste der er ledige. Tirsdag er der kapacitet ledig til 3 delforsøg: Ét delforsøg hvor apparatur nr og laborant A benyttes Ét delforsøg hvor apparatur nr 1 og laborant B benyttes, og Ét delforsøg hvor apparatur nr 3 og laborant C benyttes. Onsdag kan der også laves 3 delforsøg osv. (se det følgende skema). 8

15 .3.Krav til statistisk gyldigt forsøg Forsøgsenheder Dag Apparatur Laborant mandag 1 A tirsdag A tirsdag 1 B tirsdag 3 C onsdag 3 B onsdag 4 C onsdag 1 A torsdag 3 B Behandlinger (additiv) Vi foretager nu randomiseringen, som kort sagt er en form for lodtrækning. Sædvanligvis vil man benytte et program, der kan generere tilfældige tal (mange lommeregnere har et sådant program). For at anskueliggøre randomiseringen vil vi mere primitivt foretage lodtrækningen på følgende måde. På 4 sedler skrives A 1, på andre 4 sedler skrives A. Hver seddel krølles sammen til en kugle og placeres i en dåse. Sedlerne blandes ved at dåsen rystes (se figur). Hvis den første seddel der udtrækkes er A så betyder det, at det delforsøg der mandag udføres med apparatur 1 og laborant A skal anvende additiv A. Hvis den næste seddel der udtrækkes er A 1 så betyder det, at det delforsøg der tirsdag udføres med apparatur og laborant A skal anvende additiv A 1 osv. Resultaterne kunne eksempelvis være som angivet på følgende skema: Forsøgsenheder Behandlinger Dag Apparatur Laborant (additiv) mandag 1 A A tirsdag A A 1 tirsdag 1 B A 1 tirsdag 3 C A onsdag 3 B A onsdag 4 C A 1 onsdag 1 A A torsdag 3 B A 1 På denne måde sikrer man sig, at vi får et så vidt muligt "statistisk gyldigt" forsøg. Hvis vi derfor efter beregninger (som ses i de følgende kapitler ) konkluderer, at der er forskel på additiverne, så er det "korrekt", idet det ville være helt tilfældigt, hvis én af additiverne har været begunstiget med særlig gode forsøgsenheder. Herved har man også sikret sig, at de to stikprøver (variable) er statistisk uafhængige. 9

16 . Planlægning af forsøg Forsøg bør udføres, så alle behandlinger får lige mange gentagelser. Ved planlægningen af forsøget er det ganske klart, at hvis man eksempelvis har ressourcer til at lave 0 delforsøg, så ville det være en meget dårlig plan, hvis man lavede 18 delforsøg med A 1 og kun delforsøg med A. Der bør i naturligvis tilstræbes at lave 10 delforsøg med hver behandling. Delforsøg kan mislykkes, så målet i praksis ikke bliver opfyldt. I sådanne tilfælde kan de i de følgende kapitler anførte statistiske analyser dog stadig gennemføres. Testene bliver dog mindre robuste (dvs. mere afhængige af, at forudsætningerne gælder), og beregningerne mere komplicerede. Dimensionering Man kan fristes til at tro, at jo flere gentagelser jo bedre. s Da spredningen på et gennemsnit er, er det klart, at hvis antal forsøg n er stort bliver n spredningen lille, og så kan man finde, at der er en signifikant forskel selv om denne forskel er lille. Imidlertid risikerer man med mange gentagelser at opdage så små forskelle, at de ikke har praktisk betydning, og så er de mange delforsøg jo spild af arbejdskraft og penge. Endvidere gælder det jo, at hvis man laver 5 forsøg, så er spredningen formindsket med en faktor 5, mens hvis man laver 100 forsøg så er spredningen formindsket med en faktor 10. Der skal derfor særdeles mange forsøg til for alvor at formindske spredningen på gennemsnittet. Analogt med forklaringen i Statistiske Grundbegreber kan man under visse forudsætninger beregne hvor mange gentagelser (portioner) der skal anvendes for hver behandling, hvis P( fejl af type I) og P( fejl af type II). Man skal naturligvis angive en bagatelgrænse, men desuden kræver beregningerne, at spredningerne ved de to behandlinger er (tilnærmelsesvis) ens, og at man kan give et nogenlunde realistisk skøn for denne fælles spredning. Det er naturligvis en svaghed ved dimensioneringen, at man inden forsøget er udført skal give et sådant skøn. En vurdering heraf kunne baseres på erfaringer fra tilsvarende forsøg. Findes sådanne erfaringer ikke må man først lave nogle få delforsøg og derfra få et rimeligt gæt på spredningen σ. At spredningerne er nogenlunde ens vil i praksis ofte være tilfældet, da forsøgsenhederne jo er valgt ved randomisering. Når forsøget så er lavet, kan man (lidt sent) se, om man har skønnet rigtigt. Dimensioneringen har kun betydning hvis man får en accept, da man så ved, at en eventuel forskel ikke har praktisk betydning. Hvis man får en forkastelse, så ved man der er en signifikant forskel, men om den er af praktisk betydning må en nærmere undersøgelse vise. Formler for dimensionering af variable findes i oversigten i kapitel 3, afsnit

17 3 1 Faktor på to niveauer 3.1 Normalfordelte variable 3.1. NORMALFORDELTE VARIABLE Test af differens mellem middelværdier I dette afsnit benyttes et eksempel til at forklare metode, teststørrelse osv. Derefter vises hvorledes det samme eksempel regnes med TI-Nspire/TI89. Eksempel 3.1. Sammenligning af normalfordelte variable To produktionsmetoder M1 og M ønskes sammenlignet. Der udvælges tilfældigt 0 personer, hvoraf de 10 bliver sat til at arbejde med den ene metode, og de 10 andre med den anden. Efter ugers forløb, beregnede man for hver person det gennemsnitlige tidsforbrug pr. enhed. Da metode 1 er mere kostbar end metode, ønsker man kun at gå over til den, hvis tidsforbruget pr. enhed ved metode 1 er mindst minutter mindre end ved metode. Man fik følgende resultater. M M Undersøg på basis af disse resultater, om det på et signifikansniveau på 5% kan påvises at tidsforbruget ved metode M 1 er mindst minutter mindre end ved metode M. Løsning: a) Lad X 1 = tidsforbrug ved anvendelse af metode M 1 og X = tidsforbrug ved anvendelse af metode M. X 1 og X antages approksimativt normalfordelte med middelværdi og spredning henholdsvis, og,. 1 1 H 0 : 1 Begrundelse: Nulhypotesen udtrykker, at påstanden ikke er opfyldt (nul virkning). H: 1 Begrundelse: Den alternative metode udtrykker det vi ønsker at bevise, så den angiver, at differensen i middeltidsforbruget er større end. I beregningerne antager man, at H 0 : 1, da en forkastelse så sikrer, at H gælder. Ti-maskinerne anvender et færdigt program, der anvender en testmetode (Satterthwaites metode), som er robust overfor mindre afvigelser fra kravet om normalitet, når blot antallet af gentagelser er den samme. Er det ikke tilfældet kan man stadig foretage testen, men så stilles der større krav til, at de variable X 1 og X virkelig er normalfordelte. Formlen for Satterthwaites metode kan findes i afsnit 3.5 oversigt Er den beregnede P-værdi < signifikansniveauet forkastes H 0, dvs. vi har bevist den alternative hypotese H er sand. (sandsynligheden for vi dermed kommer med en forkert konklusion er mindre end ). Er P-værdien > signifikansniveauet accepters H 0, dvs. vi kan ikke på dette grundlag bevise, at H er sand. Får man en accept og er P - værdien ikke meget større end signifikansniveauet, så er det muligt at en stærkere t - test kunne give en forkastelse. Denne stærkere t-test kræver imidlertid at de to spredninger kan antages at være ens. 11

18 3. 1 Faktor på niveauer Dette er ofte tilfældet på grund af randomiseringen, men er man i tvivl herom kan man først foretage en test af om spredningerne er ens. Får man en accept heraf, har man naturligvis ikke hermed vist, at varianserne er ens, men da den følgende t - test af middelværdier er robust overfor mindre forskelle i varianserne, blot vi har samme antal gentagelser, er det tilladeligt i den følgende test af middelværdierne, at antage at varianserne er ens. Forklaring på formler For hver af de metoder udføres en række delforsøg. Lad antallet af forsøg være henholdsvis n 1 og n. Vi antager, at X 1 og X er statistisk uafhængige normalfordelte variable med henholdsvis middelværdierne og spredningerne 1 og. H : d H : d Nulhypotese (d er i eksemplet -), eller, og Testproceduren baseres på fordelingen af differensen Y X1 X d. Ifølge additionssætningen (se eventuelt Statistiske Grundbegreber) er Y normalfordelt og fra regnereglerne fås EX1 X d EX1EXd 1 d 1 og VX X d VX VX. 1 1 n1 n Heraf følger, at U X X d 1 er normeret normalfordelt. 1 n1 n Teststørrelsen U X X d 1 gælder kun, hvis spredningerne og er kendt eksakt. 1 1 n n 1 s 1 s Kendes kun deres estimater og må der anvendes andre testprocedurer. Får man ved en F-test en accept af, at varianserne er ens, pooles varianserne sammen til en fælles gennemsnitlig 1 X1 X d varians ( se eventuelt oversigten i afsnit 3.5.1) og størrelsen t = er nu t - fordelt. X X d s 0 s0 s0 n n 1 s n n Hvis stikprøvestørrelserne er store (begge over 30) er det dog tilstrækkelig nøjagtigt at anvende U X X d 1 som teststørrelse. s1 s n n 1 I modsat fald kan anvendes en ret kompliceret procedure, der kaldes "Satterhwaite's metode". Denne er beskrevet i afsnit Eksempel 3.1. fortsat Hypoteserne omskrives til : H: H TI-Nspire: Lister og regneark Udfyld lister med overskrift m1 og m Statistik statistiske test t-test for middelværdier menu:data ok menu: List1: benyt pil til at vælge m1" og skriv + List : Vælg m" alternative Hyp 1 samlet: nej ok TI89: APPS, STAT/LIST, indtast data i list1 og list F6, 4: - SampTtest ENTER I den fremkomne menu vælg Data ok I menu for list 1" skrives list1+,i menu for list " skrives list for alternative Hyp 1 og pooled til NO OK Man får P-værdi = Da P-værdi =6.09% >5% accepteres H 0, dvs. det er ikke muligt på dette grundlag at bevise, at tidsforbruget ved metode M 1 er minutter mindre end ved metode M. 1 1

19 3.1 Normalfordelte variable Da P-værdien var så tæt ved 5%, vil vi nu forsøge med den stærkere t-test, hvor kravet er en fælles "poolet" spredning Vi gør som før, men retter nu samlet (poolet) til ja (yes). Vi får som forventet en lidt mindre P-værdi = , men det giver stadig en accept, så konklusionen er den samme. Da P-værdien er så tæt ved 5% er der en god mulighed for, at tidsforbruget ved metode 1 faktisk er minutter mindre end ved metode (begår en fejl af type ). Det ville derfor være rimeligt at bede om at få foretaget flere forsøg. Havde vi fået en P-værdi < 0.05, så ville næste træk være at teste om spredningerne var ens (se eventuelt eksempel 3. hvordan), da vi ellers ikke måtte have anvendt den sidste metode. Test af Varians Som det ses af eksempel 3.1 kan det sjældent blive nødvendig at benytte den lidt stærkere metode, da P-værdien nok bliver mindre, kun sjældent så meget, at det har betydning for konklusionen. Imidlertid vil det i de næste kapitler være nødvendigt at teste om spredningen på stikprøver er ens. Dette sker ved en såkaldt F - test hvor teststørrelsen er F = s 1 s F-fordelingen er beskrevet i afsnit 3.5., hvor også fremgangsmåden ved testningen er angive. Som det fremgår af eksempel 3. har TI-maskinerne færdige programmer til testningen, så det er ikke nødvendigt at anvende teststørrelsen direkte. Eksempel 3.. Test af varians Samme problem som i eksempel 3.1 Undersøg ved en test på signifikansniveau på 5% om de to metoders varians er ens. Løsning: H 0 : 1 mod H: 1 TI-Nspire: Statistik Statistiske test F-test for spredninger data - menu udfyldes ENTER TI89: F6 9: - SampFtest ENTER, I menuen vælg Data Input Method= Data ENTER Menuen udfyldes, og man vælger alternative Hyp = 1, ENTER I udskrift findes P - værdi = Da P - værdi =0.471 > 0.05 accepteres H 0, dvs. vi vil i den følgende test antage, at spredningerne er ens. 13

20 3. 1 Faktor på niveauer Dimensionering. Eksempel 3.3 (fortsættelse af eksempel.) En fabrik der producerer maling, har udviklet to nye additiver A 1 og A, som bevirker en kortere tørretid. Additiv A 1 er det dyreste, men man forventer også, at det giver den korteste tørretid. På grund af prisforskellen, skal tørretiden dog være mindst 10 minutter kortere for A 1, før man vil gå over til den. For at undersøge disse forhold produceres nogle liter maling, som derefter deles op i mindre portioner. Til nogle af portionerne tilsættes additiv A 1 og til andre additiv A. Tørretiden måles derefter. a) Hvor mange delforsøg skal anvendes ved forsøget, hvis man ønsker, at P( fejl af type I) 005., P( fejl af type II) 010. og bagatelgrænsen =10 minutter, idet man fra mange tilsvarende forsøg ved, at den fælles spredning er = 1 minutter. b) Samme spørgsmål og krav som i spørgsmål a), men nu antages, at man ikke kender spredningen, men ud fra nogle få delforsøg skønner, at den er ca. 1 minutter. a) Af formlerne i oversigten i kapitel fås n u u u u dvs. der skal udføres i alt n = 5 delforsøg af hver behandling t1 ( n ) b) Idet første led er 4.67 fås n u1 TI89+TI-Nspire: solve(x=4.67*(inv - t(0.95,(*x-))/invnorm(0.95))^,x) x 4 Der kan nu gå op til 1 minut før der findes en løsning x = 5.6 svarende til n 6 Eksempel 3.4. Oprindelige data ikke opgivet På basis af dimensioneringen i eksempel 3.3 udførte man 6 delforsøg af hver behandling. Efter at forsøgsrækken var afsluttet, opdagede man, at et af forsøgene var mislykket og måtte kasseres. Der var følgelig kun 5 delforsøg med additiv A. For de to stikprøver fandt man, at Forsøgsrækken med A 1 : n = 6, x og s Forsøgsrækken med A : n = 5 x 19. og s 14. a) Kan man ud fra disse data bevise på mindst signifikansniveau = 0.05, at malingen med additivet A 1 tilsat har en mindre middeltørretid end konkurrentens? b) Hvad vil du anbefale virksomheden at gøre, hvis man som nævnt i eksempel 3.3 kun vil gå over til A 1 hvis middeltørretiden for A 1 er mindst 10 minutter kortere end for A (bagatelgrænsen). Løsning: X 1 = tørringstiden for maling tilsat additiv A 1. X = tørringstiden for maling tilsat additiv A. X 1 og X antages at være uafhængige normalfordelte variable med middelværdierne 1 og. a) Nulhypotese H 0 : 1, Alternativ hypotese: H:1 TI-Nspire: Lister og regneark Statistik Statistiske test t-test for middelværdier Statistik (da forsøgsresultaterne resultater ikke er kendt) Udfyld menu bl.a. alternativ Hyp og samlet til nej ENTER 1 TI89: APPS STAT/LIST F6, 4 - SampTtest ENTER I den fremkomne menu vælg STATS OK (da forsøgsresultaterne resultater ikke er kendt) Menuen udfyldes bl.a. alternative Hyp 1 og pooled til NO OK 14

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK (med TI-Nspire og TI 89 ) 7. udgave 013 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 10a 015 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen :

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK (med TI 89 og SAS - JMP) 5. udgave 011 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics)

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics) MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK I Sammenligning af to eller flere kvalitative variable (TI 89 og Statgraphics) DANMARKS TEKNISKE UNIVERSITET 6. udgave 005 FORORD Dette notat kan læses på

Læs mere

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK med Excel. udgave 004 i FORORD Denne bog er en fortsættelse af lærebogen M. Oddershede Larsen : Statistiske grundbegreber. Det forudsættes, at man har rådighed

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 11 016 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 1 016 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M Oddershede Larsen : Statistiske

Læs mere

Statistik viden eller tilfældighed

Statistik viden eller tilfældighed MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Stastistik og Databehandling på en TI-83

Stastistik og Databehandling på en TI-83 Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen (jonas@imf.au.dk). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel.

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel. Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel. Kapitel Deskriptiv statistik Indhold 1. Generelle forhold... 1 Kapitel : Deskriptiv Statistik... 1 Kapitel 4: Normalfordelingen...

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Statistisk forsøgsplanlægning. med benyttelse af Statgraphics

Statistisk forsøgsplanlægning. med benyttelse af Statgraphics MOGENS ODDERSHEDE LARSEN Statistisk forsøgsplanlægning med benyttelse af Statgraphics Vekselvirkning CD 10 8 C 1 udbytte 6 4 0 1 3 4 D 11 udgave 00, DTU FORORD Dette notat er baseret på at de studerende

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

2 0.9245. Multiple choice opgaver

2 0.9245. Multiple choice opgaver Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 2. juni 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X. Opgave I I en undersøgelse af et potentielt antibiotikum har man dyrket en kultur af en bestemt mikroorganisme og tilført prøver af organismen til 20 prøverør med et vækstmedium og samtidig har man tilført

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1

Læs mere

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 1 016 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen : Statistiske

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

VIDEREGÅENDE STATISTIK III Ikke parametriske test

VIDEREGÅENDE STATISTIK III Ikke parametriske test MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK III Ikke parametriske test Statistisk Kvalitetsstyring (Statgraphics) DANMARKS TEKNISKE UNIVERSITET 6. udgave 004 i FORORD Dette notat kan læses på baggrund

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

for gymnasiet og hf 2017 Karsten Juul

for gymnasiet og hf 2017 Karsten Juul for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Vejledende løsninger kapitel 8 opgaver

Vejledende løsninger kapitel 8 opgaver KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Besvarelser til øvelsesopgaver i uge 6

Besvarelser til øvelsesopgaver i uge 6 Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret.

Læs mere

for gymnasiet og hf 2016 Karsten Juul

for gymnasiet og hf 2016 Karsten Juul for gymnasiet og hf 75 50 5 016 Karsten Juul Statistik for gymnasiet og hf Ä 016 Karsten Juul 4/1-016 Nyeste version af dette håfte kan downloades fra http://mat1.dk/noter.htm HÅftet mç benyttes i undervisningen

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Empirisk Miniprojekt 2

Empirisk Miniprojekt 2 Empirisk Miniprojekt 2 Michael Bejer-Andersen, Thomas Thulesen og Emil Holmegaard Gruppe 5 26. November 2010 Indhold 1 Introduktion 2 1.1 Bane og Robot..................................... 2 1.2 Counter

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP() John Andersen, Læreruddannelsen i Aarhus, VIA Et kast med 10 terninger gav følgende udfald Fig. 1 Result of rolling 10 dices

Læs mere

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1 Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1) ; C ED 6 > Billedbehandling og mønstergenkendelse Lidt elementær statistik (version 1) Klaus Hansen 24 september 2003 1 Elementære empiriske mål Hvis vi har observationer kan vi udregne gennemsnit og varians

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

for matematik pä B-niveau i hf

for matematik pä B-niveau i hf for matematik pä B-niveau i hf 014 Karsten Juul TEST 1 StikprÅver... 1 1.1 Hvad er populationen?... 1 1. Hvad er stikpråven?... 1 1.3 Systematiske fejl ved valg af stikpråven.... 1 1.4 TilfÇldige fejl

Læs mere

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5

Læs mere