STATISTISKE GRUNDBEGREBER

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "STATISTISKE GRUNDBEGREBER"

Transkript

1 MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 17. udgave 016

2 FORORD Der er i dee bog søgt at give letlæst og askuelig fremstillig af de statistiske grudbegreber til brug ved e idledede udervisig i statistik. De væsetligste defiitioer og sætiger forklares derfor fortrisvist ved hjælp af figurer og geemregede praktiske eksempler. Øskes e mere matematisk uddybede forklarig, bevis for sætiger osv. ka dette ofte fides i et særskilt tillæg til boge, som fides på ettet uder title Supplemet til statistiske grudbegreber. Læsig: Boge er bygget således op, at der hurtigt ås frem til ormalfordelige og de vigtige ormalfordeligstest. Disse vigtige begreber ka derfor blive grudigt idarbejdet, selv om der ku er kort tid til rådighed. Er det af tidsmæssige grude svært at å hele boge ka ma ude skade for helhede oversprige kapitel 9, ligesom ma evetuelt ka tage kapitlere 1 og 8 mere oversigtsagtigt. Sidst i hver kapitel fides e række opgaver, der yderligere ka fremme forståelse. Bagerst i boge fides e facitliste til alle opgavere. I et lægere kursusforløb er dee bog tækt at skulle efterfølges af M. Oddershede Larse: Videregåede Statistik, som ka hetes gratis på adresse Regemidler. Det er hesigtsmæssigt, at ma har adgag til et program med de sædvalige statistiske fordeliger idbygget. I eksemplere agives således, hvorledes beregigere ka foretages med statistikprogrammet SAS.JMP Øskes i stedet at avede TI-Nspire (PC-udgave) eller det meget udbredte regeark Excel, ka ma på hjemmeside uder statistik hete bøger, hvor boges eksempler er reget ved avedelse af disse programmer. I 8- udgave fides tabeller over de sædvalige statistiske fuktioer, samt forklaret hvorda tabellere avedes Dee udgave, samt 8 udgave ka samme med e række adre oter fides på adresse: 5. december 016 Moges Oddershede Larse

3 INDHOLD 1 INTRODUKTION TIL STATISTIK... 1 DESKRIPTIV STATISTIK.1 Kvalitative data.... Kvatitative data Karakteristiske tal Relativ hyppighed Middelværdi og spredig Opgaver STOKASTISK VARIABEL 3.1 Sadsylighed Stokastisk variabel Tæthedsfuktio for kotiuert stokastisk variabel Liearkombiatio af stokastiske variable NORMALFORDELINGEN 4.1 Idledig Defiitio og sætiger om ormalfordelig Beregig af sadsyligheder Opgaver KONFIDENSINTERVAL FOR NORMALFORDELT VARIABEL 5.1 Udtagig af stikprøver Fordelig og spredig af geemsit Kofidesiterval for middelværdi Defiitio af kofidesiterval Populatioes spredig kedt eksakt Populatioes spredig ikke kedt eksakt Kofidesiterval for spredig Oversigt over cetrale formler i kapitel Opgaver HYPOTESETESTNING (1 NORMALFORDELT VARIABEL) 6.1 Grudlæggede begreber Hypotesetest med ukedt middelværdi og spredig Fejl af type I og type II Oversigt over cetrale formler i kapitel Opgaver REGNEREGLER FOR SANDSYNLIGHED, KOMBINATORIK 7.1 Regeregler for sadsylighed Betiget sadsylighed Kombiatorik Idledig Multiplikatiospricippet Ordet stikprøveudtagelse Uordet stikprøveudtagelse iii

4 Opgaver VIGTIGE DISKRETE FORDELINGER 8.1 Idledig Hypergeometrisk fordelig Biomialfordelig Poissofordelig Approksimatioer De geeraliserede hypergeometriske fordelig Polyomialfordelig Oversigt over cetrale formler i kapitel Opgaver ANDRE KONTINUERTE FORDELINGER 9.1 Idledig De rektagulære fordelig Ekspoetialfordelige Weibullfordelige De logaritmiske fordelig De todimesioale ormalfordelig Opgaver APPENDIX. OVERSIGT OVER APPROKSIMATIONER FACITLISTE STIKORD iv

5 1 Itroduktio til statistik 1 INTRODUKTION TIL STATISTIK Ved æste alle igeiørmæssige problemer vil de idsamlede data udvise variatio. Måler ma således getage gage idholdet (i %) af et bestemt stof i et levedsmiddel, vil det procetvise idhold ikke blive præcis samme tal for hver gag ma foretager e målig. Dette kue aturligvis være e usikkerhed ved målemetode, me det vil sjældet være de væsetligste årsag. Ved mage idustrielle processer vil e række ukotrollable forhold idvirke på det edelige resultat. Eksempelvis vil udbyttet af e kemisk proces variere fra dag til dag, fordi ma ikke har fuldstædig kotrol over forsøgsbetigelser som temperatur, omrørigstid, tidspukt for tilsætig af råmaterialer, fugtighed osv. Edvidere er forsøgsmaterialere muligvis ikke homogee ok. Råmaterialere ka f.eks. være af varierede kvalitet, der må bruges forskelligt apparatur uder produktiosprocesse, forskelligt persoale deltager i arbejdet osv. Statistik drejer sig om at samle, præsetere og aalysere data med heblik på at foretage beslutiger og løse problemer. I de deskriptive statistik beskrives data ved tabeller, grafisk (lagkagediagrammer, søjlediagrammer) og ved beregig af karakteristiske tal såsom geemsit og spredig. Ma ka eksempelvis i Damarks Statistik (fides på ettet uder adresse ) fide, hvor mage persobiler der er i Damark opdelt efter alder. Ma keder her populatioe (biler i Damark), ka grafisk vise deres fordelig i et søjlediagram og berege deres geemsitlige alder. I de mere aalyserede statistik (kaldet iferetiel statistik) søger ma ved mere avacerede statistiske metoder ud fra e repræsetativ stikprøve at kokludere oget om hele populatioe. Eksempelvis udtages ved e meigsmålig e forhåbetlig repræsetativ stikprøve på 1000 vælgere, som ma spørger om hvilket politisk parti de ville stemme på, hvis der var valg i morge. Ma vil så ud fra stikprøve kokludere, at hvis ma spurgte hele populatioe (alle vælgere i Damark), så ville ma med e vis usikkerhed få samme resultat. Viser stikprøve, at partiet Vestre vil gå.5% tilbage, så vil det samme ske, hvis der var valg i morge. Et sådat tal er aturligvis usikkert. Ma må derfor avede passede statistiske metoder til eksempelvis at berege, at usikkerhede er på %. 1

6 Deskriptiv statistik. DESKRIPTIV STATISTIK I de deskriptive statistik (eller beskrivede statistik) beskrives de idsamlede data i form af tabeller, søjlediagrammer, lagkagediagrammer, kurver samt ved udregig af cetrale tal som geemsit, typetal, spredig osv. Kurver og diagrammer forstås lettere og mere umiddelbart ed koloer af tal i e tabel. Øjet er uovertruffet til møstergekedelse ( e tegig siger mere ed 1000 ord )..1 KVALITATIVE DATA Hvis der er e aturlig opdelig af talmaterialet i klasser eller kategorier siges, at ma har kategorisk eller kvalitative data. Alle spørgeskemaudersøgelser, hvor ma eksempelvis bliver bedt om at sætte kryds i ogle rubrikker meget god, god, acceptabel osv. er af dee type. De følgede eksempler viser avedelse af heholdsvis lagkagediagram og søjlediagram Eksempel.1 Lagkagediagram Nedefor er agivet hvorda e kommues udgifter fordeler sig på de forskellige områder. Udligig 3,1 øvrige 8,4 Socialområdet,øvrige 9,4 Ældre 18,6 Børepasig 10,4 Bibliotek 1,9 fritid 3,8 Skoler 10,5 Admiistratio 7,3 Tekik,alæg 6,6 Da et diagram til askueliggørelse heraf. Løsig: Vælg File New Data Table skriv listes av eme i øverste celle og idsæt emere i koloe edeuder opret tilsvarede de ade liste med av a Vælg Graph Chart vælg a, tryk på Statistics og vælg mea Vælg eme og tryk på Catagories ok Rød pil ved Chart Pie Chart Der fremkommer følgede cirkeldiagram:

7 .1 Kvalitative data Eksempel. Søjlediagram Følgede tabel agiver madattallet ved to folketigsvalg. Partier A B C F I O V Ø Å Madater A=Socialdemokratere, B=Radikale vestre, C=Koservative folkeparti, F=Socialistisk folkeparti, I=Liberal alliace, O=Dask Folkeparti, V=Vestre, Ø=Ehedsliste, Å=Alterativet Askueliggør disse madattal ved at tege et søjlediagram Løsig: Data idtastes som vist edefor Vælg Graph Chart tryk på Madat 011 og Madat 015 Statistics Mea Vælg parti og tryk på Categories ok Resultatet var følgede søjlediagram Fordele ved e grafisk fremstillig er, at de væsetligste egeskaber ved data opås hurtigt og sikkert. Me etop det, at figurer appellerer umiddelbart til os, gør at vi ka komme til at lægge mere i dem, ed det som tallee egetlig ka bære. Eksempelvis viser forsøg, at i lagkagediagrammer, hvor ma skal sammelige vikler (eller arealer), da vil dee sammeligig afhæge oget af i hvilke retig vikles be peger. Nedeståede eksempel viser hvorda e figur ka være misvisede ude direkte at være forkert. Eksempel.3. Misvisede figur Tødere i figure edefor skal illustrere hvorda osteeksporte fordeler sig på de forskellige verdesdele. De giver imidlertid et helt forkert idtryk. Det er højdere på tødere der agiver de korrekte forhold, me af tegige vil ma tro, at det er rumfagee af tødere. De 3 små tøder ka umiddelbart være flere gage idei de store tøde, me det svarer jo ikke til talforholdee. 3

8 Deskriptiv statistik De mest almidelige figurer til at give et visuelt overblik over større talmaterialer er histogrammer (søjlediagrammer) og kurver i et koordiatsystem... KVANTITATIVE DATA (VARIABLE) Kvatitative data er data, hvor registrerige i sig selv er tal, der agiver e bestemt rækkefølge, f. eks. som i eksempel.4 hvor data registreres efter det tidspukt hvor registrerige foregår eller som i eksempel.5, hvor det er størrelse af registrerede værdi der er af iteresse. Eksempel.4. Kvatitativ variabel: tid Fra statistikbake (adresse er hetet følgede data id i Excel, der beskriver hvorledes idvadriger og udvadriger er sket geem tide. Excel: Vælg Befolkig og valg Flytiger Flytig til og fra udladet Id- og udvadrig på måeder uder bevægelse vælges flere valgmuligheder, marker alle uder måed vælges flere valgmuligheder år og derefter alle Tryk på tabel Drej tabel med uret Gem som Excel fil Giv e grafisk beskrivelse af disse data. Løsig Vælg e koloe ved at klikke på koloebogstavet øverst i koloe Tryk på CTrl C for at kopiere cellere Klik i Data på de celle, hvor dataee skal sættes id giv koloer ave år, idvadrede og udvadrede. Bemærk: slet bogstaver som idvadrede osv ide overførsle Da dataee er registreret efter tid (år) (de kvatitative variabel tid ) teges to kurver i samme koordiatsystem: Vælg Graph Chart tryk på Idvadrede og udvadrede Statistics Data Vælg år og tryk på Categories ok rød pil ved Chart vælg Overlay og Vertical Chart Y optios og vælg Lie Chart.Show poits, 4

9 Coect poits Adre tig som tykkelse af liie ka vælges uder pil ved Chart.. Kvatitative data Eksempel.5. Kvatitativ variabel, størrelse af britiokocetratioe ph I meeskers led udskiller de iderste hide e "ledvæske" som "smører" leddet. For visse ledsygdomme ka britiokocetratioe (ph) i dee væske tækes at have betydig. Som led i e ordisk medicisk udersøgelse af e bestemt ledsygdom udtog ma bladt samtlige patieter der led af dee sygdom e repræsetativ stikprøve ved simpel udvælgelse 75 patieter og målte ph i ledvæske i kæet. Resultatere (som ka fides som excel-fil på adresse ) var følgede: Giv e grafisk beskrivelse af disse data. Løsig: I dette tilfælde, hvor vi er iteresseret i at få et overblik over tallees idbyrdes størrelse er det fordelagtigt at tege et histogram. Et histogram liger et søjlediagram, me her gælder, at atallet af eheder i hver søjle repræseteres ved søjles areal (histo er græsk for areal). Ma bør så vidt muligt sørge for at gruppere er lige brede, da atallet af eheder så svarer til højde af søjle. Først fides det største tal x max og det midste tal x mi i materialet og derefter berege variatiosbredde x max - x mi. Vi ser, at største tal er 7.71 og midste tal er 6.95 og variatiosbredde derfor = Deræst deles tallee op i et passede atal itervaller (klasser). Som det første bud vælges 076. ofte et atal ær. Da 75 9 vælges ca. 9 klasser. Da 008. deler vi op i de klas- 9 ser, der ses af tabelle. Dette giver 10 itervaller. Vi tæller op hvor mage tal der ligger i hvert iterval (gøres emmest ved at starte forfra og sæt e streg i det iterval som tallet tilhører). 5

10 Deskriptiv statistik Klasser Atal ] ] // ] ] ///// 5 ] ] //////// 8 ] ] ///////////////// 17 ] ] ////////////////// 18 ] ] //////////////// 16 ] ] //// 4 ] ] /// 3 ] ] / 1 ] ] / 1 Allerede her ka ma se, at atallet er størst omkrig 7.30, og så falder hyppighede ogelude symmetrisk til begge sider. Het data fra Excel-fil, kald søjle for ph Aalyze Distributio Vælg Histograms Oly og marker ph og idsæt i Y,Colums ok rød pil ved ph Histogram Optios stryg Vertical og set Bi With til 0.08 og vælg Cout Axis Histogrammet er et "klokkeformet histogram", hvor der på tegige er flest tal fra 7.8 til =7.36 og derefter falder atallet til begge sider. Ma reger ormalt med, at resultatere af forsøg, hvor ma har foretaget måliger (hvis ma lavede ok af dem) har et sådat klokkeformet histogram og siger, at resultatere er ormalfordelt (beskrives ærmere i æste kapitel) 6

11 .3 Karakteristiske tal.3 KARAKTERISTISKE TAL Skal ma sammelige to talmaterialer, eksempelvis sammelige de 75 ph-værdier i eksempel 1.4 med 00 dårlige kæ fra Tysklad, har det ige meig at sammelige hyppighedere Ma må i sådae tilfælde agive ogle tal, som gør det muligt at foretage e sammeligig. Dette kue bladt adet ske ved at ma udregede de relative hyppigheder.3.1 Relativ hyppighed Ved de relative hyppighed forstås hyppighede divideret med det totale atal. I eksempel.5 er de relative hyppighed for ph - værdier i itervallet ] ]: %. 75 Ma kue sige, at sadsylighede er.57% for at ph ligger i dette iterval..3. Middelværdi og spredig. Middelværdi, geemsit. Kedes hele populatioe (målt højde på alle daske mæd) ka bereges e korrekt midterværdi kaldet middelværdi (græsk my) Ud fra stikprøve vil e tilærmet værdi (kaldet et estimat) for være geemsittet x (kaldt x streg). x1 x... x Kaldes observatioere i e stikprøve x 1, x,..., x er x Eksempel.6: Geemsit Fid geemsittet af tallee 6, 17, 7, 13, 5, 3 Løsig: 6 Hådregig: x Data idtastes i koloe med av x Aalyze Distributio x idsættes i Y,colums OK Ma ka u ederst bl.a se Mea Øsker ma ku at se geemsittet så tryk ederst på rød pil ved Summery Statistics og vælg Customize Summery Statistics Marker Mea (slet reste) Resultat: Spredigsmål Egetlige målefejl, såsom at ogle af observatioere ikke bliver korrekt registreret, uklarheder i spørgeskemaet osv. skal aturligvis fjeres. Derudover er der de aturlige variatio som også kue kaldes re støj (pure error), som skyldes, at ma ikke ka forvete, at to persoer der på alle områder er stillet fuldstædigt es også vil svare es på et spørgsmål. Tilsvarede hvis ma måler udbyttet ved e kemisk proces, så vil udfaldet af to forsøg ikke være es, da der altid er e række ukotrollable støjkilder (ureheder i råmaterialer, lidt forskel på persoer og apparatur osv.) 7

12 Deskriptiv statistik Dee aturlige variatio skal aturligvis iddrages i de statistiske behadlig af problemet, og dertil spiller et mål for, hvor meget tallee spreder sig aturligvis e væsetlig rolle.. Spredig (egelsk: stadard deviatio) Hvis spredige baserer sig på hele populatioe beæves de (sigma). Baserer spredige sig ku på e stikprøve beæves de s. Ma siger, at s er et estimat (skø) for. s bereges af formle s ( xi x ) i1 1 hvor observatioere i e stikprøve er x 1, x,..., x Kvadratsumme ( x x) beæves kort SAK (Summe af Afvigelseres Kvadrater) eller i1 i SS (Sum of Squares) Ved variase for e stikprøve forstås s. Eksempel.7: Spredig Fid varias og spredig af tallee 6, 17, 7, 13, 5, 3 Løsig: I eksempel.6 fides geemsittet x 85. ( 685. ) ( ) ( 785. ) ( ) ( 585. ) ( 385. ) Hådregig: s 61 Spredige s Som i eksempel.6 me u vælges Stdev og Variace (slet reste) 8. 7 Askuelig forklarig på formle for s. At formle for s skulle være særlig veleget til at agive, hvor meget resultatere spreder sig (hvor mege støj der er ) er ikke umiddelbart idlysede. I det følgede gives e askuelig forklarig. Lad os betragte forsøgsvariable X og Y, hvorpå der for hver er udført e stikprøve på 4 forsøg. Resultatere var: X: 35.9, 33.3, 34.7, 34.1 med geemsittet x = 34.5, og Y: 34.3, 34.6, 34.7, 34.4 med geemsittet y = De to forsøgsvariable har samme geemsit, me det er klart, at Y-resultatere grupperer sig meget tættere om geemsittet ed X-resultatere, dvs. Y-stikprøve har midre spredig (der er midre støj på Y - forsøget) ed X-stikprøve.For at få et mål for stikprøves spredig bereges resultateres afvigelser fra geemsittet. xi x yi y = = = = = = = = -0.1 Summe af disse afvigelser er aturligvis altid 0 og ka derfor ikke bruges som et mål for stikprøves spredig. I stedet betragtes summe af kvadratere på afvigelsere (forkortet SS: Sum of Squares eller SAK: Sum af afvigelseres Kvadrat). 8

13 SAK ( x x) 14. ( 1. ) 0. ( 04. ) 360. x i1 i SAK ( y y) ( 0. ) ( 01. ) 010. y i1 i Da et mål for variase ikke må være afhægig af atallet af forsøg, divideres med Karakteristiske tal Umiddelbart ville det være mere rimeligt at dividere med. Imidlertid ka det vises, at i middel bliver et skø for variase for lille, hvis ma dividerer med, mes de rammer præcist, hvis ma dividerer med - 1. Det ka forklares ved, at tallee x i har e tedes til at ligge tættere ved deres geemsit x ed ved middelværdie. s 360. x. og s y s 4 1 x s y Som vi forudså, er stikprøves spredig betydelig større for X-resultatere ed for Y-resultatere. Frihedsgrader. Ma siger, at stikprøves varias er baseret på f = - 1 frihedsgrader. Navet skyldes, at ku -1 af de led xi x ka vælges frit, idet summe af de led er ul. Eks- empelvis ser vi af eksempel.7, at der er 5 frihedsgrader, da kedskab til de første 5 led på 6, 17, 7, 13, 5 er ok til at bestemme det sjette led, da summe er ul. Vurderig af størrelse af stikprøves spredig. Ma ka vise, at for tæthedsfuktioer med ku et maksimumspukt gælder, at mellem x s og x s ligger ca. 89% af resultatere, og mellem x 3s og x 3s ligger ca. 95% af resultatere. For såkaldte ormalfordelte resultater, er de tilsvarede tal ca. 95% og 99.7 % I eksempel.7 fadt vi således x s = 5.357=-.1 og x s = =19.1 Det ses. at alle tallee ligger idefor itervallet [-.1;19.1].3.3 Media og kvartilafstad. Media. Mediae bereges på følgede måde: 1) Observatioere ordes i rækkefølge efter størrelse. a) Ved et ulige atal observatioer er mediae det midterste tal b) Ved et lige atal er mediae geemsittet af de to midterste tal. Eksempel.8: Media Fid mediae af tallee 6, 17, 7, 13, 5, 3. Løsig: Hådregig: Ordet i rækkefølge: 3, 5, 6, 7 13, 17. Media 6,5 SAS.JMP: Som i eksempel.6 me u vælges media Mediae kaldes også for 50% fraktile, fordi de brøkdel (fraktil) der ligger uder mediae er ca. 50%. Er media og geemsit ogelude lige store fordeler tallee sig ogelude symmetrisk omkrig middelværdie. Er mediae midre ed geemsittet er der muligvis tale om e højreskæv fordelig som har de lage hale til højre.(se figure) 9

14 Deskriptiv statistik Lad os atage at e virksomhed har 10 asatte, med måedsløiger ordet efter størrelse på 0000, 1000, 000, 3000, 4000, 5000, 6000, 7000, 8000, Geemsittet er her 31600, mes mediae er Mediae ædrer sig ikke selv om de højeste lø vokser fra til 1 millio, mes geemsittet aturligvis vokser. Mediae giver derfor e mere rimelig beskrivelse af middelløe i firmaet. Kvartilafstad. Ved edre kvartil (kaldes også 1. kvartil), forstås det tal, hvor de brøkdel der ligger uder tallet er ca. 5%. Ved øvre kvartil (kaldes også 3. kvartil), forstås det tal, hvor de brøkdel der ligger uder tallet er ca. 75%. Hvis fordelige ikke er rimelig symmetrisk, er mediae det bedste skø for e midterværdi, og kvartilafstade ka være et mål for spredige. I de tidligere omtalte løstatistik 1 fides bl.a. følgede tal, idet de to sidste koloer er vor bearbejdig af tallee. Lø pr. præsteret time r geemsit edre kvartil media øvre kvartil x k3 k1 x k1 m k3 m m 1 Ledelse på højt iveau Kotorarbejde x Af koloe ses, at for begge rækker er geemsittet større ed mediae dvs. begge m fordeliger er højreskæv, me det gælder mest for række r. 1. Her gælder åbebart, at ogle få forholdsvis høje løiger trækker geemsittet op. Skal ma sammelige løspredige i de to tilfælde, må ma tage hesy til, at mediae er meget forskellig. Ma vil derfor som der er sket i sidste koloe berege de relative kvartilafstad. De viser også, at løspredige er væsetlig midre for række ed for række 1. Eksempel.9 Kvartil Fid kvartiler og media af de 1 tal 7, 9, 11, 3, 16, 1, 15, 8,, 18,, 10 Løsig: E søjle kaldes eksempelvis x, og tallee idtastes i søjle. Vælges Aalyze Distributio idsæt x i y, colums ok Uder Quartiles fides vedlagte udskrift 1 kvartil 7.5 media 10.5 og 3 kvartil jævfør statistisk årbog 005 tabel 144 eller se uder lø\løstatistik for de offetlige sektor \lø 3 10

15 Opgaver til kapitel OPGAVER Opgave.1. Følgede tabel agiver for et udvalgt atal lade oplysig om middellevetid for befolkige og idbyggeratal. Lad Middellevetid Idbyggertal i millioer Australie Caada Damark 77,5 5.5 Frakrig Marokko Pole Sri Laka USA ) Idskriv oveståede tabel i SAS.JMP, hvor ladee er opskrevet alfabetisk. ) Omda tabelle så lade med lægst middellevetid kommer øverst 3) Lav et søjlediagram over data 4) Teg i et koordiatsystem to kurver, som agiver såvel ladees størrelse som middellevetid Opgave. Færdselspolitiet overvejede, om der burde idføres e fartgræse på 70 km/h på e bestemt ladevejsstrækig, hvor der hidtil havde været e fartgræse på 80 km/h. Som et led i aalyse af hesigtmæssighede af de overvejede ædrig observeredes ide for et bestemt tidsrum ved hjælp af radarkotrol de forbipasserede bilers fart. Resultatet af måligere var: 50 observatioer Dataee fides som e Excel-fil på hjemmeside Larse-et.dk. 1) Fid det største og midste tal bladt observatioere ) Teg et histogram, hvor itervallere er lige brede, og hvor atallet er ca ) Agiv geemsit, spredig og media. 4) Vurder på baggrud af resultatere i spørgmål og 3 om fordelige er ogelude symmetrisk (ormalfordelt). 5) Agiv hvor stor e procetdel af bilere, der kører over 80 km/h. 11

16 Deskriptiv statistik Opgave.3 Til fabrikatio af herreskjorter beyttes et råmateriale, som ideholder e vis procetdel uld. For ærmere at udersøge uldprocete, måles dee i 64 tilfældigt udvalgte batch. Resultatet (som ka fides som excel-fil på adresse ) var (i %): ) Fid det største og midste tal (ka fides ved at at se på data uder histogram) ) Der øskes teget et histogram, hvor atal itervaller er ca 8. 3) Vurder ud fra tegige og passede karakteristiske tal om fordelige er rimelig symmetrisk (ormalfordelt) 4) Bereg stikprøves relative kvartilafstad Opgave.4 De følgede tabel (som ka fides som excel-fil på adresse ) viser vægtee (i kg) af 80 kaier , ) Fid det største og midste tal (ka fides ved at at se på data uder histogram) ) Der syes at være e fejlmålig (outliers). E såda ka ødelægge ehver aalyse. Ma bliver eig om at fjere de. Fjer dee målig, og tege et histogram, hvor atallet af itervaller er ) Vurder ud fra tegige og passede karakteristiske tal om fordelige er rimelig symmetrisk (ormalfordelt) 4) Agiv hvor stor e procet af kaiere, der approksimativt overstiger e vægt på 3 kg 1

17 3 STOKASTISK VARIABEL 3.1 Sadsylighed 3.1 SANDSYNLIGHED Statistik bygger på sadsylighedsteorie, som giver metoder til at fide, hvor stor chace (sadsylighede) er for at et bestemt resultat af et eksperimet forekommer. DEFINITION af tilfældigt eksperimet. Et eksperimet som ka resultere i forskellige udfald, selv om eksperimetet getages på samme måde hver gag, kaldes et tilfældigt eksperimet (egelsk : radom experimet) Det er karakteristisk for tilfældige eksperimeter, at ma ka afgræse e mægde kaldet eksperimetets udfaldsrum U, der ideholder de mulige udfald. Derimod ka ma ikke forudsige, hvilket udfald der vil idtræffe ved udførelse af eksperimetet. Består eksperimetet eksempelvis i kast med e terig er udfaldsrummet U = {1,, 3, 4,5, 6}, me ma ka ikke forudsige udfaldet af æste kast (eksperimet). Selv om ma 4 gage i træk har fået udfaldet øjetal 1", ka ma ikke forudsige, hvilket udfald der idtræffer æste gag. Resultatet af 5. kast afhæger ikke af resultatere af de foregåede 4 spil. Ma siger, at eksperimetere er "statistisk uafhægige". Som eksempler på tilfældige eksperimeter ka æves: a) Ét kast med e møt. Udfaldsrum U = Plat, Kroe. b) Fremstillig af et parti levedsmiddel og målig af det procetvise idhold af protei. U = mægde af reelle tal fra 0 til 100. c) Udtage e stikprøve på 400 elektroiske kompoeter af e dagsproduktio og optællig af atallet af defekte kompoeter. U = 0, 1,, 3, 4, 5,..., 400 d) Udtagig af et tilfældigt TV-apparat fra e dagsproduktio af TV-apparater og optællig af atallet af loddefejl. U = mægde af positive hele tal. E hædelse er e delmægde af et eksperimets udfaldsrum. Eksempelvis er A: At få et lige øjetal e hædelse ved kast med e terig. Hædelse A siges at idtræffe, hvis et udfald fra A forekommer. Sadsylighedsbegrebet tager udgagspukt i begrebet relativ hyppighed. DEFINITION af relativ hyppighed for hædelse A. Getages et eksperimet gage, og A forekommer hædelse A etop A gage af de gage, er A s relative hyppighed ha ( ) Lad eksempelvis eksperimetet være kast med e terig og hædelse A være at få et lige øjetal. Kastes terige 100 gage og bliver resultatet et lige øjetal 45 af de 100 gage er h(a) = Det er e erfarig, at øges atallet af getagelser af eksperimetet, vil de relative hyppighed af hædelse A stabilisere sig. Når går mod,vil de relative hyppighed erfarigsmæssigt ærme sig til e græseværdi ("de store tals lov"). 13

18 3. Stokastisk variabel Ved sadsylighede for A som beæves P(A) forstås dee græseværdi. (P = probability) Da defiitioe af sadsylighed bygger på relativ hyppighed, er det aturligt, at det for ethvert par af hædelser A og B i udfaldsrummet U skal gælde : 0 # P(A) # 1, P(U) =1 og P(ete A eller B) = P(A) + P(B) (skrives kort P(AcB)= P(A)+P(B)) forudsat A og B ige elemeter har fælles (er disjukte). (e mere geerel regel fides i kapitel 8) De 3 regler kaldes sadsylighedsregiges aksiomer. I kapitel 8 udledes på dette grudlag e række regler for regig med sadsyligheder. Eksempel 3.1 Regler Lad A = at få et ulige øjetal ved et kast med e terig B = at få e sekser ved et kast med e terig Fid sadsylighede for ete at få et ulige øjetal eller e sekser ( evt. begge dele) ved kast med e terig. Løsig: 1 P(A) =. P(B) = P( AB) P( A) P( B) 3. STOKASTISK VARIABEL Ethvert statistisk problem må det på e eller ade måde være muligt at behadle talmæssigt. Betragtes et eksempel med kast med e møt, kue ma til udfaldet plat tilorde tallet 0 og til udfaldet kroe tilorde tallet 1 og på de måde få problemet overført til oget, hvor ma ka foretage beregiger. Ma siger, ma har idført e stokastisk (eller statistisk) variabel X, som er 0, år udfaldet er plat, og 1 år udfaldet er kroe. DEFINITION af stokastisk variabel (egelsk: radom variable). E stokastisk variabel (også kaldet statistisk variabel) er e fuktio, som tilorder et reelt tal til hvert udfald i udfaldsrummet for et tilfældigt eksperimet. E stokastisk variabel beteges med et stort bogstav såsom X, mes det tilsvarede lille bogstav x beteger e mulig værdi af X. Ved e diskret variabel (eller tællevariabel) forstås e variabel, hvis mulige værdier udgør e edelig eller tællelig mægde. Er eksempelvis eksperimetet udtagig af e kasse med 100 møtrikker, ud af e løbede produktio af kasser, kue de stokastiske variabel X være defieret som atal defekte møtrikker i kasse. X er e diskret variabel, da de ku ka atage heltallige værdier fra 0 til 100. Vi vil i seere afsit behadle diskrete variable. Ved e kotiuert stokastisk variabel forstås e stokastisk variabel, hvis mulige værdier er alle reelle tal i et vist iterval. Et eksempel kue være eksperimetet avedelse af e y metode til fremstillig af et produkt. Her kue de stokastiske variabel Y være det målte procetvise udbytte ved forsøget. Y er e kotiuert variabel, da de ka atage alle værdier fra 0% til 100%. 3 14

19 Histogram for ph 3.3 Tæthedsfuktio 3.3 TÆTHEDSFUNKTION FOR KONTINUERT STATISTISK VARIABEL Eksempel 3.. Kotiuert stokastisk variabel I meeskers led udskiller de iderste hide e "ledvæske" som "smører" leddet. For visse ledsygdomme ka kocetratioe af britioer (ph) i dee væske tækes at have betydig. Som led i e ordisk medicisk udersøgelse af e bestemt ledsygdom udtog ma bladt samtlige patieter der led af dee sygdom tilfældigt 75 patieter og målte ph i ledvæske i kæet. Resultatere fides i eksempel.5 Populatio og stikprøve. Samtlige idbyggere i Norde med dee sygdom udgør populatioe. Da det er gaske uoverkommeligt at udersøge alle, udtages e stikprøve på 75 patieter. Det er målet ved hjælp af statistiske metoder på basis af e stikprøve at sige oget geerelt om populatioe. Histogram. For at få et overblik over et større datamateriale, vil ma sædvaligvis starte med at tege et histogram. Hvorledes dette gøres fremgår af eksempel.5. I skemaet ses resultatet af e opdelig i 10 klasser med e bredde på Edvidere er der bereget e søjle ved at dividere de relative hyppighed med itervallægde. Klasser Atal Relativ hyppighed 75 Skalerig ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] Vi får det edefor tegede histogram Dette viser et "klokkeformet histogram", hvor der er flest tal fra 7.19 til 7.4, og derefter falder atallet til begge sider ,9 7,1 7,3 7,5 7,7 7,9 ph 15

20 3. Stokastisk variabel Ma reger ormalt med, at resultatere af forsøg hvor ma har foretaget måliger (hvis ma lavede ok af dem) har et sådat klokkeformet histogram. Hvis ma tæker sig atallet af forsøg stiger (for eksempel udersøger hele populatioe på måske 1 millio ordiske kæ), samtidig med at ma øger atallet af klasser tilsvarede (til for eksempel ), vil histogrammet blive mere og mere fitakket, og til sidst ærme sig til e kotiuert klokkeformet kurve (idteget på grafe). Hvis ma beytter de salderede skala fra skemaet, som også er afsat på højre side af tegige, vil arealet af hver søjle være de relative hyppighed, og for de idealiserede kotiuerte kurve, vil arealet uder kurve i et bestemt iterval fra a til b være sadsylighede for at få e værdi mellem a og b. Det samlede areal uder kurve er aturligvis 1. Ma siger, at de kotiuerte stokastiske variabel X (p værdie) har e tæthedsfuktio f(x) hvis graf er de ovefor ævte kotiuerte kurve. Da arealet uder e kotiuert kurve bereges ved et bestemt itegral, følger heraf følgede defiitio: DEFINITION af tæthedsfuktio f(x) for kotiuert variabel X. Pa ( X b) f( xdx ) for ethvert iterval af reelle tal a b a; b f ( x ) dx 1, f ( x) 0 for alle x Bemærk, at for kotiuerte variable er Pa ( Xb) Pa ( Xb) Pa ( X b) Pa ( X b). Et eksempel på e tæthedsfuktio for e kotiuert variabel er de i æste kapitel beskreve ormalfordelig. Måleresultater vil sædvaligvis være værdier af ormalfordelte variable, så e rimelig hypotese for de i eksempel 3. agive kotiuerte stokastiske variabel X = p er således, at de er ormalfordelt. Dette bestyrkes af at grafe for sådae etop er klokkeformede. Det er væsetlig at fide e cetral værdi i populatioe, samt agive et spredigsmål Disse agives i de følgede kapitler for de kokrete fuktioer, der behadles. Geerelt gælder følgede defiitioer DEFINITION af middelværdi for kotiuert variabel. Middelværdi for e kotiuert variabel X med tæthedsfuktio f ( x ) beæves eller E ( X ) og er defieret som E( X) x f ( x) dx DEFINITION af varias og spredig for kotiuert variabel. Variase for e kotiuert variabel X med tæthedsfuktio f ( x ) beæves eller V( X ) og er defieret som V( X) ( x) f ( x) dx Spredige (egelsk: stadard deviatio) for e diskret variabel X med tæthedsfuktio f(x) beæves defieret som V( X) og er 16

21 3.3 Tæthedsfuktio Eksempel 3.3 Kotiuert stokastisk variabel. 3 x for 0 x 8 Lad der være givet følgede fuktio: f ( x). 0 ellers a) Vis, at f ( x) dx 1 I det følgede atages, at f ( x ) er tæthedsfuktio for e kotiuert stokastisk variabel X. b) Skitser grafe for f. c) Bereg middelværdi og spredig for X. Løsig: x a) f ( x) dx x dx b) Grafe, som er e del af e parabel, ses på Fig 3.1. c) E X. x f x dx 4 x 3 x dx x 3 ( ) ( ) Fig.3.1 Tæthedsfuktio 5 x V( X) x f ( x) dx x x dx ( X ) Fordeligsfuktio. I visse situatioer er det e fordel at betragte de kotiuerte variabels fordeligsfuktio F(x) DEFINITION af fordeligsfuktio F(x) for kotiuert variabel. x Fordeligsfuktioe for e kotiuert variabel X er defieret ved F( x) P( X x) f ( x) dx DEFINITION af p-fraktil. Lad p være et vilkårligt tal mellem 0 og 1. Ved p-fraktile eller 100 p % fraktile forstås det tal x p F( x ) P( X x ) p ( f ( x) dx ) p p 0 x p, for hvilket det gælder, at Særlig ofte beyttede fraktiler er 50% fraktile, som kaldes mediae (eller. kvartil), 5 % fraktile, som kaldes edre kvartil (eller 1. kvartil) og 75% fraktile, som kaldes øvre kvartil (eller 3. kvartil). Eksempel 3.4. Fordeligsfuktio for kotiuert variabel. For de i eksempel 3.3 agive kotiuerte variabel X med tæthedsfuktio f (x) øskes fudet: 1) Fordeligsfuktioe F (x). x ) Mediae. Løsig: 0 dx = 0 for x <0 x x x x x 1) F( x) f ( x) dx xdx 3 3 x 3 0 for x dx= for x > 3 x 3 ) Mediae er bestemt ved F( x) x 4 x

22 3. Stokastisk variabel 3.4 LINEARKOMBINATION AF STOKASTISKE VARIABLE Vi betragter i dette afsit flere stokastiske variable. Eksempel 3.5 vil blive beyttet som geemgåede eksempel Eksempel 3.5. To variable. Isektpulver sælges i papkartoer. Lad de stokastiske variable X 1 være vægte af pulveret, mes X er vægte af papkartoe. I middel fyldes der 500 gram isektpulver i hver karto med e spredig på 5 gram. Kartoe vejer i middel 10 gram med e spredig på 1.0 gram. Y = X 1 + X er da bruttovægte. 1) Fid middelværdie af Y ) Fid spredig af Y. Mere geerelt haves: Lad X 1, X,..., X være stokastiske variable. Ved e liearkombiatio af disse forstås Y a0 a1 X1 a X... a X, hvor a 0, a 1, a,..., a er kostater. Ma ka vise (se evetuelt kapitel 11) at der gælder følgede Liearitetsregel: EY ( ) a a E( X) a E( X )... a E( X ) I eksempel 3.5 syes det rimeligt at atage, at vægte af pulveret og vægte af papkartoe er uafhægige ( påfyldige ka tækes at ske maskielt, ude at de er afhægig på oge måde af hvilke vægt, kartoe tilfældigvis har). Ma ka vise (se evetuelt kapitel 11, for e mere udførlig behadlig af uafhægighed m.m.), at hvis X 1, X,..., X er statistisk uafhægige, gælder Kvadratregel for statistisk uafhægige variable: V( Y) a V( X ) a V( X )... a V( X ). 1 1 Eksempel 3.5. (fortsat) To variable. Spørgsmål 1: E(Y) = E(X 1 ) + E(X ) = = 510 gram. Spørgsmål : V(Y) = V(X 1 ) + V(X ) = = 6. ( Y) gram. Kvadratregle beyttes bl.a til beregig af statistisk usikkerhed som ka fides beskrevet på hjemmeside larse-et.dk i boge Fuktioer af flere variable Esfordelte uafhægige variable. Lad os atage, at vi uafhægigt af hiade og uder de samme betigelser udtager elemeter fra e populatio med middelværdi og spredig. Lad X 1 være de stokastiske variabel, der er resultatet af første udtagig af et elemet i stikprøve, X være de stokastiske variabel, der er resultatet af ade udtagig, osv. 18

23 3.4 Liearkombiatio af stokastiske variable X 1, X,..., X vil da være esfordelte uafhægige stokastiske variable, dvs. have samme fordelig med middelværdi og spredig. Eksempel 3.6. Esfordelte variable Bruttovægte af det i eksempel 3.5 ævte karto isektpulver havde middelvægte 510 g med e spredig på 5.1 g. Vi udtager u tilfældigt og uafhægigt af hiade 10 pakker isektpulver. a) Hvad bliver i middel de samlede vægt af de 10 kartoer b) Hvad bliver i middel spredige på de samlede vægt af de 10 kartoer Løsig: Lad X 1 være vægte af karto 1, X være vægte af karto osv. X 10 være vægte af karto 10. Y= X 1 + X X 10 er da vægte af alle 10 kartoer. a) E(Y) = E(X 1 )+E(X )+... +E(X 10 ) = = 5100 g b) V(Y) = V(X 1 )+V(X )+... +V(X 10 ) =10 (5.1) = 60.1 g ( Y ) Bemærk: E almidelig fejl er her, at ma tror, at Y=10 X og dermed V(Y)=10 V(X)=600 Vi har her at gøre med 10 esfordelte uafhægige variable, og ikke 10 vægte af 1 karto. For esfordelte uafhægige stokastiske variable gælder: SÆTNING 3.1 (middelværdi og spredig for stikprøves geemsit ) X1 X... X E( X) og ( X ), hvor X X X... X Bevis: Af liearitetsregle fås E( X) E 1 1 ( ) ( )... ( ) E X 1 E X E X X X... X Af kvadratregle fås V( X) V V( X ) V( X )... V( X ). 1 Eksempel 3.7. Spredig på geemsit (eksempel 3.5 fortsat) Hvis der udtages 5 kartoer isektpulver, hvad vil da være spredige på geemsittet af vægte af isektpulveret. Løsig: Da spredige på 1 karto er 5.1 gram, vil spredige på geemsittet af 5 kartoer være 51. ( X ) 8. 5 Opgave 3.1 Vægte af e (tilfældigt udvalgt) tablet af e vis type imod hovedpie har middelværdie 065g. og spredige 004. g a) Bereg middelværdi og spredig af de sammelagte vægt af 100 (tilfældigt udvalgte) tabletter b) På basis af de 100 tabletter øskes spredige på geemsittet bereget. 19

24 4.Normalfordelige. 4 NORMALFORDELINGEN 4.1 INDLEDNING Lad os som eksempel tæke os et kemisk forsøg, hvor vi måler udbyttet af et stof A. Selv om vi getager forsøget ved avedelse af de samme metode og i øvrigt søger at gøre forsøgsbetigelsere så esartet som muligt, varierer udbyttet dog fra forsøg til forsøg. Disse variatioer fra de ee forsøg til det æste må skyldes forhold vi ikke ka styre. Det ka skyldes små ædriger i temperature, i luftes relative fugtighed, vibratioer uder fremstillige, små forskelle i de avedte råmaterialer (korstørrelse, rehed), forskelle i meeskelig reaktioseve osv. Hvis ige af disse variatiosårsager er domierede, der er et stort atal af dem, de er uafhægige og lige så godt ka have e positiv som e egativ idvirkig på resultatet, så vil de totale fejl sædvaligvis approksimativt være fordelt efter de såkaldte ormalfordelig. (også kaldet Gauss-fordelige) Som illustratio af dette ka avedes Galtos apparat. Eksempel 4.1. Eksperimet med et Galto-apparat. På de aførte figur er skitseret et Galto-apparat. A er e tragt; B er sømrækker, hvor sømmee i e uderliggede række er abragt midt ud for mellemrummee mellem sømmee i de overliggede række; C er opsamligskaaler. Lader ma mage kugler passere geem tragte A ed geem sømrækkere B til opsamligskaalere C, vil ma kostatere, at de ekelte kugler ok bliver tilfældigt fordelt i opsamligskaalere, me at kugleres samlede fordelig giver et møster, som getages, hver gag ma udfører eksperimetet. Fordelige er hver gag med tilærmelse e klokkeformet symmetrisk fordelig som skitseret på tegige, oget som er karakteristisk for ormalfordelige. Galto-apparatet illustrerer, hvorfor ma så ofte atager, at måleresultater er værdier af e ormalfordelt variabel: Hver sømrække repræseterer e faktor, hvis iveau det ikke er muligt at holde kostat fra målig til målig, og sømrækkeres påvirkig af kugles bae symboliserer de samlede virkig, som de ukotrollerede faktorer har på størrelse af de målte egeskab. 0

25 4. Defiitio og sætig om ormalfordelig E ade illustratio af uder hvilke omstædigheder e ormalfordelt variabel ka forekomme i praksis så vi i kapitel eksempel.5 hvor ma på 75 meesker med e bestemt ledsygdom målte ph i kæleddet. Histogrammet som er getaget edefor har et klokkeformet udseede, som kraftigt atyder, at de kotiuerte stokastiske variabel X = ph er ormalfordelt. Hyppighed ,94 7,0 7,1 7,18 7,6 7,34 7,4 7,5 7,58 7,66 Mere Hyppighed I de teoretiske statistik giver de cetrale græseværdisætig e forklarig på, hvorfor ormalfordelige er e god model ved mage avedelser. De cetrale græseværdi siger (løst sagt), at selvom ma ikke keder fordelige for de esfordelte stikprøvevariable X 1, X,..., X, så vil geemsittet X være approksimativt ormalfordelt blot er tilstrækkelig stor (i praksis over 30). 4. DEFINITION OG SÆTNINGER OM NORMALFORDELING Defiitio af ormalfordelig (, ) Noralfordelige er sadsylighedsfordelige for e kotiuert stokastisk variabel X med 1 tæthedsfuktioe f(x) bestemt ved f ( x) e De har middelværdi og spredig Grafe er klokkeformet og symmetrisk om liie x =. 1 x for ethvert x At f (x ) virkelig er e tæthedsfuktio med de agive egeskaber vises i Supplemet til statistiske grudbegreber afsit.a For at få et overblik over betydige af og er der edefor afbildet tæthedsfuktioe for ormalfordeligere (0, 1), (4.8,.), (4.8, 0.7) og (10, 1). 1

26 4.Normalfordelige. 0,6 0,5 0,4 0,3 0, 0, ,1 4,8,, 4,8,0,7 10,1 Fig 4.1 Forskellige ormalfordeliger Det ses, at tæthedsfuktioere er klokkeformede, og at et iterval på [ 3 ; 3 ] ideholder stort set hele sadsylighedsmasse. Vi æver ude bevis følgede sætig: SÆTNING 4.1 Additiossætig for liearkombiatio af ormalfordelte variable. Er Y e liearkombiatio af stokastisk uafhægige, ormalfordelte variable, vil Y også være ormalfordelt. Kedes middelværdi og spredig for de ormalfordelte variable, ka ma ved avedelse af liearitetsregel og kvadratregel fide Y s middelværdi og spredig. Edvidere følger det af additiossætige, og sætig 3.1, at geemsittet med e spredig på. x er ormalfordelt

27 4. Defiitio og sætig om ormalfordelig Normeret ormalfordelig Af særlig iteresse er de såkaldte ormerede ormalfordelig. De er bestemt ved at have middelværdie 0 og spredige 1. Grafe for de er teget som graf A i figur 4.1 De kaldes sædvaligvis U eller Z og des fordelig U- eller Z-fordelige. Des tæthedsfuktio beæves og des fordeligsfuktio. Specielt vil des p - fraktil z p idgå i adskillige formler i de æste afsit. Fig 4. Normeret ormalfordelig E vigtig sammehæg mellem fraktiler for X og fraktiler for Z er følgede x (4.1) xp zp eller omvedt z Beviset for dee relatio idgår i beviset for de følgede sætig, som også viser, at ma ka overføre e vilkårlig ormalfordelig til de ormerede ormalfordelig. Det er derfor ok at kue lave et program, der ka foretage beregiger i de ormerede ormalfordelig. Der gælder følgede SÆTNING 4.. (ormerig af ormalfordelig). Når X er ormalfordelt (, ) X er de variable Z ormalfordelt ( 01,), og der gælder b b a P( X b) og Pa ( Xb). Edvidere gælder xp zp Bemærk, at det for de to formler er ligegyldigt, om ulighedere er med eller ude lighedsteg. Bevis: At Z også er ormalfordelt vises ikke her. EZ E X x 1 1 ( ) f( x) dx x f( x) dx f( x) dx E( X) V Z V X x 1 V( X) ( ) f( x) dx ( x ) f( x) dx 1 Z har derfor middelværdi 0 og spredig

28 4.Normalfordelige. Edvidere fås PX b P X b b b ( ) P Z og Pa X b P a b b a ( ) Z x p x p Bevis for xp zp : PX ( xp ) p p zp xp zp 4.3. BEREGNING AF SANDSYNLIGHEDER Stikprøves geemsit og spredig. Ofte er middelværdie og spredige ukedt i e foreliggede ormalfordelig. I så fald erstattes fordelige (, ) i praksis med e approksimerede fordelig xs (, ), såfremt der foreligger et rimelig stort atal observatioer fra de give fordelig. På basis af de i eksempel.5 agive stikprøve på 75 patieter bereges et geemsit af ph værdiere på SAK x og e s værdi på s = Vi vil altså atage, at ph værdiere er approksimativt ormalfordelt (7.9, 0.134). Øsker vi at beytte oveståede ormalfordelig (7.9, 0.134) til at fide sadsylighede for, at ph er midre ed 7., er dee sadsylighed lig med arealet af det skraverede areal uder tæthedsfuktioe. Øsker vi tilsvarede at berege sadsylighede for, at ph ligger mellem 7. og 7.5 er sadsylighede lig med det skraverede areal uder kurve på omståede figur. 4

29 4.3. Beregig af sadsyligheder Eksempel 4.. Beregig af ormalfordelte sadsyligheder Lad X være ormalfordelt (, ), hvor = 7.9 og = ) Fid P(X 7.) ) Fid P(7. X 7.5) 3) Fid P(X > 7.6) 4) Fid x 0.9 bestemt ved, at P(X< x 0.9 )=0.9 Løsig: File New Data Table Giv e søjle e overskrift Skriv et tilfældigt tal f.eks 1 i koloe edeuder Cursor på overskrifte, højre musetast Vælg i meu Formula vælg Probability Normal Distributio skriv 7, sæt komma, hvorved der u står Mea, skriv 7,9 ige komma hvorved der u står std dev, skriv 0,134 ok 1) P(X 7.) = = )P(7. X 7.5))= P(X 7.5) - P(X<7.)= = Husk at bruge JMP-tastaturet år ma skal skrive mius. 3) P(X>7.6) = 1 - P(X 7.6) = = ) Har ma omvedt givet e sadsylighed p = 0.9 og øsker at fide de tilsvarede værdi x p for hvilke P( X x p ) 09. betyder det, at ma keder arealet 0.9 og skal fide x-værdie. Det svarer jo til at fide de iverse (omvedte) fuktio af ormalfordelige. x 0.9 = = 7.46 Eksempel 4.3. Kvalitetskotrol. E fabrik støber plastikkasser. Fabrikke får e ordre på kasser, som bladt adet har de specifikatio, at kassere skal have e lægde på 90 cm. Kasser, hvis lægder ikke ligger mellem toleracegræsere 89. og 90.8 cm bliver kasseret. Det vides, at fabrikke producerer kassere med e lægde X, som er ormalfordelt med e spredig på 0.5 cm. a) Hvis X har e middelværdi på 89.6, hvad er så sadsylighede for, at e kasse har e lægde, der ligger idefor toleracegræsere. b) Hvor stor er sadsylighede for at e kasse bliver kasseret, hvis ma justerer støbige, så middelværdie bliver de der giver de midste procetdel kasserede (spredige ka ma ikke ædre). Fabrikate fider, at selv efter de i spørgsmål foretage justerig kasseres for stor e procetdel af kassere. Der øskes højst 5% af kassere kasseret. c) Hvad skal spredige formidskes til, for at dette er opfyldt? Hvis det er umuligt at ædre, ka ma prøve at få ædret toleracegræsere. d) Fid de ye toleracegræser (placeret symmetrisk omkrig middelværdie 90,0) idet spredige stadig er 0.5, og højst 5% må kasseres. E y maskie idkøbes, og som et led i e udersøgelse af, om der dermed er sket ædriger i middelværdi og spredig produceres 1 kasser ved avedelse af dee maskie. Ma fadt følgede lægder: e) Agiv på dette grudlag et estimat for middelværdi og spredig. 5

30 4.Normalfordelige. Løsig: Vælg i søjle Formula a) P(89. X 90.8)= = = 77.99% b) Middelværdie justeres til midtpuktet P(X>90.8)+P(X<89.)= 1-P(X<90.8) + P(X<89,) = =0.1096= 10.96% c) Da der ligger 5% udefor itervallet, så må af symmetrigrude,5% ligge på hver si side af itervallet. Vi har følgelig, at vi skal fide spredige så P( X 89. ) z z =0.408 d) Kaldes de edre toleracegræse for a fås med samme begrudelse som i pukt c : P( X a) Vi ka her beytte de iverse ormalfordelig Nedre græse a = = 89.0 Øvre græse b = 90 +( ) = e) Data idtastes i koloe med av x Aalyze Distributio x idsættes i Y,colums OK, ederst trykkes på rød pil og ma vælger Customize Summery Statistics Marker Mea og Stdev (slet reste) Geemsit: Spredig: Eksempel 4.4. Additiossætig. E boreproces fremstiller huller med e diameter X 1, der er ormalfordelt med e middelværdi 1 =10 og e spredig på E ade proces fremstiller aksler med e diameter X, der er ormalfordelt med e middelværdi = 9.94 og e spredig på Fid sadsylighede for, at e tilfældig valgt aksel har e midre diameter ed e tilfældig valgt borehul. Løsig: P( X X1) P( X X1 0). Sættes Y X X1er Y ormalfordelt. E( Y) E( X) E( X1) V( Y) 1 V( X ) ( 1) V( X ) ( Y) P(X < X 1 )= P(Y<0) = = = 88.49% 6

31 Opgaver til kapitel 4 OPGAVER Opgave 4.1 1) E stokastisk variabel X er ormalfordelt med = 3.1 og =.4. Fid P( X. ), P( X 53. ) og P(. 3 X 7. 8). ) Fid tallet x, hvor P(X<x) = 0.1. Opgave 4. Maksimumstemperature, der opås ved e bestemt opvarmigsproces, har e variatio der er tilfældig og ka beskrives ved e ormalfordelig med e middelværdi på o og e spredig på 5.6 o C. 1) Fid procete af maksimumstemperaturer, der er midre ed o C. ) Fid procete af maksimumstemperaturer, der ligger mellem 115 o C og o C. 3) Fid de værdi, som overskrides af 57.8% af maksimumstemperaturere. Ma overvejer at gå over til e ade opvarmigsproces. Ma udfører derfor 16 gage i løbet af e periode forsøg, hvor ma måler maksimumstemperature, der opås ved dee ye proces. Resultatere var 116.6, 116,6, 117,0, 14,5, 1,, 18,6, 109,9, 114,8, 106,4, 110,7, 110,7, 113,7, 18,1, 118,8, 115,4, 13,1 4) Giv et estimat for middelværdie og spredige. Opgave 4.3 E fabrik plalægger at starte e produktio af rør, hvis diametre skal opfylde specifikatioere,500 cm ± 0,015 cm. Ud fra erfariger med tilsvarede produktioer vides, at de producerede rør vil have diametre, der er ormalfordelte med e middelværdi på,500 cm og e spredig på 0,010 cm. Ma øsker i forbidelse med plalægige svar på følgede spørgsmål: 1) Hvor stor e del af produktioe holder sig idefor specifikatiosgræsere. ) Hvor meget skal spredige ed på, for, at 95% af produktioe holder sig idefor specifikatiosgræsere (middelværdie er uædret på,500 cm). 3) Fabrikke overvejer, om det er muligt at få idført ogle specifikatiosgræser (symmetrisk omkrig,500), som bevirker, at 95% af dets produktio falder idefor græsere. Fid disse græser, idet det stadig atages at middelværdie er.500 og spredige cm. Opgave 4.4 E automatisk dåsepåfyldigsmaskie fylder høskødssuppe i dåser. Rumfaget er ormalfordelt med e middelværdi på 800 m og e spredig på 6,4 ml. 1) Hvad er sadsylighede for, at e dåse ideholder midre ed 790 m?. ) Hvis alle dåser, som ideholder midre ed 790 m og mere ed 805 m bliver kasseret, hvor stor e procetdel af dåsere bliver så kasseret? 3) Bestem de specifikatiosgræser der ligger symmetrisk omkrig middelværdie på 800 m, og som ideholde 99% af alle dåser. 7

32 4.Normalfordelige. Opgave 4.5 I et laboratorium lægges et yt gulv. Det forudsættes, at vægte Y der hviler på gulvet, er summe af vægte X 1 af maskier og apparater og vægte X af varer og persoale, dvs. Y = X 1 + X Da både X 1 og X er sum af mage relativt små vægte, atages det, at de er ormalfordelte. Det atages edvidere at X 1 og X er statistisk uafhægige. Erfariger fra tidligere gør det rimeligt at atage, at der gælder følgede middelværdier og sprediger (målt i tos): E(X 1 ) = 6.0, ( X 1 ) = 1., E(X ) = 3.5, ( X ) = ) Bereg E(Y) og ( Y). ) Bereg det tal y 0, som vægte Y med de oveævte forudsætiger ku har e sadsylighed på 1% for at overskride. 3) Bereg sadsylighede for, at vægte af varer og persoale e tilfældig dag, efter at det ye gulv er lagt, er større ed vægte af maskier og apparater. (Vik: se på differese X - X 1 ) Opgave 4.6 Ved fabrikatio af et bestemt mærke opvaskemiddel fyldes vaskepulver i papkartoer. I middel fyldes 400 g pulver i hver karto, idet der herved er e spredig på 1 g. Pulverfyldige ka forudsættes ikke at afhæge af kartoeres vægt, der i middel er 50 g med e spredig på 5g. Bereg sadsylighede p for, at e tilfældig pakke opvaskemiddel har e bruttovægt mellem 450 g og 4300 g. Opgave 4.7 Et system er af sikkerhedsmæssige grude opbygget af to apparater A, der er parallelforbude (se figur) således, at systemet virker, så læge blot et af apparatere virker. Svigter et af apparatere, startes reparatio. Det atages, at reparatiostide er ormalfordelt med middelværdie rep = 10 timer og spredig rep = 3 timer. I reparatiostide overbelastes de ade kompoet, og det atages, at des levetid fra reparatioes start (approksimativt) er ormalfordelt med middelværdi og spredig = 4 timer. 1) Fid sadsylighede for, at reparatioe er afsluttet, ide de ade kompoet fejler, hvis = 0 timer. ) Hvor stor skal være, for at sadsylighede for, at reparatioe ka afsluttes før de ade kompoet fejler, er mere ed 99.9%? Opgave 4.8 Vægte af e (tilfældig udvalgt) tablet af e vis type mod hovedpie har middelværdie 0.65 g og spredige 0.04 g. 1) Bereg middelværdi og spredig af de sammelagte vægt af 100 (tilfældigt udvalgte ) tabletter. ) Atag, at ma beytter følgede metode til at fylde tabletter i et glas. Ma placerer glasset på e vægt og fylder tabletter på, idtil vægte af tablettere i glasset overstiger 65,3 g. Bereg sadsylighede for, at glasset kommer til at ideholde mere ed 100 tabletter (se bort fra vægtes fejlvisig). 8

33 5.1 Udtagig af stikprøver 5. Kofidesiterval for ormalfordelt variabel 5.1 UDTAGNING AF STIKPRØVER I lagt de fleste i praksis forekome tilfælde vil det bl.a. af tidsmæssige og omkostigsmæssige grude være umuligt at foretage e totaltællig af hele populatioe. Helt klart er dette ved afprøvige ødelægger emet (åbig af koservesdåser) eller populatioe i pricippet er uedelig ( for at udersøge om e metode giver et større udbytte ed et adet, udføres e række kemiske forsøg og her er der teoretisk ige øvre græse for atal delforsøg) Som det seere vil fremgå ka selv e forholdsvis lille repræsetativ stikprøve give svar på væsetlige forhold omkrig hele populatioe. Det er imidlertid klart, at e betigelse herfor er, at stikprøve er repræsetativ, dvs. at stikprøve med hesy til de egeskab der øskes er et mii-billede af populatioe. For at opå det, foretager ma e eller ade form for lodtrækig (kaldes radomiserig). Afhægig af problemet ka dette gøres på forskellig måde. Simpel udvælgelse. De ekleste form for stikprøveudtagig er, at ma ummererer populatioes elemeter, og så radomiserer (ved lodtrækig, evt. ved at beyttet et program der geerer tilfældige tal) udtager de N elemeter der skal idgå i stikprøve. Eksempel: For at udersøge om e ædrig af vitamiidholdet i foderet for svi ædrede deres vægt, udvalgte ma ved radomiserig de svi, som fik det ye foder. Stratificeret udvælgelse. Uder visse omstædigheder er det fordelagtigt (midre stikprøvestørrelse for at opå samme sikkerhed) at opdele populatioe i midre grupper (kaldet strada), og så foretage e simpel udvælgelse idefor hver gruppe. Dette er dog ku e fordel, hvis elemetere idefor hver gruppe er mere esartet ed mellem gruppere. Eksempel: Øsker ma at spørge vælgere om deres holdig til et politisk spørgsmål (f.eks. om deres holdig til et skattestop) kue det måske være e fordel at dele dem op i idkomstgrupper (høj, mellem og lav). Systematisk udvælgelse. Ved e såkaldt systematisk udvælgelse, vælger ma at udtage hver k te elemet fra populatioe. Eksempel: E detailhadler øsker at måle tilfredshede hos sie kuder. Der øskes udtaget 40 kuder i løbet af e speciel dag. Da ma aturligvis ikke på forhåd keder de kuder der kommer i butikke, vælges e systematisk udvælgelse, ved at vælge hver 7'ede kude der forlader butikke. Ma starter dage med ved lodtrækig at vælge et af tallee fra 1 til 7. Lad det være tallet 5. Ma udtager u kude r. 5, 517 1, 57 19,..., Derved har ma fået valgt i alt 40 kuder. Problemet er aturligvis, om tallet 7 er det rigtige tal. Hvis ma får valgt tallet for stort, eksempelvis sætter det til 30, så vil e stikprøve på 40 kræve, at der er 1175 kuder de dag, og det behøver jo ikke at være tilfældet. Omvedt hvis tallet er for lille, så får ma måske udtaget de 40 kuder i løbet af formiddage, og så er stikprøve ok ikke repræsetativ, da ma ikke får eftermiddagskudere med. 9

34 5 Kofidesiterval for ormalfordelt variabel Klygeudvælgelse (Cluster samplig) Dee metode ka med fordel beyttes, hvis populatioe består af eller ka iddeles i delmægder (klyger). Metode består i, at ma ved radomiserig vælger et midre atal klyger, som så totaltælles. Eksempel: I et vareparti på 000 emer fordelt på 00 kasser hver med 10 emer øsker ma e vurderig af fejlprocete. I alt øskes udtaget 50 emer. Ma udtager radomiseret 5 kasser, og udersøger alle emere i kassere. 5.. FORDELING OG SPREDNING AF GENNEMSNIT Udtages e stikprøve fra e populatio er det jo for, at ma ud fra stikprøve ka fortælle oget cetralt om hele populatioe. I eksempel 1.5 var vi således iteresseret i kocetratioe af britioer (ph) i ledvæske i kæet hos patieter, der led af dee sygdom. Som led i e ordisk medicisk udersøgelse udtog ma bladt patieter der led af dee sygdom tilfældigt e stikprøve på 75. På basis heraf beregede ma geemsittet af ph værdiere til x = og spredige s = Ma vil u sige, at et estimat (skø) for de sade middelværdi for hele populatioe er 7.9 og de sade spredig er Det er imidlertid klart, at disse tal er behæftet med e vis usikkerhed. Havde vi valgt 75 adre patieter havde vi ude tvivl fået lidt adre tal. Det er derfor ikke ok, at agive at de sade middelværdi er x, vi må også agive et usikkerhedsiterval. For at kue berege et sådat iterval er det ødvedigt at kede fordelige. Her spiller de tidligere ævte cetrale græseværdisætig e vigtig rolle, idet de jo (løst sagt) siger, at selv om ma ikke keder fordelige af de kotiuerte stokastiske variabel, så vil geemsittet af værdiere i e stikprøve på tal vil være tilærmelsesvis ormalfordelt, hvis blot er tilstrækkelig stor ( i praksis over 30). Dette er af stor praktisk betydig, idet det så ikke er så vigtigt, om selve populatioe er ormalfordelt. Ofte er det jo ku af iteresseret at kue forudsige oget om hvor middelværdie af fordelige er placeret. Edvidere fremgik det af sætig 3.1, at spredige på x er ( x), hvor er spredige på de ekelte værdi i stikprøve. Heraf fremgår, at geemsittet ka ma stole mere på ed de ekelte målig, da de har e midre spredig. 30

35 5.3 Kofidesiterval for middelværdi Eksempel 5.1. Fordelig af geemsit De tid, et kude må veter i e lufthav ved e check-i disk, er givet at være e stokastisk variabel med e ukedt fordelig. Ma har dog erfarig for, at vetetide i middel er på 8. miutter med e spredig på 3 miutter. Udtages e stikprøve på 50 kuder, øskes fudet sadsylighede for, at de geemsitlige vetetid for disse kuder er mellem 7 og 9 miutter. Løsig: Da atallet i stikprøve på 50 er større ed 30, ka vi atage at geemsittet er approksimativt ormalfordelt med e middelværdi på 8. og e spredig på 3. x 50 Vi har derfor P( 7 X9) P( X9) P( X 7) = =0.968 = 96.8% 5.3. KONFIDENSINTERVAL FOR MIDDELVÆRDI Defiitio af kofidesiterval Udtages e stikprøve fra e populatio er det jo for, at ma ud fra stikprøve ka fortælle oget cetralt om hele populatioe. Ma vil eksempelvis berege geemsittet sade middelværdi for hele populatioe x og agive det som et estimat (skø) for de Det er imidlertid klart, at selv om et geemsit har e midre spredig ed de ekelte målig, så er det stadig behæftet med et vis usikkerhed Det er derfor ikke ok, at agive at de sade middelværdi er x, vi må også agive et usikkerhedsiterval. Et iterval idefor hvilket de sade værdi kaldes et 95% kofidesiterval for middelværdie. med eksempelvis 95% sikkerhed vil ligge, Mere præcist gælder det, at hvis ma for et stort atal stikprøver på de samme stokastiske variabel agav 95% kofidesitervaller, så ville de sade middelværdi tilhøre 95% af disse itervaller. 1 1 Præcis defiitio af kofidesiterval. Lad være givet e stikprøve for e stokastisk variabel X, lad være et tal mellem 0 og 1. Lad edvidere være e puktestimator for parametere og lad L og U være stokastiske variable, for hvilke det gælder, at PL ( U). På basis af de give stikprøve fides tal l og u som bestemmer det øskede iterval l u. Dette kaldes et 100 procet kofidesiterval for de ukedte parameter. 31

36 5 Kofidesiterval for ormalfordelt variabel Populatioes spredig kedt eksakt Et 95% kofidesiterval [ x r; x r] må ligge symmetrisk omkrig geemsittet, og således, at Px ( r X xr) Heraf følger, at hvis de sade middelværdi ligger i et af de farvede områder på figure, så er der midre ed.5% chace for, at vi ville have fået det fude geemsit x. For at fide græse for itervallet, må vi fide e middelværdi så P( X x) x r x x r Ma må her huske, at et geemsit har spredige, hvor σ er spredige på de ekelte målig og er atal måliger i stikprøve. Fremfor at løse oveståede ligig, er det lettere at beytte formle i sætig 5.1 Sætig 5.1. Spredig kedt eksakt Er spredige eksakt kedt er et 95% kofidesiterval bestemt ved formle x z0975. x z0975. Bevis: Af formle xp zp fås, idet ( X ), at x z x z Vi har følgelig, at radius i kofidesitervallet er r z0975. Sædvaligvis udtrykkes de geerelle formler ved sigifikasiveauet, som er sadsylighede for at begå e fejl. sættes sædvaligvis til 10%, 5%, 1 % eller 0.1% svarede til heholdsvis 90%, 95%, 99% og 99.9% kofidesitervaller. x z x z I så fald bliver formle (udtrykt ved ) 1 1 3

37 5.3 Kofidesiterval for middelværdi Eksempel 5.. Kofidesiterval hvis spredige er kedt eksakt Lad geemsittet af 1 måliger være x 90, og lad os atage, at spredige kedes eksakt til 0.5. Bestem et 95% kofidesiterval for middelværdie μ. Løsig: Nedre græse : P(X<)=0.05 = =89,717 Øvre græse ø: PX<ø)=0.975 ø = = % kofidesiterval: [ ; 90.83] Vi ved derfor med 95% sikkerhed, at populatioes sade middelværdi ligger idefor disse itervaller Populatioes spredig ikke kedt eksakt Sædvaligvis er populatioes spredig jo ikke eksakt kedt, me ma reger et estimat s ud for de. Da s jo også varierer fra stikprøve til stikprøve, giver dette e ekstra usikkerhed, så kofidesitervallet for bliver bredere. Ma må så i formle x z0975. x z0975. erstatte Z-fraktile z med e såkaldt T-fraktil t (f) (også beævt t ) hvor frihedsgradstallet f = - 1, og = atal måliger) , f Mere geerelt udtrykt ved sigifikasiveauet erstattes i formle x z x z z- fraktile z med t - fraktile t , f t-fordeliger E t - fordelig har samme klokkeformede udseede som e Z - fordelig (e ormalfordelig med middelværdi 0 og spredig 1) I modsætig til Z - fordelige afhæger des udseede imidlertid af atallet af tal i stikprøve. Er frihedsgradstallet f = -1 stort (over 30) er forskelle mellem e U- fordelig og e t- fordelig så lille, at de sædvaligvis er ude praktisk betydig. Er f lille bliver t - fordelige så meget bredere ed Z - fordelige, at t-fordelige må avedes i stedet for Z-fordelige. Grafe viser tæthedsfuktioe for t-fordeligere for f = 1, 5 og 30. Mere præcist, at af de 100 stikprøver med tilhørede 95% kofidesitervaller, vil i middel ku 5 af disse itervaller ikke ideholde de sade værdi. 33

38 5 Kofidesiterval for ormalfordelt variabel Eksempel 5.3. Beregig af t-værdier. 1) Fid t ( 1) og t 005. ( 1). ) Fid P( X 1), hvor X er t - fordelt med 1 frihedsgrader. Løsig: Formula Statistik Probability tquatile idsæt data 1) t ( 1) tquatile(0,975,1) =.18 t ( 1) tquatile(0,05,1) = -.18 ) P( X 1) = 1 - tdistributio(1, 1) = = 16.85% Er de eksakte værdi af spredige ukedt, erstattes de i de af sætig 5.1 agive formel med spredige s. Idet s har frihedsgradstallet - 1 erstattes z med t ( - 1) Herved fremkommer sætige. Sætig 5.. (De eksakte værdi af spredig ukedt) s Et 95 % kofidesiterval er bestemt ved formle: xt0, 975( 1) xt0. 975( 1) s s (eller udtrykt ved x t x t 1, 1 1, 1 Eksempel 5.4. Kofidesiterval, hvis spredige ikke er kedt eksakt. Ved fremstillig af et bestemt levedsmiddel er det vigtigt, at et tilsætigsstof fides i levedsmidlet i e kocetratio på 8.50 (g/l). For at kotrollere dette udtager levedsmiddelkotrolle 6 prøver af levedsmidlet. Resultatere var: Målig r kocetratio x (g/l) Idet ma atager, på baggrud af tidligere ligede måliger, at resultatere er ormalfordelte, skal ma besvare følgede spørgsmål:. a) Agiv et estimat for kocetratioes middelværdi og spredig. b) Agiv et 95% kofidesiterval for kocetratioe, og vurder herudfra om kravet på 8.50 er opfyldt. s 34

39 5.3 Kofidesiterval for middelværdi Løsig SAS.JMP har idbygget et program, så ma ikke behøver at avede formlere direkte. Data idsættes i søjle med av x a) Aalyze Distributio x idsættes i Y,Colums OK, ederst fremkommer følgede tabel Resultater: x 868. og s b) 95% kofidesiterval: [8.0 ; 8.5] Da itervallet ideholder 8.50, er kravet opfyldt, me da itervallet ku lige etop ideholder tallet 8.50, så det vil ok være rimeligt, at foretage e y vurderig på basis af ogle flere måliger. Eksempel 5.5 Kofidesiterval, hvis origiale data ikke kedt Fid kofidesitervallet for middelværdie, idet stikprøve er på 0 tal, som har et geemsit på 50 og e spredig på 1. Løsig: Ma beytter formle i sætig 5. s s Formel xt0975, ( 1) xt0975. ( 1) 1 r = t ( 19) = Da der er symmetri omkrig x fås kofidesitervallet [ ; ] = [ ; ] 95% kofidesiterval :[44.38 ; 55.6] Prædistiatiositerval. Ved mage avedelser øsker ma at forudsige, hvor værdie af e kommede observatio af de variable med 95% sikkerhed vil falde, sarere ed at give et 95% kofidesiterval for middelværdie af de variable. Ma siger, at ma øsker at bestemme et 95% prædistiatiositerval (forudsigelsesiterval). SÆTNING 5. ( 100 ( 1 ) % prædistiatiositerval for e ekelt observatio ). Et 100 ( 1 ) % prædistiatiositerval for e ekelt fremtidig observatio X +1 er bestemt ved 1 1 x t ( 1) s 1 x t ( 1) s Bevis: Lad X 1 være e ekelt fremtidig observatio. Eftersom X 1 er uafhægig af de øvrige X er, er X 1 også uafhægig af X. Variase af differese X X 1 er følgelig V( X X ) V( X) V( X )

40 5 Kofidesiterval for ormalfordelt variabel Da ma sædvaligvis først reger kofidesitervallet ud, så er de emmeste måde at berege det tilsvarede prædistiatiositerval at beytte, at radius r p i prædistiatiositerval fås af radius r k i kofidesitervallet ved formle r r 1 s Bevis: rp t 1 s ( ) t ( 1) s t ( 1) 1 rk p k Eksempel 5.6. Prædistiatios-iterval for middelværdi af ormalfordelig. Samme problem som i eksempel 5.4, me u øskes bestemt et 95% prædistiatiositerval for e ekelt y målig af kocetratioe. Løsig Da kofidesitervallet har lægde = 0.50 er radius r k = 0.5 Vi har derfor r p = og dermed 95% prædistiatiositerval ; ; SAS.JMP: Rød pil ved x Predictio Iterval skriv 0,95 og vælg Two-sided OK Bestemmelse af stikprøves størrelse Før ma starter sie måliger, kue det være yttigt på forhåd at vide ogelude hvor mage måliger ma skal foretage, for at få resultat med e give øjagtighed. Hvis spredige atages kedt, ved vi, at radius i kofidesitevallet er r z 1 Løses dee ligig med hesy til fås z 1 r Det grudlæggede problem er her, at ma æppe keder spredige eksakt. Ma keder muligvis på basis af tidligere erfariger størrelsesordee af spredige. Hvis ikke må ma evetuelt lave ogle få måliger, og berege et s på basis heraf. Som e første tilærmelse atages, at atallet af getagelser er over 30, så ma ka bruge U- fordelige. Hvis det derved viser sig, at er uder 30 avedes i stedet e t-fordelig, idet vi løser ligige t 1 ( 1) r Det følgede eksempel illustrerer fremgagsmåde. 36

41 5.3 Kofidesiterval for middelværdi Eksempel 5.7. Bestemmelse af stikprøves størrelse. E forstmad er iteresseret i at bestemme middelværdie af diametere af vokse egetræer i e bestemt fredet skov. Der blev målt diametere på 7 tilfældigt udvalgte egetræer (i 1 meters højde over jorde) På basis af måligere på de 7 træer sættes s 14. a) Fid hvor mage træer der skal måles, hvis et 95% kofidesiterval højst skal have e radius på ca. 5 cm. b) Fid hvor mage træer der skal måles, hvis et 95% kofidesiterval højst skal have e radius på ca. 6 cm. Løsig: a) Først beyttes formle z s r = 31 Da > 30 er det rimeligt, at beytte e Z- fordelig frem for e t-fordelig. Der skal altså tilfældigt udvælges ca. 31 egetræer. b) Beyttes samme formel som uder spm. a) fås = 1 Da < 30 burde ma have avedt e t - fordelig. t0975.,( 1) s r søjler beæves og 1 I søjle skrives og i søjle 1 skrives Derefter skrives 3 i søjle osv. Resultat Heraf ses, at = 4, da vi jo må vælge de største værdi Der skal altså tilfældigt udvælges ca. 4 egetræer. Da overslaget jo er afhægigt af om vurderige af s er korrekt, bør ma dels for e sikkerheds skyld vælge s lidt rigelig stor, dels efter at ma har målt de 31/4 træer lige kotrollere beregige af kofidesitervallet. 5.4 KONFIDENSINTERVAL FOR SPREDNING I visse situatioer øsker ma at fide et kofidesiterval for spredige. Vi vil ikke gå ærmere id på teorie herfor, me blot hevise til formlere i oversigt 5.5. Er de eksakte værdi af middelværdie ukedt skal følgede formel beyttes: ( 1) s ( 1) s ( 1) ( 1) 1 I formlere idgår de såkaldte - fordelig, (udtales ki i ade). 37

42 5 Kofidesiterval for ormalfordelt variabel -fordeliger -fordelige beyttes ved beregiger omkrig variaser, år disse er erstattet af et estimat s. 1 På figure er afbildet tæthedsfuktioe for - fordeligere () 5, ( 10) og ( 0). Det ses, at ku er defieret for tal større ed eller lig ul, og at -fordeliger ikke er symmetriske om middelværdie. Jo større frihedsgradstallet bliver jo mere symmetriske bliver de dog, og for store f - værdier - i praksis f > 30 - ka e -fordelig ( f ) approksimeres med ormalfordelige (, ), hvor f og f. SAS.JMP har e kumuleret - fordelig ligesom aturligvis alle statistikprogrammer har det. Eksempel 5.8. Beregig af - værdier. 1) Fid () 8 og () 8. ) Fid P( X 5), hvor X er - fordelt med 8 frihedsgrader. Løsig: Formula, Probability, ChiSquare Quatiler, udfyld meu 1) () 8 = = () 8 = = ) P( X 5) = = Defiitio af χ -fordelige. Lad U 1, U,..., U f være uafhægige ormerede ormalfor-delte variable. Sadsylighedsfordelige for de stokastiske variabel U1 U,..., U f kaldes -fordelige med frihedsgradstallet f og beteges ( f ) 38

43 5.4 kofidesiterval for spredige Eksempel 5.9. Kofidesiterval for varias og spredig af ormalfordelig. E virksomhed øsker at kotrollere med hvilke spredig e bestemt målemetode agiver saltidholdet i e opløsig. Der foretages følgede 1 måliger af e opløsig af det pågældede salt. Resultatere var: Målig r % opløsig a) Agiv på basis af måleresultatere et estimat for opløsiges spredig. b) Agiv et 95% kofidesiterval for spredige. Løsig: a) Data idtastes i koloe med av x Aalyze Distributio x idsættes i Y,Colums OK, ederst trykkes på rød pil og ma vælger Customize Summery Statistics Marker Stdev og Variace (slet reste) Resultat fides ederst: Spredig s = b) Der må avedes formel 3 i oversigt 5.5 : ( 1) s ( 1) s ( 1) ( 1) 1 Formula: Nedre græse for varias: =0,05018 Øvre græse for varias = % kofidesiterval for varias [ ; 0.883] 95% kofidesiterval for spredig : [0.40 ; ] hvor =

44 5 Kofidesiterval for ormalfordelt variabel 5.5. OVERSIGT over cetrale formler i kapitel 5 X atages ormalfordelt (, ).Givet stikprøve af størrelse med geemsit x og spredig s Oversigt over kofidesitervaller r Forudsætiger ukedt. ukedt ukedt. kedt ukedt ukedt. kedt ukedt. Estimat for parameter 100 (1 - ) % kofidesiterval for parameter For : For : x x s x t ( 1) x t ( 1) 1 1 Metode: se eksempel 5.4 eller eksempel 5.5 x z x z 1 1 Metode : se eksempel 5. For : s ( 1) s ( 1) s ( 1) ( 1) For : s ( ) s ( x ) 1 1 Metode: se eksempel 5.9 ( 1) s ( x ) ( 1) s ( x ) ( ) ( ) 1 Oversigt over prædistiatiositervaller r Forudsætiger Estimat for parameter 100 (1 - ) % kofidesiterval for parameter 1 ukedt. kedt For : x radius i kofidesiterval r k z 1 radius i prædistiatiositerval r r 1 p k s ukedt. ukedt For : x radius i kofidesiterval rk t ( ) 1 1 s radius i prædistiatiositerval r r 1 p k Bestemmelse af stikprøves størrelse. Øsket værdi af radius r i 100 (1 - ) % kofidesiterval 1 kedt eller > 30 z 1 Metode: se eksempel 5.7 r ukedt, me atag de højst er s t ( 1) s Metode: se eksempel r 40

45 Opgaver til kapitel 5 OPGAVER Opgave 5.1 E fabrik producerer stempelrige til e bilmotor. Det vides, at stempelrigees diameter er approksimativt ormalfordelt. Stempelrigee bør have e diameter på mm. For at kotrollere dette udtog ma tilfældigt 15 stempelrige af produktioe og målte diametere. Ma fadt, at et estimat for diametere var og for spredige var Agiv et 95% kofidesiterval for. Opgave 5. Lad der være givet 10 uafhægige observatioer af e syres kocetratio (i %) ) Fid et estimat for kocetratioes middelværdi og spredig. ) Agiv et 95% kofidesiterval for. 3) Agiv et 95% prædistiatiositerval for e ekelt y målig af kocetratioe.. Opgave 5.3 Trykstyrke i beto blev kotrolleret ved at ma støbte 1 betoklodser og testede dem. Resultatet var: ) Fid et estimat for trykstyrkes middelværdi og spredig. ) Agiv et 95% kofidesiterval for. 3) Agiv et 95% prædistiatiositerval for e ekelt målig af trykstyrke på e y betoklods. 4) Ma fadt, at radius i kofidesitervallet var for stor. Bestem med tilærmelse atallet af måliger der skal udføres, hvis radius højst skal være 1. Opgave 5.4 E polymer produceres i batch. Viskositetsmåliger udført på hver batch geem et stykke tid har vist, at variatioe i processe er meget stabil med spredig = 0. På 15 batch gav viskositetsmåligere følgede resultater: ) Fid et estimat for viskositetes spredig. ) Agiv et 95% kofidesiterval for, for at kotrollere påstade om, at = 0. 3) Fid et estimat for viskositetes middelværdi. 4) Agiv et 95% kofidesiterval for. 41

46 5 Kofidesiterval for ormalfordelt variabel Opgave 5.5 Ved e fabrikatio af et bestemt sprægstof er det vigtigt, at e reaktoropløsig har e ph-værdi omkrig 8.0. Der foretages 6 måliger på e bestemt reaktatopløsig. Resultatere var: ph De beyttede ph-målemetode atages på baggrud af tidligere ligede måliger at give ormalfordelte resultater. 1) Agiv et estimat for opløsiges middelværdi og spredig. ) Agiv et 95% kofidesiterval for ph. 3) Ma fider, at radius i kofidesitervallet er for bredt. Agiv med tilærmelse atallet af måliger der skal foretages, hvis radius skal være 0.1. Opgave 5.6 De 10 øverste ark papir i e pakke med priterpapir har følgede vægt a) Agiv et estimat for middelværdie af papirets vægt, og et 95%-kofidesiterval herfor. b) Agiv med tilærmelse atallet af ark, der skal avedes, hvis radius i kofidesitervallet højst skal være r = 0.01 c) Agiv et 95%-prædistiatiositerval for e ekelt yt ark papir. d) Agiv et estimat for spredige og et 95%-kofidesiterval for spredige af papirets vægt. Opgave 5.7 Til udersøgelse af alkoholprocete i e persos blod foretages 4 uafhægige måliger, som gav følgede resultater (i ): ) Opstil et 95% kofidesiterval for persoes alkoholkocetratio. ) Opstil et 95% kofidesiterval for målemetodes spredig. 4

47 6.1 Grudlæggede begreber 6 HYPOTESETEST (ÉN NORMALFORDELT VARIABEL) 6.1 GRUNDLÆGGENDE BEGREBER Ofte vil ma se vediger som Stikprøve viser, at udbyttet ved de y metode er sigifikat større ed ved de hidtidig avedte metode Statistiske problemer, hvor ma på basis af e stikprøve øsker med eksempelvis 95% sikkerhed at bevise e påstad om hele populatioe kaldes hypotesetest. De forskellige begreber der idgår i e hypotesetest vil blive geemgået i forbidelse med følgede eksempel. Eksempel 6.1. Hypotesetest med kedt spredig. E fabrik har geem mage år beyttet e metode, der på basis af e give mægde råmateriale gav et middeludbytte af et produceret stof på 0 = 69. kg og spredige = 1.0 kg. E yasat igeiør får til opgave at søge at forøge middeludbyttet ved e passede (billig) modifikatio af procesbetigelsere. Efter e række lovede eksperimeter i laboratoriet syes opgave at være lykkedes, me det edelige bevis herfor er, ud fra et passede atal driftsforsøg statistisk at kue bevise, at middeludbyttet er blevet forøget. Ud fra kedskab til de forskellige mulige støjfaktorer atages spredige at være uædret på 1.0 kg. Da driftsforsøgee er meget ressourcekrævede, bevilges der ku 1 delforsøg. Der foretages 1 uafhægige delforsøg og udbyttet x måltes: Forsøg r x ) Ka ma ud fra disse data bevise på sigifikasiveau = 0.05, at middeludbyttet er blevet forøget? ) Hvis svaret i spørgsmål 1 er bekræftede, så agiv et estimat for det ye middeludbytte, og agiv et 95% kofidesiterval herfor. 43

48 6. Hypotesetestig (1 ormalfordelt variabel) Løsig: 1) Løsige opdeles for overskuelighedes skyld i e række tri 1a) Defiitio af stokastisk variabel X. X = udbyttet ved de modificerede proces. 1b) Valg af X s fordeligstype. X atages at være approksimativt ormalfordelt (, 10. ). 1c) Opstillig af ulhypotese og alterativ hypotese Der opstilles e såkaldt Nulhypotese H 0 : = 69. kg. Nulhypotese skal ideholde e kokret påstad (her et lighedsteg). Påstade er, at modifikatioe ige (ul) virkig har Der opstilles edvidere e alterativ hypotese H: > 69. kg. De alterative hypotese skal så vidt muligt ideholde det, der øskes bevist. I dette tilfælde øskes vist, at middeludbyttet er vokset, dvs. > 69. kg. Teste kaldes e esidet test i modsætig til e tosidet test : H 0 : = 69. kg cotra H: 69. kg, hvor vi blot øsker at vise, at middeludbyttet har ædret sig. 1d) Agivelse af testes sigifikasiveau. Hvis stikprøves geemsit x er meget større ed 69. kg ( måske helt op mod 100 kg), så er der stor sadsylighed for at udbyttet er steget. Ma siger så, at ulhypotese forkastes, eller at x ligger i forkastelsesområdet (se figur 6.1). Hvis derimod x ku ligger lidt over 69. kg, så ka det skyldes tilfældige udsvig, og ma ka ikke med oge stor sikkerhed kokludere, at udbyttet er steget. Ma siger, at ulhypotese accepteres, eller at x ligger i acceptområdet. Fig. 6.1 Accept- og forkastelsesområde Lad x 0 være græse mellem acceptområdet og forkastelsesområdet. x 0 skal bestemmes såda, at forudsat H 0 : = 69. kg er sad, så er det yderst usadsyligt, at e stikprøves geemsit x vil komme til at ligge i forkastelsesområdet. Hvis stikprøves geemsit alligevel ligger i forkastelsesområdet, må det være forudsætige H 0 der er forkert, d.v.s. middeludbyttet må være blevet større. Det er aturligvis ikke etydigt bestemt, hvad det vil sige, at oget er yderst usadsyligt. Ma starter derfor ehver test med at fastlægge det såkaldte sigifikasiveau. Er valgt til 5%,så har ma derved fastlagt, at sadsylighede for fejlagtigt at påstå, at middeludbyttet er steget, er uder 5%. 44

49 6.1 Grudlæggede begreber Da det ka have alvorlige økoomiske kosekveser fejlagtigt at påstå at middeludbyttet er steget (produktioe omstilles osv.),så er ma aturligvis iteresseret i, at dette ikke sker. Det ormale i idustriel produktio er, at sætte = 5%, me er det eksempelvis mediciske forsøg, hvor det ka have alvorlige meeskelige kosekveser, sættes måske så lavt som 1% eller 0.1%, mes ma i adre situatioer måske sætter sigifikasiveauet til 10%. I dette eksempel er sat til 5%. 1e) Beregig af P - værdi Berege geemsit: Tallee idtastes i e søjle med av x. Aalyze Distributio marker x og tryk på y,colums ok Der fremkommer et histogram og ogle tabeller. Nederst ses e tabel hvor der står Mea Ma ka få alle de adre tal væk ved rød pil ved Summary Statistics Customize Summery statistics Fjer de ma ikke øsker x = kg. Uder forudsætig af at ulhypotese H 0 : = 69. kg er sad, så er X er ormalfordelt med middelværdi 0 = 69. og spredig Vi ka derfor emt fide de præcise adskillelse mellem accept og forkastelsesområdet, da de jo er bestemt ved at arealet skal være 95%. =69.67 Da > ligger det målte geemsit altså i forkastelsesområdet. Imidlertid vælger ma i stedet at berege de såkaldte P-værdi (Probability value) som er sadsylighede for at få e værdi på det fude stikprøvegeemsit eller derover, dvs. P-værdi = P( X ) Er dee P-værdi er midre ed =0.05 må x = ligge i forkastelsesområdet (se figur 6.) Hvis P-værdie ligger over ligger x = i acceptområdet, dvs. vi ka ikke bevise at middeludbyttet er steget. Fig 6. P-værdi 45

50 6. Hypotesetestig (1 ormalfordelt variabel) P værdi = P( X ) 1 P( X ) = f) Koklusio Da P - værdi =.6% < 5% forkastes H 0, Vi har et statistisk bevis for, at de modificerede proces giver et større middeludbytte. Alterativt kue vi have beyttet e testfuktio: Tallee idtastes i e søjle med av x. Aalyze Distributio marker x og tryk på y,colums ok Der fremkommer et histogram og ogle tabeller. Rød pil ved x Test Mea udfyld meu med 69. og 1. Da H: 69. skal vælges Prob>z, dvs. P-værdi=0.065 ) Udbyttet ka i middel forvetes at være ca. x kg 95% kofidesiterval: Radius r = z0975. = = %Kofidesiterval [ ; ]=[69.19 ; 70.33] At kofidesitervallet ideholder tallet 69. er klart i modstrid med at vi lige har vist, at middelværdie er større ed 69.. Det skyldes, at kofidesitervallet forkaster med.5% til hver side, mes e esidet test forkaster ku til e side med 5%. Mere logisk ville det være, at lave e esidet 95% kofidesiterval, x z ;.. ; 69. 8; 1 Det er imidlertid ikke stadard, ok fordi det er sværere at forklare e udeforståede, at middelværdie med 95% sikkerhed ligger over Alterativt kue vi have beyttet programmer i SAS.JMP: Tallee idtastes i e søjle med av x. Aalyze Distributio marker x og tryk på y,colums ok Der fremkommer et histogram og ogle tabeller. Rød pil ved x Test Mea udfyld meu med 69. og 1. Da H: 69. skal vælges Prob>z, dvs. P-værdi= % kofidesiterval: lidt højere oppe ses e tabel, hvor ma aflæser itervallet [69.4 ;70.8] At tallee ikke er helt de samme skyldes at programmet ikke har så store afrudigsfejl. Eksempel 6.. Hypotesetest, hvor ma får accept af H 0. Samme problem som i eksempel 6.1, me u er sigifikasiveauet =1%. Løsig: H 0 : = 69. mod H: H 0 : > 69. I eksemplet fadt vi på basis af 1 forsøg, at P-værdi =.6%. Koklusio: H 0 accepteres, dvs. vi ka ikke på et sigifikasiveau på 1% bevise, at middelværdie var steget. 46

51 6. Hypotesetest med ukedt middelværdi og spredig Bemærk: Vi skriver ikke at vi har bevist de ikke er steget, det ka meget vel være tilfældet. Vi ka bare ikke bevise det med de øskede sikkerhed. 6. HYPOTESETEST MED UKENDT MIDDELVÆRDI OG SPREDNING I eksempel 6.1 blev baggrude for teste geemgået. Samtidig atog vi, at spredige var kedt eksakt. Dette er sjældet tilfældet, me havde vi haft over 30 måliger i stikprøve, ville det sædvaligvis være tilladeligt, at erstatte de eksakte værdi med de beregede spredig s, og foretage de samme beregiger Imidlertid er det på et statistisk program lige så let at lave de korrekte t-test, så det vil ma ok altid gøre. Eksempel 6.3. Esidet hypotesetest om middelværdi (spredig ikke kedt eksakt) Samme problem som i eksempel 6.1, me u er spredige ikke kedt eksakt. Forsøg r x ) Ka ma ud fra disse data bevise på sigifikasiveau = 0.05, at middeludbyttet er blevet forøget, dvs. større ed 69. kg? ) Hvis svaret i spørgsmål 1 er bekræftede, så agiv et estimat for det ye middeludbytte, og agiv et 95% kofidesiterval herfor. Løsig: 1) X = udbyttet ved de modificerede proces. X atages at være approksimativt ormalfordelt (, ). H 0 : = 69. kg. H: > 69. kg. Tallee idtastes i e søjle med av x. Aalyze Distributio marker x og tryk på y,colums ok Der fremkommer et histogram og ogle tabeller. Rød pil ved x Test Mea udfyld meu med 69. Bladt e del tabeller fides Da H: 69. skal vælges Prob>t, dvs. P-værdi= Da P-værdi < 5% forkastes H 0, dvs. vi har et statistisk bevis for, at de modificerede proces giver et større middeludbytte. ) I samme udskrift lidt højere oppe fides følgede tabel Kofidesiterval [69.4 ; 70.8] Opridelige data ikke kedt Får ma at vide, at geemsittet er og spredig er 0.816, så bereges (se oversigt 6.4) t = =.3773 og så P(T>t)=1-P(T<t)= = dvs. samme resultat som før 95% kofidesiterval: Metode ka ses i eksempel

52 6. Hypotesetestig (1 ormalfordelt variabel) Eksempel 6.4 Tosidet hypotesetest om middelværdi (spredig ikke kedt eksakt). Ved fremstillig af et bestemt levedsmiddel er det vigtigt, at et tilsætigsstof fides i levedsmidler i e kocetratio på 8.40 (g/l). For at kotrollere om tilsætigsstoffet har e kocetratio på ca. 8.40, udtager levedsmiddelkotrolle 6 prøver af levedsmidler. Resultatere var: Målig r Kocetratio x (g/l) Det øskes på dee baggrud udersøgt om kocetratioe har de øskede værdi. Sigifikasiveau sættes til 5%. Løsig: Lad X være kocetratioe af tilsætigsstoffet i levedsmidlet. Det atages, at X er ormalfordelt (, ) Da det både er uøsket, at kocetratioe er for lille og at de er for stor, bliver ulhypotese H 0 : = 8.4 mod H: 84., dvs. vi har e tosidet test. Bemærk, at selv om ma vel egetlig hellere ville bevise, at kocetratioe er 8.4 og derfor helst ville have dee påstad i de alterative hypotese, er dette ikke muligt, da ulhypotese skal ideholde et lighedsteg. Løsig Tallee idtastes i e søjle med av x. Aalyze Distributio marker x og tryk på y,colums ok Der fremkommer et histogram og ogle tabeller. Rød pil ved x Test Mea udfyld meu med 8.4 Der fremkommer bl.a. følgede tabel: Da vi har e tosidet test er P-værdi = Da P-værdi = > 0.5 accepteres ulhypotese, dvs. vi ka ikke bevise, at kocetratioe afviger sigifikat fra 8.4 g/l Bemærk, at SAS.JMP har multipliceret P-værdi med, hvilket ok skyldes, at så skal vi altid sammelige med 5%. Eksempel 6.5. Test af spredig E virksomhed øsker at kotrollere om de spredig som e bestemt målemetode agiver saltidholdet i e opløsig er uder 0.5. Der foretages følgede 1 måliger af e opløsig af det pågældede salt. Resultatere var: Målig r % opløsig Med et sigifikasiveau på 5% ka ma da vise, at målemetode ikke opfylder det stillede krav? Løsig Lad X = rumfag af drik i flaske. X atages ormalfordelt (, ), hvor såvel som er ukedte. H o : 05. imod H: > 0.5 Tallee idtastes i e søjle med av x. Aalyze Distributio marker x og tryk på y,colums ok Der fremkommer et histogram og ogle tabeller. Rød pil ved x Test Std Dev udfyld meu med 0.5 Der fremkommer bl.a. følgede tabel: 48

53 6.3 Fejl af type I og type II Da H: > 0.5 ses ved Prob>ChiSq dvs. P-værdi = Da P-værdi=9.13% > 5 %, accepteres H 0, dvs. det er ikke påvist, at spredige ved måligere er for stor, me der er dog ær ved at være sigifikas. Eksempel 6.6. Test af spredig (ude origial data) E fabrikat af læskedrikke har købt e automatisk påfyldigsmaskie. Ved købet af maskie har ma betiget sig, at rumfaget af de påfyldte væske i middel skal have e spredig, der ikke overstiger 0.0 ml. Efter kort tids avedelse får ma mistake om, at spredige er for stor. Mage klager over uderfyldte flasker. Derfor foretages e kotrol, hvor ma tilfældigt udtager 0 flasker med læskedrik, og måler rumfaget af væske i flaske. Det viser sig, at stikprøves spredig er s = 0.4 ml. Med et sigifikasiveau på 5% er det da et statistisk bevis for, at de ye maskie ikke opfylder det stillede krav? Løsig: Lad X = rumfag af drik i flaske. X atages ormalfordelt (, ), hvor såvel som er ukedte. H o : 0. imod H: > 0., ( 1) s ( se oversigt 6.4) dvs. i det foreliggede tilfælde = = P- værdi = = P( 7. 36) Da P-værdi=9.65% > 5 %, accepteres H 0, dvs. det er ikke påvist, at spredige ved påfyldige er for stor, me der er dog ær ved at være sigifikas FEJL AF TYPE I OG TYPE II: Ved ehver test ka der være to typer fejl, hvoraf vi hidtil ku har taget hesy til de ee type. For bedre at forstå problemstillige vil vi se på følgede skema. Beslutig H 0 accepteres H 0 forkastes Forudsætig H 0 er sad Rigtig beslutig Forkert beslutig :Type I fejl H 0 er falsk Forkert beslutig:type II fejl Rigtig beslutig Det må være et krav til e god test, at der ku er e lille sadsylighed for at begå e fejl af type I eller type II. I eksempel 6.1 ville e type I fejl være, hvis ma kokluderer, at de modificerede proces giver et større udbytte, selv om det ikke er tilfældet. Virksomhede bruger måske milliobeløb på at omlægge produktioe, og det er gaske forgæves. E type II fejl ville være, at ma ikke opdager, at de modificerede proces giver et større udbytte. Dette er aturligvis uheldigt, me hvis det skyldes, at forbedrige ikke blev opdaget, fordi de er gaske rige, har det muligvis ige praktisk betydig. Hvis e test har sigifikasiveau og de beregede P-værdi < så forkastes H o. Vi ved hermed, at P(type I fejl), dvs. vi rimelig sikre på, at have foretaget e korrekt beslutig. P-værdie agiver jo sadsylighede for at vi træffer e forkert beslutig. Hvis = 5% og P-værdie er 4.5% forkastes H 0. Det samme sker, hvis P-værdi = 0.001%, me vi er her uægtelig oget sikrere på, at vi at vi træffer e korrekt beslutig. Hvis vi accepterer H o er det blot udtryk for, at vi ikke ka forkaste(svag koklusio: "H o frikedes på grud af bevisets stillig"). 49

54 6. Hypotesetestig (1 ormalfordelt variabel) Ma ka have begået e type II fejl, dvs. ikke opdaget, at de alterative hypotese var sad. Eksempel 6.7. Fejl af type Samme problem som i eksempel 6.1, me u er sigifikasiveauet =1% Løsig: H 0 : = 69. mod H: H 0 : > 69. I eksemplet fadt vi på basis af 1 forsøg, at P-værdi =.6%. Koklusio: H 0 accepteres, dvs. vi ka ikke på et sigifikasiveau på 1% bevise, at middelværdie var steget. Imidlertid ka middeludbyttet meget vel være steget, me vi kue bare ikke bevise det med de øskede sikkerhed. Vi ka have begået e fejl af type. Som det ses af eksempel 6.6, så vil e formidskelse af mulighede for at begå e type 1 fejl ( formidskes) forøge sadsylighede for at begå e type fejl. De eeste måde hvorpå begge ka formidskes er at øge atallet af forsøg. Problemet hermed er, at ma derved måske opdager e så lille forbedrig, at det ikke er retabelt at foretage e dyr ædrig af fremstilligsprocesse. Først år udbyttet overstiger e bagatelgræse vil ma reagere. Dimesioerig af forsøg (vælge stikprøvestørrelse ). Lad os atage, at virksomhede i eksempel 6.1 fider, at hvis stigige i udbyttet ved de modificerede proces er midre ed = 0.5 kg, så har det ige praktisk iteresse ( = 0.5 kg er bagatelgræse), og derfor gør det itet, hvis ma ikke opdager det (begår e type II fejl). Hvis derimod stigige er større ed 0.5 kg, så har det stor betydig, og sadsylighede for at begå e type II fejl må derfor være lille. Lad os sætte de til højst = 10%. Problemet er u, hvor stor e stikprøvestørrelse (atallet af delforsøg) der skal udføres, for at oveævte krav er opfyldt. E såda vurderig kaldes e dimesioerig af forsøget. Udfører ma det ud fra e dimesioerig ødvedige atal forsøg, vil e accept af ulhypotese u betyde, at ok ka udbyttet være steget, me ikke så meget, at det har praktisk iteresse. I oversigt 6.4 er agivet de formler, der skal avedes ved e dimesioerig. De følgede eksempler viser avedelse heraf. Eksempel 6.8. Dimesioerig (kedt spredig). Ide ma i eksempel 6.1 begydte at lave de dyre delforsøg, vil igeiøre gere have e vurderig af, hvor mage driftsforsøg der er ødvedige, år det vides, at det først er økoomisk retabelt at gå over til de ye metode, hvis middeludbyttet er steget med midst 0.5 kg. 1) Fid stikprøvestørrelse, i det tilfælde, hvor = 0.5 kg og = 10%. Det atages stadig, at = 1.0 kg og sigifikasiveauet er = 5 %. Lad være de i spørgsmål 1 fude stikprøvestørrelse. ) Idet der udføres delforsøg skal ma besvare følgede spørgsmål: a) Hvilke koklusio ka drages, hvis ma fider, at x = 69.8 b) Hvilke koklusio ka drages, hvis ma fider, at x = 69.4 Løsig 1) X = udbyttet ved de modificerede proces. X atages at være ormalfordelt (, 10. ). H 0 : = 69. kg. H: > 69. kg. Da teste er esidet fremgår det af oversigt 6.4 at: z1 z1 z z

55 6.3 Fejl af type I og type II = = 34.5 = 35 a) H 0 : = 69. mod H: H 0 : > 69. P( x >69.8) = 1 - P( x 69.8) = = Da P-værdi = <0.05 forkastes H 0 : = 69. kg, dvs. vi er på et Sigifikasiveau på 5% sikre på at middelværdie er over 69. kg. Imidlertid ka vi ikke være sikre på at de er over bagatelgræse = 69.7 kg Lad H 0 : = 69.7 mod H: H 0 : > 69.7 Vi fider på samme måde som ovefor, at P-værdi = 7.7%, dvs. e påstad om at middeludbyttet ligger over 69.7 kg vil være fejlagtig i ca. 8% af tilfældee. Vi vil derfor æppe på de baggrud gå over til de ye metode. b) H 0 : = 69. mod H: H 0 : > 69. Vi fider på samme måde som i pukt a), at P-værdi = 11.8%%, H 0 : = 69. kg accepteres, dvs. vi ka ikke vise, at middeludbyttet er steget. Dette ka dog godt være tilfældet, me da vi har dimesioeret er vi rimeligt sikre på, at e evetuel stigig ikke har praktisk iteresse. Eksempel 6.9. Dimesioerig, (ukedt spredig) E virksomhed bliver af miljøkotrolle pålagt at formidske idholdet i sit spildevad af et stof A, der mistækes for at kue foruree grudvadet. Idholdet af stoffet A i spildevadet skal uder 1.7 mg/l, og miljøkotrolle heviser til e y metode, som burde kue formidske idholdet til det øskede iveau. For at vurdere de ye metode øskes foretaget e række delforsøg. Hvor mage forsøg skal der midst foretages, hvis = 5%, = 10%, = 0.10 mg/l og et overslag over hvor stor er sætter dee til 0.15 mg/l. Løsig: Lad X = idhold af A (i mg/l) efter beyttelse af de y metode. X atages ormalfordelt (, ), hvor såvel som er ukedte. Da idholdet af stoffet A øskes formidsket, bliver ulhypotese H 0 : 17. mg/l mod H: 17. mg/l, dvs. vi har e esidet test. Da ikke er kedt (ku et løst skø kedes), er teste e t - test. Formle i oversigt 6.4 avedes: z z Først bereges =19.7 Da =0 < 30 bør ma u løse e ligig (se edefor) Da spredige jo var usikker, så vil ma ok øjes med at sætte = 30 Præcis beregig: Løs ligige t ( 1) z søjler beæves og 1. I søjle skrives 0 og i søjle 1 skrives 51

56 6. Hypotesetestig (1 ormalfordelt variabel) Derefter skrives 1 og Resultat De øskede dimesioerig kræver altså forsøg. 5

57 6.4. OVERSIGT over cetrale formler i kapitel Oversigt X atages ormalfordelt (, ).Givet stikprøve af størrelse med geemsit x og spredig s Sigifikasiveau:. 0 er e give kostat Oversigt over test af middelværdi T er e stokastisk variabel der er t - fordelt med f = - 1. Y er e stokastisk variabel, der er ormalfordelt 0, Forudsætiger ukedt. ( x ) t 0 s kedt eksakt. Alterativ hypotese H H: 0 PT ( t) H: 0 PT ( t) P - værdi Beregig H 0 forkastes 1-t Distributio(t,f) eller t-test t Distributio(t,f) eller t-test som række 1 som række H: 0 PT ( t) for x 0 PT ( t) for x 0 H: 0 PY ( x) Z-test se eksempel 6.1 H: 0 PY ( x) H: Z-test P - værdi P - værdi < 1 dog hvis t-test : P - værdi P - værdi 1 0 PY ( x) for x 0 Z - test P - værdi < dog hvis Z-test : P - værdi PY ( x) for x 0 Dimesioerig 0 er de midste ædrig i der har praktisk iteresse. =P(type I fejl), = P(type II fejl) Forudsætig Hypotese Formel Beregig kedt eksakt Esidet Tosidet z z z 1 1 z1 1 se eksempel 6.8 er ukedt, me erstattes i formlere af det bedste estimat eller gæt for spredige. Esidet Løse ligig, se eksempel 6.9 Tosidet z z 1 1 t1 ( 1) z 1 z z 1 t ( 1) 1 1 z 1 53

58 6. Hypotesetestig (1 ormalfordelt variabel) Oversigt over test af varias Q er fordelt med f = - 1. er e give kostat 0 Forudsætig ukedt Alterativ hypotese H H: 0 PQ ( ) P - værdi Beregig H 0 forkastes ( 1) s 0 H: 0 H: 0 PQ ( ) 1 PQ ( ) for 1 PQ ( ) for som række 1 som række se eksempel 6.5 eller 6.6 P-værdi< P-værdi< 1 kedt ( 1) s ( x ) 0 H: 0 H: 0 PQ ( ) P-værdi< PQ ( ) H: 0 PQ ( ) for 1 PQ ( ) for 1 som række 1 som række P-værdi< 1 54

59 Opgaver til kapitel 6 OPGAVER Opgave 6.1 Et levedsmiddel ( cored beef ) forhadles i pakker på 100 g. Ved fabrikatioe tilsættes traditioelt et koserverigsmiddel B (itrit). Da ma har mistake om, at B avedt i større mægder ka have uøskede bivirkiger, må der højst tilsættes.5 mg B pr. 100 g. Fabrikate reklamerer med, at der i middel højst er mg B pr. pakke. E kokurret tvivler herpå, og vil teste påstade. Der købes i forskellige butikker i alt 36 pakker, og idholdet af B blev målt. Ma fadt et geemsit af B på x =.10 mg med et estimat på spredige på s = 0.30 mg. Ka ma ud fra disse data bevise på sigifikasiveau = 0.01, at reklame lyver. Opgave 6. Et flyselskab overvejer at lukke e flyrute, såfremt = middelværdie af atal solgte pladser pr. afgag er uder 60. På de sidste = 100 afgage er der i geemsit solgt x = 58.0 pladser med e stadardafvigel- se på s =11.0 pladser. 1) Ka ma ud fra disse data bevise på sigifikasiveau = 0.05, at der i middel er solgt uder 60 pladser pr. afgag? (Husk at aføre: Hvad X er. Atagelser. Nulhypotese. Beregiger. Koklusio). ) Forudsat, at ma i spørgsmål 1 ka bevise, at der er solgt uder 60 pladser, skal der agives et estimat ~ for middelværdie samt et 95% kofidesiterval for middelværdie. Opgave 6.3 E fabrikatio er baseret på e kemisk reaktio, hvor processe forudsætter tilstedeværelse af e katalysator. Med de hidtil beyttede katalysatortype C 1 udyttes i middel ku ca. 70% af de dyreste råvare. Firmaet overvejer at gå over til e mere effektiv katalysatortype C ved produktioe. Omlægig hertil vil imidlertid kræve betydelige etablerigsomkostiger, hvorfor firmaet ku vil lægge produktioe om, såfremt i middel midst 80% af de dyreste råvare udyttes, år C beyttes. Til vurderig heraf foretoges e række forsøg med beyttelse af C. Følgede udyttelsesproceter fadtes: ) Vurder, om de opåede forsøgsresultater ka opfattes som et eksperimetelt bevis for, at i middel over 80% af de dyreste råvare udyttes, år C beyttes. α = 1% ) Forudsat, at ma i spørgsmål 1 ka bevise, at over 80% af de dyreste råvare udyttes, skal der agives et estimat ~ samt et 95% kofidesiterval for middelværdie. Vi atager i det følgede, at udyttelsesprocete X (approksimativt) er ormalfordelt ( x,s) 3) Bereg sadsylighede for, at udyttelsesprocete X for e ekelt målig er midre ed 80%, år C beyttes. 55

60 6. Hypotesetestig (1 ormalfordelt variabel) Opgave 6.4 Et kemikalium fremstilles idustrielt ved iddampig af e bestemt opløsig. Det var vigtigt, at dee opløsig var svagt basisk med ph = 8.0. Ma foretog derfor kotrolmæssigt ogle phbestemmelser for de beyttede opløsig. Følgede værdier fadtes: a) Foretag e testig af om opløsige ka atages at opfylde kravet til ph-værdi b) Forudsat, at ma i spørgsmål a) ka bevise, at opløsige ikke opfylder kravet, skal opstilles et 95% kofidesiterval for ph-værdie. Opgave 6.5 Ma frygter, at de såkaldte syrereg er årsag til, at e bestemt skov er stærkt medtaget. Ma måler SO - kocetratioe forskellige steder i skovbude (i g/m 3 ) og fider: I ubeskadede skove er SO - kocetratioe 0 g/m 3. a) Giver forsøgee et bevis for, at middelkocetratioe af SO i de beskadigede skov er større ed ormalt? b) Forudsat, at ma i spørgsmål a ka bevise, at middelkocetratioe af SO i de beskadigede skov er større ed ormalt, skal ma agive et tosidet 95%-kofidesiterval for SO - kocetratioe. Opgave 6.6 Et yt måleapparat påstås at give måleresultater med spredige = 1.8 mg/l ved målig af salt-idholdet i e opløsig. Da dette er midre ed det sædvalige, køber et laboratorium et eksemplar af apparatet for at kotrollere påstade. Der foretages 15 måliger med følgede resultater: Test på basis af disse resultater, om spredige afviger fra 1.8 mg/l. (Husk altid at aføre: Hvad X er. Atagelser. Nulhypotese. Beregiger. Koklusio.). Opgave 6.7 Ved idkøbet af et yt måleapparat oplystes det, at apparatet målte med e spredig på.8 eheder. Efter at have brugt apparatet et stykke tid ærede købere mistake om, at apparatet målte med større spredig ed oplyst. For at få spørgsmålet udersøgt lod købere e bestemt målig udføre et atal gage. Følgede resultater fadtes: Hvilke koklusioer ka købere drage ud fra e statistisk aalyse af de fude forsøgsresultater? 56

61 Opgaver til kapitel 6 Opgave 6.8 På et kraftvarmeværk meer ma, at e y metode vil kue formidske svovlidholdet i de slagger, der bliver tilbage efter kulfyrige. Med e bestemt kvalitet kul, har det hidtidige svovlidhold været.70 %. For at vurdere de ye metode øsker igeiøre at foretage e række forsøg. 1) Hvor mage forsøg skal der midst foretages, hvis = 5%, = 10%, = 0.04 og et overslag over sprediges størrelse sætter de til højst 0.08%. ) Uaset resultatet af dimesioerige i spørgsmål 1), er der ku praktiske muligheder for at lave 16 forsøg. Følgede værdier af svovlidholdet fadtes (%) Test om disse måleresultater beviser, at svovlidholdet ved de ye metode i middel er blevet midre. 3) Er det på basis af resultatere muligt at vurdere, om de fude formidskelse er stor ok til, at ma vil gå over til de ye metode? Opgave 6.9 På pakke af e iscreme står, at portioe ideholder 14 gram fedt. For at kotrollere dette købes pakker is, og fedtidholdet måles. 1) Bestem de ødvedige stikprøvestørrelse, for at ma ved e forskel i fedtidhold på = 0.30 gram højst har, at P (type I fejl) = = 0.01 og P (type II fejl) = = ( 04. gram). ) Ma fider et geemsit på 13.1 gram og et estimat s for spredige på 0.4 gram. Ka ma ud fra disse data bevise på sigifikasiveau = 0.01, at middelidholdet afviger fra 14 gram? (Husk altid at aføre: Hvad X er. Atagelser. Nulhypotese. Beregiger. Koklusio.). 3) Er det på basis af resultatere muligt at vurdere, om at e evetuel afvigelse er større ed bagatelgræse på 0,4 gram. 57

62 7. Regeregler for sadsylighed, Kombiatorik 7. REGNEREGLER FOR SANDSYNLIGHED, KOMBINATORIK 7.1 REGNEREGLER FOR SANDSYNLIGHEDER Vi har tidligere omtalt sadsylighed. I dette kapitel omtales ogle af de grudlæggede defiitioer og begreber Det følgede eksempel blive beyttet til illustratio af defiitioer og begreber. Eksempel 7.1. Geemgåede eksempel. To skytter Aders og Bria skyder hver ét skud mod e skydeskive. Sadsylighede for at Aders rammer skive er 0.80 mes Bria har e træfsadsylighed på 0,60. Et eksperimet består i at de hver skyder et skud. Lad A være hædelse at Aders rammer skive og lad B være sadsylighede for at Bria rammer skive. Vi har derfor, at P(A) = 0.80 og P(B) = Lad os ved at sætte e streg over A forstå ikke A. Geerelt gælder P( A) = 1 - P ( A ) I eksempel 8.1 er A hædelse at Aders ikke rammer skive. Vi har derfor, at P( A ) = 1 - P(A) = = 0.0 Fællesmægde til A og B beæves A B og er mægde af alle udfald i udfaldsrummet U, der tilhører både A og B (De skraverede mægde i figur 8.1 ). Eksempelvis er A B i eksempel 7.1 hædelse, at både Aders og Bria rammer skive Fig 7.1. Fællesmægde Foreigsmægde af A og B beæves A B og er mægde af alle udfald i udfaldsrummet U, der ete tilhører A eller B evetuelt dem begge (de skraverede mægde på figur 7. ) Eksempelvis er A B i eksempel 8.1 de hædelse, at ete rammer Aders eller også rammer Bria skive evetuelt gør de det begge. Ma kue også udtrykke det ved at midst e af dem rammer skive. 58 Fig. 7. Foreigsmægde

63 8. Regeregler for sadsyligheder Der gælder u følgede additiossætig: PA ( B) PA ( ) PB ( ) PA ( B). Sætige fremgår umiddelbart ved at betragte arealere i figur 7.3. P( A B) P( A) PB ( ) PA ( B) Fig.7.3 Additiossætig Statistisk uafhægighed. To hædelser A og B siges at være statistisk uafhægige, såfremt sadsylighede for, at de ee hædelse idtræffer, ikke afhæger af, om de ade hædelse idtræffer. I eksempel 7.1 må ma eksempelvis atage, at om Aders rammer skive har ige idflydelse på om Bria rammer, så her må ma atage A og B er uafhægige. Et adet eksempel er kast med e terig. Her vil sadsylighede for at få e sekser i adet kast være uafhægigt af udfaldet i første kast Der gælder følgede Produktsætig for uafhægige hædelser: For to uafhægige hædelser gælder PA ( B) PA ( ) PB ( ) Eksempel 7. (eksempel 7.1 fortsat) Lad A være hædelse, at Aders rammer skive, og lad B være hædelse, at Bria rammer skive. Det er givet, at P(A) = 0.80 og P(B) = Fid sadsylighede for a) At både Aders og Bria rammer skive b) At ete Aders eller Bria (evt. begge) rammer skive, dvs. midst e af dem rammer skive. c) At hverke Aders elle Bria rammer skive Løsig: a) Da hædelsere atages at være uafhægige gælder ifølge produktsætige P( AB) b) Ifølge additiossætige gælder P( AB) c) P( AB) P( A) P( B) ( 108. )( 106. ) 008. Produktsætig og additiossætig ka geeraliseres til flere hædelser ed. For tre hædelser A, B og C gælder således P( ABC) P( A) P( B) P( C) P( A B) P( A C) P( B C) I tilfælde af at hædelsere A, B og C er uafhægige gælder således: P( ABC) P( A) P( B) P( C). 59

64 7. Regeregler for sadsylighed, Kombiatorik Er hædelsere A og B ikke uafhægige, ka ma som beskrevet i afsit 7.3 udlede e mere geerel produktsætig 7.. Betiget sadsylighed Er hædelsere A og B ikke uafhægige vil PA ( B) PA ( ) PB ( ) Eksempel 7.3. Ikke uafhægige hædelser E fabrik har erfarig for, at de daglige produktio af glasfigurer ideholder 10 % misfarvede, 0% har ridser, og 1 % af produktioe er både ridsede og misfarvede. Et eksperimet består i tilfældigt at udtage e glasfigur af produktioe. Lad A være hædelse at få e misfarvet og lad B være hædelse at få e ridset. Her er P( A) P( B) P( AB) For at få e mere geerel regel idføres PBA ( ) som kaldes sadsylighede for, at B idtræffer, år A er idtruffet (de af A betigede sadsylighed for B). For at forklare de følgede defiitio, vil vi simplificere eksempel 7.3, idet vi atager, at de daglige produktio er 100 glasfigurer. I så fald er der 10 misfarvede figurer, 0 ridsede figurer, og 1 figur der er både misfarvet og ridset. Hvis vi begræser vort udfaldsrum til A, så er 1 1 P( A B) PBA ( ) P( A) 100 Fig. 7.4 Taleksempel Dee beregig begruder rimelighede i følgede defiitio: De af A betigede sadsylighed for B skrives PBA ( )( sadsylighede for, at B idtræffer, år A er idtruffet) PA ( B) defieres ved PBA ( ). P( A) Ved multiplikatio fås Produktsætige: P( AB) P( A) P( B A) Beyttes produktsætige på eksempel 7.1 fås P( A B) P( A) P( B A) Eksempel 7.4: Betiget sadsylighed. E beholder ideholder 3 røde og 3 hvide kugler. Vi udtrækker successivt kugler fra ure. Vi betragter følgede hædelser: A: De først udtruke kugle er rød. B: De ade udtruke kugle er rød. Bereg P( A B) hvis 1) kugleudtrækige foregår, ved at de først udtruke kugle lægges tilbage før de ade udtrækkes. ) kugleudtrækige foregår, ved at de først udtruke kugle ikke lægges tilbage før de ade udtrækkes. Løsig 1) Her er PBA ( ) 3 og derfor ifølge produktsætige 6 ) Her er PBA ( ) 5 og derfor 3 1 P( AB) P( A B) P( A) P( B A)

65 7.3 Kombiatorik Bayes sætig PB ( ) PAB ( ) For to hædelser A og B for hvilke P(A) > 0 gælder Bayes sætig : PBA ( ) P( A) Bevis: P( A B) PB ( A) PB ( ) PAB ( ) Af defiitioe på betiget sadsylighed og produktsætige fås PBA ( ) P( A) P( A) P( A) Bayes sætig gør, at det er let at omskrive fra de ee betigede sadsylighed til de ade. Dette er tilfældet, hvis de ee af de to betigede sadsyligheder PBA ( ) og PAB ( ) er meget lettere at berege ed de ade. Eksempel 7.5 (Bayes sætig) I e officeruddaelse ka ma vælge mellem e tekisk liie og e operativ liie. På e bestemt årgag har 60 % valgt de operative liie og af disse er 0% kvider. På de tekiske liie er 10% kvider. Ved lodtrækig vælges e elev. a) Fid sadsylighede for, at dee er e kvide. Ved oveståede lodtrækig viste det sig at eleve var e kvide. b) Hvad er sadsylighede for, at hu kommer fra de tekiske liie. Løsig: Vi defierer følgede hædelser: T: De udtruke er tekiker K: De udtruke er e kvide. a) PK ( ) PT ( K) PO ( K) PKT ( ) PT ( ) PKO ( ) PO ( ) % PKT ( ) PT ( ) b) Af Bayes sætig fås: PTK ( ) PK ( ) % E ade metode ville det være, at atage, at der bliver optaget 100 elever. Vi har så følgede skema Kvider I alt Operativ 1 60 Tekisk 4 40 Heraf fås umiddelbart 16 4 PK ( ) 16% og PTK ( ) 5% Kombiatorik Idledig: Såfremt et udfaldsrum U ideholder udfald som alle er lige sadsylige, vil sadsylighede for hvert udfald være Pu ( ) 1. E hædelse A som ideholder a udfald vil da have sadsylighede P( A). Dette udtrykkes ofte kort ved at sige, at sadsylighede for A er atal gustige udfald i A divideret med det totale atal udfald i udfaldsrummet. I sådae tilfælde, bliver problemet derfor, hvorledes ma let ka optælle atal udfald. Dette ka ofte gøres ved beyttelse af kombiatorik. a 61

66 7. Regeregler for sadsylighed, Kombiatorik Multiplikatiospricippet Multiplikatiospricippet: Lad et valg bestå af delvalg, hvoraf det første valg har valgmuligheder, det æste valg har valgmuligheder,... og det te valg har r 1 r r valgmuligheder. Det samlede atal valgmuligheder er da r 1 r... r Multiplikatiospricippet illustreres ved følgede eksempel. Eksempel 7.6. Multiplikatiospricippet E mad ejer forskellige jakker, 4 slips og 3 forskellige fabrikater skjorter. På hvor mage forskellige måder ka ha sammesætte si påklædig af skjorte,slips og jakke. Løsig: 1) Valg af skjorte giver 3 valgmuligheder ) Valg af slips giver 4 valgmuligheder 3) Valg af jakke giver valgmuligheder Ifølge multiplikatiospricippet giver det i alt 34 4muligheder Ma kue illustrere løsige ved følgede forgreigsgraf Eksempel 7.7 Fakultet På hvor mage måder ka 5 persoer opstilles i e kø (i rækkefølge) Løsig: Pladsere i køe ummereres 1,,3,4,5. Plads r. 1 i køe besættes 5 valgmuligheder Plads r. i køe besættes 4 valgmuligheder Plads r. 3 i køe besættes 3 valgmuligheder Plads r. 4 i køe besættes valgmuligheder Plads r. 5 i køe besættes 1 valgmulighed I alt forskellige rækkefølger. Ved fakultet ( udråbsteg) forstås! ( 1) ( )... 1 Edvidere defieres 0! = 1. SAS.JMP: Formula: Tracedetal Factorial 5 ok 6

67 7.3 Kombiatorik Ordet stikprøveudtagelse Lad os tæke os vi har e beholder ideholdede 9 kugler med umree 1,, 3,..., 9. Vi udtager u e stikprøve på 4 kugler. Det ka ske 1) ude tilbagelægig: E kugle er taget op, ummeret oteres, me de lægges ikke tilbage ide ma tager e y kugle op. ) med tilbagelægig: E kugle tages op, ummeret oteres, og derefter lægges kugle tilbage ide ma tager e y kugle op. Ma ka følgelig få de samme kugle op flere gage. Ved e ordet stikprøveudtagelse lægges vægt på de rækkefølge hvori kuglere udtages,. dvs. der er forskel på,1,3,5 og 3,1,,5 a) Ude tilbagelægig Eksempel 7.8. Ordet ude tilbagelægig I e foreig skal der bladt 10 kadidater vælges e bestyrelse På hvor mage forskellige måder ka ma sammesætte dee bestyrelse, hvis 1) Bestyrelse består af e formad og e kasserer Bestyrelse består af e formad, e æstformad, e kasserer og e sekretær. Løsig: 1) E formad vælges bladt 10 kadidater 10 valgmuligheder E Kasserer vælges bladt de resterede 9 kadidater 9 valgmuligheder Da der for hvert valg af formad er 9 muligheder for kasserer, følger af multiplikatiospricippet, at det totale atal forskellige bestyrelser er = 90. ) Aalogt fås ifølge multiplikatiospricippet at atal forskellige bestyrelser 7 = 5040 SAS.JMP : Formula Tracedetal Factorial idsæt 10 divisio Factorial idsæt 6, Ok Resultat =5040 Eksempel 7.8 begruder følgede defiitio Permutatioer. Atal måder (rækkefølger eller permutatioer ) som m elemeter ka udtages (ordet og ude tilbagelægig) ud af elemeter er! Pm (, ) ( 1) ( )...( m1) = m! b) Med tilbagelægig Eksempel 7.9. Ordet, med tilbagelægig I e foreig skal 4 tillidshverv fordeles mellem 10 persoer. E perso ka godt have flere tillidshverv. På hvor mage forskellige måder ka disse hverv fordeles.? Løsig: Tillidshverv 1 placeres. 10 valgmuligheder Tillidshverv placeres 10 valgmuligheder Tillidshverv 3 placeres 10 valgmuligheder Tillidshverv 4 placeres 10 valgmuligheder I alt (ifølge multiplikatiospricippet) 10 =

68 7. Regeregler for sadsylighed, Kombiatorik Uordet stikprøveudtagelse Eksempel 7.10 Uordet ude tilbagelægig E beholder ideholdede 5 kugler med umree k 1, k, k 3, k 4, k 5. Vi udtager u e stikprøve på 3 kugler ude tilbagelægig. Rækkefølge kugle tages op er ude betydig, dvs. der er ikke forskel på eksempelvis k 1, k 4, k og k 1, k 4, k. Hvor mage forskellige stikprøver ka forekomme? Løsig: Atallet er ikke flere ed ma ka foretage e simpel optællig: {k 1,k,k 3 }{k 1,k,k 4 }{k 1,k,k 5 }{k 1,k 3,k 4 }{k 1,k 3,k 5 }{k 1,k 4,k 5 }{k,k 3,k 4 }{k,k 3,k 5 }{k,k 4,k 5 }{k 3,k 4,k 5 } Atal stikprøver = 10 Det er klart, at re optællig er uoverkommeligt, hvis mægde er stor. Defiitio af kombiatio Lad M være e mægde med elemeter. E kombiatio af r elemeter fra M er et udvalg af r elemeter udtaget af M ude at tage hesy til rækkefølge af elemeter Atallet af kombiatioer med r elemeter beteges C(,r) eller ( over r). r Sætig 7.1 (Atal kombiatioer). Atal kombiatioer med r elemeter fra e mægde på elemeter er Cr Bevis:! (, ) r!( r)! Beviset kyttes for ekelheds skyld til et taleksempel, som let ka geeraliseres. Lad os atage, vi på tilfældig måde udtager 3 kugler af e kasse, der ideholder 5 kugler med umree k1, k, k3, k4, k5. 5! Vi skal u vise, at C( 53,) 3!! Lad os først gå ud fra, at rækkefølge hvori kuglere trækkes er af betydig, Der er altså eksempelvis forskel på k1, k3, k4 og k, k, k. Dette ka gøres på P(5,3) = måder Hvis de 3 kugler udtages, så rækkefølge ikke spiller e rolle, har vi vedtaget, det ka gøres på C(5,3) måder. Lad e af disse måder være k, k, k. Disse 3 elemeter ka ordes i rækkefølge på 3! 3 1måder. Vi har følgelig, at P C C P(,) ! (,) 53 (,) 53 3! (,) 53 C(,) 53 3! 3! 3!! 3!! Eksempel Atal kombiatioer I e foreig skal der bladt 10 kadidater vælges 4 persoer til e bestyrelse. På hvor mage forskellige måder ka ma sammesætte dee bestyrelse? Løsig: Atal måder ma ka sammesætte bestyrelse er 10! K(10,4) måder 4! 6! 4! Formula Tracedetal ChooseK idsæt = 10, k=4 Ok Når ma trykker på Ok skrives 10, og i formula står 64

69 Opgaver til kapitel 7 OPGAVER Opgave 7.1 I e midre by viser e udersøgelse, at 60% af alle husstade holder e lokal avis, mes 30% holder e ladsdækkede avis. Edvidere holder 10% af husstadee begge aviser. Lad e husstad være tilfældig udvalgt, og lad A være de hædelse, at husstade holder e lokal avis, og B de hædelse, at husstade holder e ladsdækkede avis. Bereg sadsylighedere for følgede hædelser. C: Husstade holder ku de lokale avis. D: Husstade holder midst é af avisere. E: Husstade holder ige avis F: Husstade holder etop é avis. Opgave 7. 1) I figur 1 er vist et elektrisk apparat, som ku fugerer, hvis ete alle kompoeter 1a, 1b og 1c i de øverste ledig eller alle kompoeter a, b og c i de ederste ledig fugerer. Sadsylighede for at hver kompoet fugerer er vist på tegige, og det atages, at sadsylighede for at e kompoet fugerer er uafhægig af om de øvrige kompoeter fugerer. 1) Hvad er sadsylighede for at apparatet i figur 1 fugerer. ) I figur er vist et adet elektrisk apparat, som tilsvarede ku fugerer, hvis alle de tre kredsløb I, II og III fugerer, og det er ku tilfældet hvis ete de øverste eller de ederste kompoet fugerer. Hvad er sadsylighede for at apparatet i figur fugerer. 65

70 7. Regeregler for sadsylighed, Kombiatorik Opgave 7.3 Tre skytter skyder hver ét skud mod e skydeskive. De har træfsadsyligheder 0.75, 0.50 og Bereg sadsylighede for 1) ige træffere, ) é træffer, 3) to træffere, 4) tre træffere. Opgave 7.4 E terig har form som et regulært polyeder med 0 sideflader. På 4 sideflader er der skrevet 1, på 8 sideflader er der skrevet 6 mes der er skrevet, 3, 4 og 5 på hver sideflader. Fid sadsylighede for i tre kast med dee terig at få 1) tre seksere ) midst é sekser 3) ete tre seksere eller tre eere Opgave 7.5 E klasse med 1 elever skal uder e øvelse fordeles på 5 grupper. 4 af gruppere skal være på 4 elever, og 1 gruppe skal være på 5 elever. På hvor mage måder ka fordelige af elevere på de 5 grupper foregå? Opgave 7.6 Af e forsamlig på 8 kvider og 4 mæd skal udtages e arbejdsgruppe på 5 persoer. a) Gør rede for, at gruppe ka udvælges på 448 forskellige måder, år det forlages, at de skal bestå af højst 3 kvider og højst 3 mæd. b) Bereg atallet af måder, hvorpå gruppe ka udvælges, år det forlages, at de 5 persoer ikke alle må være af samme kø. Opgave 7.7 a) Bestem det atal måder, hvorpå bogstavere A, B og C ka stilles rækkefølge. b) Samme opgave for A, B, C, D, E,F, G og H. Opgave 7.8. På et spisekort er opført 6 forretter, 10 hovedretter og 4 desserter. 1) Hvor mage forskellige middage beståede ete af forret og hovedret eller af hovedret og dessert ka ma sammesætte. ) Hvor mage forskellige middage beståede af e forret, e hovedret og e dessert ka ma sammesætte. Opgave 7.9 Bestem atallet af 5-cifrede tal, der ka skrives med to l-taller, et - tal og to 3-taller. Opgave 7.10 Fire projektgrupper på e virksomhed atages at have sadsylighedere 0.6, 0.7, 0.8 og 0.9 for at få succes med deres projekt. Gruppere atages at arbejde uafhægigt af hiade. Fid sadsylighede for, at a) alle grupper får succes, b) ige grupper får succes, c) midst 1 gruppe får succes, d) i alt etop 1 gruppe får succes, e) i alt etop 3 grupper får succes, f) i alt etop grupper får succes. 66

71 Opgaver til kapitel 7 Opgave 7.11 E virksomhed fremstiller e bestemt slags apparater. Hvert apparat er sammesat af 5 kompoeter. Heraf er 3 tilfældigt udvalgt bladt kompoeter af type a og bladt kompoeter af type b. Det vides, at 10% af a- kompoetere er defekte og 0% af b-kompoetere er defekte. Et apparat fugerer hvis og ku hvis det ikke ideholder oge defekt kompoet. Der udtages på tilfældig måde et apparat fra produktioe. Lad os betragte hædelsere: A: Det udtage apparat ideholder midst 1 defekt a-kompoet. B: Det udtage apparat ideholder midst 1 defekt b-kompoet. 1) Fid P( A), P( B) og P( A B). ) Fid sadsylighede for, at et apparat, der på tilfældig måde udtages af produktioe ikke fugerer. 3) Et apparat udtages på tilfældig måde fra produktioe og det kostateres ved afprøvig at det ikke fugerer. Fid sadsylighede for, at apparatet ikke ideholder oge defekt a-kompoet. Opgave 7.1 E test består af 40 spørgsmål, der alle skal besvares med,'ja'. 'ej' og 'ved ikke'. På hvor mage forskellige måder ka prøve besvares? Opgave 7.13 I e virksomhed skal der istalleres et kaldesystem. I hvert lokale opsættes et batteri af lamper, og hver af de asatte har si bestemte lampekombiatio. 1) Hvis = 5, hvor mage asatte ka da have deres eget kaldesystem (se figure) ) Hvis virksomhede har 500 asatte, hvor stor skal så være. Opgave 7.14 Normale persobilers idregistrerigsumre består af to bogstaver og et ummer mellem 0000 og Lad os atage, at ma er ået til umre der begyder med UV. Et eksempel på e ummerplade er da UV Hvad er sadsylighede for, at e yidregistreret bil får et registrerigsummer med lutter forskellige cifre, år vi atager, at alle cifre har samme sadsylighed? Opgave 7.15 Hvor mage forskellige telefoumre på 8 cifre ka ma dae, år første ciffer ikke må være ul? 67

72 8. Vigtige diskrete fordeliger 8. VIGTIGE DISKRETE FORDELINGER 8.1 INDLEDNING Vi vil i dette kapitel betragte diskrete stokastiske variable, hvis værdier er hele tal. Vi vil især behadle de diskrete fordeliger: De hypergeometriske fordelig, Biomialfordelige og Poissofordelige 8. HYPERGEOMETRISK FORDELING De hypergeometriske fordelig, fider bl.a. avedelse ved kvalitetskotrol af varepartier (jævfør eksempel 8.3), ved markedsudersøgelser, hvor ma ude tilbagelægig udtager e repræsetativ stikprøve på eksempelvis 500 persoer I det følgede eksempel udledes formle for de hypergeometriske fordelig. Eksempel 8.1. Hypergeometrisk fordelig I e foreig skal der bladt 5 kvidelige og 8 madlige kadidater vælges e bestyrelse på 4 persoer. Fid sadsylighede for, at der er etop 1 kvide i bestyrelse.. Løsig: X = atal kvider i bestyrelse At der skal være etop 1 kvide i bestyrelse forudsætter, at vi udtager 1 kvide ud af de 5 kvider og 3 mæd ud af de 8 mæd. At udtage 1 kvide ud af 5 kvider ka gøres på C(5,1) måder At udtage 3 mæd ud af 8 mæd ka gøres på C(8,3) måder. Atal gustige udfald er ifølge multiplikatiospricippet C(5,1) C(8,3) Det totale atal udfald fås ved at udtage 4 persoer ud af de 13 kadidater Dette ka gøres på C(13,4) måder. C(,) 51 C(,) 83 P( X1) C( 13, 4) Formula Discrete Probability Hypergeometric Probability, udfyld meu = Karakteristisk for e hypergeometrisk fordelig er, at elemetere i udfaldsrummet (kugler i e beholder) ka opdeles i to grupper. E opdelig kue som i eksempel 8.1 være kvider og mæd eller som i kvalitetskotrol være i defekte varer og ikke-defekte varer. Lad os atage, at vi har e beholder med N kugler, hvoraf de K er røde og reste har e ade farve. Der udtrækkes e stikprøve på kugler ude tilbagelægig. Lad X være atallet af røde kugler bladt de kugler. 68

73 8. Hypergeometrisk fordelig X er hypergeometrisk fordelt med parametree N, K, (kort skrevet h(n,k,)) P(X = x) er sadsylighede for at etop x kugler er røde bladt de udtruke kugler. X siges at være hypergeometrisk fordelt med parametree N, K,, hvor K( M, x) K( N M, x) PX ( x) K( N, ) SAS.JMP : Hypergeometric Probability (N, K,, x) Formle udledes på samme måde som det skete i eksempel 8.1 Sætte x = 0, 1,,... fider vi forskellige værdier af tæthedsfuktioe. I Supplemet til statistiske grudbegreber afsit 8A bevises, at de hypergeometriske fordelig har middelværdie E( X) p og spredige ( X) p( p) N K 1, hvor p. N 1 N Eksempel 8.: Hypergeometrisk fordelig h (9, 6, 3 ). I e ure fides 10 kugler, hvoraf 6 er sorte, 4 er hvide. Vi betragter det tilfældige eksperimet: "Udtrækig af e kugle og observatio af farve på kugle. Eksperimetet getages 3 gage, idet de udtruke kugle ikke lægges tilbage mellem hver udtrækig. Lad X betege atallet af udtruke sorte kugler. Fid og skitser tæthedsfuktioe for X, og bereg middelværdi og spredig for X. Løsig: X er e diskret stokastisk variabel, der som er hypergeometrisk fordelt h (10, 6, 3) med tæthedsfuktioe f (x) = P(X = x): E søjle kaldes x og der idsættes 0 E søjle kaldes p og der idsættes derefter idsættes i søjle x tallet 1 osv. Der fremkommer følgede tabel Vælg Graph Chart Vælg p og tryk på Statistics Data tryk på x og idsæt i Catagories ok Rød pil ved Chart Vertical Chart og Y Optios Needle Chart 69

74 8. Vigtige diskrete fordeliger K Sættes p 6 er middelværdie E( X) p3 6. og N spredige ( X) p( p) N = N De hypergeometriske fordelig fider bl.a. avedelse i kvalitetskotrol, hvilket følgede eksempel viser. Eksempel 8.3: Stikprøveudtagig (kvalitetskotrol) E producet fabrikerer kompoeter, som sælges i æsker med 600 kompoeter i hver. Som led i e kvalitetskotrol udtages hvert kvarter tilfældigt e æske produceret idefor de sidste 15 miutter, og 5 tilfældigt udvalgte kompoeter i dee udersøges, hvorefter det foregåede kvarters produktio godkedes, såfremt der højst er é defekt kompoet i stikprøve. Hvor stor er acceptsadsylighede p, hvis æske ideholder i alt 10 defekte kompoeter, såfremt udtrækige sker ude mellemliggede tilbagelægiger? Løsig: X = atal defekte bladt de 5 kompoeter X er hypergeometrisk fordelt med N = 600, K=10, og = 5 Da partiet godkedes, hvis der ete er 0 defekte eller 1 defekt, følger af additiossætige at p = P (X = 0) + P (X = 1). SAS.JMP: Formula Discrete Probability p = = BINOMIALFORDELING Biomialfordelige beyttes som model for atallet af "succeser" ved uafhægige getagelser af et eksperimet, som hver gag har samme sadsylighed p for "succes". Problemstillige fremgår af følgede eksempel. Eksempel 8.4. E biomialfordelt variabel. E drejebæk producerer 1 % defekte emer. Lad X være atallet af defekte bladt de æste 5 emer der produceres. Vi øsker at fide sadsylighede for at fide etop defekte bladt disse 5, det vil sige P( X ). Løsig: Lad et eksperimet være at udtage et eme fra produktioe. Resultatet af eksperimetet har to udfald: defekt, ikke defekt. Eksperimetet getages 5 gage uafhægigt af hiade. Der er e bestemt sadsylighed for at få e defekt, emlig p = Lad d være det udfald at få e defekt, og d være det udfald at få e fejlfri. 70

75 8.3 Biomialfordelige Vi opskriver u samtlige forløb, der giver defekte ud af 5. ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, Da eksperimetere getages uafhægigt af hiade, følger det af produktsætige (både - og), at det første forløb må have sadsylighede ( ) ( ) ( ) ( ) 3. Det æste forløb må have sadsylighede 001. ( ) 001. ( ) ( ) 001. ( ) 3 Vi ser, at alle gustige forløb har samme sadsylighed. Atal forløb må være lig atal måder ma ka placere d er på 5 tomme pladser (eller atal måder ma ka tage kugler ud af e mægde på 5). Dette ved vi ka gøres på C(5,)=10 måder (svarede til de 10 forløb). 3 Vi får følgelig, at p C(,) ( ) I eksemplet har vi udledt de såkaldte biomialfordelig, som er defieret på følgede måde: DEFINITION af biomialfordelig. 1) Lad et tilfældigt eksperimet have udfald succes og fiasko ) Lad eksperimetet blive getaget gage uafhægigt af hiade, og lad sadsylighede for succes være e kostat p Lad X være atallet af succeser bladt de getagelser X er e diskret stokastisk variabel med tæthedsfuktioe Kx p x x (, ) ( 1 p) for x01,,,..., f ( x) P( X x) 0 ellers X siges at være biomialfordelt b (, p). Eksempel 8.5 = eksempel 8.4 fortsat X er biomialfordelt b(,p) hvor = 5 og p = 0.01 SAS.JMP: Formula Discrete Probability P(X=) = =

76 8. Vigtige diskrete fordeliger SÆTNING 8.1. (middelværdi og spredig for biomialfordelig). Lad X være biomialfordelt b (, p). Der gælder da E( X) p og ( X) p( 1 p). Bevis: Lad os betragte et eksperimet, hvor resultatet succes har sadsylighede p for at ske. Lad os foretage uafhægige getagelser af eksperimetet. At getagelsere er uafhægige betyder, at udfaldet af et eksperimet ikke afhæger af udfaldet af de forrige eksperimeter. Lad os betragte stokastiske variable X 1, X,..., X, hvor X i 1 hvis i' te getagelse af eksperimetet giver succes. 0 ellers Vi har E( Xi) xi f ( xi) 1 p0( 1 p) p, og i V( Xi) ( xi ) f ( xi) ( 1 p) p( 0 p) ( 1 p) p p p( 1 p) i Idet X X1 X... X er biomialfordelt b (, p) fås af liearitetsregle (kapitel 1afsit 5), at E( X) E( X1) E( X) E( X3)... E( X ) p p p... p p. Edvidere fås af kvadratregle i kapitel 1 afsit 5, idet vi har uafhægige getagelser, at V( X) V( X1) V( X)... V( X ) p( 1 p) p( 1 p)... p( 1 p), eller V( X) p( 1 p). Eksempel 8.6: Tæthedsfuktio for biomialfordelt variabel. Lad der på to af sidefladere på e terig være skrevet tallet 1, på to adre sideflader være skrevet tallet og på de sidste to sideflader være skrevet tallet 3.Vi betragter det tilfældige eksperimet: "7 kast med e terige og observatio af det fremkome tal. Lad X betege atallet af toere ved de 7 kast. X atages at være biomialfordelt b 7, ) Agiv tæthedsfuktioe f (x) for X (3 betydede cifre), og teg et stolpediagram for f (x). ) Fid middelværdi og spredig for X E perso foretager eksperimetet 11 gage, d.v.s. foretager 11 gage e serie på 7 kast med terige. Stikprøve gav følgede resultat Atal toere i e serie Atal gage dette skete ) Giv på grudlag af stikprøve et estimat for p i biomialfordelige. 4) Giv på grudlag af stikprøve et estimat for middelværdi og spredig. 7

77 Løsig: x x 1 1) f(x) = P(X = x) = 1 1 hvor x = 0, 1, osv. 3 3 E søjle kaldes x og der idsættes 0 E søjle kaldes p og der idsættes 8.3 Biomialfordelige derefter idsættes i søjle x tallet 1 osv. Vælg Graph Chart Vælg p og tryk på Statistics Data tryk på x og idsæt i Catagories ok Rød pil ved Chart Vertical Chart og Y Optios Needle Chart E( X) p ( X) p( 1 p) ) og 3) Der er i alt toere i 77 kast. 3 Et estimat for p er p ) Stikprøves middelværdi er x 09., og stikprøves spredig er 11 ( X) p( 1 p)

78 8. Vigtige diskrete fordeliger Approksimatio af hypergeometrisk fordelig med biomialfordelig. At erstatte de hypergeometriske fordelig h (N, K, ) med biomialfordelige b (, p) vil for de fleste avedelser kue gøres med e passede øjagtighed, hvis stikprøvestørrelse er N 1 midre ed eller lig 10% af partistørrelse N ( ). 10 N 10 K I så fald sættes i biomialfordelige p. N Eksempel 8.7. Approksimatio af hypergeometrisk fordelig til biomialfordelig. I eksempel 8.3, hvor ma udtog 5 kompoeter fra æsker på 600 kompoeter, skete udtagige logisk ok ude tilbagelægig. Imidlertid er det klart, at da æskere ideholder mage kompoeter vil sadsylighede for at få e defekt ikke ædrer sig meget, hvis ma i stedet havde foretaget udtagige med tilbagelægig. Der blev ataget, at der var 10 defekte i e såda æske med 600, og dette atal defekte vil så være kostat, uder hver udtrækig. Da ka approksimeres med biomialfordelig N Vi har derfor, at P(at få e defekt) = Løsige af problemet i eksempel 8.3 vil derfor u være: pa P( X 1) P( X 0) P( X 1) = = Det ses, at vi får praktisk samme resultat som i eksempel 8.3. Hypotesetest for biomialfordelt variabel. I kapitel 6 geemgik vi ved e række eksempler de grudlæggede begreber for hypotesetestig for é ormalfordelt variabel. Disse begreber ka uædret overføres til hypotesetestig for biomialfordelt variabel. Kofidesitervaller. Ved løsig af e passede ligig (se oversigt 8.8 ) ka ma fide de eksakte græser for kofidesitervallere. De følgede to eksempler viser beregig af test og kofidesitervaller. Eksempel 8.8. Esidet biomialfordeligstest. E levedsmiddelproducet fremstiller et levedsmiddel A, som imidlertid har e ret rige holdbarhed. Efter e række eksperimeter lykkedes det at frembrige et produkt B, som i alt væsetligt er idetisk med A, me som har e bedre holdbarhed. Af markedsmæssige grude er det vigtigt, at der ikke er forskel på smage af B og af det velkedte produkt A. For at udersøge dette, lader producete et pael af 4 ekspertsmagere vurdere, om ma ka smage forskel. Ma foretog derfor følgede smagsprøvigseksperimet. Hver ekspertsmager fik 3 es udseede portioer, hvoraf e portio var af det ee levedsmiddel og de to adre portioer var af det adet levedsmiddel. 74

79 8.3 Biomialfordelige Hvilket af de 3 portioer der skulle ideholde et adet levedsmiddel ed de to adre, og om det skulle være levedsmiddel A eller B, afgjordes hver gag ved lodtrækig. Ku forsøgsledere havde kedskab til resultatet. Hver ekspertsmager fik besked på, at de skulle fortælle forsøgsledere hvilke af de tre portioer der smagte aderledes. Hvis ma ikke kue smage forskel, skulle ma gætte. Resultatet viste, at af de 4 svar var 13 svar rigtige. 1 Ved re gætig kue ma forvete ca. 3 dvs. ca. 8 rigtige svar. 13 rigtige svar er betydeligt flere, me ka det alligevel tilskrives tilfældigheder ved gætig? Ka der på et sigifikasiveau på 5% statistisk påvist, at ekspertsmagere ka smage forskel på smage af A og B? Løsig: Lad X = atallet af rigtige svar. X er biomialfordelt b (, p), hvor = 4 og p er ukedt. 1 Nulhypotese H0: p mod de alterative hypotese Hp : P - værdi = P( X 13) = =.84% Da P - værdi =.84% < 5% forkastes ulhypotese (estjeret), dvs. der må kokluderes, at der er e smagsforskel mellem produkt A og B. Eksempel 8.9. Kofidesiterval for parametere p i biomialfordelig. E plastikfabrik har udviklet e y type affaldsbeholdere. Ma overvejer at give e 6 års garati for holdbarhede. For at få et skø over om det er økoomisk retabelt, bliver 100 beholdere udsat for et accelereret livstidstest som simulerer 6 års brug af beholdere. Det viste sig, at af de 100 beholdere overlevede de 85 teste. Idet atallet af overlevede beholdere atages at være biomialfordelt, skal ma 1) Agive et estimat for sadsylighede p for at e beholder overlever i 6 år. ) Agive et 95% kofidesiterval for p. Løsig: 1) Lad X være atallet af overlevede beholdere. X forudsættes biomialfordelt b (100, p). Ifølge oversigt 8.8 er et estimat for p: ~ x 85 p ) Approksimativ metode 1: N-G = = 0.78 Ø-G = = 0,9 Resultat: 95% kofidesiterval : [0.78 ; 0.9 ] 75

80 8. Vigtige diskrete fordeliger Udefor et 95% kofidesiterval ligger 5%, og af symmetrigrude ligger der,5% på hver side. Biomial Quatile giver som resultat det hele tal for hvilket P(X 0.05) (heholdsvis P(X 0,975), så forskelle mellem de korrekte værdi og de fude ka højst være ca 1. Da vi derefter skal dividere med = 100 bliver i dette tilfælde afvigelse højst ca 0.01 som jo ikke afvige meget fra det korrekte. Approksimativ metode I oversigte 8.8 ses, at ma ka approksimere med e ormalfordelig, da 10#85# radius r = = = 0.7 Resultat: 95% kofidesiterval :[ ; ] = [0.78 ; 0.9 ] Eksakt løsig: Beyttes formel i oversigt 8.8. Øvre græse: Løs ligige P( X 85) = 0.05 med hesy til p. Beyttes gættemetode, dvs, kalde der e søjle p, e ade søjle øvre og i formula uder øvre skriver fås ved at vælge p-værdier Heraf ses, at øvre græse er 91.36% Hvis ma tilsvarede i e søjle edre skriver fås dvs. edre græse er 77.63% 95% Kofidesiterval: [77.63%; 91.36%] Bemærk, at kofidesitervallet ikke ligger helt symmetrisk omkrig 0.85, da biomialfordelige ikke er helt symmetrisk omkrig 0.85 Forklarig på formle: Udefor et 95% kofidesiterval ligger 5%, og af symmetrigrude ligger der,5% på hver side. Er de sade værdi for p eksempelvis 90% vil der i middel være 90 ud af 100 overlevede beholdere. Nu fadt vi ku 85 ud af 100. Sadsylighede P(X#85) for at få 85 eller færre overlevede beholdere ud af 100 er derfor ret rige. Vi har P(X#85) = Selv om 7.6% er et lille tal, så er det dog over.5%, så e P-værdi på 90% ligger ide i kofidesitervallet. For at fide de øvre græse må vi derfor lade p stige idtil P(X#85) = Deræst fides edre græse ved at lade p falde, idtil PX ( 85) Som det ses, er forskelle i forhold til de approksimative løsig meget lille, og som forvetet ligger de eksakte løsig uder de approksimative løsig. 76

81 8.4 Poissofordelige Bestemmelse af stikprøves størrelse Før ma starter sie måliger, kue det være yttigt på forhåd at vide ogelude hvor mage måliger ma skal foretage, for at få resultat med e give øjagtighed. Hvis ma atager, at ma ka approksimere med ormalfordelige, ved vi, at radius for et 95% p ( 1 p ) kofidesiterval er r z Løses dee ligig med hesy til fås z p p ( 1 ) r Det grudlæggede problem er her, at ma æppe keder p eksakt. Ma keder muligvis på basis af tidligere erfariger størrelsesordee af p. Hvis ikke kue ma evetuelt udtage e lille stikprøve, og berege et p på basis heraf. Edelig er der de mulighed, at sætter p = 0.5, som er maksimumsværdie af p ( 1 p) Beyttes dee værdi får ma de størst mulige værdi af for e give værdi af r. Ulempe er, at dette fører til e større stikprøvestørrelse ed ødvedigt. Det følgede eksempel illustrerer fremgagsmåde. Eksempel Bestemmelse af atal i stikprøve. I e opiiosudersøgelse vil ma spørge et repræsetativt atal vælgere om hvilket parti de vilde stemme på, hvis der var valg i morge. I dee udersøgelse øskes ide udtagig af stikprøve, at atallet skal være så stort, at radius i kofidesitervallet højst er %. Løsig: Metode 1. For at få e øvre græse, sættes p = 0.5. Vi får z Normal Quatile p p r ( ) 1 1 ( 1 ) Metode Da ma på forhåd ved, at ved sidste valg fik ige partier mere ed 30% af stemmere sættes p = 0.3. z Normal Quatile p p r ( ) ( 1 ) POISSONFORDELINGEN Poissofordeliger beyttes ofte som statistisk model for atallet af "impulser" pr. tidsehed. Disse impulser atages at komme tilfældigt og uafhægigt af hiade. Som eksempler ka æves: Atal trafikuheld på e bestemt vejstrækig i løbet af et år, atal biler, der passerer e militær kotrolpost, atal varevoge der akommer pr. time til et stort varehus og atal telefosamtaler der føres fra e telefocetral, der er oprettet uder e øvelse. Modelle ka dog også avedes på adet ed pr. tidsehed, eksempelvis også på atal rever pr. km kabel, hvis disse rever forekommer tilfældigt og uafhægigt af hiade. 77

82 Vigtige diskrete fordeliger Uder sådae omstædigheder ka ma ofte beytte de i det følgede omtalte Poissofordelig som statistisk model for atallet af "impulser" pr. tidsehed eller volumeehed eller lægdeehed osv. SÆTNING 8. (Poissofordelig). Lad X være e stokastisk variabel, som agiver atallet af impulser i et givet tidsrum (eller areal, volume, produktiosehed osv.), idet ethvert tidspukt i tidsrummet har samme mulighed for at være impulstidspukt som ethvert adet tidspukt. Edvidere skal impulsere idtræffe tilfældigt og uafhægigt af hiade * ). Hvis det geemsitlige atal impulser i tidsrummet er 0, så siges X at være Poissofordelt p ( ) med sadsylighedsfordelige (tæthedsfuktioe) f(x) = P(X = x) bestemt ved x f ( x) P( X x) e x! 0 for ellers x {,,,...} 01 Middelværdie for p( ) er E ( X ) = og spredige er ( X ). I formulerige af de oveævte betigelser ka efter behov "et lille tidsrum t" erstattes med "e lille lægde ", "et lille areal A" eller "et lille volume V". *) Præcis formulerig: Følgede 3 betigelser skal være opfyldt: 1) Sadsylighede for etop é impuls i et meget lille tidsrum t er med tilærmelse proportioal med t. P (Matematisk formulerig lim ( X 1 ) ( er e positiv kostat) t 0 t ) Sadsylighede for eller flere impulser i det meget lille tidsrum t er lille sammeliget med t. P (Matematisk formulerig lim ( X 1 ) 0 ) t 0 t 3) Atal impulser i forskellige, ikke overlappede tidsrum er statistisk uafhægige. E bevisskitse for sætige ka ses i Supplemet til statistiske grudbegreber afsit 8.C. Eksempel 8.11: Atal rever p. meter i et tydt kobberkabel. På e fabrik fremstilles kobberkabler af e bestemt tykkelse. Mikroskopiske rever forekommer tilfældigt lags disse kabler. Ma har erfarig for, at der i geemsit er 1.3 af de type rever p. 10 meter kabel. Bereg sadsylighede for, at der 1) ige rever er i 1 meter tilfældigt udvalgt kabel. ) er midst rever i 1 meter tilfældigt udvalgt kabel. 3) er højst 4 rever i meter tilfældigt udvalgt kabel Fabrikke går u over til e ade og billigere produktiosmetode. For at få et estimat for middelværdie ved de ye metode måltes atallet af rever på 1 kabelstykker på hver 10 meter. Resultatere var Kabel r Atal rever ) Agiv på basis heraf et estimat for middelværdie af atal rever pr. 10 m kabel. 78

83 Løsig: 8.4 Poissofordelige X = atal rever i 1 meter kabel. X atages Poissofordelt p ( ). (idet vi med tilærmelse ka atage, at betigelsere i sætig 8. er opfyldt (impuls er her ridser). Da det geemsitlige atal rever pr. 1m kabel er ) P( X 0) e ! SAS.JMP: Poisso Probability(1,3,0) = 0.9 ) P( X ) 1 P( X 1) 1 - Poisso Distributio (1,3,1) = ) Y = atal rever i meter kabel. Da der i geemsit er,46 rever i meter kabel, er.46 et estimat for. Vi har derfor P( X 4) = Poisso Distributio(,46, 4) = ) Der er i alt 94 rever i 1 kabelstykker på hver 10 meter. Et estimat for er derfor ~ Hypotesetest og kofidesitervaller for Poissofordelt variabel. I kapitel 5 geemgik vi ved e række eksempler de grudlæggede begreber for hypotesetestig og kofidesitervaller for é ormalfordelt variabel. Disse begreber ka uædret overføres til hypotesetestig og kofidesitervaller for Possofordelt variabel. Har ma rådighed over et program med kumuleret Poissofordelig ka testee geemføres eksakt. (se oversigt 8.8) Eksempel 8.1. Esidet Poissotest. I eksempel 8.11 betragtede vi mikroskopiske rever i et kobberkabel. Fabrikke gik over til e ade og billigere produktiosmetode. 1) Test, om de ye metode giver færre rever ed de gamle metode. ) Forudsat, de ye metode giver sigifikat færre rever ed de gamle metode, skal ma a) Agiv et 95% kofidesiterval for middelværdie af atal rever pr. 10 meter kabel b) Agiv et 95% kofidesiterval for middelværdie 1 af atal rever pr. 10 meter kabel. Løsig: 1) Lad X betege atallet af rever i 10 meter kabel ved y metode X atages Poissofordelt p( ), hvor vi i eksempel 8.7 fadt at et estimat for var ~ 94. Ved gammel metode er atal rever i 10 m kabel i middel μ 0 = Nulhypotese H 0 : mod de alterative hypotese H: fås: 79

84 Vigtige diskrete fordeliger P - værdi = PY ( 94) Poisso Distributio(147,6, 94) = Da P - værdi < 0.05 forkastes ulhypotese (stærkt),dvs. vi er sikre på, at middelatallet af rever er blevet formidsket ved at avede de ye metode a) oversigt 8.8 avedes. 10 m kabel: m = 94 Øvre græse x: Løs ligige P( X x) = med hesy til x. Poisso Quatile(94,0.975) = 113 Nedre græse: Løs ligige P( X x) Poisso Quatile(94,0.05) = 75 95% Kofidesiterval: [75.0; 113.0] = 0.05 med hesy til x Forklarig på formle: Udefor et 95% kofidesiterval ligger 5%, og af symmetrigrude ligger der,5% på hver side. (jævfør figure) Jo midre de sade værdi af middelværdie er, jo midre er sadsylighede for, at geemsittet blev 94. b) 10 m kabel: Vi leder derfor i græse efter et x, så P( X x) = ; 65. ; APPROKSIMATIONER Vi har udertide beyttet os af, at det uder visse forudsætiger er muligt med e rimelig øjagtighed, at foretage approksimatioer, f.eks. at approksimere e biomialfordelig eller e Poissofordelig med e ormalfordelig. Dette ka give ogle simplere beregiger, eksempelvis år ma approksimerer e hypergeometrisk fordelig med e biomialfordelig eller år ma ved udregig af kofidesitervaller for biomialfordelig approksimerer med ormalfordelig. I appedix 8.1 er agivet e samlet oversigt over de mulige approksimatioer. 8.6 De geeraliserede hypergeometriske fordelig. De hypergeometriske fordelig beyttes som model ved stikprøveudtagig ude tilbagelægig, hvor hvert elemet har ete e bestemt egeskab (defekt) eller ikke har dee egeskab (ikke defekt). Hvis der foreligger flere ed to egeskaber, f.eks. udtagig af møtrikker, hvis diameter ete tilhører et givet toleraceiterval eller er for stor eller for lille, ka ma geeralisere de hypergeometriske fordelig. Dette illustreres ved følgede eksempel: 80

85 Polyomialfordelige Eksempel 8.1. Geeraliseret hypergeometrisk fordelig. I e ure fides 1 kugler, hvoraf 5 er sorte, 4 er hvide og 3 er røde. Vi betragter det tilfældige eksperimet: "Udtrækig af 6 kugler ude tilbagelægig og observatio af farve på kuglere. Bereg sadsylighede for at få sorte, 3 hvide og 1 rød kugle. LØSNING: Lad X 1 være atallet af sorte kugler, X være atallet af hvide kugler og X 3 være atallet af røde kugler. Aalogt med begrudelse for de hypergeometriske fordelig fås: C(,) 5 C(,) 43 C(,) P( X1, X 3, X3 1) 013. C( 1, 6) Polyomialfordelige. Biomialfordelige beyttes som model ved uafhægige getagelser af samme eksperimet. Eksperimetet har to udfald succes eller ikke succes og der er e kostat sadsylighed for succes. Hvis der foreligger flere ed to udfald, f.eks. udtagig af møtrikker fra e løbede produktio, hvor diameter ete tilhører et givet toleraceiterval eller er for stor eller for lille, ka ma geeralisere til polyomialfordelige. Idet formle for biomialfordelige ka skrives f x p x p x! p x p x! ( ) ( ) ( ) p x p x, hvor x x!( x)! x! x! p p og x x fås aalogt DEFINITION af polyomialfordelig. Lad være et positivt helt tal, og lad p 1 p... p k 1 og x x... x hvor alle pér er positive 1 1 tal og alle xér er hele tal. Sadsylighedsfordelige for e polyomialfordelt stokastisk variabel P( X x, X x,..., X x ) 1 1 k k! x1 x p1 p... p x! x!... x! 1 k k ( X 1, X,..., X k ) Dette illustreres ved følgede eksempel: Eksempel Polyomialfordelige E stor produktio af glaskugler ideholder 40% sorte, 35% hvide og 5% røde kugler. Vi betragter det tilfældige eksperimet: "Udtrækig af 6 kugler observatio af farve på kuglere. Bereg sadsylighede for at få sorte, 3 hvide og 1 rød kugle. LØSNING: Lad X 1 være atallet af sorte kugler, X være atallet af hvide kugler og X 3 være atallet af røde kugler. Vi får u P( X!, X, X )!!! x k k er 81

86 Vigtige diskrete fordeliger 8.8. OVERSIGT over cetrale formler i kapitel 8 X er biomialfordelt b(,p), hvor er kedt og p ukedt. Givet stikprøveværdi x Kofidesiterval Forudsætiger Estimat for p 100 (1 - ) % kofidesiterval for parameter approksimatio metode 1 max. fejl ca 100 % ~ x p BiomialQuatile ( ~ p,, 005. ) BiomialQuatile p p ( ~,, ) se eksempel 8.9 approksimatio med ormalfordelig 10 x x 10 ~ x p ~ p z ~ p ( 1 ~ p ) ~ ~ p ( 1 ~ p ) p p z 1 1 Se eksempel 8.9 eksakt ~ x p edre græse: Løs ligig PX ( x) med hesy til p. Gættemetode: se eksempel 8.9 øvre græse: Løs ligig P( X x) med hesy til p Test af parameter p for biomialfordelt variabel Der foreligger e stikprøve på X. Observeret stikprøveværdi x. Sigifikasiveau er. Y er biomialfordelt bp (, ), hvor er e give kostat Alterativ hypotese H H: p p 0 P( Y x) H: p p 0 P( Y x) 0 p 0 P - værdi Beregig H 0 forkastes 1-Biomial Distributio(p 0,, x-1) se eksempel 8.8 P-værdi < Biomial Distributio(p 0,, x) H: p p 0 P( Y x) for x p0 P( Y x) for x p0 som række 1 som række P-værdi < 1 8

87 8.8 Oversigt X er Poissofordelt med middelværdi μ, hvor μ er ukedt. Der optælles i alt m impulser i e stikprøve Kofidesiterval Forudsætig Estimat for parameter 100 (1 - ) % kofidesiterval for parameter Approksimatio m $ 10 μ = m edre græse x x = Poisso Quatile( m, ) øvre græse x: x = Poisso Quatile( m, 1 - ) se eksempel 8.1 μ = m m z m m z m 1 1 Test af parameter μ for Poissofordelt variabel. Der optælles i alt m impulser i e stikprøve. Sigifikasiveau er. Y er Poissofordelt p( 0 ), hvor 0 er e give kostat. Alterativ hypotese H H: 0 PY ( m) H: H: P - værdi Beregig H 0 forkastes 1 - Poisso Distributio(,m) 0 PY ( m) Poisso Distributio( 0,m) se evt. eksempel PY ( m) for x 0 som række 1 PY ( m) for x 0 som række 0 P - værdi P-værdi 1 83

88 Vigtige diskrete fordeliger OPGAVER Opgave 8.1 Ved e lodtrækig fordeles 3 gevister bladt 5 lodsedler. E spiller har købt 5 lodsedler. 1) Bereg sadsylighede for at spillere vider etop é gevist. Lad de stokastiske variable X være bestemt ved X = atal gevister som spillere vider ) Fid og skitser tæthedsfuktioe for X 3) Bereg middelværdie for X Opgave 8. Fra et sædvaligt spil kort udtrækkes på tilfældig måde 3 kort ude tilbagelægig. Bestem sadsylighedere for hver af hædelsere A: Der udtrækkes ku 8'ere. B: Der udtrækkes lutter hjerter. C: Der udtrækkes sorte og 1 rødt kort. Opgave 8.3 På e udervisigsistitutio skal 105 studerede holde fest samme med deres 3 lærere. Et festudvalg på 5 persoer vælges tilfældigt. a) Bereg sadsylighede for at der kommer etop 1 lærer med i udvalget. b) Bereg sadsylighede for at der kommer mere ed 1 lærer med i udvalget Opgave 8.4. I e kortbuke er der 6 kort, hvoraf etop 4 er spar. Kortee fordeles i lige store buker A og B. 1) Peter påstår, at sadsylighede for at buke A ideholder etop 3 spar er 4.87%. Har Peter ret? ) Bereg sadsylighede for, at e af bukere ideholder etop 1 spar. Opgave 8.5 E fabrikat fremstiller e bestemt type radiokompoeter. Disse leveres i æsker med 30 kompoeter i hver æske. E køber har de aftale med fabrikate, at hvis e æske ideholder 4 defekte kompoeter eller derover, ka købere returere æske, i modsat fald skal de godkedes. Købere kotrollere hver æske ved e stikprøve, idet ha af æske udtager 10 kompoeter tilfældigt. Lad X være atal defekte i stikprøve. Der overvejes u to plaer: 1) Hvis X = 0, så godkedes æske, ellers udersøges æske ærmere. ) Hvis X 1, så godkedes æske, ellers udersøges æske ærmere. Hvad er sadsylighede for, at e æske, der ideholder etop 4 defekte kompoeter, bliver godkedt af købere ved metode 1 og ved metode. Opgave 8.6 E tipskupo har 13 kampe med 3 mulige teg - 1, x og - for hver kamp. E perso bestemmer teget, der skal sættes for hver kamp, ved tilfældig udtrækig af e seddel fra 3 sedler med tegee heholdsvis 1, x og. Agiv sadsylighede for, at persoe opår etop 8 rigtige tippede kampe på si kupo. 84

89 Opgaver til kapitel 8 Opgave 8.7 I et elektrisk specialapparat idgår 30 kompoeter, som hver er idkapslet i et heliumfyldt hylster. Bereg, idet sadsylighede for, at et kompoethylster lækker, er 0.%, sadsylighede for, at midst ét af de 30 kompoethylstre lækker. Opgave 8.8 E sypigetipper (M/K) deltog i tipig 4 gage i løbet af et år. På hver tipskupo var der 13 kampe, ved hver af hvilke tippere ved systematisk gætig satte et af de 3 teg: 1, x,. Bereg sadsylighede p for, at tippere det pågældede år tippede midst 00 kampe rigtigt. Opgave 8.9 Bladt familier med 3 bør udvælges 50 familier tilfældigt. Agiv sadsylighede for, at der i midst 8 af disse familier udelukkede er bør af samme kø. Opgave Ved e fabrikatio af plastikposer leveres disse i æsker med 100 poser i hver. Ved e godkedelseskotrol af et parti plastikposer udtages og udersøges e tilfældigt udtaget æske, og partiet godkedes, såfremt æske højst ideholder é defekt pose. Vi atager, at de løbede produktio af poser er således, at hver produktio med sadsylighede % giver e pose, der er defekt; vi vil seere formulere dette således, at produktioe er i statistisk kotrol med fejlsadsylighede p = %. Hvor stor er sadsylighede for, at partiet uder disse omstædigheder accepteres? Opgave 8.11 Det er oplyst, at der for e give vaccie er 80% sadsylighed for, at de ved avedelse har de øskede virkig. På et hospital foretoges vacciatio af 100 persoer med de pågældede vaccie. Bereg sadsylighede for, at 15 eller færre af de foretage vacciatioer er ude virkig. Opgave 8.1 Ved et køb af plastikbægre aftaltes med leveradøre, at det skal være e forudsætig for købet, at partiet godkedes ved e stikprøvekotrol. Kotrolle udøves ved, at 00 bægre udtages tilfældigt af partiet og kotrolleres. Partiet godkedes, såfremt højst 5 af de 00 bægre er defekte. Bereg sadsylighede for, at partiet godkedes, hvis det i alt ideholder 300 defekte bægre. Opgave 8.13 E fabrikat får halvfabrikata hjem i partier på eheder. Fra hvert parti udtages e stikprøve på 100 eheder og atallet af fejlagtige bladt disse oteres. Hvis dette atal er midre ed eller lig med, accepteres hele partiet; i modsat fald udersøges partiet yderligere. 1) Hvad er sadsylighede for, at et parti med e fejlprocet på 1 vil blive yderligere udersøgt. ) Hvor stor er sadsylighede for, at et parti med e fejlprocet på 5 vil blive accepteret. 85

90 Vigtige diskrete fordeliger Opgave 8.14 E maskifabrikat påtæker at købe møtrikker af e bestemt type. Ma beslutter sig til at købe et tilbudt parti af de ævte størrelse, såfremt e stikprøve på 150 møtrikker højst ideholder 4% defekte møtrikker. 1) Bereg sadsylighede for, at partiet bliver godkedt af maskifabrikke, såfremt det ideholder a) 4% defekte møtrikker, b) 7,5% defekte møtrikker, ) Bestem, for hvilke procetdel defekte møtrikker det oveævte parti har 50% sadsylighed for at blive godkedt af maskifabrikke. Opgave 8.15 E y vaccie formodes med e sadsylighed på midst 85% at have e forebyggede virkig over for e bestemt ifluezatype. Før e truede ifluezaepedemi vaccieres et hospitalspersoale på 600 persoer med de pågældede vaccie. 15 af disse bliver smittet af sygdomme. Ka dette opfattes som e eksperimetel påvisig af, at vaccie er midre virksom ed vetet? Opgave ) Atag, at e vis type af fostermisdaelse ormalt forekommer med hyppighede 164 tilfælde p fødsler. Bereg sadsylighede for 3 eller flere fostermisdaelser bladt 56 fødsler. ) For at udersøge om forholdee i et bestemt arbejdsmiljø forøger hyppighede af dee type misdaelse, udersøgte ma hyppighede af misdaelser for mødre, som uder graviditete havde haft de aktuelle type af arbejde, og fadt 3 misdaelser bladt 56 fødsler. Ka de forøgede relative hyppighed i dette materiale skyldes tilfældigheder? Opgave 8.17 Udsættes platere af e bestemt sort roser for meldugssmitte, bliver i middel brøkdele p agrebet, hvor p er midst 0.0. E rosegarter fremavler e rosestamme, som ha påstår er mere modstadsdygtig over for meldugssmitte. For at kotrollere dee påstad bliver 100 roser af de ye stamme udsat for meldugssmitte. Det viser sig, at 1 roser bliver agrebet. 1) Bekræfter dette resultat rosegarteres påstad? (Husk altid at aføre: Hvad X er. Atagelser. Nulhypotese. Beregiger. Koklusio.). Hvis rosegartere har ret, skal ma ) Agiv et estimat ~ p for de ye stammes p. 3) Agiv et 95% kofidesiterval for de ye stammes p. Opgave 8.18 E fabrikat af chip til computere reklamerer med, at højst % af e bestemt type chip, som fabrikke seder ud på markedet er defekte. Et stort computerfirma vil købe et meget stort parti af disse chip, hvis påstade er rigtigt. For at teste påstade købes 1000 af dem. Det viser sig, at 33 ud af de 1000 er defekte. Ka fabrikates påstad på dee baggrud forkastes på sigifikasiveau 5%? 86

91 Opgaver til kapitel 8 Opgave 8.19 E producet af billigt plastiklegetøj får mage klager over at e bestemt type legetøj er defekt ved salget. Legetøjet sælges til butikkere i kasser på 10 stk, og som et led i e kvalitetetskotrol udtages 100 kasser og atallet x af defekt legetøj optaltes. Følgede resultater fadtes: x Atal kasser Lad p være sadsylighede for at få et defekt stykke legetøj. 1) Fid et estimat ~ p for p. ) Agiv et 95% kofidesiterval for p. Opgave 8.0 Af 1000 tilfældigt udvalgte patieter, der led af lugekræft, var 83 døde seest 5 år efter sygdomme blev opdaget. Agiv på dette grudlag et 95% kofidesiterval for sadsylighede for at dø af dee sygdom seest 5 år efter at sygdomme bliver opdaget. Opgave 8.1 E fabrikat af lommeregere vurderer, at ca. 1% af de producerede lommeregere er defekte. For at få e øjere vurderig heraf øskes udtaget e stikprøve, der er så stor, at radius i et 95% kofidesiterval for fejlprocete p er højst 0.5%. Fid stikprøves størrelse. Opgave 8. På e fabrik fremstilles gulvtæpper, som har størrelse 0 m. Ved fabrikatioe er der geemsitlig 6 vævefejl pr. 100 m klæde. 1) Bereg sadsylighede for, at et tilfældigt gulvtæppe ige vævefejl har. ) Bereg sadsylighede for, at et tilfældigt gulvtæppe højst har vævefejl. Fabrikke køber e y væv. For at få et estimat for middelværdie måltes atallet af vævefejl i 1 gulvtæpper hver på 0 m. Resultatere var Gulvtæppe r Atal vævefejl ) Fid et estimat for middelværdie af atal vævefejl p. 0 m klæde. Opgave 8.3 Et radioaktivt præparat udergår geemsitligt 100 desitegratioer (søderdeliger) p. miut. Lad X betege atal desitegratioer i et sekud (som er lille i forhold til præparatets halverigstid). Fid P( X 1). 87

92 Vigtige diskrete fordeliger Opgave 8.4 Ved e TV-fabrikatio optælles som led i e godkedelseskotrol atal loddefejl p. 5 TVapparater. Fabrikate øsker at få et overblik over atal loddefejl, og optalte derfor atal loddefejl på 4 tilfældigt udtage TV apparater. Resultatet fremgår af skemaet: Atal loddefejl Atal TV apparater Lad X være atallet af loddefejl i 5 TV apparater. 1) Agiv de sadsylighedsfordelig X approksimativt ka atages at følge, og giv et estimat for parametere i fordelige. ) Bereg på basis af svaret i spørgsmål 1 sadsylighede for, at der på 5 tilfældigt udtage TVapparater højst er i alt 18 loddefejl? Opgave 8.5 På et tekisk uiversitet er et cetralt edb-alæg i kostat brug. Ma har erfarig for, at alægget i løbet af e 0 ugers periode har geemsitligt 7 maskistop. Bereg sadsylighede p for, at alægget i e 4 ugers periode har midst ét maskistop. Opgave 8.6 På e fabrik idtræffer i geemsit 7 ulykker om året. Atag, at de forskellige ulykker idtræffer uafhægigt af hiade, og at de er ogelude jævt fordelt over året. Bereg, idet et arbejdsår sættes lig med 48 uger, sadsylighede for at der i e uge idtræffer flere ed 3 ulykker. Opgave 8.7 Til et bestemt telefoummer er der i løbet af aftee i middel 300 opkald i time. Bereg sadsylighede for, at der i løbet af et miut er højst 8 opkald. Opgave 8.8 E fabrikatio af fortiede plader fider sted ved e kotiuerlig elektrolytisk proces. Umiddelbart efter produktioe kotrolleres for pladefejl. Ma har erfarig for, at der i middel er 1 pladefejl hvert 5'te miut. Bereg sadsylighede for, at der højst er 5 pladefejl ved e halv times produktio. Opgave 8.9 Lastbiler med affald akommer tilfældigt og idbyrdes uafhægigt til e losseplads. Lossepladses maksimale kapacitet er bereget til, at der i middel akommer 90 lastbiler p. time. Ledelse af pladse føler, at travlhede er blevet større i de sidste tid, således at atallet af lastbiler overskrider de maksimale kapacitet. For at udersøge dette, foretages e optællig af lastbiler i perioder à 10 miutter. Følgede resultater fremkom: ) Bekræfter disse resultater ledelses formodig? (Husk altid at aføre: Hvad X er. Atagelser. Nulhypotese. Beregiger. Koklusio.). Forudsat ma ka vise, at ledelse har ret på et sigifikasiveau på 5%, skal ma ~ ) Agiv et estimat for middelværdie [lastbiler/time]. 3) Agiv et 95% kofidesiterval for middelværdie [lastbiler/time]. 88

93 Opgaver til kapitel 8 Opgave 8.30 Nedeståede tabel viser fordelige af 400 volumeeheder med hesy til atal gærceller p. volumeehed. Atal gærceller Atal volumeeheder Lad X være atal gærceller p. volumeehed. Det atages, at X er e stokastisk variabel der er Poissofordelt p ( ). 1) Fid et estimat ~ for. ) Agiv et 95% kofidesiterval for. 3) Forudsat at X er Poissofordelt p ( ~ ) øskes bereget det forvetede atal volumeeheder, hvori der forekommer 5 gærceller (for x = 5). Opgave 8.31 Ved ispektio af e produktio med isolerig af kobberledig taltes der i løbet af 50 miutter i alt 11 isolerigsfejl. Idet atallet af isolerigsfejl p. 50 miutter atages at være Poissofordelt p ( 1 ), skal ma 1a) agive et estimat for 1. 1b) agive et 95% kofidesiterval for 1. Det oplyses u, at ma i hver 5 miutters periode i de ovefor omtalte 50 miutters periode havde observeret følgede atal isolerigsfejl: Periode Atal fejl Idet atallet af isolerigsfejl p. 5 miutter atages at være Poissofordelt p ( a) agive et estimat for. b) agive et 95% kofidesiterval for. ), skal ma Opgave 8.3 I e ure fides 10 røde kugler, 5 hvide kugler og 3 sorte kugler.6 gage efter hiade optages tilfældigt e kugle fra ure. Bestem sadsylighede for, at der i alt er optaget 1 rød, hvide og 3 sorte kugler, år 1) kuglere optages ude tilbagelægig ) kuglere optages med tilbagelægig. Opgave 8.33 E virksomhed fabrikerer farvede glasklodser til dekoratiosbrug. Defekte glasklodser frasorteres. Ma har erfarig for, at af de frasorterede klodser har i middel 50% ku rever, 35% ku farvefejl, medes reste har begge disse fejl. Bereg sadsylighede for, at af 1 tilfældige defekte klodser har 6 ku rever, 4 ku farvefejl og begge disse fejl. Opgave 8.34 I et kortspil med de sædvalige 5 spillekort har e spiller modtaget 13 kort. Agiv i procet med decimaler sadsylighede for, at 3 af disse er esser og 5 er billedkort. 89

94 9. Adre kotiuerte fordeliger 9 ANDRE KONTINUERTE FORDELINGER 9.1 INDLEDNING Vi vil i dette kapitel kort orietere om e række fordeliger, som er vigtige i specielle sammehæge, 9. DEN REKTANGULÆRE FORDELING DEFINITION af rektagulær fordelig med parametree a og b. Lad a og b være to reelle tal, hvor a<b. Sadsylighedsfordelige for e kotiuert stokastisk variabel X med tæthedsfuktioe f (x) 1 for a xb bestemt ved f ( x) b a 0 ellers siges at være rektagulært fordelt rekt (a, b ). SÆTNING 9.1. ( Middelværdi og spredig for rektagulær fordelig ). a b b a De rektagulære fordelig har E( X) og ( X ) (a < b) 3 Bevis: E( X) V( X) b a a x b a dx x b a ( ba) b a b a b x x 3 ( b a) dx b a 3( b a) 1 b a Eksempel 9.1 Kotiuert variabel. Lad rade af e roulette være ækvidistat iddelt efter e skala fra 0 til 1, jævfør figure. Ved et roulettespil briges roulettes viser til at rotere, hvorefter de stadser ud for et tilfældigt pukt på skalae. Lad X være det tal som roulettes viser peger på. Idet X må kue atage ethvert tal mellem 0 og 1, må X være e kotiuert variabel. Agiv tæthedsfuktio og fordeligsfuktio for X og skitser disse. b a 90

95 9.3 Ekspoetialfordelige Løsig: x Da P( 0 X x) for 0 x 1 1 er fordeligsfuktioe for X 0 for x 0 x F( x) for 0 x for x 1 Ved differetiatio fås tæthedsfuktioe 1 for 0 x 1 f ( x) 1 0 ellers 9.3 EKSPONENTIALFORDELINGEN I kapitel 7 betragtede vi atallet N af rever pr. meter lags et kobberkabel. Vi atog, at N var Poissofordelt. Hvis vi i stedet havde betragtet afstade X mellem revere, havde vi fået e y stokastisk variabel, som må være kotiuert. Som det fremgår af følgede sætig er X ekspoetialfordelt. SÆTNING 9..Ekspoetialfordelig. Lad W være e Poissofordelt stokastisk variabel. Lad det geemsitlige atal impulser i e tidsehed være. Lad X være tide idtil æste impuls. X er da e kotiuert stokastisk variabel med sadsylighedsfordelige (tæthedsfuktioe) f ( x ) = P ( X = x) bestemt ved x 1 e for x0 f ( x) hvor 1 0 ellers X siges at være ekspoetialfordelt exp ( ) med parametere. Middelværdie for exp ( ) er E(X) = og spredige er ( X ). Bevis: I tidsrummet fra x 0 til x 0 + x er der I geemsit [x 0 ; x 0 + x ]. W er da Poissofordelt. Idet X er tide fra é impuls til de æste, er [x 0 ; x 0 + x ]. x p( x) P( X x) P( W 0) impulser. Lad W være det aktuelle atal impulser i tidsrummet, da der ige impulser er i tidsrummet 91

96 9.Adre kotiuerte fordeliger 0 ( x) x x x Da PW ( 0) e e, er P( X x) e. 0! x Vi har derfor F( x) P( X x) 1 P( X x) 1e. x Ved differetiatio fås tæthedsfuktioe: f ( x) F'( x) e. Sættes 1 fås formle. Bevis for middelværdi og spredig: E X x x x 1 1 ( ) e dx -e ( x 0 0 x V( X) E( X ) E( X) x e dx 0 -e x x x 0. Som det fremgår af beviset for sætig 9., er fordeligsfuktioe for e ekspoetialfordelt variabel bestemt ved udtrykket F( x) P( X x) x 1 e for x 0 0 ellers På edeståede graf er afbildet tæthedsfuktioe for ekspoetialfordeligere exp(1.0) og exp(.0) 1 0,8 0,6 0,4 0, Fig 9.1 Ekspoetialfordeligere exp(1) og exp() 9

97 9.3 Ekspoetialfordelige Eksempel 9.. Afstade mellem successive rever i kabel. Vi betragter det i eksempel 9.10 omtalte problem, hvor ma fadt, at atallet N af mikroskopiske rever i et kobberkabel er Poissofordelt. Der var i geemsit 1.3 af de type rever pr. 10 meter. Lad X være afstade mellem to på hiade følgede rever. Bereg sadsylighede for, at der er mere ed 1 meter mellem to rever. Løsig 1 Da der i geemsit er 1.3 rever pr. meter, må der i geemsit være 081. meter mellem 13. to rever. Vi har derfor at X er ekspoetialfordelt med = P( X 1) 1 P( X 1) 1 1 e =e Levetider. I apparater, som består af elektroiske kompoeter (eksempelvis lommeregere), er der et meget rige mekaisk slid. Apparatets fremtidige levetid vil derfor (æste ikke) afhæge af, hvor læge det har fugeret idtil u. I sådae tilfælde vil ekspoetialfordelige erfarigsmæssigt være e god approksimativ model for apparatets levetid. Det ka emlig vises, at ekspoetialfordelige er de eeste kotiuerte fordelig, som har oveævte egeskab (er ude hukommelse) Bevis: Lad X være ekspoetialfordelt med middelværdi da: P ( X a b) ( X a) P( X a bx a) P( X a) og lad b > a > 0 være vilkårlige kostater. Der gælder a b P( X a b) e b =e P( X b) P( X a) e b Eksempel 9.3. Levetid for elektriske pærer. Ma har erfarig for, at e bestemt type elektriske pærer har e "brædtid" T (målt i timer), som approksimativt er ekspoetialfordelt. På basis af et stort atal måliger ved ma, at middellevetide er = 1500 timer. 1) Hvor stor er sadsylighede for, at e tilfældig pære bræder over, ide de har været tædt i 100 timer? ) Fid sadsylighede for, at e tilfældig pære bræder i mere ed 1800 timer. 3) E pære har brædt i 800 timer. Hvad er sadsylighede for, at de bræder i midst 1800 timer mere. 93

98 9.Adre kotiuerte fordeliger Løsig 1) PT ( ) F( ) e = = 551% ) PT ( ) F( ) e = 301%. 3) Da ekspoetialfordelige ige hukommelse har, vil svaret blive som i spørgsmål, dvs. 30.1%. 9.4 WEIBULLFORDELINGEN Hvis kompoetere i et elektroisk apparat ikke slides, dvs. de fremtidige levetid ikke afhæger af de foregåede tid, er som ævt i afsit 9.3 ekspoetialfordelige veleget som model for apparatets levetid. Hvis derimod de pågældede kompoeters evetuelle svigte afhæger af de forløbe tid, ka ma ofte med fordel beytte de i det følgede ævte Weibullfordelig som approksimativ model for apparatets levetid (model for apparatets pålidelighed). DEFINITION af Weibulfordelig. Lad k og være positive tal. Sadsylighedsfordelige for e kotiuert stokastisk variabel X med tæthedsfuktioe f ( x ) bestemt ved k f ( x) k 0 x k k 1 x e for x0 ellers siges at være Weibullfordelige wei( k, ). k 1 k 1 Det ka vises, at Weibullfordelige wei( k, ) har middelværdie E( X) ) og spredige ( X ) k k 1 k k Det ses, at Weibullfordelige ka opfattes som e geeralisatio af ekspoetialfordelige, idet wei( 1, ) exp( ). Såfremt levetidere for kompoeter i et apparat aftager jo lægere tid apparatet har været i fuktio (på grud af slid), ka ma beytte e Weibullfordelig med k > 1 som approksimativ model for apparatets levetid. 1) Gammafuktioe 3A ( x) er defieret i Supplemet til statistiske grudbegreber 94

99 9.6 De -dimesioale ormalfordelig 9.5 DEN LOGARITMISKE NORMALFORDELING Idefor det biokemiske eller biologiske område (forsøgsdyrs reaktiostid, cellevækst m.v.) er de stokastiske variabel X ikke ormalfordelt, me hvis ma foretager e logaritmisk trasformatio Y l X er Y (approksimativt) ormalfordelt. Ma siger så, at X er logaritmisk ormalfordelt. 1 l x 1 1 Tæthedsfuktioe for X er bestemt ved f ( x) for x > 0. x e Det ka vises, at mes Y l X har middelværdi og spredig har X middelværdi E( X) e e 1 og V( X) e e ( e 1). Nedefor er teget e logaritmisk ormalfordelig med middelværdi 8 og spredig 5. Logormal Distributio 0,15 0,1 Mea,Std. dev 8,5 desity 0,09 0,06 0, x 9.6 DEN -DIMENSIONALE NORMALFORDELING Flerdimesioale fordeliger vil blive omtalt ærmere i kapitel 1. Her æves ude forklarig et eksempel herpå. DEFINITION af -dimesioal ormalfordelig Lad, være reelle tal og, være positive tal. Sadsylighedsfordelige for -dimesioal kotiuert stokastisk variabel (X 1,X ) med tæthedsfuktio bestemt ved 1 f ( x) 1 1 e 1 1 x x x x ( 1 ) 1 1 kaldes de -dimesioale ormalfordelig med parametree 1,, 1 og. Det ka vises, at E( X ), E( X ), X ( ), ( ) og ( X, ) X 1 1 Grafe ses overfor. X 1 95

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18 15 1 9 6 3 0 Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 14 udgave 014 FORORD Der er i dee bog søgt at give letlæst og askuelig fremstillig af de statistiske

Læs mere

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER med avedelse af TI 89 og Excel 8 5 9 6 3 0 Histogram for ph 6,9 7, 7,3 7,5 7,7 7,9 ph. udgave 0 FORORD Der er i dee bog søgt at give letlæst og askuelig

Læs mere

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18 15 1 9 6 3 0 Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 13 udgave 013 FORORD Der er i dee bog søgt at give letlæst og askuelig fremstillig af de statistiske

Læs mere

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i Normalfordeliger For at e stokastisk variabel X ka være ormalfordelt, skal X agive værdie af e eller ade målig, f.eks. tid, lægde, vægt, beløb osv. Notatioe er: Xi ~ N( μ, σ hvor i er observatiosummeret,

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Repetitio: Normalfordelige Ladmåliges fejlteori Lektio Trasformatio af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/udervisig/lf13 Istitut for Matematiske Fag Aalborg Uiversitet

Læs mere

antal gange krone sker i første n kast = n

antal gange krone sker i første n kast = n 1 Uge 15 Teoretisk Statistik, 5. april 004 1. Store tals lov Eksempel: møtkast Koverges i sadsylighed Tchebychevs ulighed Sætig: Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder

Læs mere

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Epidemiologi og biostatistik. Forelæsig Uge, tirsdag. Niels Trolle Aderse, Afdelige for Biostatistik. Geerelt om kurset: - Formål - Forelæsiger - Øvelser - Forelæsigsoter - Bøger - EpiBasic: http://www.biostat.au.dk/teachig/software

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Statistik ved Bachelor-uddaelse i folkesudhedsvideskab Græseværdisætiger Det hadler om geemsit Statistikere elsker geemsit Det er oplagt e god ide at tage geemsit. Hvis jeg f.eks skal gætte på vægte af

Læs mere

Diskrete og kontinuerte stokastiske variable

Diskrete og kontinuerte stokastiske variable Diskrete og kotiuerte stokastiske variable Beroulli Biomial fordelig Negativ biomial fordelig Hypergeometrisk fordelig Poisso fordelig Kotiuerte stokastiske variable Uiform fordelig Ekspoetial fordelig

Læs mere

9. Binomialfordelingen

9. Binomialfordelingen 9. Biomialfordelige 9.. Gekedelse Hvert forsøg ka ku resultere i to mulige udfald; succes og fiasko. I modsætig til poissofordelige er atallet af forsøg edeligt. 9.. Model X : Stokastisk variabel, der

Læs mere

Generelle lineære modeller

Generelle lineære modeller Geerelle lieære modeller Regressiosmodeller med é uafhægig itervalskala variabel: Y e eller flere uafhægige variable: X,..,X k De betigede fordelig af Y givet X,..,X k atages at være ormal med e middelværdi,

Læs mere

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning) Dages program Estimatio: Kapitel 9.4-9.7 Eksempler på middelrette og/eller kosistete estimator (de sidste fra sidste forelæsig) Ko desiterval for store datasæt kap. 9.4 Ko desiterval for små datasæt kap.

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet. Matematik A Studetereksame Forsøg med digitale eksamesopgaver med adgag til iterettet Forberedelsesmateriale Vejledede opgave Forår 0 til stx-a-net MATEMATIK Der skal afsættes 6 timer af holdets sædvalige

Læs mere

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik. Epidemiologi og biostatistik Forelæsig Uge 1, torsdag. februar 006 ichael Væth, Afdelig for Biostatistik. Sammeligig af to middelværdier sikkerhedsitervaller statistisk test Sammeligig af to proportioer

Læs mere

Motivation. En tegning

Motivation. En tegning Motivatio Scatter-plot at det mådelige salg mod det måedlige reklamebudget. R: plot(salg ~ budget, data = salg) Økoometri Lektio Simpel Lieær Regressio salg 400 450 500 550 20 25 30 35 40 45 50 budget

Læs mere

Estimation ved momentmetoden. Estimation af middelværdiparameter

Estimation ved momentmetoden. Estimation af middelværdiparameter Statistik og Sadsylighedsregig 1 STAT kapitel 4.2 4.3 Susae Ditlevse Istitut for Matematiske Fag Email: susae@math.ku.dk http://math.ku.dk/ susae Estimatio ved mometmetode Idimellem ka det være svært (eller

Læs mere

Stikprøvefordelinger og konfidensintervaller

Stikprøvefordelinger og konfidensintervaller Stikprøvefordeliger og kofidesitervaller Stikprøvefordelige for middelværdi De Cetrale Græseværdi Sætig Egeskaber Ved Estimatore Kofidesitervaller t-fordelige Estimator og estimat E stikprøve statistik

Læs mere

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside : Statistiske test Efteråret 00 Jes Friis, AAU Hjemmeside : http://akaaudk/jfj Kotiuerte fordeliger Defiitio: Tæthedsfuktio E sadsylighedstæthedsfuktio på R er e itegrabel fuktio f : R [0; [ hvor f d = Defiitio:

Læs mere

x-klasserne Gammel Hellerup Gymnasium

x-klasserne Gammel Hellerup Gymnasium SANDSYNLIGHEDSREGNING OG KOMBINATORIK x-klassere Gammel Hellerup Gymasium Idholdsfortegelse SANDSYNLIGHEDSREGNING... 3 SANDSYNLIGHEDSFELT... 3 DE STORE TALS LOV... 4 Sadsyligheder og frekveser:... 4 STOKASTISK

Læs mere

Løsninger til kapitel 7

Løsninger til kapitel 7 Løsiger til kapitel 7 Opgave 7.1 a) HpoStat giver resultatet: Pop. varias er ukedt, me 30, så Normalf. bruges approksimativt = 54,400 s 1.069,90 = 00,000 0,95 49,868 58,93 Dette betder, at med 95% sikkerhed

Læs mere

Vejledende opgavebesvarelser

Vejledende opgavebesvarelser Vejledede opgavebesvarelser 1. Atal hæder er lig med K(52,5), altså 2598960. Ved brug af multiplikatiospricippet ka atal hæder med 3 ruder og 2 spar udreges som K(13, 3) K(13, 2), hvilket giver 22308.

Læs mere

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager Program Statistik og Sadsylighedsregig 2 Sadsylighedstætheder og kotiuerte fordeliger på R Helle Sørese Uge 6, madag Velkomme I dag: Praktiske bemærkiger Hvad skal vi lave på SaSt2? Sadsylighedstætheder

Læs mere

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk! Statistik Lektio 8 Parrede test Test for forskel i adele Test for es varias Gesy med flyskræk! Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og kviders

Læs mere

Den flerdimensionale normalfordeling

Den flerdimensionale normalfordeling De flerdimesioale ormalfordelig Stokastiske vektorer Ved e stokastisk vektor skal vi forstå e vektor, hvor de ekelte kompoeter er sædvalige stokastiske variable. For de stokastiske vektor Y = Y,..., Y

Læs mere

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n Ladmåliges fejlteori Lektio 3 Estimatio af σ Dobbeltmåliger Geometrisk ivellemet Lieariserig - rw@math.aau.dk Istitut for Matematiske Fag Aalborg Uiversitet Repetitio: Middelværdi og Varias Sætig: Middelværdi

Læs mere

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ ) 3. februar 003 Epidemiologi og biostatistik. Uge, torag d. 3. februar 003 Morte Frydeberg, Istitut for Biostatistik. Type og type fejl Nogle specielle metoder: Test i RxC tabeller Test i x tabeller Fishers

Læs mere

Elementær Matematik. Polynomier

Elementær Matematik. Polynomier Elemetær Matematik Polyomier Ole Witt-Hase 2008 Køge Gymasium Idhold 1. Geerelle polyomier...1 2. Divisio med hele tal....1 3. Polyomiers divisio...2 4. Polyomiers rødder....4 5. Bestemmelse af røddere

Læs mere

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk! Test i to populatioer Hypotesetest for parrede observatioer Test for es varias Gesy med flyskræk! Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og

Læs mere

Konfidens intervaller

Konfidens intervaller Kofides itervaller Kofides itervaller for: Kofides iterval for middelværdi, varias kedt Kofides iterval for middelværdi, varias ukedt Kofides iterval for adel Kofides iterval for varias Bestemmelse af

Læs mere

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6. enote 5 enote 5 Determiater I dee enote ser vi på kvadratiske matricer. Deres type er altså for 2, se enote 4. Det er e fordel, me ikke absolut ødvedigt, at kede determiatbegrebet for (2 2)-matricer på

Læs mere

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6 Dee udgave er til geemkig på ettet. Boge ka købes for kr. 5 hos EH-Mat. E y og udvidet udgave med title»symbol- og formelskrivig«er udkommet september 00. Se mere om de her. Idholdsfortegelse Formelskrivig

Læs mere

Analyse 1, Prøve maj 2009

Analyse 1, Prøve maj 2009 Aalyse, Prøve 5. maj 009 Alle hevisiger til TL er hevisiger til Kalkulus (006, Tom Lidstrøm). Direkte opgavehevisiger til Kalkulus er agivet med TLO, ellers er alle hevisiger til steder i de overordede

Læs mere

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner Projekter: Kapitel 4 Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Kotiuitet og kotiuerte fuktioer Ord som kotiuert og kotiuerlig

Læs mere

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik Noter om ombiatori, Kirste Roseilde, februar 008 Kombiatori Disse oter er e itrodutio til ombiatori og starter helt fra bude, så e del af det idledede er siert edt for dig allerede, me der ommer også hurtigt

Læs mere

Teoretisk Statistik, 9. februar Beskrivende statistik

Teoretisk Statistik, 9. februar Beskrivende statistik Uge 7 I Teoretisk Statistik, 9 februar 004 Beskrivede statistik Kategoriserede variable 3 Kvatitative variable 4 Fraktiler for ugrupperede observatioer 5 Fraktiler for grupperede observatioer 6 Beliggeheds-

Læs mere

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave 14. 20. december 2007

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave 14. 20. december 2007 Mikroøkoomi, matematik og statistik Eksameshjemmeopgave 14. 20. december 2007 Helle Buzel, Tom Egsted og Michael H.J. Stæhr 14. december 2007 R E T N I N G S L I N I E R F O R E K S A M E N S H J E M M

Læs mere

STATISTIKNOTER Simple normalfordelingsmodeller

STATISTIKNOTER Simple normalfordelingsmodeller STATISTIKNOTER Simple ormalfordeligsmodeller Jørge Larse IMFUFA Roskilde Uiversitetsceter Februar 1999 IMFUFA, Roskilde Uiversitetsceter, Postboks 260, DK-4000 Roskilde. Jørge Larse: STATISTIKNOTER: Simple

Læs mere

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer Statistik Lektio 7 Hpotesetest og kritiske værdier Tpe I og Tpe II fejl Strke af e test Sammeligig af to populatioer 1 Tri I e Hpotesetest E hpotesetest består af 5 elemeter: I. Atagelser Primært hvilke

Læs mere

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter Matematikkes mysterier - på et obligatorisk iveau af Keeth Hase 7. Ligiger, polyomier og asymptoter Hvad er e asymotote? Og hvorda fides de? 7. Ligiger, polyomier og asymptoter Idhold 7.0 Idledig 7.1 Udsag

Læs mere

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik. 30. august 005 Epidemiologi og biostatistik. Forelæsig 3 Uge, torag d. 8. september 005 Michael Væth, Afdelig for Biostatistik. Mere om kategoriske data Test for uafhægighed I RxC tabeller Test for uafhægighed

Læs mere

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros Brachevejledig ulykker idefor lager området Brachearbejdsmiljørådet for trasport og egros Baggrud Udersøgelser på lager- og trasportområdet har vist, at beskrivelse af hædelsesforløbet ved udfyldelse

Læs mere

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol Simpel Lieær Regressio Opsplitig af variatioe Determiatios koefficiet Variasaalse F-test Model-kotrol Opbgig af statistisk model Specificer model Ligiger og atagelser Estimer parametre Modelkotrol Er modelle

Læs mere

Sandsynlighedsregning i biologi

Sandsynlighedsregning i biologi Om begrebet sadsylighed Sadsylighedsregig i biologi Hvis vi kaster e almidelig, symmetrisk terig, er det klart for de fleste af os, hvad vi meer, år vi siger, at sadsylighede for at få e femmer er 1/6.

Læs mere

Noter om kombinatorik, Kirsten Rosenkilde, februar 2008 1. Kombinatorik

Noter om kombinatorik, Kirsten Rosenkilde, februar 2008 1. Kombinatorik Noter om ombiatori, Kirste Roseilde, februar 008 Kombiatori Disse oter er e itrodutio til ombiatori og starter helt fra bude, så e del af det idledede er siert edt for dig allerede, me der ommer også hurtigt

Læs mere

og Fermats lille sætning

og Fermats lille sætning Projekter: Kaitel 0. Projekt 0. Modulo-regig, restklassegruer og Fermats lille sætig Projekt 0. Modulo-regig, restklassegruere ( { 0 }, ) og Fermats lille sætig Vi aveder moduloregig og restklasser mage

Læs mere

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable Idholdsfortegelse Geerelt:...3 Stokastisk variabel:...3 Tæthedsfuktio/sadsylighedsfuktio for stokastisk variabel:...3 Fordeligsfuktio/sumfuktio for stokastisk variabel:...3 Middelværdi:...4 Geemsit:...4

Læs mere

Projekt 1.3 Brydningsloven

Projekt 1.3 Brydningsloven Projekt 1.3 Brydigslove Når e bølge, fx e lysbølge, rammer e græseflade mellem to stoffer, vil bølge ormalt blive spaltet i to: Noget af bølge kastes tilbage (spejlig), hvor udfaldsvikle u er de samme

Læs mere

Lys og gitterligningen

Lys og gitterligningen Fysik rapport: Lys og gitterligige Forfatter: Bastia Emil Jørgese.z Øvelse blev udført osdag de 25. jauar 202 samme med Lise Kjærgaard Paulse 2 - Bastia Emil Jørgese Fysik rapport (4 elevtimer), februar

Læs mere

Renteformlen. Erik Vestergaard

Renteformlen. Erik Vestergaard Reteformle Erik Vestergaard 2 Erik Vestergaard www.matematikfysik.dk Erik Vestergaard, 2010. Billeder: Forside: istock.com/ilbusca Side 4: istock.com/adresrimagig Desude ege illustratioer. Erik Vestergaard

Læs mere

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion Statistik 8. gag 1 KONIDENSINTERVALLER Kofidesitervaller: kapitel 11 Valg og test af fordeligsfuktio Statistik 8. gag 11. KONIDENS INTERVALLER Et kofides iterval udtrykker itervallet hvori de rigtige værdi

Læs mere

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger Faculty of Life Scieces Program Esidet variasaalyse Normalfordelige Claus Ekstrøm E-mail: ekstrom@life.ku.dk Esidet variasaalyse (oe-way ANOVA) Hvilke type data? Hvad er problemstillige? Variatio mellem

Læs mere

Branchevejledning. ulykker indenfor. godschauffør. området. Branchearbejdsmiljørådet for transport og engros

Branchevejledning. ulykker indenfor. godschauffør. området. Branchearbejdsmiljørådet for transport og engros Brachevejledig ulykker idefor godschauffør området Brachearbejdsmiljørådet for trasport og egros Baggrud Udersøgelser på lager- og trasportområdet har vist, at beskrivelse af hædelsesforløbet ved udfyldelse

Læs mere

Sammenligning af to grupper

Sammenligning af to grupper Sammeligig af to gruer Reetitio, heruder om kritiske værdier Sammeligig af to gruer Sammeligig af to middelværdier Sammeligig af to adele Sammeligig af to variaser yoteser og hyotesetest. E hyotese er

Læs mere

MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER

MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18. udgave 2017 FORORD Der er i denne bog søgt at give letlæst og anskuelig fremstilling af de statistiske grundbegreber til brug ved en indledende undervisning

Læs mere

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353 Takegagskompetece Hesigte med de følgede afsit er først og fremmest at skabe klarhed over de mere avacerede regeregler i skole og give resultatet i de almee form, der er karakteristisk for algebra. Vi

Læs mere

Estimation og test i normalfordelingen

Estimation og test i normalfordelingen af Birger Stjerholm Made Samfudlitteratur 07 Etimatio og tet i ormalfordelige Dee tekt ideholder et overblik over ogle grudlæggede pricipper for etimatio og tet i ormalfordelige i hyppigt forekommede ituatioer:

Læs mere

GENEREL INTRODUKTION.

GENEREL INTRODUKTION. Study Guide til Matematik C. OVERSIGT. Dee study guide ideholder følgede afsit - Geerel itroduktio. - Emeliste. - Eksame. - Bilag. Udervisigsmiisteriets bekedtgørelse for matematik C. GENEREL INTRODUKTION.

Læs mere

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18 15 1 9 6 3 0 Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 15.b udgave 015 FORORD Der er i denne bog søgt at give letlæst og anskuelig fremstilling af

Læs mere

DATV: Introduktion til optimering og operationsanalyse, 2007. Bin Packing Problemet

DATV: Introduktion til optimering og operationsanalyse, 2007. Bin Packing Problemet DATV: Itroduktio til optimerig og operatiosaalyse, 2007 Bi Packig Problemet David Pisiger, Projektopgave 2 Dette er de ade obligatoriske projektopgave på kurset DATV: Itroduktio til optimerig og operatiosaalyse.

Læs mere

DATV: Introduktion til optimering og operationsanalyse, 2007. Følsomhed af Knapsack Problemet

DATV: Introduktion til optimering og operationsanalyse, 2007. Følsomhed af Knapsack Problemet DATV: Itroduktio til optimerig og operatiosaalyse, 2007 Følsomhed af Kapsack Problemet David Pisiger, Projektopgave 1 Dette er de første obligatoriske projektopgave på kurset DATV: Itroduktio til optimerig

Læs mere

Bjørn Grøn. Analysens grundlag

Bjørn Grøn. Analysens grundlag Bjør Grø Aalyses grudlag Aalyses grudlag Side af 4 Idholdsfortegelse Kotiuerte og differetiable fuktioer 3 Differetial- og itegralregiges udviklig 5 3 Hovedsætiger om differetiable fuktioer 8 Opgaver til

Læs mere

Undersøgelse af numeriske modeller

Undersøgelse af numeriske modeller Udersøgelse af umeriske modeller Formål E del af målsætige med dette delprojekt er at give kedskab til de begræsiger, fejl og usikkerheder, som optræder ved modellerig. I de forbidelse er følgede udersøgelse

Læs mere

Sandsynlighedsregning

Sandsynlighedsregning Sadsylighedsregig E ote om sadsylighedsregig. Via basal sadsylighedsregig gøres læsere klar til forstå biomialfordelige. Herik S. Hase, Sct. Kud Versio 5.0 Opgaver til hæftet ka hetes her. PDF Facit til

Læs mere

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger Faculty of Life Scieces Program Populatioer og stikprøver Claus Ekstrøm E-mail: ekstrom@life.ku.dk Praktiske oplysiger Populatioer og stikprøver Data Datatyper Visualiserig Cetrum og spredig af e fordelig

Læs mere

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset. STATISTIK Skriftlig evaluerig, 3. semester, madag de 30. auar 006 kl. 9.00-3.00. Alle hælpemidler er tilladt. Opgaveløsige forsyes med av og CPR-r. OPGAVE Ved e produktio af viduer er der mulighed for,

Læs mere

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504) Gamle eksamesopgaver Diskret Matematik med Avedelser (DM72) & Diskrete Strukturer(DM504) Istitut for Matematik& Datalogi Syddask Uiversitet, Odese Alle sædvalige hjælpemidler(lærebøger, otater etc.), samt

Læs mere

Asymptotisk optimalitet af MLE

Asymptotisk optimalitet af MLE Kapitel 4 Asymptotisk optimalitet af MLE Lad Y 1, Y 2,... være uafhægige, idetisk fordelte variable med værdier i et rum (Y,K). Vi har givet e model (ν θ ) θ Θ for fordelige af Y 1 (og dermed også for

Læs mere

StudyGuide til Matematik B.

StudyGuide til Matematik B. StudyGuide til Matematik B. OVERSIGT. Dee study guide ideholder følgede afsit Geerel itroduktio. Emeliste. Eksame. Bilag 1: Udervisigsmiisteriets bekedtgørelse for matematik B. Bilag 2: Bilag 3: Uddrag

Læs mere

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier Noter om polyomier, Kirste Rosekilde, Marts 2006 1 Polyomier Disse oter giver e kort itroduktio til polyomier, og de fleste sætiger æves ude bevis. Udervejs er der forholdsvis emme opgaver, mes der til

Læs mere

Claus Munk. kap. 1-3

Claus Munk. kap. 1-3 Claus Muk kap. 1-3 1 Dages forelæsig Grudlæggede itroduktio til obligatioer Betaligsrækker og låeformer Det daske obligatiosmarked Pris og kurs Effektive reter 2 1 Obligatioer Grudlæggede Itro Debitor

Læs mere

Dagens forelæsning. Claus Munk. kap. 1-3. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Dagens forelæsning. Claus Munk. kap. 1-3. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro Dages forelæsig Grudlæggede itroduktio til obligatioer Claus Muk kap. - 3 Betaligsrækker og låeformer Det daske obligatiosmarked Effektive reter 2 Obligatioer Grudlæggede Itro Obligatioer Grudlæggede Itro

Læs mere

Vejledende besvarelser til opgaver i kapitel 15

Vejledende besvarelser til opgaver i kapitel 15 Vejledede besvarelser til opgaver i apitel 5 Opgave a) De teststatistier, ma aveder til at teste om to middelværdier er es, består af et estimat på forselle mellem middelværdiere,, divideret med et udtry

Læs mere

Sandsynlighedsteori 1.2 og 2 Uge 5.

Sandsynlighedsteori 1.2 og 2 Uge 5. Istitut for Matematiske Fag Aarhus Uiversitet De 27. jauar 25. Sadsylighedsteori.2 og 2 Uge 5. Forelæsiger: Geemgage af emere karakteristiske fuktioer og Mometproblemet afsluttes, og vi starter på afsittet

Læs mere

MOGENS ODDERSHEDE LARSEN. Fourieranalyse

MOGENS ODDERSHEDE LARSEN. Fourieranalyse MOGENS ODDERSHEDE LARSEN Fourieraalyse. udgave 7 FORORD Dette otat giver e kort idførig i teorie for fourierrækker og fouriertrasformatio. Det forudsættes i dette otat, at ma har rådighed over matematiklommeregere

Læs mere

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18 15 1 9 6 3 0 Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 15. udgave 015 FORORD Der er i denne bog søgt at give letlæst og anskuelig fremstilling af

Læs mere

Modul 14: Goodness-of-fit test og krydstabelanalyse

Modul 14: Goodness-of-fit test og krydstabelanalyse Forskigsehede for Statistik ST01: Elemetær Statistik Bet Jørgese Modul 14: Goodess-of-fit test og krydstabelaalyse 14.1 Idledig....................................... 1 14.2 χ 2 -test i e r c krydstabel.............................

Læs mere

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen TEKST NR 435 2004 Basisstatistik 2. udgave Jørge Larse August 2006 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1 Økoometri 1 Iferes i de lieære regressiosmodel 9. september 006 Økoometri 1: F7 1 Dages program Opsamlig af hemmeopgave om Mote Carlo eksperimeter Mere om hypotesetest: Ekelt lieær restriktio på koefficieter

Læs mere

Introduktion til Statistik

Introduktion til Statistik Itroduktio til Statistik 4. udgave Susae Ditlevse og Helle Sørese Susae Ditlevse, susae@math.ku.dk Helle Sørese, helle@math.ku.dk Istitut for Matematiske Fag Købehavs Uiversitet Uiversitetsparke 5 2100

Læs mere

Morten Frydenberg version dato:

Morten Frydenberg version dato: Morte Frdeberg versio dato: 4--4 Itroduktio til kurset Statistik Forelæsig Morte Frdeberg, Sektio for Biostatistik af Biostatistik dele af. semester kurset. Statistiske modeller Biomialfordelige Normalfordelige

Læs mere

Begreber og definitioner

Begreber og definitioner Begreber og defiitioer Daske husstades forbrug på de medierelaterede udgiftsposter stiger og udgør i 2012*) 11,3 % af husstadees samlede forbrug mod 5,5 % i 1994. For husstade med de laveste idkomster

Læs mere

Bestemmelse af vandføring i Østerå

Bestemmelse af vandføring i Østerå Bestemmelse af vadførig i Østerå Geerelt varierer vadstade og vadførige i daske vadløb over året. Normalt er vadførige lille om sommere for derpå at øge om efteråret. Om vitere ses ormalt de højeste vadføriger

Læs mere

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test: Statistik for biologer 005-6, modul 7: Tests for forskel i cetral tedes for data på ordial- og itervalskala M7, slide M7, slide Typer af statistiske test: Parametrisk statistik: - Tester for forskel i

Læs mere

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006 Dages program Økoometri De multiple regressiosmodel 5. februar 006 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.-3.3+appedix E.-E.) Defiitio og motivatio Fortolkig af parametree

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Dages program Kvatitative metoder De multiple regressiosmodel 6. februar 007 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.- 3.+appedix E.) Defiitio og motivatio Fortolkig af

Læs mere

TEKST NR 435 2004. TEKSTER fra IMFUFA

TEKST NR 435 2004. TEKSTER fra IMFUFA TEKST NR 435 2004 Basisstatisti 2. udgave Jørge Larse August 2006 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING

Læs mere

Længde [cm] Der er frit vandspejle i sandkassen. Herudover er sandkassen åben i højden cm i venstresiden og 0-20 cm i højresiden.

Længde [cm] Der er frit vandspejle i sandkassen. Herudover er sandkassen åben i højden cm i venstresiden og 0-20 cm i højresiden. Vadtrasportmodel Formål For beregig af vadtrasporte i sadkasse er der lavet e boksmodel. Formålet med boksmodelle er at beskrive vadtrasporte i sadkasse. Herover er formålet at bestemme de hydrauliske

Læs mere

Talfølger og -rækker

Talfølger og -rækker Da Beltoft og Klaus Thomse Aarhus Uiversitet 2009 Talfølger og -rækker Itroduktio til Matematisk Aalyse Zeos paradoks om Achilleus og skildpadde Achilleus løber om kap med e skildpadde. Achilleus løber

Læs mere

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer Hypoteetet Hypoteetet og kritike værdier Type og Type fejl Styrke af e tet Sammeligig af to populatioer Kofideiterval for σ tore tikprøver. Hvi X følger e χ -fordelig med frihedgrader, dv. X~χ (), gælder

Læs mere

De reelle tal. Morten Grud Rasmussen 5. november Se Sætning 3.6 og 3.7 for forskellige formuleringer af egenskaben og dens negation.

De reelle tal. Morten Grud Rasmussen 5. november Se Sætning 3.6 og 3.7 for forskellige formuleringer af egenskaben og dens negation. De reelle tal Morte Grud Rasmusse 5. ovember 2015 Ordede mægder Defiitio 3.1 (Ordet mægde). pm, ăq kaldes e ordet mægde såfremt: For alle x, y P M gælder etop ét af følgede: x ă y, x y, y ă x @x, y, z

Læs mere

6 Populære fordelinger

6 Populære fordelinger 6 Populære fordeliger I apitel 4 itroducerede vi stoastise variabler so e åde at repræsetere udfald af et esperiet på. De stoastise variabler ue være både disrete (fx terigslag) og otiuerte (fx vareægder).

Læs mere

Projekt 2.3 Det gyldne snit og Fibonaccitallene

Projekt 2.3 Det gyldne snit og Fibonaccitallene Projekter: Kapitel Projekt.3 Det glde sit og Fiboaccitallee Forslag til hvorda klasses arbejde med projektet ka tilrettelægges: Forløbet:. Præsetatio af emet med vægt på det glde sit.. Grppere arbejder

Læs mere

Beregning af prisindeks for ejendomssalg

Beregning af prisindeks for ejendomssalg Damarks Saisik, Priser og Forbrug 2. april 203 Ejedomssalg JHO/- Beregig af prisideks for ejedomssalg Baggrud: e radiioel prisideks, fx forbrugerprisidekse, ka ma ofe følge e ideisk produk over id og sammelige

Læs mere

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme Itroduktio til Statistik Forelæsig 4: Kofidesiterval for middelværdi (og spredig) Peder Bacher DTU Compute, Dyamiske Systemer Bygig 303B, Rum 009 Damarks Tekiske Uiversitet 2800 Lygby Damark e-mail: pbac@dtu.dk

Læs mere

Kvadratisk 0-1 programmering. David Pisinger

Kvadratisk 0-1 programmering. David Pisinger Kvadratisk - programmerig David Pisiger 27-8 MAX-CUT problemet Givet e ikke-orieteret graf G = (V, E) er MAX-CUT problemet defieret som MAX-CUT = {< G > : fid et sit S, T i grafe G som maksimerer atal

Læs mere

RESEARCH PAPER. Nr. 2, En model for lagerstørrelsen som determinant for købs- og brugsadfærden for et kortvarigt forbrugsgode.

RESEARCH PAPER. Nr. 2, En model for lagerstørrelsen som determinant for købs- og brugsadfærden for et kortvarigt forbrugsgode. RESEARCH PAPER Nr., 005 E model for lagerstørrelse som determiat for købs- og brugsadfærde for et kortvarigt forbrugsgode af Jørge Kai Olse INSTITUT FOR AFSÆTNINGSØKONOMI COPENHAGEN BUSINESS SCHOOL SOLBJERG

Læs mere

Introduktion til uligheder

Introduktion til uligheder Itroduktio til uligheder, marts 0, Kirste Rosekilde Itroduktio til uligheder Dette er e itroduktio til ogle basale uligheder om det aritmetiske geemsit, det geometriske geemsit, det harmoiske geemsit og

Læs mere

- et værktøj til fejlrettende QR-koder. Projekt 0.3 Galois-legemerne. Indhold. Hvad er matematik? A, i-bog

- et værktøj til fejlrettende QR-koder. Projekt 0.3 Galois-legemerne. Indhold. Hvad er matematik? A, i-bog Projekt 0.3 Galois-legemere GF é ëp û - et værktøj til fejlrettede QR-koder Idhold De karakteristiske egeskaber ved de tre mest almidelige talsystemer, og... De kommutative, associative og distributive

Læs mere

Termodynamik. Indhold. Termodynamik. Første og anden hovedsætning 1/18

Termodynamik. Indhold. Termodynamik. Første og anden hovedsætning 1/18 ermodyamik. Første og ade hovedsætig /8 ermodyamik Idhold. Isoterme og adiabatiske tilstadsædriger for gasser...3 3. ermodyamikkes. hovedsætig....5 4. Reversibilitet...6 5. Reversibel maskie og maksimalt

Læs mere