STATISTISKE GRUNDBEGREBER

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "STATISTISKE GRUNDBEGREBER"

Transkript

1 MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 14 udgave 014

2 FORORD Der er i dee bog søgt at give letlæst og askuelig fremstillig af de statistiske grudbegreber til brug ved e idledede udervisig i statistik De væsetligste defiitioer og sætiger forklares derfor fortrisvist ved hjælp af figurer og geemregede praktiske eksempler Øskes e mere matematisk uddybede forklarig, bevis for sætiger osv ka dette ofte fides i et særskilt tillæg til boge, som fides på ettet uder title Supplemet til statistiske grudbegreber Læsig: Boge er bygget således op, at der hurtigt ås frem til ormalfordelige og de vigtige ormalfordeligstest Disse vigtige begreber ka derfor blive grudigt idarbejdet, selv om der ku er kort tid til rådighed Er det af tidsmæssige grude svært at å hele otatet ka ma ude skade for helhede oversprige kapitlere 10 og 11, ligesom ma evetuelt ka tage kapitlere 1 og 9 mere oversigtsagtigt Sidst i hver kapitel fides e række opgaver, der yderligere ka fremme forståelse Bagerst i boge fides e facitliste til alle opgavere I et lægere kursusforløb er dee bog tækt at skulle efterfølges af M Oddershede Larse: Videregåede Statistik, som ka hetes gratis på adresse wwwlarse-etdk Regemidler Det er hesigtsmæssigt, at ma har adgag til et program med de sædvalige statistiske fordeliger idbygget I eksemplere agives således, hvorledes beregigere ka foretages med TI-Nspire (PCudgave) Øskes i stedet at avede det meget udbredte regeark Excel, ka ma på hjemmeside wwwlarse-etdk uder statistik hete file Eksempler reget med Excel hvor e række af boges eksempler er reget ved avedelse af dette statistikprogram I afsit 1 er agivet de grudlæggede ordrer for lommeregere TI-spire og TI89 I 8- udgave fides tabeller over de sædvalige statistiske fuktioer, samt forklaret hvorda tabellere avedes Dee udgave, samt 8 udgave ka samme med e række adre oter fides på adresse: wwwlarse-etdk 16 jui 014 Moges Oddershede Larse

3 INDHOLD 1 INTRODUKTION TIL STATISTIK 1 DESKRIPTIV STATISTIK 1 Kvalitative data Kvatitative data 4 3 Karakteristiske tal 7 Opgaver 11 3 STOKASTISK VARIABEL 31 Sadsylighed 14 3 Stokastisk variabel Tæthedsfuktio for kotiuert stokastisk variabel Liearkombiatio af stokastiske variable 0 Opgaver 1 4 NORMALFORDELINGEN 41 Idledig 4 Defiitio og sætiger om ormalfordelig 3 43 Beregig af sadsyligheder 6 Opgaver 9 5 KONFIDENSINTERVAL FOR NORMALFORDELT VARIABEL 51 Udtagig af stikprøver 31 5 Fordelig og spredig af geemsit 3 53 Kofidesiterval for middelværdi Defiitio af kofidesiterval Populatioes spredig kedt eksakt Populatioes spredig ikke kedt eksakt Kofidesiterval for spredig Oversigt over cetrale formler i kapitel 5 4 Opgaver 43 6 HYPOTESETESTNING (1 NORMALFORDELT VARIABEL) 61 Grudlæggede begreber 45 6 Hypotesetest med ukedt middelværdi og spredig Fejl af type I og type II Oversigt over cetrale formler i kapitel 6 55 Opgaver 58 7 HYPOTESETESTNING ( NORMALFORDELTE VARIABLE) 71 Idledig 61 7 Sammeligig af ormalfordelte variable 6 73 Oversigt over cetrale formler i kapitel 7 66 Opgaver 6 8 REGNEREGLER FOR SANDSYNLIGHED, KOMBINATORIK 81 Regeregler for sadsylighed 70 8 Betiget sadsylighed 7 iii

4 83 Kombiatorik Idledig Multiplikatiospricippet Ordet stikprøveudtagelse Uordet stikprøveudtagelse 76 Opgaver 77 9 VIGTIGE DISKRETE FORDELINGER 91 Idledig 80 9 Hypergeometrisk fordelig Biomialfordelig 8 94 Poissofordelig Approksimatioer De geeraliserede hypergeometriske fordelig Polyomialfordelig 9 98 Oversigt over cetrale formler i kapitel 9 93 Opgaver ANDRE KONTINUERTE FORDELINGER 101 Idledig De rektagulære fordelig Ekspoetialfordelige Weibullfordelige De logaritmiske fordelig De todimesioale ormalfordelig 106 Opgaver FLERDIMENSIONAL STATISTISK VARIABEL Esses Idledig Kovarias og korrelatioskoefficiet Liearkombiatio 115 Opgaver GRUNDLÆGGENDE OPERATIONER PÅ LOMMEREGNER TI-Nspire TI89 TI-Nspire 119 TI89 11 APPENDIX OVERSIGT OVER APPROKSIMATIONER 13 FACITLISTE 14 STIKORD 17 iv

5 1 Itroduktio til statistik 1 INTRODUKTION TIL STATISTIK Ved æste alle igeiørmæssige problemer vil de idsamlede data udvise variatio Måler ma således getage gage idholdet (i %) af et bestemt stof i et levedsmiddel, vil det procetvise idhold ikke blive præcis samme tal for hver gag ma foretager e målig Dette kue aturligvis være e usikkerhed ved målemetode, me det vil sjældet være de væsetligste årsag Ved mage idustrielle processer vil e række ukotrollable forhold idvirke på det edelige resultat Eksempelvis vil udbyttet af e kemisk proces variere fra dag til dag, fordi ma ikke har fuldstædig kotrol over forsøgsbetigelser som temperatur, omrørigstid, tidspukt for tilsætig af råmaterialer, fugtighed osv Edvidere er forsøgsmaterialere muligvis ikke homogee ok Råmaterialere ka feks være af varierede kvalitet, der må bruges forskelligt apparatur uder produktiosprocesse, forskelligt persoale deltager i arbejdet osv Statistik drejer sig om at samle, præsetere og aalysere data med heblik på at foretage beslutiger og løse problemer I de deskriptive statistik beskrives data ved tabeller, grafisk (lagkagediagrammer, søjlediagrammer) og ved beregig af karakteristiske tal såsom geemsit og spredig Ma ka eksempelvis i Damarks Statistik (fides på ettet uder adresse wwwstatistikbakedk ) fide, hvor mage persobiler der er i Damark i 009 opdelt efter alder Ma keder her populatioe (biler i Damark), ka grafisk vise deres fordelig i et søjlediagram og berege deres geemsitlige alder I de mere aalyserede statistik (kaldet iferetiel statistik) søger ma ved mere avacerede statistiske metoder ud fra e repræsetativ stikprøve at kokludere oget om hele populatioe Eksempelvis udtages ved e meigsmålig e forhåbetlig repræsetativ stikprøve på 1000 vælgere, som ma spørger om hvilket politisk parti de ville stemme på, hvis der var valg i morge Ma vil så ud fra stikprøve kokludere, at hvis ma spurgte hele populatioe (alle vælgere i Damark), så ville ma med e vis usikkerhed få samme resultat Viser stikprøve, at partiet Vestre vil gå 5% tilbage, så vil det samme ske, hvis der var valg i morge Et sådat tal er aturligvis usikkert Ma må derfor avede passede statistiske metoder til eksempelvis at berege, at usikkerhede er på % 1

6 Deskriptiv statistik DESKRIPTIV STATISTIK I de deskriptive statistik (eller beskrivede statistik) beskrives de idsamlede data i form af tabeller, søjlediagrammer, lagkagediagrammer, kurver samt ved udregig af cetrale tal som geemsit, typetal, spredig osv Kurver og diagrammer forstås lettere og mere umiddelbart ed koloer af tal i e tabel Øjet er uovertruffet til møstergekedelse ( e tegig siger mere ed 1000 ord ) 1 KVALITATIVE DATA Hvis der er e aturlig opdelig af talmaterialet i klasser eller kategorier siges, at ma har kategorisk eller kvalitative data Alle spørgeskemaudersøgelser, hvor ma eksempelvis bliver bedt om at sætte kryds i ogle rubrikker meget god, god, acceptabel osv er af dee type De følgede eksempler viser avedelse af heholdsvis lagkagediagram og søjlediagram Eksempel 1 Lagkagediagram Nedefor er agivet hvorda e kommues udgifter fordeler sig på de forskellige områder Udligig 3,1 øvrige 8,4 Socialområdet,øvrige 9,4 Ældre 18,6 Børepasig 10,4 Bibliotek 1,9 fritid 3,8 Skoler 10,5 Admiistratio 7,3 Tekik,alæg 6,6 Da et lagkagediagram til askueliggørelse heraf Løsig: TI-Nspire: Add lists ad Spreadsheet skriv listes av eme i øverste celle (avecelle) og i liste edeuder skriv eme opret tilsvarede de ade liste Vælg Data ad Statistics midt på de vadrette akse på figur vestre musetast vælg eme højre musetast, pie chart

7 1 Kvalitative data Eksempel Søjlediagram Følgede tabel agiver madattallet ved to folketigsvalg Partier A B C F I O V Ø Madater A = Socialdemokratere, B =Radikale vestre, C = Koservative folkeparti, F =Socialistisk folkeparti, I =Liberal alliace, O = Dask Folkeparti, V = Vestre, Ø = Ehedsliste Askueliggør disse madattal ved at tege et søjlediagram Løsig: Ti-Nspire : Lister og regeark lav listere som vist edefor diagrammer og statistik På x-liste vælg Parti på y-liste vælg tilføj y-værdiliste madat 07 ige tilføj y-værdiliste madat 11 Fordele ved e grafisk fremstillig er, at de væsetligste egeskaber ved data opås hurtigt og sikkert Me etop det, at figurer appellerer umiddelbart til os, gør at vi ka komme til at lægge mere i dem, ed det som tallee egetlig ka bære Eksempelvis viser forsøg, at i lagkagediagrammer, hvor ma skal sammelige vikler (eller arealer), da vil dee sammeligig afhæge oget af i hvilke retig vikles be peger Nedeståede eksempel viser hvorda e figur ka være misvisede ude direkte at være forkert Eksempel 3 Misvisede figur Tødere i figure edefor skal illustrere hvorda osteeksporte fordeler sig på de forskellige verdesdele De giver imidlertid et helt forkert idtryk Det er højdere på tødere der agiver de korrekte forhold, me af tegige vil ma tro, at det er rumfagee af tødere De 3 små tøder ka umiddelbart være flere gage idei de store tøde, me det svarer jo ikke til talforholdee 3

8 Deskriptiv statistik De mest almidelige figurer til at give et visuelt overblik over større talmaterialer er histogrammer (søjlediagrammer) og kurver i et koordiatsystem KVANTITATIVE DATA (VARIABLE) Kvatitative data er data, hvor registrerige i sig selv er tal, der agiver e bestemt rækkefølge, f eks som i eksempel 4 hvor data registreres efter det tidspukt hvor registrerige foregår eller som i eksempel 5, hvor det er størrelse af registrerede værdi der er af iteresse Eksempel 4 Kvatitativ variabel: tid Fra statistikbake (adresse er hetet følgede data id i Excel, der beskriver hvorledes idvadriger og udvadriger er sket geem tide Excel: Vælg Befolkig og valg Flytig til og fra udladet Id- og udvadrig på måeder uder bevægelse vælges flere valgmuligheder, marker alle uder måed vælges flere valgmuligheder år og derefter alle Tryk på tabel Drej tabel med uret Gem som Excel fil Idvadriger og udvadriger efter tid og bevægelse Idvadrede Udvadrede Giv e grafisk beskrivelse af disse data Løsig TI-Nspire Vælg e koloe ved at klikke på koloebogstavet øverst i koloe Tryk på CTrl C for at kopiere cellere Klik i Lister og regeark på de celle, hvor dataee skal sættes id giv koloer ave år, idvadrede og udvadrede og slet evetuelle overskrifter i selve koloere Da dataee er registreret efter tid (år) (de kvatitative variabel tid ) teges to kurver i samme koordiatsystem: Vælg statistik og datatyper På x-liste vælg år på y-liste vælg tilføj y-værdiliste idvadrede ige tilføj y-værdiliste udvadrede tryk på et pukt på tegige og vælg Forbid datapukter 4

9 Kvatitative data Eksempel 5 Kvatitativ variabel, størrelse af britiokocetratioe ph I meeskers led udskiller de iderste hide e "ledvæske" som "smører" leddet For visse ledsygdomme ka britiokocetratioe (ph) i dee væske tækes at have betydig Som led i e ordisk medicisk udersøgelse af e bestemt ledsygdom udtog ma bladt samtlige patieter der led af dee sygdom e repræsetativ stikprøve ved simpel udvælgelse 75 patieter og målte ph i ledvæske i kæet Resultatere (som ka fides som excel-fil på adresse wwwlarse-etdk ) var følgede: Giv e grafisk beskrivelse af disse data Løsig: I dette tilfælde, hvor vi er iteresseret i at få et overblik over tallees idbyrdes størrelse er det fordelagtigt at tege et histogram Et histogram liger et søjlediagram, me her gælder, at atallet af eheder i hver søjle repræseteres ved søjles areal (histo er græsk for areal) Ma bør så vidt muligt sørge for at gruppere er lige brede, da atallet af eheder så svarer til højde af søjle Først fides det største tal x max og det midste tal x mi i materialet og derefter berege variatiosbredde x max - x mi Vi ser, at største tal er 771 og midste tal er 695 og variatiosbredde derfor = 076 Deræst deles tallee op i et passede atal itervaller (klasser) Som det første bud vælges 076 ofte et atal ær Da 75 9 vælges ca 9 klasser Da 008 deler vi op i de klas- 9 ser, der ses af tabelle Dette giver 10 itervaller Vi tæller op hvor mage tal der ligger i hvert iterval (gøres emmest ved at starte forfra og sæt e streg i det iterval som tallet tilhører) 5

10 Deskriptiv statistik Klasser Atal ]694-70] // ]70-710] ///// 5 ] ] //////// 8 ]718-76] ///////////////// 17 ]76-734] ////////////////// 18 ]734-74] //////////////// 16 ]74-750] //// 4 ] ] /// 3 ] ] / 1 ] ] / 1 Allerede her ka ma se, at atallet er størst omkrig 730, og så falder hyppighede ogelude symmetrisk til begge sider TI-Nspire: Vælg tilføj lister og regeark skriv listes av x i avecelle idtast data (evt ved at trykke på avet og ctrlc) diagrammer og statistik uder av ederst vælg diagramtyper histogram marker e søjle og vælg skala procet vælg søjleidstilliger lige store itervaller og vælg de øskede bredde og størst og midst værdi Histogrammet er et "klokkeformet histogram", hvor der er flest tal fra 719 til 74, og derefter falder atallet til begge sider Ma reger ormalt med, at resultatere af forsøg, hvor ma har foretaget måliger (hvis ma lavede ok af dem) har et sådat klokkeformet histogram og siger, at resultatere er ormalfordelt (beskrives ærmere i æste kapitel) 6

11 3 Karakteristiske tal 3 KARAKTERISTISKE TAL Skal ma sammelige to talmaterialer, eksempelvis sammelige de 75 ph-værdier i eksempel 14 med 00 dårlige kæ fra Tysklad, har det ige meig at sammelige hyppighedere Ma må i sådae tilfælde agive ogle tal, som gør det muligt at foretage e sammeligig Dette kue bladt adet ske ved at ma udregede de relative hyppigheder 31 Relativ hyppighed Ved de relative hyppighed forstås hyppighede divideret med det totale atal I eksempel 5 er de relative hyppighed for ph - værdier i itervallet ]718-76]: % 75 Ma kue sige, at sadsylighede er 57% for at ph ligger i dette iterval 3 Middelværdi og spredig Middelværdi, geemsit Kedes hele populatioe (målt højde på alle daske mæd) ka bereges e korrekt midterværdi kaldet middelværdi (græsk my) Ud fra stikprøve vil e tilærmet værdi (kaldet et estimat) for være geemsittet x (kaldt x streg) x1 x x Kaldes observatioere i e stikprøve x 1, x,, x er x Eksempel 6: Geemsit Fid geemsittet af tallee 6, 17, 7, 13, 5, 3 Løsig: 6 Hådregig: x TI-Nspire: Skriv mea ({6, 17, 7, 13, 5, 3}) Spredigsmål Egetlige målefejl, såsom at ogle af observatioere ikke bliver korrekt registreret, uklarheder i spørgeskemaet osv skal aturligvis fjeres Derudover er der de aturlige variatio som også kue kaldes re støj (pure error), som skyldes, at ma ikke ka forvete, at to persoer der på alle områder er stillet fuldstædigt es også vil svare es på et spørgsmål Tilsvarede hvis ma måler udbyttet ved e kemisk proces, så vil udfaldet af to forsøg ikke være es, da der altid er e række ukotrollable støjkilder (ureheder i råmaterialer, lidt forskel på persoer og apparatur osv) Dee aturlige variatio skal aturligvis iddrages i de statistiske behadlig af problemet, og dertil spiller et mål for, hvor meget tallee spreder sig aturligvis e væsetlig rolle 7

12 Deskriptiv statistik Spredig (egelsk: stadard deviatio) Hvis spredige baserer sig på hele populatioe beæves de (sigma) Baserer spredige sig ku på e stikprøve beæves de s Ma siger, at s er et estimat (skø) for s bereges af formle s ( xi x ) i1 1 hvor observatioere i e stikprøve er x 1, x,, x Kvadratsumme ( x x) beæves kort SAK (Summe af Afvigelseres Kvadrater) eller i1 SS (Sum of Squares) i Ved variase for e stikprøve forstås s Eksempel 7: Spredig Fid varias og spredig af tallee 6, 17, 7, 13, 5, 3 Løsig: I eksempel 6 fides geemsittet x 85 ( 685 ) ( 1785 ) ( 785 ) ( 1385 ) ( 585 ) ( 385 ) Hådregig: s 61 Spredige s TI-Nspire: Beregiger Statistik Listematematik Stikprøvevarias {6, 17, 7, 13, 5, 3} Samme u blot vælge Stadardafvigelse for stikprøve 8 7 Askuelig forklarig på formle for s At formle for s skulle være særlig veleget til at agive, hvor meget resultatere spreder sig (hvor mege støj der er ) er ikke umiddelbart idlysede I det følgede gives e askuelig forklarig Lad os betragte forsøgsvariable X og Y, hvorpå der for hver er udført e stikprøve på 4 forsøg Resultatere var: X: 359, 333, 347, 341 med geemsittet x = 345, og Y: 343, 346, 347, 344 med geemsittet y = 345 De to forsøgsvariable har samme geemsit, me det er klart, at Y-resultatere grupperer sig meget tættere om geemsittet ed X-resultatere, dvs Y-stikprøve har midre spredig (der er midre støj på Y - forsøget) ed X-stikprøve For at få et mål for stikprøves spredig bereges resultateres afvigelser fra geemsittet xi x yi y = = = = = = = = -01 Summe af disse afvigelser er aturligvis altid 0 og ka derfor ikke bruges som et mål for stikprøves spredig I stedet betragtes summe af kvadratere på afvigelsere (forkortet SS: Sum of Squares eller SAK: Sum af afvi- 8

13 gelseres Kvadrat) SAK ( x x) 14 ( 1 ) 0 ( 04 ) 360 x i1 i SAK ( y y) ( 0 ) 01 0 ( 01 ) 010 y i1 i Da et mål for variase ikke må være afhægig af atallet af forsøg, divideres med Karakteristiske tal Umiddelbart ville det være mere rimeligt at dividere med Imidlertid ka det vises, at i middel bliver et skø for variase for lille, hvis ma dividerer med, mes de rammer præcist, hvis ma dividerer med - 1 Det ka forklares ved, at tallee x i har e tedes til at ligge tættere ved deres geemsit x ed ved middelværdie s 360 x og s y s 4 1 x s y Som vi forudså, er stikprøves spredig betydelig større for X-resultatere ed for Y-resultatere Frihedsgrader Ma siger, at stikprøves varias er baseret på f = - 1 frihedsgrader Navet skyldes, at ku -1 af de led xi x ka vælges frit, idet summe af de led er ul Eksempelvis ser vi af eksempel 7, at der er 5 frihedsgrader, da kedskab til de første 5 led på 6, 17, 7, 13, 5 er ok til at bestemme det sjette led, da summe er ul Vurderig af størrelse af stikprøves spredig Ma ka vise, at for tæthedsfuktioer med ku et maksimumspukt gælder, at mellem x s og x s ligger ca 89% af resultatere, og mellem x 3s og x 3s ligger ca 95% af resultatere For såkaldte ormalfordelte resultater, er de tilsvarede tal ca 95% og 997 % I eksempel 7 fadt vi således x s = 5357=-1 og x s = =191 Det ses at alle tallee ligger idefor itervallet [-1;191] 33 Media og kvartilafstad Media Mediae bereges på følgede måde: 1) Observatioere ordes i rækkefølge efter størrelse a) Ved et ulige atal observatioer er mediae det midterste tal b) Ved et lige atal er mediae geemsittet af de to midterste tal Eksempel 8: Media Fid mediae af tallee 6, 17, 7, 13, 5, 3 Løsig: Hådregig: Ordet i rækkefølge: 3, 5, 6, 7 13, 17 Media 6,5 TI-Nspire: Beregiger skriv media ({ 6, 17, 7, 13, 5, }) Mediae kaldes også for 50% fraktile, fordi de brøkdel (fraktil) der ligger uder mediae er ca 50% Er media og geemsit ogelude lige store fordeler tallee sig ogelude symmetrisk omkrig middelværdie Er mediae midre ed geemsittet er der muligvis tale om e højreskæv fordelig som har de lage hale til højre(se figure) 9

14 Deskriptiv statistik At ma eksempelvis i løstatistikker agives mediae og ikke geemsittet fremgår af følgede lille eksempel Lad os atage at e virksomhed har 10 asatte, med måedsløiger ordet efter størrelse på 0000, 1000, 000, 3000, 4000, 5000, 6000, 7000, 8000, Geemsittet er her 31600, mes mediae er 4500 Mediae ædrer sig ikke selv om de højeste lø vokser fra til 1 millio, mes geemsittet aturligvis vokser Mediae giver derfor e mere rimelig beskrivelse af middelløe i firmaet Kvartilafstad Hvis fordelige ikke er rimelig symmetrisk, er mediae det bedste skø for e midterværdi, og kvartilafstade ka være et mål for spredige I de tidligere omtalte løstatistik 1 fides bla følgede tal, idet de to sidste koloer er vor bearbejdig af tallee Lø pr præsteret time r geemsit edre kvartil media øvre kvartil x k3 k1 x k1 m k3 m m 1 Ledelse på højt iveau Kotorarbejde x Af koloe ses, at for begge rækker er geemsittet større ed mediae dvs begge m fordeliger er højreskæv, me det gælder mest for række r 1 Her gælder åbebart, at ogle få forholdsvis høje løiger trækker geemsittet op Skal ma sammelige løspredige i de to tilfælde, må ma tage hesy til, at mediae er meget forskellig Ma vil derfor som der er sket i sidste koloe berege de relative kvartil-afstad De viser også, at løspredige er væsetlig midre for række ed for række 1 Eksempel 9 Kvartil Fid kvartiler og media af de 1 tal 7, 9, 11, 3, 16, 1, 15, 8,, 18,, 10 Løsig: Skal ma både have middelværdi spredig osv ka ma beytte edeståede metode, som også giver kvartiler TI-Nspire: Lister og regeark giv e liste et av og idsæt tal i liste vælg statistik statistiske beregiger statistik med 1 variabel udfyld meuer Eter Bladt mage tal fås 1 kvartil 75 media 105 og 3 kvartil jævfør statistisk årbog 005 tabel 144 eller se wwwstatistikbakedk uder lø\løstatistik for de offetlige sektor \lø 3 10

15 Opgaver til kapitel OPGAVER Opgave 1 I wwwstatistikbakedk/luft4 er følgede oplysiger for året 003 hetet id i Excel Udslip til luft af drivhusgasser efter ehed, type, kilde og tid 003 Mia C0-ækvivaleter I alt Eergisektore 3 Idustri og produktio 8 Trasport 13 Affaldsbehadlig Ladbrug 10 Adet 9 a) Het selv disse data id i Excel, og opstil et lagkagediagram til belysig af tallee b) Fid de tilsvarede tal for 1996, og vælg e passede grafisk fremstillig til sammeligig af tallee fra 1996 og 003 c) Bereg i Excel for åree 1990 til 003 eergisektores udslip i forhold til det samlede udslip af drivhusgasser (i %), og teg dette grafisk Opgave Følgede tabel agiver for et udvalgt atal lade oplysig om middellevetid for befolkige og idbyggeratal Lad Middellevetid Idbyggertal i millioer Australie Caada Damark 77,5 55 Frakrig Marokko Pole Sri Laka USA ) Idskriv oveståede tabel i Excel, hvor ladee er opskrevet alfabetisk Beyt Excel til 1) at orde ladee efter middellevetid (lægst levetid først), og afbild dem grafisk ) teg i et koordiatsystem to kurver, som agiver såvel ladees størrelse som middellevetid Opgave 3 I fides ogle oplysiger om Damarks forbrug af eergi efter type og mægde 1) Het produktio af aturgas og råolie id målt i tos for de sidste år (i måeder) id i Excel ) Teg i Excel i samme koordiatsystem to kurver for heholdsvis produktioe af aturgas og råolie 11

16 Deskriptiv statistik Opgave 4 Færdselspolitiet overvejede, om der burde idføres e fartgræse på 70 km/h på e bestemt ladevejsstrækig, hvor der hidtil havde været e fartgræse på 80 km/h Som et led i aalyse af hesigtmæssighede af de overvejede ædrig observeredes ide for et bestemt tidsrum ved hjælp af radarkotrol de forbipasserede bilers fart Resultatet af måligere (som ka fides som excel-fil på adresse wwwlarse-etdk ) var: 50 observatioer ) Foretag e vurderig af, om fordelige er ogelude symmetrisk (ormalfordelt) ved a) at tege et histogram b) at berege karakteristiske værdier ) Agiv hvor stor e procet af bilistere, der approksimativt overstiger hastighedsgræse på 80 km/h (Vik: Vælg formler, statistisk, Tæl hvis) Opgave 5 Til fabrikatio af herreskjorter beyttes et råmateriale, som ideholder e vis procetdel uld For ærmere at udersøge uldprocete, måles dee i 64 tilfældigt udvalgte batch Resultatet (som ka fides som excel-fil på adresse wwwlarse-etdk ) var (i %): ) Foretag e vurderig af, om fordelige er ogelude symmetrisk (ormalfordelt) ved a) at tege et histogram b) at berege karakteristiske værdier Der er i datamaterialet e såkaldte outliers (e mulig fejlmålig) E såda ka ødelægge ehver aalyse Det er i dette tilfælde tilladeligt at fjere de, da vi går ud fra det er e fejlmålig ) Bereg stikprøves relative kvartilafstad

17 Opgaver til kapitel Opgave 6 De følgede tabel (som ka fides som excel-fil på adresse wwwlarse-etdk ) viser vægtee (i kg) af 80 kaier , ) Foretag e vurderig af, om fordelige er ogelude symmetrisk (ormalfordelt) ved a) at tege et histogram b) at berege karakteristiske værdier ) Agiv hvor stor e procet af kaiere, der approksimativt overstiger e vægt på 3 kg (Vik: (Vik: Vælg formler, statistisk, Tæl, Hvis) Opgave 7 I statistikbake fider ma uder puktet Uddaelse og kultur, Fuldførte kompetacegivede uddaelser ved bacheloruddaelsere e statistik over atal elever i Maskitekik og Desig og Iovatio i 008 fordelt efter alder fra 0 til 36 år for hele ladet 1) Idsæt data i Excel for de to uddaelser ) Lav et søjlediagram over aldersfordelige for de to uddaelser 3) Bereg på basis af oveævte tal de geemsitlige alder af de studerede for de to uddaelser i Opgave 8 I statistikbake fid uder Lø,fortjeeste for privatasatte efteruddaelse osv, Højere uddaelse, Tekisk, ledere i 008 Geemsit, media, øvre og edre kvartil for såvel mæd som kvider 1) Overfør data til Excel på ege harddisk ) Agiv om de to fordeliger er symmetrisk, højre eller vestreskæv 3) Er der forskel på løspredige for mæd og kvider (Vik: Bereg de relative kvartilafstad) 13

18 3 Stokastisk variabel 3 STOKASTISK VARIABEL 31 SANDSYNLIGHED Statistik bygger på sadsylighedsteorie, som giver metoder til at fide, hvor stor chace (sadsylighede) er for at et bestemt resultat af et eksperimet forekommer DEFINITION af tilfældigt eksperimet Et eksperimet som ka resultere i forskellige udfald, selv om eksperimetet getages på samme måde hver gag, kaldes et tilfældigt eksperimet (egelsk : radom experimet) Det er karakteristisk for tilfældige eksperimeter, at ma ka afgræse e mægde kaldet eksperimetets udfaldsrum U, der ideholder de mulige udfald Derimod ka ma ikke forudsige, hvilket udfald der vil idtræffe ved udførelse af eksperimetet Består eksperimetet eksempelvis i kast med e terig er udfaldsrummet U = {1,, 3, 4,5, 6}, me ma ka ikke forudsige udfaldet af æste kast (eksperimet) Selv om ma 4 gage i træk har fået udfaldet øjetal 1", ka ma ikke forudsige, hvilket udfald der idtræffer æste gag Resultatet af 5 kast afhæger ikke af resultatere af de foregåede 4 spil Ma siger, at eksperimetere er "statistisk uafhægige" (e præcis defiitio ses i kapitel 11) Som eksempler på tilfældige eksperimeter ka æves: a) Ét kast med e møt Udfaldsrum U = Plat, Kroe b) Fremstillig af et parti levedsmiddel og målig af det procetvise idhold af protei U = mægde af reelle tal fra 0 til 100 c) Udtage e stikprøve på 400 elektroiske kompoeter af e dagsproduktio og optællig af atallet af defekte kompoeter U = 0, 1,, 3, 4, 5,, 400 d) Udtagig af et tilfældigt TV-apparat fra e dagsproduktio af TV-apparater og optællig af atallet af loddefejl U = mægde af positive hele tal E hædelse er e delmægde af et eksperimets udfaldsrum Eksempelvis er A: At få et lige øjetal e hædelse ved kast med e terig Hædelse A siges at idtræffe, hvis et udfald fra A forekommer Sadsylighedsbegrebet tager udgagspukt i det i kapitel 1 omtalte begreb relativ hyppighed DEFINITION af relativ hyppighed for hædelse A Getages et eksperimet gage, og A forekommer hædelse A etop A gage af de gage, er A s relative hyppighed ha ( ) Lad eksempelvis eksperimetet være kast med e terig og hædelse A være at få et lige øjetal Kastes terige 100 gage og bliver resultatet et lige øjetal 45 af de 100 gage er h(a) = 045 Det er e erfarig, at øges atallet af getagelser af eksperimetet, vil de relative hyppighed af 14

19 3 Stokastisk variabel hædelse A stabilisere sig Når går mod,vil de relative hyppighed erfarigsmæssigt ærme sig til e græseværdi ("de store tals lov") Ved sadsylighede for A som beæves P(A) forstås dee græseværdi (P = probability) Da defiitioe af sadsylighed bygger på relativ hyppighed, er det aturligt, at det for ethvert par af hædelser A og B i udfaldsrummet U skal gælde : 0 # P(A) # 1, P(U) =1 og P(ete A eller B) = P(A) + P(B) (skrives kort P(AcB)= P(A)+P(B)) forudsat A og B ige elemeter har fælles (er disjukte) (e mere geerel regel fides i kapitel 8) De 3 regler kaldes sadsylighedsregiges aksiomer I kapitel 8 udledes på dette grudlag e række regler for regig med sadsyligheder Eksempel 31 Regler Lad A = at få et ulige øjetal ved et kast med e terig B = at få e sekser ved et kast med e terig Fid sadsylighede for ete at få et ulige øjetal eller e sekser( evt begge dele) ved kast med e terig Løsig: 1 P(A) = P(B) = P( AB) P( A) P( B) 3 STOKASTISK VARIABEL Ethvert statistisk problem må det på e eller ade måde være muligt at behadle talmæssigt Betragtes et eksempel med kast med e møt, kue ma til udfaldet plat tilorde tallet 0 og til udfaldet kroe tilorde tallet 1 og på de måde få problemet overført til oget, hvor ma ka foretage beregiger Ma siger, ma har idført e stokastisk (eller statistisk) variabel X, som er 0, år udfaldet er plat, og 1 år udfaldet er kroe DEFINITION af stokastisk variabel (egelsk: radom variable) E stokastisk variabel (også kaldet statistisk variabel) er e fuktio, som tilorder et reelt tal til hvert udfald i udfaldsrummet for et tilfældigt eksperimet E stokastisk variabel beteges med et stort bogstav såsom X, mes det tilsvarede lille bogstav x beteger e mulig værdi af X Ved e diskret variabel (eller tællevariabel) forstås e variabel, hvis mulige værdier udgør e edelig eller tællelig mægde Er eksempelvis eksperimetet udtagig af e kasse med 100 møtrikker, ud af e løbede produktio af kasser, kue de stokastiske variabel X være defieret som atal defekte møtrikker i kasse X er e diskret variabel, da de ku ka atage heltallige værdier fra 0 til 100 Vi vil i seere afsit behadle diskrete variable 3 Ved e kotiuert stokastisk variabel forstås e stokastisk variabel, hvis mulige værdier er alle 15

20 3 Stokastisk variabel reelle tal i et vist iterval Et eksempel kue være eksperimetet avedelse af e y metode til fremstillig af et produkt Her kue de stokastiske variabel Y være det målte procetvise udbytte ved forsøget Y er e kotiuert variabel, da de ka atage alle værdier fra 0% til 100% 33 TÆTHEDSFUNKTION FOR KONTINUERT STATISTISK VARIABEL Eksempel 3 Kotiuert stokastisk variabel I meeskers led udskiller de iderste hide e "ledvæske" som "smører" leddet For visse ledsygdomme ka kocetratioe af britioer (ph) i dee væske tækes at have betydig Som led i e ordisk medicisk udersøgelse af e bestemt ledsygdom udtog ma bladt samtlige patieter der led af dee sygdom tilfældigt 75 patieter og målte ph i ledvæske i kæet Resultatere fides i eksempel 5 Populatio og stikprøve Samtlige idbyggere i Norde med dee sygdom udgør populatioe Da det er gaske uoverkommeligt at udersøge alle, udtages e stikprøve på 75 patieter Det er målet ved hjælp af statistiske metoder på basis af e stikprøve at sige oget geerelt om populatioe Histogram For at få et overblik over et større datamateriale, vil ma sædvaligvis starte med at tege et histogram Hvorledes dette gøres fremgår af eksempel 5 I skemaet ses resultatet af e opdelig i 10 klasser med e bredde på 008 Edvidere er der bereget e søjle ved at dividere de relative hyppighed med itervallægde Klasser Atal Relativ hyppighed 75 Skalerig ]694-70] ]70-710] ] ] ]718-76] ]76-734] ]734-74] ]74-750] ] ] ] ] ] ] Vi får det edefor tegede histogram Dette viser et "klokkeformet histogram", hvor der er flest tal fra 719 til 74, og derefter falder atallet til begge sider 16

21 33 Tæthedsfuktio Histogram for ph ,9 7,1 7,3 7,5 7,7 7,9 ph Ma reger ormalt med, at resultatere af forsøg hvor ma har foretaget måliger (hvis ma lavede ok af dem) har et sådat klokkeformet histogram Hvis ma tæker sig atallet af forsøg stiger (for eksempel udersøger hele populatioe på måske 1 millio ordiske kæ), samtidig med at ma øger atallet af klasser tilsvarede (til for eksempel ), vil histogrammet blive mere og mere fitakket, og til sidst ærme sig til e kotiuert klokkeformet kurve (idteget på grafe) Hvis ma beytter de skalerede skala fra skemaet, som også er afsat på højre side af tegige, vil arealet af hver søjle være de relative hyppighed, og for de idealiserede kotiuerte kurve, vil arealet uder kurve i et bestemt iterval fra a til b være sadsylighede for at få e værdi mellem a og b Det samlede areal uder kurve er aturligvis 1 Ma siger, at de kotiuerte stokastiske variabel X (ph værdie) har e tæthedsfuktio f(x) hvis graf er de ovefor ævte kotiuerte kurve Da arealet uder e kotiuert kurve bereges ved et bestemt itegral, følger heraf følgede defiitio: DEFINITION af tæthedsfuktio f(x) for kotiuert variabel X Pa ( X b) f( xdx ) for ethvert iterval af reelle tal a b a; b f ( x ) dx 1, f ( x) 0 for alle x Bemærk, at for kotiuerte variable er Pa ( Xb) Pa ( Xb) Pa ( X b) Pa ( X b) Et eksempel på e tæthedsfuktio for e kotiuert variabel er de i æste kapitel beskreve ormalfordelig 17

22 3 Stokastisk variabel Måleresultater vil sædvaligvis være værdier af ormalfordelte variable, så e rimelig hypotese for de i eksempel 3 agive kotiuerte stokastiske variabel X = ph er således, at de er ormalfordelt Dette bestyrkes af at grafe for sådae etop er klokkeformede Det er væsetlig at fide e cetral værdi i populatioe, samt agive et spredigsmål Disse agives i de følgede kapitler for de kokrete fuktioer, der behadles Geerelt gælder følgede defiitioer DEFINITION af middelværdi for kotiuert variabel Middelværdi for e kotiuert variabel X med tæthedsfuktio f ( x ) beæves eller E ( X ) og er defieret som E( X) x f ( x) dx DEFINITION af varias og spredig for kotiuert variabel Variase for e kotiuert variabel X med tæthedsfuktio f ( x ) beæves eller V( X ) og er defieret som V( X) ( x) f ( x) dx Spredige (egelsk: stadard deviatio) for e diskret variabel X med tæthedsfuktio f(x) beæves defieret som V( X) og er Eksempel 33 Kotiuert stokastisk variabel 3 x for 0 x 8 Lad der være givet følgede fuktio: f ( x) 0 ellers a) Vis, at f ( x) dx 1 I det følgede atages, at f ( x ) er tæthedsfuktio for e kotiuert stokastisk variabel X b) Skitser grafe for f c) Bereg middelværdi og spredig for X Løsig: x a) f ( x) dx x dx b) Grafe, som er e del af e parabel, ses på Fig 31 c) E X x f x dx 4 x 3 x dx x 3 ( ) ( ) Fig31 Tæthedsfuktio 5 x V( X) x f ( x) dx x x dx ( X ) Fordeligsfuktio I visse situatioer er det e fordel at betragte de kotiuerte variabels fordeligsfuktio F(x) DEFINITION af fordeligsfuktio F(x) for kotiuert variabel x Fordeligsfuktioe for e kotiuert variabel X er defieret ved F( x) P( X x) f ( x) dx 18

23 33 Tæthedsfuktio DEFINITION af p-fraktil Lad p være et vilkårligt tal mellem 0 og 1 Ved p-fraktile eller 100 p % fraktile forstås det tal x p F( x ) P( X x ) p ( f ( x) dx ) p p 0 x p, for hvilket det gælder, at Særlig ofte beyttede fraktiler er 50% fraktile, som kaldes mediae (eller kvartil), 5 % fraktile, som kaldes edre kvartil (eller 1 kvartil) og 75% fraktile, som kaldes øvre kvartil (eller 3 kvartil) Eksempel 34 Fordeligsfuktio for kotiuert variabel For de i eksempel 33 agive kotiuerte variabel X med tæthedsfuktio f (x) øskes fudet: 1) Fordeligsfuktioe F (x) x ) Mediae Løsig: 0 dx = 0 for x < 0 x x x x x 1) F( x) f ( x) dx xdx 3 3 x 3 0 for x dx= for x > 3 x 3 ) Mediae er bestemt ved F( x) x 4 x

24 3 Stokastisk variabel 34 LINEARKOMBINATION AF STOKASTISKE VARIABLE Vi betragter i dette afsit flere stokastiske variable Eksempel 35 vil blive beyttet som geemgåede eksempel Eksempel 35 To variable Isektpulver sælges i papkartoer Lad de stokastiske variable X 1 være vægte af pulveret, mes X er vægte af papkartoe I middel fyldes der 500 gram isektpulver i hver karto med e spredig på 5 gram Kartoe vejer i middel 10 gram med e spredig på 10 gram Y = X 1 + X er da bruttovægte 1) Fid middelværdie af Y ) Fid spredig af Y Mere geerelt haves: Lad X 1, X,, X være stokastiske variable Ved e liearkombiatio af disse forstås Y a0 a1 X1 a X a X, hvor a 0, a 1, a,, a er kostater Ma ka vise (se evetuelt kapitel 11) at der gælder følgede Liearitetsregel: EY ( ) a a E( X) a E( X ) a E( X ) I eksempel 35 syes det rimeligt at atage, at vægte af pulveret og vægte af papkartoe er uafhægige ( påfyldige ka tækes at ske maskielt, ude at de er afhægig på oge måde af hvilke vægt, kartoe tilfældigvis har) Ma ka vise (se evetuelt kapitel 11, for e mere udførlig behadlig af uafhægighed mm), at hvis X 1, X,, X er statistisk uafhægige, gælder Kvadratregel for statistisk uafhægige variable: V( Y) a V( X ) a V( X ) a V( X ) 1 1 Eksempel 35 (fortsat) To variable Spørgsmål 1: E(Y) = E(X 1 ) + E(X ) = = 510 gram Spørgsmål : V(Y) = V(X 1 ) + V(X ) = = 6 ( Y) 6 51 gram Kvadratregle beyttes bla til beregig af statistisk usikkerhed som ka fides beskrevet på hjemmeside larse-etdk i boge Fuktioer af flere variable Esfordelte uafhægige variable Lad os atage, at vi uafhægigt af hiade og uder de samme betigelser udtager elemeter fra e populatio med middelværdi og spredig Lad X 1 være de stokastiske variabel, der er resultatet af første udtagig af et elemet i stikprøve, X være de stokastiske variabel, der er resultatet af ade udtagig, osv 0

25 34 Liearkombiatio af stokastiske variable X 1, X,, X vil da være esfordelte uafhægige stokastiske variable, dvs have samme fordelig med middelværdi og spredig Eksempel 36 Esfordelte variable Bruttovægte af det i eksempel 34 ævte karto isektpulver havde middelvægte 510 g med e spredig på 51 g Vi udtager u tilfældigt og uafhægigt af hiade 10 pakker isektpulver a) Hvad bliver i middel de samlede vægt af de 10 kartoer b) Hvad bliver i middel spredige på de samlede vægt af de 10 kartoer Løsig: Lad X 1 være vægte af karto 1, X være vægte af karto osv X 10 være vægte af karto 10 Y= X 1 + X + + X 10 er da vægte af alle 10 kartoer a) E(Y) = E(X 1 )+E(X )+ +E(X 10 ) = = 5100 g b) V(Y) = V(X 1 )+V(X )+ +V(X 10 ) =10 (51) = 601 g ( Y ) Bemærk: E almidelig fejl er her, at ma tror, at Y=10 X og dermed V(Y)=10 V(X)=600 Vi har her at gøre med 10 esfordelte uafhægige variable, og ikke 10 vægte af 1 karto For esfordelte uafhægige stokastiske variable gælder: SÆTNING 31 (middelværdi og spredig for stikprøves geemsit ) X1 X X E( X) og ( X ), hvor X X X X Bevis: Af liearitetsregle fås E( X) E 1 1 ( ) ( ) ( ) E X 1 E X E X X X X Af kvadratregle fås V( X) V V( X ) V( X ) V( X ) 1 Eksempel 37 Spredig på geemsit (eksempel 35 fortsat) Hvis der udtages 5 kartoer isektpulver, hvad vil da være spredige på geemsittet af vægte af isektpulveret Løsig: Da spredige på 1 karto er 51 gram, vil spredige på geemsittet af 5 kartoer være 51 ( X ) 8 5 Opgave 31 Vægte af e (tilfældigt udvalgt) tablet af e vis type imod hovedpie har middelværdie 065g og spredige 004 g Bereg middelværdi og spredig af de sammelagte vægt af 100 (tilfældigt udvalgte) tabletter 1

26 4Normalfordelige 4 NORMALFORDELINGEN 41 INDLEDNING Lad os som eksempel tæke os et kemisk forsøg, hvor vi måler udbyttet af et stof A Selv om vi getager forsøget ved avedelse af de samme metode og i øvrigt søger at gøre forsøgsbetigelsere så esartet som muligt, varierer udbyttet dog fra forsøg til forsøg Disse variatioer fra de ee forsøg til det æste må skyldes forhold vi ikke ka styre Det ka skyldes små ædriger i temperature, i luftes relative fugtighed, vibratioer uder fremstillige, små forskelle i de avedte råmaterialer (korstørrelse, rehed), forskelle i meeskelig reaktioseve osv Hvis ige af disse variatiosårsager er domierede, der er et stort atal af dem, de er uafhægige og lige så godt ka have e positiv som e egativ idvirkig på resultatet, så vil de totale fejl sædvaligvis approksimativt være fordelt efter de såkaldte ormalfordelig (også kaldet Gauss-fordelige) Som illustratio af dette ka avedes Galtos apparat Eksempel 41 Eksperimet med et Galto-apparat På de aførte figur er skitseret et Galto-apparat A er e tragt; B er sømrækker, hvor sømmee i e uderliggede række er abragt midt ud for mellemrummee mellem sømmee i de overliggede række; C er opsamligskaaler Lader ma mage kugler passere geem tragte A ed geem sømrækkere B til opsamligskaalere C, vil ma kostatere, at de ekelte kugler ok bliver tilfældigt fordelt i opsamligskaalere, me at kugleres samlede fordelig giver et møster, som getages, hver gag ma udfører eksperimetet Fordelige er hver gag med tilærmelse e klokkeformet symmetrisk fordelig som skitseret på tegige, oget som er karakteristisk for ormalfordelige Galto-apparatet illustrerer, hvorfor ma så ofte atager, at måleresultater er værdier af e ormalfordelt variabel: Hver sømrække repræseterer e faktor, hvis iveau det ikke er muligt at holde kostat fra målig til målig, og sømrækkeres påvirkig af kugles bae symboliserer de samlede virkig, som de ukotrollerede faktorer har på størrelse af de målte egeskab

27 4 Defiitio og sætig om ormalfordelig E ade illustratio af uder hvilke omstædigheder e ormalfordelt variabel ka forekomme i praksis så vi i kapitel eksempel 5 hvor ma på 75 meesker med e bestemt ledsygdom målte ph i kæleddet Histogrammet som er getaget edefor har et klokkeformet udseede, som kraftigt atyder, at de kotiuerte stokastiske variabel X = ph er ormalfordelt Hyppighed ,94 7,0 7,1 7,18 7,6 7,34 7,4 7,5 7,58 7,66 Mere Hyppighed I de teoretiske statistik giver de cetrale græseværdisætig e forklarig på, hvorfor ormalfordelige er e god model ved mage avedelser De cetrale græseværdi siger (løst sagt), at selvom ma ikke keder fordelige for de esfordelte stikprøvevariable X 1, X,, X, så vil geemsittet X være approksimativt ormalfordelt blot er tilstrækkelig stor (i praksis over 30) 4 DEFINITION OG SÆTNINGER OM NORMALFORDELING Defiitio af ormalfordelig (, ) Noralfordelige er sadsylighedsfordelige for e kotiuert stokastisk variabel X med 1 tæthedsfuktioe f(x) bestemt ved f ( x) e De har middelværdi og spredig Grafe er klokkeformet og symmetrisk om liie x = 1 x for ethvert x At f (x ) virkelig er e tæthedsfuktio med de agive egeskaber vises i Supplemet til statistiske grudbegreber afsit A For at få et overblik over betydige af og er der edefor afbildet tæthedsfuktioe for ormalfordeligere (0, 1), (48, ), (48, 07) og (10, 1) 3

28 4Normalfordelige 0,6 0,5 0,4 0,3 0, 0, ,1 4,8,, 4,8,0,7 10,1 Fig 41 Forskellige ormalfordeliger Det ses, at tæthedsfuktioere er klokkeformede, og at et iterval på [ 3 ; 3 ] ideholder stort set hele sadsylighedsmasse Vi æver ude bevis følgede sætig: SÆTNING 41 Additiossætig for liearkombiatio af ormalfordelte variable Er Y e liearkombiatio af stokastisk uafhægige, ormalfordelte variable, vil Y også være ormalfordelt Kedes middelværdi og spredig for de ormalfordelte variable, ka ma ved avedelse af liearitetsregel og kvadratregel fide Y s middelværdi og spredig Edvidere følger det af additiossætige, og sætig 31, at geemsittet med e spredig på x er ormalfordelt 4

29 4 Defiitio og sætig om ormalfordelig Normeret ormalfordelig Af særlig iteresse er de såkaldte ormerede ormalfordelig De er bestemt ved at have middelværdie 0 og spredige 1 Grafe for de er teget som graf A i figur 41 De kaldes sædvaligvis U eller Z og des fordelig U- eller Z-fordelige Des tæthedsfuktio beæves og des fordeligsfuktio Specielt vil des p - fraktil z p idgå i adskillige formler i de æste afsit Fig 4 Normeret ormalfordelig E vigtig sammehæg mellem fraktiler for X og fraktiler for Z er følgede x z p p Beviset for dee relatio idgår i beviset for de følgede sætig, som også viser, at ma ka overføre e vilkårlig ormalfordelig til de ormerede ormalfordelig Det er derfor ok at lave e tabel over de ormerede ormalfordelig Dette er det ma udytter, hvis ma ikke har rådighed over et program, der som beskrevet i afsit 43 direkte ka berege værdiere Der gælder følgede SÆTNING 4 (ormerig af ormalfordelig) Når X er ormalfordelt (, ) X er de variable Z ormalfordelt ( 01,), og der gælder b b a P( X b) og Pa ( Xb) Edvidere gælder x z p p Bemærk, at det for de to formler er ligegyldigt, om ulighedere er med eller ude lighedsteg 5

30 4Normalfordelige Bevis: At Z også er ormalfordelt vises ikke her EZ E X x 1 1 ( ) f( x) dx x f( x) dx f( x) dx E( X) 0 V Z V X x 1 V( X) ( ) f( x) dx ( x ) f( x) dx 1 Z har derfor middelværdi 0 og spredig 1 Edvidere fås P X b P X b b b ( ) P Z og Pa X b P a b b a ( ) Z x p x p Bevis for xp zp : P( X xp ) p p zp xp zp 43 BEREGNING AF SANDSYNLIGHEDER Stikprøves geemsit og spredig Ofte er middelværdie og spredige ukedt i e foreliggede ormalfordelig I så fald erstattes fordelige (, ) i praksis med e approksimerede fordelig xs (, ), såfremt der foreligger et rimelig stort atal observatioer fra de give fordelig På basis af de i eksempel 15 agive stikprøve på 75 patieter bereges et geemsit af ph værdiere på SAK x og e s værdi på s Vi vil altså atage, at ph værdiere er approksimativt ormalfordelt (79, 0134) Øsker vi at beytte oveståede ormalfordelig (79, 0134) til at fide sadsylighede for, at ph er midre ed 7, er dee sadsylighed lig med arealet af det skraverede areal uder tæthedsfuktioe Øsker vi tilsvarede at berege sadsylighede for, at ph ligger mellem 7 og 75 er sadsylighede lig med det skraverede areal uder kurve på omståede figur 6

31 Eksempel 4 Beregig af ormalfordelte sadsyligheder Lad X være ormalfordelt (, ), hvor = 79 og = ) Fid P( X 7 ) ) Fid P( 7 X 75 ) 3) Fid P( X 76 ) 4) Fid 90% fraktile x 09 Løsig: Ma fider de beyttede sadsylighedsfordeliger ved at vælge TI-Nspire: Beregiger Statistik Fordeliger 43 Beregig af sadsyligheder 4) Har ma omvedt givet e sadsylighed p = 09 og øsker at fide de tilsvarede værdi x p for hvilke P( X x p ) 09 betyder det, at ma keder arealet 09 og skal fide x-værdie Det svarer jo til at fide de iverse (omvedte) fuktio af ormalfordelige Eksempel 43 Kvalitetskotrol E fabrik støber plastikkasser Fabrikke får e ordre på kasser, som bladt adet har de specifikatio, at kassere skal have e lægde på 90 cm Kasser, hvis lægder ikke ligger mellem toleracegræsere 89 og 908 cm bliver kasseret Det vides, at fabrikke producerer kassere med e lægde X, som er ormalfordelt med e spredig på 05 cm a) Hvis X har e middelværdi på 896, hvad er så sadsylighede for, at e kasse har e lægde, der ligger idefor toleracegræsere b) Hvor stor er sadsylighede for at e kasse bliver kasseret, hvis ma justerer støbige, så middelværdie bliver de der giver de midste procetdel kasserede (spredige ka ma ikke ædre) Fabrikate fider, at selv efter de i spørgsmål foretage justerig kasseres for stor e procetdel af kassere Der øskes højst 5% af kassere kasseret c) Hvad skal spredige formidskes til, for at dette er opfyldt? Hvis det er umuligt at ædre, ka ma prøve at få ædret toleracegræsere d) Fid de ye toleracegræser (placeret symmetrisk omkrig middelværdie 90,0) idet spredige stadig er 05, og højst 5% må kasseres E y maskie idkøbes, og som et led i e udersøgelse af, om der dermed er sket ædriger i middelværdi og spredig produceres 1 kasser ved avedelse af dee maskie Ma fadt følgede lægder: e) Agiv på dette grudlag et estimat for middelværdi og spredig 7

32 4Normalfordelige Løsig: Ma fider de beyttede sadsylighedsfordeliger ved i TI-Nspire: Vælg Beregiger Statistik Fordeliger a) P( 89 X 908 ) ormcdf(89, 908, 896, 05)= = 7799% b) Middelværdie justeres til midtpuktet 900 P( X 908 ) P( X 89 ) ormcdf(908,, 90, 05)+ormCdf(-,89, 90, 05)= 1096% c) Da der ligger 5% udefor itervallet, så må af symmetrigrude,5% ligge på hver si side af itervallet Vi har følgelig, at vi skal fide spredige så P( X 89 ) 0 05 Metode 1:Af relatioe (41) fås z 0408 z ivnorm( 005) 0 05 Metode : solve( ormcdf(,89, 90,x)=005,x) x 0 eller solve(ivnorm(005,90,x)=89,x) x 0 Resultat x = ma vælger solve (da ikke fides eksakt løsig) d) Kaldes de edre toleracegræse for a fås med samme begrudelse som i pukt c : P( X a) 0 05 Vi ka her beytte de iverse ormalfordelig Nedre græse a = ivnorm(005, 90,005) = 890 Øvre græse b = 90 +(90-890) = 9098 e) TI-Nspire: Lister og regeark giv e liste et av og idtal tal i liste vælg data listematematik middel kopier liste id Eter Getag, me u vælges stdevsamp Eksempel 44 Additiossætig E boreproces fremstiller huller med e diameter X 1, der er ormalfordelt med e middelværdi 1 og e spredig på 004 E ade proces fremstiller aksler med e diameter X, der er ormalfordelt med e middelværdi og e spredig på 003 Atag, at , og at 994 Fid sadsylighede for, at e tilfældig valgt aksel har e midre diameter ed e tilfældig valgt borehul Løsig: P( X X1) P( X X1 0) Sættes Y X X1er Y ormalfordelt E( Y) E( X) E( X1) V( Y) 1 V( X ) ( 1) V( X ) ( Y) TI-Nspire: PX ( X1) PY ( 0) ormcdf(, 0, -006, 005) = = 8849% 8

33 Opgaver til kapitel 4 OPGAVER Opgave 41 1) E stokastisk variabel X er ormalfordelt med = 0 og = 1 Fid P( X 075 ), P( X 16 ) og P( 075 X 16 ) ) E stokastisk variabel X er ormalfordelt med = 1 og = 4 Fid P( 3 X 7 8) Opgave 4 Maksimumstemperature, der opås ved e bestemt opvarmigsproces, har e variatio der er tilfældig og ka beskrives ved e ormalfordelig med e middelværdi på 1133 o og e spredig på 56 o C 1) Fid procete af maksimumstemperaturer, der er midre ed 1161 o C ) Fid procete af maksimumstemperaturer, der ligger mellem 115 o C og 1167 o C 3) Fid de værdi, som overskrides af 578% af maksimumstemperaturere Ma overvejer at gå over til e ade opvarmigsproces Ma udfører derfor 16 gage i løbet af e periode forsøg, hvor ma måler maksimumstemperature, der opås ved dee ye proces Resultatere var 1166, 116,6, 117,0, 14,5, 1,, 18,6, 109,9, 114,8, 106,4, 110,7, 110,7, 113,7, 18,1, 118,8, 115,4, 13,1 4) Giv et estimat for middelværdie og spredige Opgave 43 E fabrik plalægger at starte e produktio af rør, hvis diametre skal opfylde specifikatioere,500 cm ± 0,015 cm Ud fra erfariger med tilsvarede produktioer vides, at de producerede rør vil have diametre, der er ormalfordelte med e middelværdi på,500 cm og e spredig på 0,010 cm Ma øsker i forbidelse med plalægige svar på følgede spørgsmål: 1) Hvor stor e del af produktioe holder sig idefor specifikatiosgræsere ) Hvor meget skal spredige ed på, for, at 95% af produktioe holder sig idefor specifikatiosgræsere (middelværdie er uædret på,500 cm) 3) Fabrikke overvejer, om det er muligt at få idført ogle specifikatiosgræser (symmetrisk omkrig,500), som bevirker, at 95% af dets produktio falder idefor græsere Fid disse græser, idet det stadig atages at middelværdie er 500 og spredige 0010 cm Opgave 44 E automatisk dåsepåfyldigsmaskie fylder høskødssuppe i dåser Rumfaget er ormalfordelt med e middelværdi på 800 m og e spredig på 6,4 ml 1) Hvad er sadsylighede for, at e dåse ideholder midre ed 790 m? ) Hvis alle dåser, som ideholder midre ed 790 m og mere ed 805 m bliver kasseret, hvor stor e procetdel af dåsere bliver så kasseret? 3) Bestem de specifikatiosgræser der ligger symmetrisk omkrig middelværdie på 800 m, og som ideholde 99% af alle dåser 9

34 4Normalfordelige Opgave 45 I et laboratorium lægges et yt gulv Det forudsættes, at vægte Y der hviler på gulvet, er summe af vægte X 1 af maskier og apparater og vægte X af varer og persoale, dvs Y = X 1 + X Da både X 1 og X er sum af mage relativt små vægte, atages det, at de er ormalfordelte Det atages edvidere at X 1 og X er statistisk uafhægige Erfariger fra tidligere gør det rimeligt at atage, at der gælder følgede middelværdier og sprediger (målt i tos): E(X 1 ) = 60, ( X 1 ) = 1, E(X ) = 35, ( X ) = 04 1) Bereg E(Y) og ( Y) ) Bereg det tal y 0, som vægte Y med de oveævte forudsætiger ku har e sadsylighed på 1% for at overskride 3) Bereg sadsylighede for, at vægte af varer og persoale e tilfældig dag, efter at det ye gulv er lagt, er større ed vægte af maskier og apparater (Vik: se på differese X - X 1 ) Opgave 46 Ved fabrikatio af et bestemt mærke opvaskemiddel fyldes vaskepulver i papkartoer I middel fyldes 400 g pulver i hver karto, idet der herved er e spredig på 1 g Pulverfyldige ka forudsættes ikke at afhæge af kartoeres vægt, der i middel er 50 g med e spredig på 5g Bereg sadsylighede p for, at e tilfældig pakke opvaskemiddel har e bruttovægt mellem 450 g og 4300 g Opgave 47 Et system er af sikkerhedsmæssige grude opbygget af to apparater A, der er parallelforbude (se figur) således, at systemet virker, så læge blot et af apparatere virker Svigter et af apparatere, startes reparatio Det atages, at reparatiostide er ormalfordelt med middelværdie rep = 10 timer og spredig rep = 3 timer I reparatiostide overbelastes de ade kompoet, og det atages, at des levetid fra reparatioes start (approksimativt) er ormalfordelt med middelværdi og spredig = 4 timer 1) Fid sadsylighede for, at reparatioe er afsluttet, ide de ade kompoet fejler, hvis = 0 timer ) Hvor stor skal være, for at sadsylighede for, at reparatioe ka afsluttes før de ade kompoet fejler, er mere ed 999%? Opgave 48 Vægte af e (tilfældig udvalgt) tablet af e vis type mod hovedpie har middelværdie 065 g og spredige 004 g 1) Bereg middelværdi og spredig af de sammelagte vægt af 100 (tilfældigt udvalgte ) tabletter ) Atag, at ma beytter følgede metode til at fylde tabletter i et glas Ma placerer glasset på e vægt og fylder tabletter på, idtil vægte af tablettere i glasset overstiger 65,3 g Bereg sadsylighede for, at glasset kommer til at ideholde mere ed 100 tabletter (se bort fra vægtes fejlvisig) 30

35 51 Udtagig af stikprøver 5 Kofidesiterval for ormalfordelt variabel 51 UDTAGNING AF STIKPRØVER I lagt de fleste i praksis forekome tilfælde vil det bla af tidsmæssige og omkostigsmæssige grude være umuligt at foretage e totaltællig af hele populatioe Helt klart er dette ved afprøvige ødelægger emet (åbig af koservesdåser) eller populatioe i pricippet er uedelig ( for at udersøge om e metode giver et større udbytte ed et adet, udføres e række kemiske forsøg og her er der teoretisk ige øvre græse for atal delforsøg) Som det seere vil fremgå ka selv e forholdsvis lille repræsetativ stikprøve give svar på væsetlige forhold omkrig hele populatioe Det er imidlertid klart, at e betigelse herfor er, at stikprøve er repræsetativ, dvs at stikprøve med hesy til de egeskab der øskes er et mii-billede af populatioe For at opå det, foretager ma e eller ade form for lodtrækig (kaldes radomiserig) Afhægig af problemet ka dette gøres på forskellig måde Simpel udvælgelse De ekleste form for stikprøveudtagig er, at ma ummererer populatioes elemeter, og så radomiserer (ved lodtrækig, evt ved at beyttet et program der geerer tilfældige tal) udtager de N elemeter der skal idgå i stikprøve Eksempel: For at udersøge om e ædrig af vitamiidholdet i foderet for svi ædrede deres vægt, udvalgte ma ved radomiserig de svi, som fik det ye foder Stratificeret udvælgelse Uder visse omstædigheder er det fordelagtigt (midre stikprøvestørrelse for at opå samme sikkerhed) at opdele populatioe i midre grupper (kaldet strada), og så foretage e simpel udvælgelse idefor hver gruppe Dette er dog ku e fordel, hvis elemetere idefor hver gruppe er mere esartet ed mellem gruppere Eksempel: Øsker ma at spørge vælgere om deres holdig til et politisk spørgsmål (feks om deres holdig til et skattestop) kue det måske være e fordel at dele dem op i idkomstgrupper (høj, mellem og lav) Systematisk udvælgelse Ved e såkaldt systematisk udvælgelse, vælger ma at udtage hver k te elemet fra populatioe Eksempel: E detailhadler øsker at måle tilfredshede hos sie kuder Der øskes udtaget 40 kuder i løbet af e speciel dag Da ma aturligvis ikke på forhåd keder de kuder der kommer i butikke, vælges e systematisk udvælgelse, ved at vælge hver 7'ede kude der forlader butikke Ma starter dage med ved lodtrækig at vælge et af tallee fra 1 til 7 Lad det være tallet 5 Ma udtager u kude r 5, 517 1, 57 19,, Derved har ma fået valgt i alt 40 kuder Problemet er aturligvis, om tallet 7 er det rigtige tal Hvis ma får valgt tallet for stort, eksempelvis sætter det til 30, så vil e stikprøve på 40 kræve, at der er 1175 kuder de dag, og det behøver jo ikke at være tilfældet Omvedt hvis tallet er for lille, så får ma måske udtaget de 40 kuder i løbet af formiddage, og så er stikprøve ok ikke repræsetativ, da ma ikke får eftermiddagskudere med 31

36 5 Kofidesiterval for ormalfordelt variabel Klygeudvælgelse (Cluster samplig) Dee metode ka med fordel beyttes, hvis populatioe består af eller ka iddeles i delmægder (klyger) Metode består i, at ma ved radomiserig vælger et midre atal klyger, som så totaltælles Eksempel: I et vareparti på 000 emer fordelt på 00 kasser hver med 10 emer øsker ma e vurderig af fejlprocete I alt øskes udtaget 50 emer Ma udtager radomiseret 5 kasser, og udersøger alle emere i kassere 5 FORDELING OG SPREDNING AF GENNEMSNIT Udtages e stikprøve fra e populatio er det jo for, at ma ud fra stikprøve ka fortælle oget cetralt om hele populatioe I eksempel 15 var vi således iteresseret i kocetratioe af britioer (ph) i ledvæske i kæet hos patieter, der led af dee sygdom Som led i e ordisk medicisk udersøgelse udtog ma bladt patieter der led af dee sygdom tilfældigt e stikprøve på 75 På basis heraf beregede ma geemsittet af ph værdiere til x = 7868 og spredige s = Ma vil u sige, at et estimat (skø) for de sade middelværdi for hele populatioe er 79 og de sade spredig er 0134 Det er imidlertid klart, at disse tal er behæftet med e vis usikkerhed Havde vi valgt 75 adre patieter havde vi ude tvivl fået lidt adre tal Det er derfor ikke ok, at agive at de sade middelværdi er x, vi må også agive et usikkerhedsiterval For at kue berege et sådat iterval er det ødvedigt at kede fordelige Her spiller de tidligere ævte cetrale græseværdisætig e vigtig rolle, idet de jo (løst sagt) siger, at selv om ma ikke keder fordelige af de kotiuerte stokastiske variabel, så vil geemsittet af værdiere i e stikprøve på tal vil være tilærmelsesvis ormalfordelt, hvis blot er tilstrækkelig stor ( i praksis over 30) Dette er af stor praktisk betydig, idet det så ikke er så vigtigt, om selve populatioe er ormalfordelt Ofte er det jo ku af iteresseret at kue forudsige oget om hvor middelværdie af fordelige er placeret Edvidere fremgik det af sætig 31, at spredige på x er ( x), hvor er spredige på de ekelte værdi i stikprøve Heraf fremgår, at geemsittet ka ma stole mere på ed de ekelte målig, da de har e midre spredig 3

37 53 Kofidesiterval for middelværdi Eksempel 51 Fordelig af geemsit De tid, et kude må veter i e lufthav ved e check-i disk, er givet at være e stokastisk variabel med e ukedt fordelig Ma har dog erfarig for, at vetetide i middel er på 8 miutter med e spredig på 3 miutter Udtages e stikprøve på 50 kuder, øskes fudet sadsylighede for, at de geemsitlige vetetid for disse kuder er mellem 7 og 9 miutter Løsig: Da atallet i stikprøve på 50 er større ed 30, ka vi atage at geemsittet er approksimativt 3 ormalfordelt med e middelværdi på 8 og e spredig på 0 44 x 50 Vi har derfor P( 7 X 9) TI-Nspire ormcdf(7,9,8,044) = = 968% 53 KONFIDENSINTERVAL FOR MIDDELVÆRDI 531 Defiitio af kofidesiterval Udtages e stikprøve fra e populatio er det jo for, at ma ud fra stikprøve ka fortælle oget cetralt om hele populatioe Ma vil eksempelvis berege geemsittet sade middelværdi for hele populatioe x og agive det som et estimat (skø) for de Det er imidlertid klart, at selv om et geemsit har e midre spredig ed de ekelte målig, så er det stadig behæftet med et vis usikkerhed Det er derfor ikke ok, at agive at de sade middelværdi er x, vi må også agive et usikkerhedsiterval Et iterval idefor hvilket de sade værdi kaldes et 95% kofidesiterval for middelværdie med eksempelvis 95% sikkerhed vil ligge, Mere præcist gælder det, at hvis ma for et stort atal stikprøver på de samme stokastiske variabel agav 95% kofidesitervaller, så ville de sade middelværdi tilhøre 95% af disse itervaller 1 1 Præcis defiitio af kofidesiterval Lad være givet e stikprøve for e stokastisk variabel X, lad være et tal mellem 0 og 1 Lad edvidere være e puktestimator for parametere og lad L og U være stokastiske variable, for hvilke det gælder, at PL ( U) På basis af de give stikprøve fides tal l og u som bestemmer det øskede iterval l u Dette kaldes et 100 procet kofidesiterval for de ukedte parameter 33

38 5 Kofidesiterval for ormalfordelt variabel 53 Populatioes spredig kedt eksakt Et 95% kofidesiterval [ x r; x r] må ligge symmetrisk omkrig geemsittet, og således, at Px ( r X xr) 095 Heraf følger, at hvis de sade middelværdi ligger i et af de farvede områder på figure, så er der midre ed 5% chace for, at vi ville have fået det fude geemsit x For at fide græse for itervallet, må vi fide e middelværdi så P( X x) 0 05 x r x x r Ma må her huske, at et geemsit har spredige, hvor σ er spredige på de ekelte målig og er atal måliger i stikprøve Fremfor at løse oveståede ligig, er det lettere at beytte formle i sætig 51 Sætig 51 Spredig kedt eksakt Er spredige eksakt kedt er et 95% kofidesiterval bestemt ved formle x z0 975 x z0 975 Bevis: Af formle xp zp fås, idet ( X ), at x z0 975 x z0 975 Vi har følgelig, at radius i kofidesitervallet er r z0975 Sædvaligvis udtrykkes de geerelle formler ved sigifikasiveauet, som er sadsylighede for at begå e fejl sættes sædvaligvis til 10%, 5%, 1 % eller 01% svarede til heholdsvis 90%, 95%, 99% og 999% kofidesitervaller I så fald bliver formle (udtrykt ved ) x z x z 1 1 Alle de avedte regemidler har programmer, der automatisk bereger ete kofidesiterval eller radius r i kofidesitervallet 34

39 53 Kofidesiterval for middelværdi Eksempel 5 Kofidesiterval hvis spredige er kedt eksakt Lad geemsittet af 1 måliger være x 90, og lad os atage, at spredige kedes eksakt til 05 Bestem et 95% kofidesiterval for middelværdie μ Løsig: Metode 1 Beytte formel x z x z TI-Nspire: r = z ivnorm( 0975 ) = Da der er symmetri omkrig x fås kofidesitervallet [90-083;90+083] = [89717 ; 9083] Metode : Beytte færdige programmer TI-Nspire: Beregiger Statistik Kofidesitervaller z-iterval for 1 variabel meu:statisk udfyld meu ENTER Vi ved derfor med 95% sikkerhed, at populatioes sade middelværdi ligger idefor disse itervaller 533 Populatioes spredig ikke kedt eksakt Sædvaligvis er populatioes spredig jo ikke eksakt kedt, me ma reger et estimat s ud for de Da s jo også varierer fra stikprøve til stikprøve, giver dette e ekstra usikkerhed, så kofidesitervallet for bliver bredere Ma må så i formle x z0975 x z0975 erstatte Z-fraktile z med e såkaldt T-fraktil t 0975 (f) (også beævt t ) hvor frihedsgradstallet f = - 1, og = atal måliger) 0975, f Mere geerelt udtrykt ved sigifikasiveauet erstattes i formle x z x z z- fraktile z med t - fraktile t , f t-fordeliger E t - fordelig har samme klokkeformede udseede som e Z - fordelig (e ormalfordelig med middelværdi 0 og spredig 1) I modsætig til Z - fordelige afhæger des udseede imidlertid af atallet af tal i stikprøve Er frihedsgradstallet f = -1 stort (over 30) er forskelle mellem e U- fordelig og e t- fordelig så lille, at de sædvaligvis er ude praktisk betydig Er f lille bliver t - fordelige så meget bredere ed Z - fordelige, at t-fordelige må avedes i stedet for Z-fordelige Mere præcist, at af de 100 stikprøver med tilhørede 95% kofidesitervaller, vil i middel ku 5 af disse itervaller ikke ideholde de sade værdi 35

40 5 Kofidesiterval for ormalfordelt variabel Grafe viser tæthedsfuktioe for t-fordeligere for f = 1, 5 og 30 Eksempel 53 Beregig af t-værdier 1) Fid t ( 1) og t 005 ( 1) ) Fid P( X 1), hvor X er t - fordelt med 1 frihedsgrader Løsig: TI-Nspire: Beregiger Statistik Fordeliger iverst udfyld meu 1) t ( 1) = 18 t ( ) = -18 ) P( X 1) = tcdf(1,,1) = 1685% Er de eksakte værdi af spredige ukedt, erstattes de i de af sætig 51 agive formel med spredige s Idet s har frihedsgradstallet - 1 erstattes z 0975 med t 0975 ( - 1) Herved fremkommer sætige Sætig 5 (De eksakte værdi af spredig ukedt) s Et 95 % kofidesiterval er bestemt ved formle: xt0, 975( 1) xt0 975( 1) s s (eller udtrykt ved x t x t 1, 1 1, 1 Eksempel 54 Kofidesiterval, hvis spredige ikke er kedt eksakt Ved fremstillig af et bestemt levedsmiddel er det vigtigt, at et tilsætigsstof fides i levedsmidlet i e kocetratio på 850 (g/l) For at kotrollere dette udtager levedsmiddelkotrolle 6 prøver af levedsmidlet Resultatere var: Målig r kocetratio x (g/l) Idet ma atager, på baggrud af tidligere ligede måliger, at resultatere er ormalfordelte, skal ma besvare følgede spørgsmål: a) Agiv et estimat for kocetratioes middelværdi og spredig b) Agiv et 95% kofidesiterval for kocetratioe, og vurder herudfra om kravet på 850 er opfyldt s 36

41 53 Kofidesiterval for middelværdi Løsig Ti-Nspire har idbygget et program, så ma ikke behøver at avede formlere direkte Lister og regeark udfyld liste (husk overskrift) Statistik Kofidesitervaller t-iterval for 1 variabel meu: data udfyld meu ENTER a) Resultater: x 868 og s 041 b) 95% kofidesiterval: [80 ; 85] Da itervallet ideholder 850, er kravet opfyldt, me da itervallet ku lige etop ideholder tallet 850, så det vil ok være rimeligt, at foretage e y vurderig på basis af ogle flere måliger Eksempel 55 Kofidesiterval, hvis origiale data ikke kedt Fid kofidesitervallet for middelværdie, idet stikprøve er på 0 tal, som har et geemsit på 50 og e spredig på 1 Løsig: Som i eksempel 54 blot vælges her Statistik/Stats fremfor Data 95% kofidesiterval :[4438 ; 556] Prædistiatiositerval Ved mage avedelser øsker ma at forudsige, hvor værdie af e kommede observatio af de variable med 95% sikkerhed vil falde, sarere ed at give et 95% kofidesiterval for middelværdie af de variable Ma siger, at ma øsker at bestemme et 95% prædistiatiositerval (forudsigelsesiterval) SÆTNING 5 ( 100 ( 1 ) % prædistiatiositerval for e ekelt observatio ) Et 100 ( 1 ) % prædistiatiositerval for e ekelt fremtidig observatio X +1 er bestemt ved 1 1 x t ( 1) s 1 x t ( 1) s Bevis: Lad X 1 være e ekelt fremtidig observatio Eftersom X 1 er uafhægig af de øvrige X er, er X 1 også uafhægig af X Variase af differese X X 1 er følgelig V( X X ) V( X) V( X ) Da ma sædvaligvis først reger kofidesitervallet ud, så er de emmeste måde at berege det tilsvarede prædistiatiositerval at beytte, at radius r p i prædistiatiositerval fås af radius r k i kofidesitervallet ved formle r r 1 s Bevis: rp t 1 s ( ) t ( 1) s t ( 1) 1 rk p k 37

42 5 Kofidesiterval for ormalfordelt variabel Eksempel 56 Prædistiatios-iterval for middelværdi af ormalfordelig Samme problem som i eksempel 54, me u øskes bestemt et 95% prædistiatiositerval for e ekelt y målig af kocetratioe Løsig Da kofidesitervallet har lægde = 050 er radius r k = 05 Vi har derfor r p = og dermed 95% prædistiatiositerval ; ; 893 Bestemmelse af stikprøves størrelse Før ma starter sie måliger, kue det være yttigt på forhåd at vide ogelude hvor mage måliger ma skal foretage, for at få resultat med e give øjagtighed Hvis spredige atages kedt, ved vi, at radius i kofidesitevallet er r z 1 Løses dee ligig med hesy til fås z 1 r Det grudlæggede problem er her, at ma æppe keder spredige eksakt Ma keder muligvis på basis af tidligere erfariger størrelsesordee af spredige Hvis ikke må ma evetuelt lave ogle få måliger, og berege et s på basis heraf Som e første tilærmelse atages, at atallet af getagelser er over 30, så ma ka bruge U- fordelige Hvis det derved viser sig, at er uder 30 avedes i stedet e t-fordelig, idet vi løser ligige t 1 ( 1) r Det følgede eksempel illustrerer fremgagsmåde 38

43 53 Kofidesiterval for middelværdi Eksempel 57 Bestemmelse af stikprøves størrelse E forstmad er iteresseret i at bestemme middelværdie af diametere af vokse egetræer i e bestemt fredet skov Der blev målt diametere på 7 tilfældigt udvalgte egetræer (i 1 meters højde over jorde) På basis af måligere på de 7 træer sættes s 14 a) Fid hvor mage træer der skal måles, hvis et 95% kofidesiterval højst skal have e radius på ca 5 cm b) Fid hvor mage træer der skal måles, hvis et 95% kofidesiterval højst skal have e radius på ca 6 cm Løsig: a) Først beyttes formle z s r 0975 TI-Nspire:(ivNorm(0975)*14)/5)^ = 301 = 31 Da > 30 er det rimeligt, at beytte e Z- fordelig frem for e t-fordelig Der skal altså tilfældigt udvælges ca 31 egetræer b) Beyttes samme formel som uder spm a) fås = 1 Da < 30 burde ma have avedt e t - fordelig t0975,( 1) s r solve(x=(ivt(0975,x-1)*14/6)^,x) x>1 Efter oge tid fås x = 337 Der skal altså tilfældigt udvælges ca 4 egetræer Da overslaget jo er afhægigt af om vurderige af s er korrekt, bør ma dels for e sikkerheds skyld vælge s lidt rigelig stor, dels efter at ma har målt de 31/4 træer lige kotrollere beregige af kofidesitervallet 54 KONFIDENSINTERVAL FOR SPREDNING I visse situatioer øsker ma at fide et kofidesiterval for spredige Vi vil ikke gå ærmere id på teorie herfor, me blot hevise til formlere i oversigt 55 Er de eksakte værdi af middelværdie ukedt skal følgede formel beyttes: ( 1) s ( 1) s ( 1) ( 1) 1 I formlere idgår de såkaldte - fordelig, (udtales ki i ade) 39

44 5 Kofidesiterval for ormalfordelt variabel -fordeliger -fordelige beyttes ved beregiger omkrig variaser, år disse er erstattet af et estimat s 1 På figure er afbildet tæthedsfuktioe for - fordeligere () 5, ( 10) og ( 0) Det ses, at ku er defieret for tal større ed eller lig ul, og at -fordeliger ikke er symmetriske om middelværdie Jo større frihedsgradstallet bliver jo mere symmetriske bliver de dog, og for store f - værdier - i praksis f > 30 - ka e -fordelig ( f ) approksimeres med ormalfordelige (, ), hvor f og f TI-Nspire har e kumuleret - fordelig ligesom aturligvis alle statistikprogrammer har det Eksempel 58 Beregig af - værdier 1) Fid 0 05 () 8 og () 8 ) Fid P( X 5), hvor X er - fordelt med 8 frihedsgrader Løsig: TI-Nspire: Beregiger, Statistik, Fordeliger, ivχ, udfyld meu 1 Defiitio af χ -fordelige Lad U 1, U,, U f være uafhægige ormerede ormalfor-delte variable Sadsylighedsfordelige for de stokastiske variabel U1 U,, U f kaldes -fordelige med frihedsgradstallet f og beteges ( f ) 40

45 54 kofidesiterval for spredige Eksempel 59 Kofidesiterval for varias og spredig af ormalfordelig E virksomhed øsker at kotrollere med hvilke spredig e bestemt målemetode agiver saltidholdet i e opløsig Der foretages følgede 1 måliger af e opløsig af det pågældede salt Resultatere var: Målig r % opløsig a) Agiv på basis af måleresultatere et estimat for opløsiges spredig b) Agiv et 95% kofidesiterval for variase og for spredige Løsig: ( 1) s ( 1) s TI-Nspire har itet færdigt program, så der må avedes formel 3 i oversigt 55 : ( 1) ( 1) Data idtastes i Lister og regeark Statistik Statistiske beregiger Statistik med 1 variabel meu udfyldes spredig fides bladt mage tal Opskriv i e celle (i udskrift F1) formel for øvre græse, osv 1 41

46 5 Kofidesiterval for ormalfordelt variabel 55 OVERSIGT over cetrale formler i kapitel 5 X atages ormalfordelt (, )Givet stikprøve af størrelse med geemsit og spredig s Oversigt over kofidesitervaller r Forudsætiger Estimat for parameter 100 (1 - ) % kofidesiterval for parameter ukedt ukedt ukedt kedt For : For : ukedt For : ukedt kedt ukedt For : x x s ( ) s ( ) s ( x ) 1 s s x t ( 1) x t ( 1) 1 1 TI89 :F7: t-iterval TI-Nspire:Kofidesitervaller t-iterval for 1 variabel x z x z 1 1 TI89 :F7: Z-iterval TI-Nspire:Kofidesitervaller z-iterval for 1 variabel 1 s ( 1) s ( 1) ( 1) 1 ( 1) s ( x ) ( 1) s ( x ) ( ) ( ) 1 x Oversigt over prædistiatiositervaller r Forudsætiger Estimat for parameter 100 (1 - ) % kofidesiterval for parameter 1 ukedt kedt For : x radius i kofidesiterval r k z 1 radius i prædistiatiositerval r r 1 p k ukedt ukedt For : x radius i kofidesiterval rk t ( ) 1 1 s radius i prædistiatiositerval r r 1 p k Bestemmelse af stikprøves størrelse Øsket værdi af radius r i 100 (1 - ) % kofidesiterval 1 kedt eller > 30 z 1 TI89+TI-Nspire: (ivnorm(1- /)* /r)^ r ukedt, me atag de højst er s t ( 1) s Løs ligig, se eksempel 58 1 r 4

47 Opgaver til kapitel 5 OPGAVER Opgave 51 Lad der være givet 10 uafhægige observatioer af e syres kocetratio (i %) ) Fid et estimat for kocetratioes middelværdi og spredig ) Agiv et 95% kofidesiterval for 3) Agiv et 95% prædistiatiositerval for e ekelt y målig af kocetratioe Opgave 5 Trykstyrke i beto blev kotrolleret ved at ma støbte 1 betoklodser og testede dem Resultatet var: ) Fid et estimat for trykstyrkes middelværdi og spredig ) Agiv et 95% kofidesiterval for 3) Agiv et 95% prædistiatiositerval for e ekelt målig af trykstyrke på e y betoklods 4) Ma fadt, at radius i kofidesitervallet var for stor Bestem med tilærmelse atallet af måliger der skal udføres, hvis radius højst skal være 1 Opgave 53 E fabrik producerer stempelrige til e bilmotor Det vides, at stempelrigees diameter er approksimativt ormalfordelt Stempelrigee bør have e diameter på mm og e spredig på 0001 mm For at kotrollere dette udtog ma tilfældigt 15 stempelrige af produktioe og målte diametere I resultatere har ma for simpelheds skyld, ku agivet de 3 sidste cifre, altså agives som 365 Ma fadt følgede resultater ) Fid et estimat for rigees diameter og spredig ) Agiv et 99% kofidesiterval for Opgave 54 E polymer produceres i batch Viskositetsmåliger udført på hver batch geem et stykke tid har vist, at variatioe i processe er meget stabil med spredig = 0 På 15 batch gav viskositetsmåligere følgede resultater: ) Fid et estimat for viskositetes spredig ) Agiv et 95% kofidesiterval for, for at kotrollere påstade om, at = 0 3) Fid et estimat for viskositetes middelværdi 4) Agiv et 95% kofidesiterval for 43

48 5 Kofidesiterval for ormalfordelt variabel Opgave 55 Ved e fabrikatio af et bestemt sprægstof er det vigtigt, at e reaktoropløsig har e ph-værdi omkrig 80 Der foretages 6 måliger på e bestemt reaktatopløsig Resultatere var: ph De beyttede ph-målemetode atages på baggrud af tidligere ligede måliger at give ormalfordelte resultater 1) Agiv et estimat for opløsiges middelværdi og spredig ) Agiv et 95% kofidesiterval for ph 3) Ma fider, at radius i kofidesitervallet er for bredt Agiv med tilærmelse atallet af måliger der skal foretages, hvis radius skal være 01 Opgave 56 De 10 øverste ark papir i e pakke med priterpapir har følgede vægt a) Agiv et estimat for middelværdie af papirets vægt, og et 95%-kofidesiterval herfor b) Agiv med tilærmelse atallet af ark, der skal avedes, hvis radius i kofidesitervallet højst skal være r = 001 c) Agiv et 95%-prædistiatiositerval for e ekelt yt ark papir d) Agiv et estimat for spredige og et 95%-kofidesiterval for spredige af papirets vægt Opgave 57 Til udersøgelse af alkoholprocete i e persos blod foretages 4 uafhægige måliger, som gav følgede resultater (i ): ) Opstil et 95% kofidesiterval for persoes alkoholkocetratio ) Opstil et 95% kofidesiterval for målemetodes spredig 44

49 61 Grudlæggede begreber 6 HYPOTESETEST (ÉN NORMALFORDELT VARIABEL) 61 GRUNDLÆGGENDE BEGREBER Ofte vil ma se vediger som Stikprøve viser, at udbyttet ved de y metode er sigifikat større ed ved de hidtidig avedte metode Statistiske problemer, hvor ma på basis af e stikprøve øsker med eksempelvis 95% sikkerhed at bevise e påstad om hele populatioe kaldes hypotesetest De forskellige begreber der idgår i e hypotesetest vil blive geemgået i forbidelse med følgede eksempel Eksempel 61 Hypotesetest E fabrik har geem mage år beyttet e metode, der på basis af e give mægde råmateriale gav et middeludbytte af et produceret stof på 0 = 69 kg og spredige = 10 kg E yasat igeiør får til opgave at søge at forøge middeludbyttet ved e passede (billig) modifikatio af procesbetigelsere Efter e række lovede eksperimeter i laboratoriet syes opgave at være lykkedes, me det edelige bevis herfor er, ud fra et passede atal driftsforsøg statistisk at kue bevise, at middeludbyttet er blevet forøget Ud fra kedskab til de forskellige mulige støjfaktorer atages spredige at være uædret på 10 kg Da driftsforsøgee er meget ressourcekrævede, bevilges der ku 1 delforsøg Der foretages 1 uafhægige delforsøg og udbyttet x måltes: Forsøg r x ) Ka ma ud fra disse data bevise på sigifikasiveau = 005, at middeludbyttet er blevet forøget? ) Hvis svaret i spørgsmål 1 er bekræftede, så agiv et estimat for det ye middeludbytte, og agiv et 95% kofidesiterval herfor 45

50 Hypotesetestig (1 ormalfordelt variabel) Løsig: 1) Løsige opdeles for overskuelighedes skyld i e række tri 1a) Defiitio af stokastisk variabel X X = udbyttet ved de modificerede proces 1b) Valg af X s fordeligstype X atages at være approksimativt ormalfordelt (, 10 ) 1c) Opstillig af ulhypotese og alterativ hypotese Der opstilles e såkaldt Nulhypotese H 0 : = 69 kg Nulhypotese skal ideholde e kokret påstad (her et lighedsteg) Påstade er, at modifikatioe ige (ul) virkig har Der opstilles edvidere e alterativ hypotese H: > 69 kg De alterative hypotese skal så vidt muligt ideholde det, der øskes bevist I dette tilfælde øskes vist, at middeludbyttet er vokset, dvs > 69 kg Teste kaldes e esidet test i modsætig til e tosidet test : H 0 : = 69 kg cotra H: 69 kg, hvor vi blot øsker at vise, at middeludbyttet har ædret sig 1d) Agivelse af testes sigifikasiveau Hvis stikprøves geemsit x er meget større ed 69 kg ( måske helt op mod 100 kg), så er der stor sadsylighed for at udbyttet er steget Ma siger så, at ulhypotese forkastes, eller at x ligger i forkastelsesområdet (se figur 61) Hvis derimod x ku ligger lidt over 69 kg, så ka det skyldes tilfældige udsvig, og ma ka ikke med oge stor sikkerhed kokludere, at udbyttet er steget Ma siger, at ulhypotese accepteres, eller at x ligger i acceptområdet Fig 61 Accept- og forkastelsesområde Lad x 0 være græse mellem acceptområdet og forkastelsesområdet x 0 skal bestemmes såda, at forudsat H 0 : = 69 kg er sad, så er det yderst usadsyligt, at e stikprøves geemsit x vil komme til at ligge i forkastelsesområdet Hvis stikprøves geemsit alligevel ligger i forkastelsesområdet, må det være forudsætige H 0 der er forkert, dvs middeludbyttet må være blevet større Det er aturligvis ikke etydigt bestemt, hvad det vil sige, at oget er yderst usadsyligt Ma starter derfor ehver test med at fastlægge det såkaldte sigifikasiveau Er valgt til 5%,så har ma derved fastlagt, at sadsylighede for fejlagtigt at påstå, at middeludbyttet er steget, er uder 5% 46

51 61 Grudlæggede begreber Da det ka have alvorlige økoomiske kosekveser fejlagtigt at påstå at middeludbyttet er steget (produktioe omstilles osv),så er ma aturligvis iteresseret i, at dette ikke sker Det ormale i idustriel produktio er, at sætte = 5%, me er det eksempelvis mediciske forsøg, hvor det ka have alvorlige meeskelige kosekveser, sættes måske så lavt som 1% eller 01%, mes ma i adre situatioer måske sætter sigifikasiveauet til 10% I dette eksempel er sat til 5% 1e) Beregig af P - værdi Geemsittet af de 1 resultater giver x = 6976 kg Uder forudsætig af at ulhypotese H 0 : = 69 kg er sad, så er X er ormalfordelt med middelværdi 0 = 69 og spredig Vi ka derfor emt fide de præcise adskillelse mellem accept og forkastelsesområdet, da de jo er bestemt ved at arealet skal være 95% TI-Nspire ivnorm(095,69,10/1)= 6967 Da 6976 > 6976 ligger det målte geemsit altså i forkastelsesområdet Imidlertid vælger ma i stedet at berege de såkaldte P-værdi (Probability value) som er sadsylighede for at få e værdi på det fude stikprøvegeemsit 6976 eller derover, dvs P-værdi = P( X 69 76) Er dee P-værdi er midre ed =005 må x = 6976 ligge i forkastelsesområdet (se figur 6) Hvis P-værdie ligger over ligger x = 6976 i acceptområdet, dvs vi ka ikke bevise at middeludbyttet er steget Fig 6 P-værdi TI-Nspire: P værdi = P( X 69 76) ormcdf(6976,, 691, / ( 1)) =006 47

52 Hypotesetestig (1 ormalfordelt variabel) 1f) Koklusio Da P - værdi = 6% < 5% forkastes H 0, Vi har et statistisk bevis for, at de modificerede proces giver et større middeludbytte Alterativt kue vi have beyttet e testfuktio: TI-Nspire: Lister og regeark data idtastes Statistik Statistiske test z-test for 1 middelværdi meu udfyldes ENTER ) Udbyttet ka i middel forvetes at være ca x kg 95% kofidesiterval: TI-Nspire: Beregiger Statistik Kofidesitervaller z-iterval for 1 variabel meu: Statisk udfyld meu ENTER C It : [ 6919 ; 70 3] At kofidesitervallet ideholder tallet 69 er klart i modstrid med at vi lige har vist, at middelværdie er større ed 69 Det skyldes, at kofidesitervallet forkaster med 5% til hver side, mes e esidet test forkaster ku til e side med 5% Mere logisk ville det være, at lave e esidet 95% kofidesiterval, x z ; ; 69 8; 1 Det er imidlertid ikke stadard, ok fordi det er sværere at forklare e udeforståede, at middelværdie med 95% sikkerhed ligger over 698 Eksempel 6 Hypotesetest, hvor ma får accept af H 0 Samme problem som i eksempel 61, me u er sigifikasiveauet =1% Løsig: H 0 : = 69 mod H: H 0 : > 69 I eksemplet fadt vi på basis af 1 forsøg, at P-værdi = 6% Koklusio: H 0 accepteres, dvs vi ka ikke på et sigifikasiveau på 1% bevise, at middelværdie var steget Bemærk: Vi skriver ikke at vi har bevist de ikke er steget, det ka meget vel være tilfældet Vi ka bare ikke bevise det med de øskede sikkerhed 6 HYPOTESETEST MED UKENDT MIDDELVÆRDI OG SPREDNING I eksempel 61 blev baggrude for teste geemgået Samtidig atog vi, at spredige var kedt eksakt Dette er sjældet tilfældet, me havde vi haft over 30 måliger i stikprøve, ville det sædvaligvis være tilladeligt, at erstatte de eksakte værdi med de beregede spredig s, og foretage de samme beregiger Imidlertid er det på et statistisk program lige så let at lave de korrekte t-test, så det vil ma ok altid gøre 48

53 6 Hypotesetest med ukedt middelværdi og spredig Eksempel 63 Esidet hypotesetest om middelværdi (spredig ikke kedt eksakt) Samme problem som i eksempel 61, me u er spredige ikke kedt eksakt Forsøg r x ) Ka ma ud fra disse data bevise på sigifikasiveau = 005, at middeludbyttet er blevet forøget, dvs større ed 69 kg? Løsig: 1) X = udbyttet ved de modificerede proces X atages at være approksimativt ormalfordelt (, ) H 0 : = 69 kg H: > 69 kg Beregig TI-Nspire: Lister og regeark data idtastes Statistik Statistiske test t-test for 1 middelværdi data meu udfyldes ENTER P-værdi: P( X >69) = =186% Da P-værdi < 5% forkastes H 0, dvs vi har et statistisk bevis for, at de modificerede proces giver et større middeludbytte ) TI-Nspire: Beregiger Statistik Kofidesitervaller t-iterval for 1 variabel meu:- Data udfyld meu ENTER Kofidesiterval [694 ; 708] 49

54 Hypotesetestig (1 ormalfordelt variabel) Eksempel 64 Tosidet hypotesetest om middelværdi (spredig ikke kedt eksakt) Ved fremstillig af et bestemt levedsmiddel er det vigtigt, at et tilsætigsstof fides i levedsmidler i e kocetratio på 840 (g/l) For at kotrollere om tilsætigsstoffet har e kocetratio på ca 840, udtager levedsmiddelkotrolle 6 prøver af levedsmidler Resultatere var: Målig r Kocetratio x (g/l) Det øskes på dee baggrud udersøgt om kocetratioe har de øskede værdi Sigifikasiveau sættes til 5% Løsig: Lad X være kocetratioe af tilsætigsstoffet i levedsmidlet Det atages, at X er ormalfordelt (, ) Da det både er uøsket, at kocetratioe er for lille og at de er for stor, bliver ulhypotese H 0 : = 84 mod H: 84, dvs vi har e tosidet test Bemærk, at selv om ma vel egetlig hellere ville bevise, at kocetratioe er 84 og derfor helst ville have dee påstad i de alterative hypotese, er dette ikke muligt, da ulhypotese skal ideholde et lighedsteg TI-Nspire: Lister og regeark data idtastes Statistik Statistiske test t-test for 1 middelværdi meu udfyldes ENTER Da x = 89 < 84 er P( X < 89) = Da P-værdi = > 005 accepteres ulhypotese, dvs vi ka ikke bevise, at kocetratioe afviger sigifikat fra 84 g/l Bemærk, at TI- har multipliceret P-værdi med, hvilket ok skyldes, at så skal vi altid sammelige med 5% 50

55 63 Fejl af type I og type II Eksempel 65 Test af spredig E fabrikat af læskedrikke har købt e automatisk påfyldigsmaskie Ved købet af maskie har ma betiget sig, at rumfaget af de påfyldte væske i middel skal have e spredig, der ikke overstiger 00 ml Efter kort tids avedelse får ma mistake om, at spredige er for stor Mage klager over uderfyldte flasker Derfor foretages e kotrol, hvor ma tilfældigt udtager 0 flasker med læskedrik, og måler rumfaget af væske i flaske Det viser sig, at stikprøves spredig er s = 04 ml Med et sigifikasiveau på 5% er det da et statistisk bevis for, at de ye maskie ikke opfylder det stillede krav? Løsig: Lad X = rumfag af drik i flaske X atages ormalfordelt (, ), hvor såvel som er ukedte H o : 0 imod H: > 0, ( 1) s ( se oversigt 64) dvs i det foreliggede tilfælde ( 0 1) P- værdi = P( 7 36) chicdf(736,,19) = = 965% Da P-værdi=965% > 5 %, accepteres H 0, dvs det er ikke påvist, at spredige ved påfyldige er for stor, me der er dog ær ved at være sigifikas 63 FEJL AF TYPE I OG TYPE II: Ved ehver test ka der være to typer fejl, hvoraf vi hidtil ku har taget hesy til de ee type For bedre at forstå problemstillige vil vi se på følgede skema Beslutig H 0 accepteres H 0 forkastes Forudsætig H 0 er sad Rigtig beslutig Forkert beslutig Type I fejl H 0 er falsk Forkert beslutig Type II fejl Rigtig beslutig Det må være et krav til e god test, at der ku er e lille sadsylighed for at begå e fejl af type I eller type II I eksempel 61 ville e type I fejl være, hvis ma kokluderer, at de modificerede proces giver et større udbytte, selv om det ikke er tilfældet Virksomhede bruger måske milliobeløb på at omlægge produktioe, og det er gaske forgæves E type II fejl ville være, at ma ikke opdager, at de modificerede proces giver et større udbytte Dette er aturligvis uheldigt, me hvis det skyldes, at forbedrige ikke blev opdaget, fordi de er gaske rige, har det muligvis ige praktisk betydig Hvis e test har sigifikasiveau og de beregede P-værdi < så forkastes H o Vi ved hermed, at P(type I fejl), dvs vi rimelig sikre på, at have foretaget e korrekt beslutig P-værdie agiver jo ogelude sadsylighede for at vi træffer e forkert beslutig 51

56 Hypotesetestig (1 ormalfordelt variabel) Hvis = 5% og P-værdie er 45% forkastes H 0 Det samme sker, hvis P-værdi = 0001%, me vi er her uægtelig oget sikrere på, at vi at vi træffer e korrekt beslutig Hvis vi accepterer H o er det blot udtryk for, at vi ikke ka forkaste(svag koklusio: "H o frikedes på grud af bevisets stillig") Ma ka have begået e type II fejl, dvs ikke opdaget, at de alterative hypotese var sad Eksempel 66 Fejl af type Samme problem som i eksempel 61, me u er sigifikasiveauet =1% Løsig: H 0 : = 69 mod H: H 0 : > 69 I eksemplet fadt vi på basis af 1 forsøg, at P-værdi = 6% Koklusio: H 0 accepteres, dvs vi ka ikke på et sigifikasiveau på 1% bevise, at middelværdie var steget Imidlertid ka middeludbyttet meget vel være steget, me vi kue bare ikke bevise det med de øskede sikkerhed Vi ka have begået e fejl af type Som det ses af eksempel 66, så vil e formidskelse af mulighede for at begå e type 1 fejl ( formidskes) forøge sadsylighede for at begå e type fejl De eeste måde hvorpå begge ka formidskes er at øge atallet af forsøg Problemet hermed er, at ma derved måske opdager e så lille forbedrig, at det ikke er retabelt at foretage e dyr ædrig af fremstilligsprocesse Først år udbyttet overstiger e bagatelgræse vil ma reagere Dimesioerig af forsøg (vælge stikprøvestørrelse ) Lad os atage, at virksomhede i eksempel 61 fider, at hvis stigige i udbyttet ved de modificerede proces er midre ed = 05 kg, så har det ige praktisk iteresse ( = 05 kg er bagatelgræse), og derfor gør det itet, hvis ma ikke opdager det (begår e type II fejl) Hvis derimod stigige er større ed 05 kg, så har det stor betydig, og sadsylighede for at begå e type II fejl må derfor være lille Lad os sætte de til højst = 10% Problemet er u, hvor stor e stikprøvestørrelse (atallet af delforsøg) der skal udføres, for at oveævte krav er opfyldt E såda vurderig kaldes e dimesioerig af forsøget Udfører ma det ud fra e dimesioerig ødvedige atal forsøg, vil e accept af ulhypotese u betyde, at ok ka udbyttet være steget, me ikke så meget, at det har praktisk iteresse I oversigt 64 er agivet de formler, der skal avedes ved e dimesioerig De følgede eksempler viser avedelse heraf 5

57 63 Fejl af type I og type II Eksempel 67 Dimesioerig (kedt spredig) Ide ma i eksempel 61 begydte at lave de dyre delforsøg, vil igeiøre gere have e vurderig af, hvor mage driftsforsøg der er ødvedige, år det vides, at det først er økoomisk retabelt at gå over til de ye metode, hvis middeludbyttet er steget med midst 05 kg 1) Fid stikprøvestørrelse, i det tilfælde, hvor = 05 kg og = 10% Det atages stadig, at = 10 kg og sigifikasiveauet er = 5 % Lad være de i spørgsmål 1 fude stikprøvestørrelse ) Idet der udføres delforsøg skal ma besvare følgede spørgsmål: a) Hvilke koklusio ka drages, hvis ma fider, at x = 698 b) Hvilke koklusio ka drages, hvis ma fider, at x = 694 Løsig 1) X = udbyttet ved de modificerede proces X atages at være approksimativt ormalfordelt (, 10 ) H 0 : = 69 kg H: > 69 kg z1 z1 z z Da teste er esidet fremgår det af oversigt 64) at: 05 ((ivnorm(095)+ivnorm(090))/(05/10))^ = 345 = 35 a) H 0 : = 69 mod H: H 0 : > TI-Nspire: Lister og regeark Statistik Statistiske test z-test for 1 middelværdi Stats meu udfyldes ENTER Da P-værdi < 005 forkastes H 0 : = 69 kg, dvs vi er på et Sigifikasiveau på 5% sikre på at middelværdie er over 69 kg Imidlertid ka vi ikke være sikre på at de er over bagatelgræse = 697 kg Lad H 0 : = 697 mod H: H 0 : > 697 Vi fider på samme måde som ovefor, at P-værdi = 77%, dvs e påstad om at middeludbyttet ligger over 697 kg vil være fejlagtig i ca 8% af tilfældee Vi vil derfor æppe på de baggrud gå over til de ye metode b) H 0 : = 69 mod H: H 0 : > 69 Vi fider på samme måde som i pukt a), at P-værdi = 118%%, H 0 : = 69 kg accepteres, dvs vi ka ikke vise, at middeludbyttet er steget Dette ka dog godt være tilfældet, me da vi har dimesioeret er vi rimeligt sikre på, at e evetuel stigig ikke har praktisk iteresse Eksempel 68 Dimesioerig, (ukedt spredig) E virksomhed bliver af miljøkotrolle pålagt at formidske idholdet i sit spildevad af et stof A, der mistækes for at kue foruree grudvadet Idholdet af stoffet A i spildevadet skal uder 17 mg/l, og miljøkotrolle heviser til e y metode, som burde kue formidske idholdet til det øskede iveau For at vurdere de ye metode øskes foretaget e række delforsøg Hvor mage forsøg skal der midst foretages, hvis = 5%, = 10%, = 010 mg/l og et overslag over hvor stor er sætter dee til 015 mg/l 10 53

58 Hypotesetestig (1 ormalfordelt variabel) Løsig: Lad X = idhold af A (i mg/l) efter beyttelse af de y metode X atages ormalfordelt (, ), hvor såvel som er ukedte Da idholdet af stoffet A øskes formidsket, bliver ulhypotese H 0 : 17 mg/l mod H: 17 mg/l, dvs vi har e esidet test Da ikke er kedt (ku et løst skø kedes), er teste e t - test Formle i oversigt 64 avedes: z z Først bereges ((ivorm(095)+ivorm(090))/(010/015))^ Resultat = 197 Da < 30 bør ma u løse e ligig (se edefor) Da spredige jo var usikker, så vil ma ok øjes med at sætte = 30 t095 ( 1) Præcis beregig: Løs ligige 19 7 TI-Nspire: solve(x = 197 (iv_t(095,x-1)/ivorm(095))^,x) x 19 Resultat: x = 117, dvs = De øskede dimesioerig kræver altså forsøg z

59 64 Oversigt 64 OVERSIGT over cetrale formler i kapitel 6 X atages ormalfordelt (, )Givet stikprøve af størrelse med geemsit x og spredig s Sigifikasiveau: er e give kostat 0 Oversigt over test af middelværdi T er e stokastisk variabel der er t - fordelt med f = - 1 Y er e stokastisk variabel, der er ormalfordelt (, ukedt ( x ) t 0 s kedt eksakt 0 Forudsætiger Alterativ hypotese H P - værdi Beregig H 0 forkastes H: 0 PT ( t) TI89+TI-Nspire: tcdf (, t, 1) P - værdi eller : t-test H: 0 PT ( t) TI89+TI-Nspire: tcdf (, t, 1) eller t-test H: 0 PT ( t) for x 0 PT ( t) for x 0 som række 1 som række H: 0 PY ( x) TI89+TI-Nspire H: H: : ormcdf x (,, 0, ) eller Z-test 0 PY ( x) TI89+TI-Nspire : ormcdf x,, 0, eller Z-test 0 PY ( x) for x 0 som række 1 PY ( x) for x 0 som række P - værdi < 1 dog hvis t-test P - værdi P - værdi P - værdi < 1 dog hvis Z-test avedes P - værdi 55

60 Hypotesetestig (1 ormalfordelt variabel) Dimesioerig 0 er de midste ædrig i der har praktisk iteresse =P(type I fejl), = P(type II fejl) Forudsætig Hypotese Formel Beregig kedt eks- akt Esidet z z 1 1 TI89+TI-Nspire: ((ivnorm(1- ))/( / ))^ )+ivnorm(1- Tosidet z z1 1 TI89+TI-Nspire: ((ivnorm(1- /)+ivnorm(1- ))/( / ))^ er ukedt, me erstattes i formlere af det bedste estimat eller gæt for spredige Esidet Løse ligig, se eksempel 610 Tosidet z z 1 1 t1 ( 1) u 1 z z 1 t ( 1) Løse ligig, se eksempel u 1 56

61 64 Oversigt Oversigt over test af varias Q er fordelt med f = - 1 er e give kostat 0 Forudsætig ukedt ( 1) s 0 Alterativ hypotese H H: 0 H: 0 PQ ( ) PQ ( ) P - værdi Beregig H 0 forkastes TI89+TI-Nspire: chicdf (,, 1) P-værdi< TI89+TI-Nspire: chicdf (,, 1) H: 0 1 PQ ( ) for 1 PQ ( ) for som række 1 som række P-værdi< 1 kedt ( 1) s ( x ) 0 H: 0 H: 0 PQ ( ) PQ ( ) TI89+TI-Nspire: chicdf (,, ) TI89+TI-Nspire : chicdf (,, ) P-værdi< H: 0 PQ ( ) for 1 PQ ( ) for 1 som række 1 som række P-værdi< 1 57

62 Hypotesetestig (1 ormalfordelt variabel) OPGAVER Opgave 61 Et levedsmiddel ( cored beef ) forhadles i pakker på 100 g Ved fabrikatioe tilsættes traditioelt et koserverigsmiddel B (itrit) Da ma har mistake om, at B avedt i større mægder ka have uøskede bivirkiger, må der højst tilsættes 5 mg B pr 100 g Fabrikate reklamerer med, at der i middel højst er mg B pr pakke E kokurret tvivler herpå, og vil teste påstade Der købes i forskellige butikker i alt 36 pakker, og idholdet af B blev målt Ma fadt et geemsit af B på x = 10 mg med et estimat på spredige på s = 030 mg Ka ma ud fra disse data bevise på sigifikasiveau = 001, at reklame lyver Opgave 6 Et flyselskab overvejer at lukke e flyrute, såfremt = middelværdie af atal solgte pladser pr afgag er uder 60 På de sidste = 100 afgage er der i geemsit solgt x = 580 pladser med e stadardafvigel- se på s =110 pladser 1) Ka ma ud fra disse data bevise på sigifikasiveau = 005, at der i middel er solgt uder 60 pladser pr afgag? (Husk at aføre: Hvad X er Atagelser Nulhypotese Beregiger Koklusio) ) Forudsat, at ma i spørgsmål 1 ka bevise, at der er solgt uder 60 pladser, skal der agives et estimat ~ for middelværdie samt et 95% kofidesiterval for middelværdie Opgave 63 E fabrikatio er baseret på e kemisk reaktio, hvor processe forudsætter tilstedeværelse af e katalysator Med de hidtil beyttede katalysatortype C 1 udyttes i middel ku ca 70% af de dyreste råvare Firmaet overvejer at gå over til e mere effektiv katalysatortype C ved produktioe Omlægig hertil vil imidlertid kræve betydelige etablerigsomkostiger, hvorfor firmaet ku vil lægge produktioe om, såfremt i middel midst 80% af de dyreste råvare udyttes, år C beyttes Til vurderig heraf foretoges e række forsøg med beyttelse af C Følgede udyttelsesproceter fadtes: ) Vurder, om de opåede forsøgsresultater ka opfattes som et eksperimetelt bevis for, at i middel over 80% af de dyreste råvare udyttes, år C beyttes α = 1% ) Forudsat, at ma i spørgsmål 1 ka bevise, at over 80% af de dyreste råvare udyttes, skal der agives et estimat ~ samt et 95% kofidesiterval for middelværdie Vi atager i det følgede, at udyttelsesprocete X (approksimativt) er ormalfordelt ( x,s) 3) Bereg sadsylighede for, at udyttelsesprocete X for e ekelt målig er midre ed 80%, år C beyttes 58

63 Opgaver til kapitel 6 Opgave 64 Et kemikalium fremstilles idustrielt ved iddampig af e bestemt opløsig Det var vigtigt, at dee opløsig var svagt basisk med ph = 80 Ma foretog derfor kotrolmæssigt ogle phbestemmelser for de beyttede opløsig Følgede værdier fadtes: a) Foretag e testig af om opløsige ka atages at opfylde kravet til ph-værdi b) Forudsat, at ma i spørgsmål a) ka bevise, at opløsige ikke opfylder kravet, skal opstilles et 95% kofidesiterval for ph-værdie Opgave 65 Ma frygter, at de såkaldte syrereg er årsag til, at e bestemt skov er stærkt medtaget Ma måler SO - kocetratioe forskellige steder i skovbude (i g/m 3 ) og fider: I ubeskadede skove er SO - kocetratioe 0 g/m 3 a) Giver forsøgee et bevis for, at middelkocetratioe af SO i de beskadigede skov er større ed ormalt? b) Forudsat, at ma i spørgsmål a ka bevise, at middelkocetratioe af SO i de beskadigede skov er større ed ormalt, skal ma agive et tosidet 95%-kofidesiterval for SO - kocetratioe Opgave 66 Et yt måleapparat påstås at give måleresultater med spredige = 18 mg/l ved målig af salt-idholdet i e opløsig Da dette er midre ed det sædvalige, køber et laboratorium et eksemplar af apparatet for at kotrollere påstade Der foretages 15 måliger med følgede resultater: Test på basis af disse resultater, om spredige afviger fra 18 mg/l (Husk altid at aføre: Hvad X er Atagelser Nulhypotese Beregiger Koklusio) Opgave 67 Ved idkøbet af et yt måleapparat oplystes det, at apparatet målte med e spredig på 8 eheder Efter at have brugt apparatet et stykke tid ærede købere mistake om, at apparatet målte med større spredig ed oplyst For at få spørgsmålet udersøgt lod købere e bestemt målig udføre et atal gage Følgede resultater fadtes: Hvilke koklusioer ka købere drage ud fra e statistisk aalyse af de fude forsøgsresultater? 59

64 Hypotesetestig (1 ormalfordelt variabel) Opgave 68 På et kraftvarmeværk meer ma, at e y metode vil kue formidske svovlidholdet i de slagger, der bliver tilbage efter kulfyrige Med e bestemt kvalitet kul, har det hidtidige svovlidhold været 70 % For at vurdere de ye metode øsker igeiøre at foretage e række forsøg 1) Hvor mage forsøg skal der midst foretages, hvis = 5%, = 10%, = 004 og et overslag over sprediges størrelse sætter de til højst 008% ) Uaset resultatet af dimesioerige i spørgsmål 1), er der ku praktiske muligheder for at lave 16 forsøg Følgede værdier af svovlidholdet fadtes (%) Test om disse måleresultater beviser, at svovlidholdet ved de ye metode i middel er blevet midre 3) Er det på basis af resultatere muligt at vurdere, om de fude formidskelse er stor ok til, at ma vil gå over til de ye metode? Opgave 69 På pakke af e iscreme står, at portioe ideholder 14 gram fedt For at kotrollere dette købes pakker is, og fedtidholdet måles 1) Bestem de ødvedige stikprøvestørrelse, for at ma ved e forskel i fedtidhold på = 040 gram højst har, at P (type I fejl) = = 001 og P (type II fejl) = = 005 ( 04 gram) ) Ma fider et geemsit på 131 gram og et estimat s for spredige på 04 gram Ka ma ud fra disse data bevise på sigifikasiveau = 001, at middelidholdet afviger fra 14 gram? (Husk altid at aføre: Hvad X er Atagelser Nulhypotese Beregiger Koklusio) 3) Er det på basis af resultatere muligt at vurdere, om at e evetuel afvigelse er større ed bagatelgræse på 0,4 gram 60

65 71 Idledig 7 HYPOTESETEST TO NORMALFORDELTE VARIABLE 71 INDLEDNING I dette kapitel beyttes følgede eksempel til at forklare problemstillig, metode osv Eksempel 71 Sammeligig af ormalfordelte variable To produktiosmetoder M1 og M øskes sammeliget Der udvælges tilfældigt 0 persoer, hvoraf de 10 bliver sat til at arbejde med de ee metode, og de 10 adre med de ade Efter ugers forløb, beregede ma for hver perso det geemsitlige tidsforbrug pr ehed Da metode 1 er mere kostbar ed metode, øsker ma ku at gå over til de, hvis tidsforbruget pr ehed ved metode 1 er midst miutter midre ed ved metode Ma fik følgede resultater M M For at forsøgsresultatere skal være statistisk gyldige, skal måligere være uafhægige og repræsetative for det ma skal udersøge Det er således ikke korrekt, hvis ma i eksempel 71 først udtager 10 persoer, foretager måligere, laver e test, opdager ma ikke ka vise at metode 1 giver miutters lavere tidsforbrug, udtager yderligere 10 persoer, tester på de samlede fremkome tal, osv idtil ma opår de øskede sigifikas Forsøg bør udføres så der er lige mage getagelser Det er klart, at det ville være forkert, at udtage persoer til at arbejde med metode M 1 og 18 persoer til at arbejde med metode M Hvis e af persoere bliver syg uder arbejdet, så der ku er 9 på det ee hold, ødelægger det dog ikke teste Ved sammeligig af ormalfordelte variable er der afhægigt af hvorda stikprøve er idsamlet valg mellem metoder Er stikprøvere for de to variable som i eksempel 71 idsamlet uafhægigt af hiade beyttes sædvaligvis de i appedix 71 agive metode Er observatioere idsamlet parvist skal ma beytte de i eksempel 73 agive metode 61

66 7 Hypotesetest ormalfordelte variable 7 SAMMENLIGNING AF NORMALFORDELTE VARIABLE Eksempel 71 Sammeligig af ormalfordelte variable To produktiosmetoder M1 og M øskes sammeliget Der udvælges tilfældigt 0 persoer, hvoraf de 10 bliver sat til at arbejde med de ee metode, og de 10 adre med de ade Efter ugers forløb, beregede ma for hver perso det geemsitlige tidsforbrug pr ehed Da metode 1 er mere kostbar ed metode, øsker ma ku at gå over til de, hvis tidsforbruget pr ehed ved metode 1 er midst miutter midre ed ved metode Ma fik følgede resultater M M ) Udersøg på basis af disse resultater, om det på et sigifikasiveau på 5% ka påvises at tidsforbruget ved metode M 1 er miutter midre ed ved metode M ) Hvis dette ka påvises, skal der agives et 95% kofidesiterval for differese i tidsforbrug Løsig: 1) X 1 = udbyttet ved avedelse af metode M 1 og X = udbyttet ved avedelse af metode M X 1 og X atages approksimativt ormalfordelte med middelværdi og spredig heholdsvis, og, 1 1 H 0 : 1 Begrudelse: Nulhypotese udtrykker jo, at itet er ædret (ul virkig), så de agiver, at differese i middeltidsforbruget er præcist H: 1 Begrudelse: De alterative metode udtrykker jo det vi øsker at bevise, så de agiver, at differese i middeltidsforbruget er større ed Såvel TI-Nspire som Excel aveder et færdigt program, der aveder e testmetode (Satterthwaites metode), som er robust overfor midre afvigelser fra kravet om ormalitet, år blot atallet af getagelser er (æste) de samme Formle for Satterthwaites metode ka fides i oversigt 73 Er det ikke tilfældet ka ma stadig foretage teste, me så stilles der større krav til, at de variable X 1 og X virkelig er ormalfordelte Når regemidlere avedes, omskrives hypotesere til : H: H TI-Nspire: Lister og regeark Udfyld lister med overskrift m1 og m Statistik statistiske tests t-iterval for variable meu: data ok meu: List1: beyt pil til at vælge m1" og skriv + List : Vælg m" alterative Hyp samlet: ej ok 1 Ma får P-værdi =

67 7 Sammeligig af ormalfordelte variable Da P-værdi =464% < 5% forkastes H 0, dvs vi har bevist, at tidsforbruget ved metode M 1 er miutter midre ed ved metode M ) 95% Kofidesiterval for differes TI-Nspire: Lister og regeark Udfyld lister med overskrift m1 og m Statistik kofidesitervaller t- iterval for variable meu: data ok meu: List1: beyt pil til at vælge m" List : Vælg m1" samlet: ej ok Differese er 31 og 95% kofidesiterval for differese er [177 ; 464] Eksempel 7 Sammeligig af ormalfordelte variable (opridelige data ikke givet) Et luftfartsselskab A hævder, at dets fly til USA i geemsit afgår mere præcist ed et kokurrerede luftfartsselskab E forbrugergruppe udersøger dee påstad ved i e give periode at bestemme forsikelsere for samtlige flyafgage til USA for hver af de to selskaber Ma fadt følgede tal: Luftfartsselskab Atal afgage x s A miutter 30 miutter B miutter 35 miutter Støtter udersøgelse luftfartsselskab A's påstad? Løsig: X A = forsikelse i miutter for luftfartselskab A X B =forsikelse i miutter for luftfartselskab B X A og X B atages approksimativt ormalfordelte med middelværdi og spredig heholdsvis og B, B Da vi øsker at vise, at A er mere præcise ed B, så haves: H0 : A B H : A B Lister og regeark Statistik Statistiske test t-iterval for variable meu: Statistik ok udfyld meu alterative Hyp samlet: ej ok 1 P-værdi = 0156 Koklusio: Da P-værdi > 005 accepteres H 0, dvs vi ka ikke vise, at A er mere præcis ed B A, A 63

68 7 Hypotesetest ormalfordelte variable Parvise observatioer Parvise observatioer (Matched pairs samples) ka avedes, hvis det har meig at samme lige observatioere to og to (i par) Som et eksempel herpå vil vi ige betragte problemstillige i eksempel 71, me u atage, at forsøget er foretaget på e ade måde Eksempel 73 Parvise observatioer To produktiosmetoder M1 og M øskes sammeliget Der udvælges tilfældigt 10 persoer Efter lodtrækig bliver 5 persoer sat til først i uger, at arbejde med produktiosmetode M1 og derefter i de æste uger med produktiosmetode M De øvrige 5 persoer arbejder omvedt først med metode M og derefter med metode M1 Efter ugers forløb, beregede ma for hver perso det geemsitlige tidsforbrug pr ehed Da metode 1 er mere kostbar ed metode, øsker ma ku at gå over til de, hvis tidsforbruget pr ehed ved metode 1 er midst miutter midre ed ved metode Ma fik følgede resultater Perso r M M ) Udersøg på basis af disse resultater, om det på et sigifikasiveau på 5% ka påvises at tidsforbruget ved metode M 1 er miutter midre ed ved metode M ) Agiv edvidere et 95% kofidesiterval for differese mellem de to middeludbytter Forklarig på metode: Da e forsøgsperso ka være hurtig og e ade lagsom (perso 1 er således hurtigere ed perso ) ka spredige på M 1 og M være så stor, at ma itet ka vise Hvis ma i stedet tager differesere M - M1 vil disse forskelle jo udjæves, da perso 1 jo er hurtig uder arbejdet med begge metoder, mes perso er lagsom ved begge Perso r M ,1 9,4 M ,8 94,6 D = M - M ,7, I stedet for at beytte metode i eksempel 71 ka vi u teste ulhypotese H : D mod H: D ved metode i eksempel 6 (e variabel) 0 Løsig: 1) D = forskelle i tidsforbruget ved metode M og metode M 1 D atages approksimativt ormalfordelt med middelværdi og spredig H 0 : D = H: D > TI-Nspire: Lister og regeark Udfyld lister med overskrift m1 og m y liste beæves m3 i celle lige uder højre musetast :tryk gage og skriv m - m1 ENTER vælg på meu variabelreferece Statistik t-iterval for 1 variabel meu:data ok meu udfyldes med m3 ok 64

69 7 Sammeligig af ormalfordelte variable P-værdi = Koklusio: Da P-værdi < 005 forkastes H 0, dvs M1 er sigifikat miutter lavere ed M, dvs ma vil gå over til at beytte metode M1 ) Kofidesiterval for differes: TI-Nspire: Beregiger Statistik Kofidesitervaller t-iterval for 1 variabel meu:statisk udfyld meu bla med m3 ENTER Differes = 31 Kofidesiterval [10 ; 43 ] 65

70 7 Hypotesetest ormalfordelte variable 73 OVERSIGT over cetrale formler i kapitel 7 Test af middelværdier og og kofidesiterval for differes for ormalfordelte 1 1 variable X 1 og X atages ormalfordelte heholdsvis ( 1, 1) og (, ) Givet stikprøver af X 1 og X Størrelse, geemsit og spredig heholdsvis 1,, s 1 og,, s Sigifikasiveau er Lad d være e give kostat s 1 s c Forkortelser: a =, b =, c = a + b, g a b T er t - fordelt med frihedsgradstallet f x 1 x Forudsætiger, ukedte 1 x1 x d t c f er det ærmeste hele tal, som er større ed g Alterativ hypotese H P - værdi Beregig H 0 forkastes 1 100( 1 )% kofidesiterval for differes 1 : x x t ( f ) c x x t ( f ) c TI-Nspire kofidesiterval, t-iterval for variable P - værdi< P - værdi 1 dog hvis Ttest P - værdi< 1 Forkortelser: x x x d Y er ormalfordelt 1 1 (, ) 1 d PT ( t) tcdf (, t, f ) eller TI-Nspire: t-iterval, var,- samlet, ej 1 d PT ( t) tcdf (, t, f ) eller som TI :ovefor 1 d PT ( t) for x1 x d som række 1 som række PT ( t) for x x d Forudsætiger Alterativ hypotese H, kedte 1 d PY ( x) 1 d PY ( x) 1 1 d PY ( x) for x1 x d PY ( x) for x x d P - værdi Beregig H 0 forkastes 1 ormcdf ( x,,, ) eller -sampztest ormcdf (, x,, ) eller -sampztest som række 1 som række 100( 1)% kofidesiterval for differes 1 : x x z x x z 1 -SampZit P - værdi< P - værdi 1 dog hvis Ztest P - værdi< 66

71 Opgaver til kapitel 7 OPGAVER Opgave 71 Det påstås at modstade i e tråd af type A er større ed modstade i e tråd af type B Til afklarig af dee påstad udtages tilfældigt 6 tråde af hver type og deres modstade måles Følgede resultater fadtes: Modstad i tråd A (i ohm) Modstad i tråd B (i ohm) Hvilke koklusioer ka drages med hesy til påstade? Opgave 7 Et levedsmiddelfirma havde udviklet e diæt, som har lavt idhold af fedt, kulhydrater og kolesterol Diæte er udviklet med heblik på patieter med hjerteproblemer, me firmaet øsker u at udersøge diætes virkig på folk med vægtproblemer To stikprøver på hver 100 persoer med vægtproblemer blev udtaget tilfældigt Gruppe A fik de ye diæt, mes gruppe B fik de diæt, ma ormalt gav For hver perso blev registreret størrelse af vægttabet i e 3 ugers periode Ma fadt følgede værdier for geemsit og spredig: Gruppe A: x A 931 kg, s A 467 Gruppe B: x B 740 kg, s B 404 1) Udersøg om vægttabet for gruppe A er sigifikat større ed for gruppe B Sigifikasiveau 5% ) I tilfælde af sigifikas bereg da et 95% kofidesiterval for differese mellem de to gruppers middelværdier Opgave 73 E produktio af plastikvarer må omlægges på grud af bestemmelser i e y miljølov Ved de fremtidige produktio ka ide for miljøloves rammer vælges mellem produktiosmetoder I og II Metode I er de dyreste, og fabrikate har reget ud, at det (ku) ka betale sig at beytte metode I, såfremt de giver et middeludbytte, som er midst 10 måleeheder (udbytteproceter) større ed udbyttet ved beyttelse af metode II Ved et fuldstædigt radomiseret forsøg fadtes følgede måleresultater: Metode I Metode II Fabrikate valgte herefter at beytte metode I a) Foretag e udersøgelse af, om valget var statistisk velmotiveret b) Hvis forslaget er velmotiveret skal der opstilles et 95% - kofidesiterval for differese mellem middeludbyttere ved beyttelse af metodere l og II 67

72 7 Hypotesetest ormalfordelte variable Opgave 74 To sjælladske fabrikker producerer begge e bestemt type kvægfoder, for hvilke det øskes, at proteiidholdet i færdigvare skal være 6% På de fabrikkers driftslaboratorier foretoges følgede måliger af proteiidholdet i e uges produktio: Fabrik Fabrik Foretag e statistisk vurderig af, om de to produktioer ka atages i middel at give kvægfoder med samme proteiidhold Opgave 75 Målig af itelligeskvotiet på 16 tilfældigt udvalgte studerede ved e diplomretig (med mere ed 00 studerede) viste et geemsit på = 107 og e empirisk varias på =100, medes e x 1 s 1 tilsvarede målig på 14 tilfældigt udvalgte studerede fra e ade diplomretig viste et geemsit på =11 og e empirisk varias på = 64 x s Tyder disse tal på e forskel på studetermaterialet på de to retiger? Opgave 76 Et bestemt medikamet øskes testet for dets effekt på blodtrykket 1 mæd fik deres blodtryk målt før og efter idtagelse af medikametet Resultatere var: mad r Før Efter Udfør e testig af, om disse tal tyder på, at medikametet påvirker blodtrykket Opgave 77 Et diætprodukt påstår i e reklame, at brug af produktet i e måed vil resultere i et vægttab på midst 3 kg E forbrugerorgaisatio øsker at teste dee påstad 8 persoer bruger produktet i e måed, og resultatet fremgår af edeståede tabel: Perso r Startvægt Slutvægt ) Udersøg på grudlag af disse tal, om det på basis af disse tal på et sigifikasiveau på 5% ka vises, at reklames påstad er fejlagtig ) Opstil et 95% tosidet kofidesiterval for middelværdie af vægttabet, og giv på grudlag heraf e vurderig af virkige af diætproduktet 68

73 Opgaver til kapitel 7 Opgave 78 E producet af malervarer har laboratorieresultater, der tyder på, at e y lak A, har e større slidstyrke ed de sædvalige lak B Ha øsker e afprøvig i praksis og aftaler med ejere af 6 bygiger med mage trapper, at ha må lakere deres trapper Efter 3 måeders forløb måles grade af slid (i %) i hver bygig 1) Agiv hvorledes du ville foretage forsøget ) De målte værdier af slid efter valg af pla var Bygig r Ny lak Sædvalig lak Udersøg om observatioere leverer et eksperimetelt bevis for, at de ye lak er mere slidstærk ed de sædvalige lak 69

74 8 Regeregler for sadsylighed, Kombiatorik 8 REGNEREGLER FOR SANDSYNLIGHED, KOMBINATORIK 81 REGNEREGLER FOR SANDSYNLIGHEDER Vi har tidligere omtalt sadsylighed I dette kapitel omtales ogle af de grudlæggede defiitioer og begreber Det følgede eksempel blive beyttet til illustratio af defiitioer og begreber Eksempel 81 Geemgåede eksempel To skytter Aders og Bria skyder hver ét skud mod e skydeskive Sadsylighede for at Aders rammer skive er 080 mes Bria har e træfsadsylighed på 0,60 Et eksperimet består i at de hver skyder et skud Lad A være hædelse at Aders rammer skive og lad B være sadsylighede for at Bria rammer skive Vi har derfor, at P(A) = 080 og P(B) = 060 Lad os ved at sætte e streg over A forstå ikke A Geerelt gælder P( A) = 1 - P ( A ) I eksempel 81 er A hædelse at Aders ikke rammer skive Vi har derfor, at P( A ) = 1 - P(A) = 1-08 = 00 Fællesmægde til A og B beæves A B og er mægde af alle udfald i udfaldsrummet U, der tilhører både A og B (De skraverede mægde i figur 81 ) Eksempelvis er A B i eksempel 81 hædelse, at både Aders og Bria rammer skive Fig 81 Fællesmægde Foreigsmægde af A og B beæves A B og er mægde af alle udfald i udfaldsrummet U, der ete tilhører A eller B evetuelt dem begge (de skraverede mægde på figur 8 ) Eksempelvis er A B i eksempel 81 de hædelse, at ete rammer Aders eller også rammer Bria skive evetuelt gør de det begge Ma kue også udtrykke det ved at midst e af dem rammer skive 70 Fig 8 Foreigsmægde

75 8 Regeregler for sadsyligheder Der gælder u følgede additiossætig: PA ( B) PA ( ) PB ( ) PA ( B) Sætige fremgår umiddelbart ved at betragte arealere i figur 83 P( A B) P( A) PB ( ) PA ( B) Fig83 Additiossætig Statistisk uafhægighed To hædelser A og B siges at være statistisk uafhægige, såfremt sadsylighede for, at de ee hædelse idtræffer, ikke afhæger af, om de ade hædelse idtræffer I eksempel 81 må ma eksempelvis atage, at om Aders rammer skive har ige idflydelse på om Bria rammer, så her må ma atage A og B er uafhægige Et adet eksempel er kast med e terig Her vil sadsylighede for at få e sekser i adet kast være uafhægigt af udfaldet i første kast Der gælder følgede Produktsætig for uafhægige hædelser: For to uafhægige hædelser gælder PA ( B) PA ( ) PB ( ) Eksempel 8 (eksempel 81 fortsat) Lad A være hædelse, at Aders rammer skive, og lad B være hædelse, at Bria rammer skive Det er givet, at P(A) = 080 og P(B) = 060 Fid sadsylighede for a) At både Aders og Bria rammer skive b) At ete Aders eller Bria (evt begge) rammer skive, dvs midst e af dem rammer skive c) At hverke Aders elle Bria rammer skive Løsig: a) Da hædelsere atages at være uafhægige gælder ifølge produktsætige P( AB) b) Ifølge additiossætige gælder P( AB) c) P( AB) P( A) P( B) ( 108 )( 106 ) 008 Produktsætig og additiossætig ka geeraliseres til flere hædelser ed For tre hædelser A, B og C gælder således P( ABC) P( A) P( B) P( C) P( A B) P( A C) P( B C) I tilfælde af at hædelsere A, B og C er uafhægige gælder således: P( ABC) P( A) P( B) P( C) 71

76 8 Regeregler for sadsylighed, Kombiatorik Er hædelsere A og B ikke uafhægige, ka ma som beskrevet i afsit 83 udlede e mere geerel produktsætig 8 Betiget sadsylighed Er hædelsere A og B ikke uafhægige vil PA ( B) PA ( ) PB ( ) Eksempel 83 Ikke uafhægige hædelser E fabrik har erfarig for, at de daglige produktio af glasfigurer ideholder 10 % misfarvede, 0% har ridser, og 1 % af produktioe er både ridsede og misfarvede Et eksperimet består i tilfældigt at udtage e glasfigur af produktioe Lad A være hædelse at få e misfarvet og lad B være hædelse at få e ridset Her er P( A) P( B) P( AB) 001 For at få e mere geerel regel idføres PBA ( ) som kaldes sadsylighede for, at B idtræffer, år A er idtruffet (de af A betigede sadsylighed for B) For at forklare de følgede defiitio, vil vi simplificere eksempel 83, idet vi atager, at de daglige produktio er 100 glasfigurer I så fald er der 10 misfarvede figurer, 0 ridsede figurer, og 1 figur der er både misfarvet og ridset Hvis vi begræser vort udfaldsrum til A, så er 1 1 P( A B) PBA ( ) P( A) 100 Fig 84 Taleksempel Dee beregig begruder rimelighede i følgede defiitio: De af A betigede sadsylighed for B skrives PBA ( )( sadsylighede for, at B idtræffer, år A er idtruffet) PA ( B) defieres ved PBA ( ) P( A) Ved multiplikatio fås Produktsætige: P( AB) P( A) P( B A) Beyttes produktsætige på eksempel 81 fås P( A B) P( A) P( B A) Eksempel 84: Betiget sadsylighed E beholder ideholder 3 røde og 3 hvide kugler Vi udtrækker successivt kugler fra ure Vi betragter følgede hædelser: A: De først udtruke kugle er rød B: De ade udtruke kugle er rød Bereg P( A B) hvis 1) kugleudtrækige foregår, ved at de først udtruke kugle lægges tilbage før de ade udtrækkes ) kugleudtrækige foregår, ved at de først udtruke kugle ikke lægges tilbage før de ade udtrækkes Løsig 1) Her er PBA ( ) 3 og derfor ifølge produktsætige 6 ) Her er PBA ( ) 5 og derfor 3 1 P( AB) P( A B) P( A) P( B A) 1 4 7

77 83 Kombiatorik Bayes sætig PB ( ) PAB ( ) For to hædelser A og B for hvilke P(A) > 0 gælder Bayes sætig : PBA ( ) P( A) Bevis: P( A B) PB ( A) PB ( ) PAB ( ) Af defiitioe på betiget sadsylighed og produktsætige fås PBA ( ) P( A) P( A) P( A) Bayes sætig gør, at det er let at omskrive fra de ee betigede sadsylighed til de ade Dette er tilfældet, hvis de ee af de to betigede sadsyligheder PBA ( ) og PAB ( ) er meget lettere at berege ed de ade Eksempel 85 (Bayes sætig) I e officeruddaelse ka ma vælge mellem e tekisk liie og e operativ liie På e bestemt årgag har 60 % valgt de operative liie og af disse er 0% kvider På de tekiske liie er 10% kvider Ved lodtrækig vælges e elev a) Fid sadsylighede for, at dee er e kvide Ved oveståede lodtrækig viste det sig at eleve var e kvide b) Hvad er sadsylighede for, at hu kommer fra de tekiske liie Løsig: Vi defierer følgede hædelser: T: De udtruke er tekiker K: De udtruke er e kvide a) PK ( ) PT ( K) PO ( K) PKT ( ) PT ( ) PKO ( ) PO ( ) % PKT ( ) PT ( ) b) Af Bayes sætig fås: PTK ( ) PK ( ) % E ade metode ville det være, at atage, at der bliver optaget 100 elever Vi har så følgede skema Kvider I alt Operativ 1 60 Tekisk 4 40 Heraf fås umiddelbart 16 4 PK ( ) 16% og PTK ( ) 5% Kombiatorik 831 Idledig: Såfremt et udfaldsrum U ideholder udfald som alle er lige sadsylige, vil sadsylighede for hvert udfald være Pu ( ) 1 E hædelse A som ideholder a udfald vil da have sadsylighede P( A) Dette udtrykkes ofte kort ved at sige, at sadsylighede for A er atal gustige udfald i A divideret med det totale atal udfald i udfaldsrummet I sådae tilfælde, bliver problemet derfor, hvorledes ma let ka optælle atal udfald Dette ka ofte gøres ved beyttelse af kombiatorik a 73

78 8 Regeregler for sadsylighed, Kombiatorik 83 Multiplikatiospricippet Multiplikatiospricippet: Lad et valg bestå af delvalg, hvoraf det første valg har valgmuligheder, det æste valg har valgmuligheder, og det te valg har r 1 r r valgmuligheder Det samlede atal valgmuligheder er da r 1 r r Multiplikatiospricippet illustreres ved følgede eksempel Eksempel 86 Multiplikatiospricippet E mad ejer forskellige jakker, 4 slips og 3 forskellige fabrikater skjorter På hvor mage forskellige måder ka ha sammesætte si påklædig af skjorte,slips og jakke Løsig: 1) Valg af skjorte giver 3 valgmuligheder ) Valg af slips giver 4 valgmuligheder 3) Valg af jakke giver valgmuligheder Ifølge multiplikatiospricippet giver det i alt 34 4muligheder Ma kue illustrere løsige ved følgede forgreigsgraf Eksempel 87 Fakultet På hvor mage måder ka 5 persoer opstilles i e kø (i rækkefølge) Løsig: Pladsere i køe ummereres 1,,3,4,5 Plads r 1 i køe besættes 5 valgmuligheder Plads r i køe besættes 4 valgmuligheder Plads r 3 i køe besættes 3 valgmuligheder Plads r 4 i køe besættes valgmuligheder Plads r 5 i køe besættes 1 valgmulighed I alt forskellige rækkefølger Ved fakultet ( udråbsteg) forstås! ( 1) ( ) 1 Edvidere defieres 0! = 1 TI-Nspire: 5 Sadsylighedsregig Fakultet ENTER 5! = 10 74

79 83 Kombiatorik 833 Ordet stikprøveudtagelse Lad os tæke os vi har e beholder ideholdede 9 kugler med umree 1,, 3,, 9 Vi udtager u e stikprøve på 4 kugler Det ka ske 1) ude tilbagelægig: E kugle er taget op, ummeret oteres, me de lægges ikke tilbage ide ma tager e y kugle op ) med tilbagelægig: E kugle tages op, ummeret oteres, og derefter lægges kugle tilbage ide ma tager e y kugle op Ma ka følgelig få de samme kugle op flere gage Ved e ordet stikprøveudtagelse lægges vægt på de rækkefølge hvori kuglere udtages, dvs der er forskel på,1,3,5 og 3,1,,5 a) Ude tilbagelægig Eksempel 88 Ordet ude tilbagelægig I e foreig skal der bladt 10 kadidater vælges e bestyrelse På hvor mage forskellige måder ka ma sammesætte dee bestyrelse, hvis 1) Bestyrelse består af e formad og e kasserer Bestyrelse består af e formad, e æstformad, e kasserer og e sekretær Løsig: 1) E formad vælges bladt 10 kadidater 10 valgmuligheder E Kasserer vælges bladt de resterede 9 kadidater 9 valgmuligheder Da der for hvert valg af formad er 9 muligheder for kasserer, følger af multiplikatiospricippet, at det totale atal forskellige bestyrelser er = 90 ) Aalogt fås ifølge multiplikatiospricippet at atal forskellige bestyrelser 7 = 5040 TI-Nspire: Sadsylighedsregig Permutetioer Pr(10,4) Resultat: = 5040 Eksempel 88 begruder følgede defiitio Permutatioer Atal måder (rækkefølger eller permutatioer ) som m elemeter ka udtages (ordet og ude tilbagelægig) ud af elemeter er Pm (, ) ( 1) ( )( m1) b) Med tilbagelægig Eksempel 89 Ordet, med tilbagelægig I e foreig skal 4 tillidshverv fordeles mellem 10 persoer E perso ka godt have flere tillidshverv På hvor mage forskellige måder ka disse hverv fordeles? Løsig: Tillidshverv 1 placeres 10 valgmuligheder Tillidshverv placeres 10 valgmuligheder Tillidshverv 3 placeres 10 valgmuligheder Tillidshverv 4 placeres 10 valgmuligheder I alt (ifølge multiplikatiospricippet) 10 =

80 8 Regeregler for sadsylighed, Kombiatorik 834 Uordet stikprøveudtagelse Eksempel 810 Uordet ude tilbagelægig E beholder ideholdede 5 kugler med umree k1, k, k3, k4, k5 Vi udtager u e stikprøve på 3 kugler ude tilbagelægig Rækkefølge kugle tages op er ude betydig, dvs der er ikke forskel på eksempelvis k1, k4, kog k4, k1, k Hvor mage forskellige stikprøver ka forekomme? Løsig: Atallet er ikke flere ed ma ka foretage e simpel optællig: k, k, k, k, k, k k, k, k k, k, k k, k, k k, k, k k, k, k k, k, k k3, k, k Atal stikprøver = 10 Det er klart, at re optællig er uoverkommeligt, hvis mægde er stor Defiitio af kombiatio Lad M være e mægde med elemeter E kombiatio af r elemeter fra M er et udvalg af r elemeter udtaget af M ude at tage hesy til rækkefølge af elemeter Atallet af kombiatioer med r elemeter beteges K(,r) eller ( over r) r Sætig 81 (Atal kombiatioer) Atal kombiatioer med r elemeter fra e mægde på elemeter er Kr Bevis:! (, ) r!( r)! Beviset kyttes for ekelheds skyld til et taleksempel, som let ka geeraliseres Lad os atage, vi på tilfældig måde udtager 3 kugler af e kasse, der ideholder 5 kugler med umree k1, k, k3, k4, k5 5! Vi skal u vise, at k( 53,) 3!! Lad os først gå ud fra, at rækkefølge hvori kuglere trækkes er af betydig, Der er altså eksempelvis forskel på k1, k3, k4 og k, k, k Dette ka gøres på P(5,3) = måder Hvis de 3 kugler udtages, så rækkefølge ikke spiller e rolle, har vi vedtaget, det ka gøres på K(5,3) måder Lad e af disse måder være k1, k3, k4 Disse 3 elemeter ka ordes i rækkefølge på 3! 3 1måder P(,) ! Vi har følgelig, at P(,) 53 K(,) 53 3! K(,) 53 K(,) 53 3! 3! 3!! 3!! Eksempel 811 Atal kombiatioer I e foreig skal der bladt 10 kadidater vælges 4 persoer til e bestyrelse På hvor mage forskellige måder ka ma sammesætte dee bestyrelse? Løsig: Atal måder ma ka sammesætte bestyrelse er 10! K(10,4) måder 4! 6! 4! TI-Nspire: Sadsylighedsregig Kombiatioer Cr(10,4) 76

81 Opgaver til kapitel 8 OPGAVER Opgave 81 I e midre by viser e udersøgelse, at 60% af alle husstade holder e lokal avis, mes 30% holder e ladsdækkede avis Edvidere holder 10% af husstadee begge aviser Lad e husstad være tilfældig udvalgt, og lad A være de hædelse, at husstade holder e lokal avis, og B de hædelse, at husstade holder e ladsdækkede avis Bereg sadsylighedere for følgede hædelser C: Husstade holder ku de lokale avis D: Husstade holder midst é af avisere E: Husstade holder ige avis F: Husstade holder etop é avis Opgave 8 1) I figur 1 er vist et elektrisk apparat, som ku fugerer, hvis ete alle kompoeter 1a, 1b og 1c i de øverste ledig eller alle kompoeter a, b og c i de ederste ledig fugerer Sadsylighede for at hver kompoet fugerer er vist på tegige, og det atages, at sadsylighede for at e kompoet fugerer er uafhægig af om de øvrige kompoeter fugerer 1) Hvad er sadsylighede for at apparatet i figur 1 fugerer ) I figur er vist et adet elektrisk apparat, som tilsvarede ku fugerer, hvis alle de tre kredsløb I, II og III fugerer, og det er ku tilfældet hvis ete de øverste eller de ederste kompoet fugerer Hvad er sadsylighede for at apparatet i figur fugerer 77

82 8 Regeregler for sadsylighed, Kombiatorik Opgave 83 Tre skytter skyder hver ét skud mod e skydeskive De har træfsadsyligheder 075, 050 og 030 Bereg sadsylighede for 1) ige træffere, ) é træffer, 3) to træffere, 4) tre træffere Opgave 84 E terig har form som et regulært polyeder med 0 sideflader På 4 sideflader er der skrevet 1, på 8 sideflader er der skrevet 6 mes der er skrevet, 3, 4 og 5 på hver sideflader Fid sadsylighede for i tre kast med dee terig at få 1) tre seksere ) midst é sekser 3) ete tre seksere eller tre eere Opgave 85 E klasse med 1 elever skal uder e øvelse fordeles på 5 grupper 4 af gruppere skal være på 4 elever, og 1 gruppe skal være på 5 elever På hvor mage måder ka fordelige af elevere på de 5 grupper foregå? Opgave 86 Af e forsamlig på 8 kvider og 4 mæd skal udtages e arbejdsgruppe på 5 persoer a) Gør rede for, at gruppe ka udvælges på 448 forskellige måder, år det forlages, at de skal bestå af højst 3 kvider og højst 3 mæd b) Bereg atallet af måder, hvorpå gruppe ka udvælges, år det forlages, at de 5 persoer ikke alle må være af samme kø Opgave 87 a) Bestem det atal måder, hvorpå bogstavere A, B og C ka stilles rækkefølge b) Samme opgave for A, B, C og D Opgave 88 På et spisekort er opført 6 forretter, 10 hovedretter og 4 desserter 1) Hvor mage forskellige middage beståede ete af forret og hovedret eller af hovedret og dessert ka ma sammesætte ) Hvor mage forskellige middage beståede af e forret, e hovedret og e dessert ka ma sammesætte Opgave 89 Bestem atallet af 5-cifrede tal, der ka skrives med to l-taller, et - tal og to 3-taller Opgave 810 Fire projektgrupper på e virksomhed atages at have sadsylighedere 06, 07, 08 og 09 for at få succes med deres projekt Gruppere atages at arbejde uafhægigt af hiade Fid sadsylighede for, at a) alle grupper får succes, b) ige grupper får succes, c) midst 1 gruppe får succes, d) i alt etop 1 gruppe får succes, e) i alt etop 3 grupper får succes, f) i alt etop grupper får succes 78

83 Opgaver til kapitel 8 Opgave 811 E virksomhed fremstiller e bestemt slags apparater Hvert apparat er sammesat af 5 kompoeter Heraf er 3 tilfældigt udvalgt bladt kompoeter af type a og bladt kompoeter af type b Det vides, at 10% af a- kompoetere er defekte og 0% af b-kompoetere er defekte Et apparat fugerer hvis og ku hvis det ikke ideholder oge defekt kompoet Der udtages på tilfældig måde et apparat fra produktioe Lad os betragte hædelsere: A: Det udtage apparat ideholder midst 1 defekt a-kompoet B: Det udtage apparat ideholder midst 1 defekt b-kompoet 1) Fid P( A), P( B) og P( A B) ) Fid sadsylighede for, at et apparat, der på tilfældig måde udtages af produktioe ikke fugerer 3) Et apparat udtages på tilfældig måde fra produktioe og det kostateres ved afprøvig at det ikke fugerer Fid sadsylighede for, at apparatet ikke ideholder oge defekt a-kompoet Opgave 81 E test består af 40 spørgsmål, der alle skal besvares med,'ja' 'ej' og 'ved ikke' På hvor mage forskellige måder ka prøve besvares? Opgave 813 I e virksomhed skal der istalleres et kaldesystem I hvert lokale opsættes et batteri af lamper, og hver af de asatte har si bestemte lampekombiatio 1) Hvis = 5, hvor mage asatte ka da have deres eget kaldesystem (se figure) ) Hvis virksomhede har 500 asatte, hvor stor skal så være Opgave 814 Normale persobilers idregistrerigsumre består af to bogstaver og et ummer mellem 0000 og Lad os atage, at ma er ået til umre der begyder med UV Et eksempel på e ummerplade er da UV Hvad er sadsylighede for, at e yidregistreret bil får et registrerigsummer med lutter forskellige cifre, år vi atager, at alle cifre har samme sadsylighed? Opgave 815 Hvor mage forskellige telefoumre på 8 cifre ka ma dae, år første ciffer ikke må være ul? 79

84 9 Vigtige diskrete fordeliger 9 VIGTIGE DISKRETE FORDELINGER 91 INDLEDNING Vi vil i dette kapitel betragte diskrete stokastiske variable, hvis værdier er hele tal Vi vil især behadle de diskrete fordeliger: De hypergeometriske fordelig, Biomialfordelige og Poissofordelige 9 HYPERGEOMETRISK FORDELING De hypergeometriske fordelig, fider bla avedelse ved kvalitetskotrol af varepartier (jævfør eksempel 9), ved markedsudersøgelser, hvor ma ude tilbagelægig udtager e repræsetativ stikprøve på eksempelvis 500 persoer I det følgede eksempel udledes formle for de hypergeometriske fordelig Eksempel 91 Hypergeometrisk fordelig I e foreig skal der bladt 5 kvidelige og 8 madlige kadidater vælges e bestyrelse på 4 persoer Fid sadsylighede for, at der er etop 1 kvide i bestyrelse Løsig: X = atal kvider i bestyrelse At der skal være etop 1 kvide i bestyrelse forudsætter, at vi udtager 1 kvide ud af de 5 kvider og 3 mæd ud af de 8 mæd At udtage 1 kvide ud af 5 kvider ka gøres på K(5,1) måder At udtage 3 mæd ud af 8 mæd ka gøres på K(8,3) måder Atal gustige udfald er ifølge multiplikatiospricippet K(5,1) K(8,3) Det totale atal udfald fås ved at udtage 4 persoer ud af de 13 kadidater Dette ka gøres på K(13,4) måder K(,) 51 K(,) 83 P( X 1) K( 13, 4) TI-Nspire: Vælg Sadsylighedsregig Kombiatioer Cr(5,1) Cr(8,3)/Cr(13,4)=03916 Karakteristisk for e hypergeometrisk fordelig er, at elemetere i udfaldsrummet (kugler i e beholder) ka opdeles i to grupper E opdelig kue som i eksempel 91 være kvider og mæd eller som i kvalitetskotrol være i defekte varer og ikke-defekte varer Lad os atage, at vi har e beholder med N kugler, hvoraf de M er røde og reste har e ade farve Der udtrækkes e stikprøve på kugler ude tilbagelægig Lad X være atallet af røde kugler bladt de kugler X er hypergeometrisk fordelt med parametree N, M, (kort skrevet h(n,m,)) 80

85 9 Hypergeometrisk fordelig P(X = x) er sadsylighede for at etop x kugler er røde bladt de udtruke kugler X siges at være hypergeometrisk fordelt med parametree N, M, (kort skrevet h(n,m,)) hvor K( M, x) K( N M, x) PX ( x) K( N, ) Formle udledes på samme måde som det skete i eksempel 91 Sætte x = 0, 1,, fider vi forskellige værdier af tæthedsfuktioe I Supplemet til statistiske grudbegreber afsit 9A bevises, at de hypergeometriske fordelig N M har middelværdie E( X) p og spredige ( X) p( 1 p), hvor p N 1 N Eksempel 9: Hypergeometrisk fordelig h (9, 6, 3 ) I e ure fides 10 kugler, hvoraf 6 er sorte, 4 er hvide Vi betragter det tilfældige eksperimet: "Udtrækig af e kugle og observatio af farve på kugle Eksperimetet getages 3 gage, idet de udtruke kugle ikke lægges tilbage mellem hver udtrækig Lad X betege atallet af udtruke sorte kugler Fid og skitser tæthedsfuktioe for X, og bereg middelværdi og spredig for X Løsig: X er e diskret stokastisk variabel, der som er hypergeometrisk fordelt h (10, 6, 3) med tæthedsfuktioe f (x) = P(X = x): K( 60, ) K( 43, ) for x 0 K( 10, 3) 10 K(,) 61 K(,) for x 1 K( 10, 3) 10 f ( x) P( X x) K( 6, ) K( 41, ) for x K( 10, 3) 10 K( 63, ) K( 40, ) for x 3 K( 10, 3) 10 0 ellers Stolpediagram for h (10, 6, 3) M Sættes p 6 er middelværdie E( X) p3 6 og N N N spredige ( X) p( 1 p) = 0748 De hypergeometriske fordelig fider bla avedelse i kvalitetskotrol, hvilket følgede eksempel viser 81

86 9 Vigtige diskrete fordeliger Eksempel 93: Stikprøveudtagig (kvalitetskotrol) E producet fabrikerer kompoeter, som sælges i æsker med 600 kompoeter i hver Som led i e kvalitetskotrol udtages hvert kvarter tilfældigt e æske produceret idefor de sidste 15 miutter, og 5 tilfældigt udvalgte kompoeter i dee udersøges, hvorefter det foregåede kvarters produktio godkedes, såfremt der højst er é defekt kompoet i stikprøve Hvor stor er acceptsadsylighede p, hvis æske ideholder i alt 10 defekte kompoeter, såfremt udtrækige sker ude mellemliggede tilbagelægiger? Løsig: X = atal defekte bladt de 5 kompoeter X er hypergeometrisk fordelt med N = 600, M=10, og = 5 Da partiet godkedes, hvis der ete er 0 defekte eller 1 defekt, følger af additiossætige at p = P (X = 0) + P (X = 1) Hædelse "X = 0" forudsætter, at vi i alt udtager 0 af de 10 defekte og 5 forskellige af de 590 K( 10, 0) K( 590, 5) ikke-defekte, dvs P( X 0) 0651 K( 600, 5) Hædelse "X = 1" forudsætter, at vi i alt udtager 1 af de 10 defekte og 4 forskellige af de 590 K( 10, 1) K( 590, 4) ikke-defekte, dvs P( X 1) K( 600, 5) Vi har altså p = = = 9388% TI-Nspire: Bereger Skriv (Cr(10,0) Cr(590,5)+Cr(10,1) Cr(590,4))/Cr(600,5) = BINOMIALFORDELING Biomialfordelige beyttes som model for atallet af "succeser" ved uafhægige getagelser af et eksperimet, som hver gag har samme sadsylighed p for "succes" Problemstillige fremgår af følgede eksempel Eksempel 94 E biomialfordelt variabel E drejebæk producerer 1 % defekte emer Lad X være atallet af defekte bladt de æste 5 emer der produceres Vi øsker at fide sadsylighede for at fide etop defekte bladt disse 5, det vil sige P( X ) Løsig: Lad et eksperimet være at udtage et eme fra produktioe Resultatet af eksperimetet har to udfald: defekt, ikke defekt Eksperimetet getages 5 gage uafhægigt af hiade Der er e bestemt sadsylighed for at få e defekt, emlig p = 001 Lad d være det udfald at få e defekt, og d være det udfald at få e fejlfri Vi opskriver u samtlige forløb, der giver defekte ud af 5 8

87 93 Biomialfordelige ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, ddddd,,,, Da eksperimetere getages uafhægigt af hiade, følger det af produktsætige (både -og), at det første forløb må have sadsylighede ( 10 01) ( 10 01) ( 10 01) 0 01 ( 10 01) 3 Det æste forløb må have sadsylighede 001 ( 1001 ) 001 ( 1001 ) ( 1001 ) 001 ( 1001 ) 3 Vi ser, at alle gustige forløb har samme sadsylighed Atal forløb må være lig atal måder ma ka placere d er på 5 tomme pladser (eller atal måder ma ka tage kugler ud af e mægde på 5) Dette ved vi ka gøres på K(5,)=10 måder (svarede til de 10 forløb) 3 Vi får følgelig, at p K(,) ( 1001 ) I eksemplet har vi udledt de såkaldte biomialfordelig, som er defieret på følgede måde: DEFINITION af biomialfordelig 1) Lad et tilfældigt eksperimet have udfald succes og fiasko ) Lad eksperimetet blive getaget gage uafhægigt af hiade, og lad sadsylighede for succes være e kostat p Lad X være atallet af succeser bladt de getagelser X er e diskret stokastisk variabel med tæthedsfuktioe Kx p x x (, ) ( 1 p) for x01,,,, f ( x) P( X x) 0 ellers X siges at være biomialfordelt b (, p) Eksempel 95 = eksempel 94 fortsat X er biomialfordelt b(,p) hvor = 5 og p = 001 P(X=) : Statistik Fordeliger biomialpdf Udfyld meu Facit : SÆTNING 91 (middelværdi og spredig for biomialfordelig) Lad X være biomialfordelt b (, p) Der gælder da E( X) p og ( X) p( 1 p) 83

88 9 Vigtige diskrete fordeliger Bevis: Lad os betragte et eksperimet, hvor resultatet succes har sadsylighede p for at ske Lad os foretage uafhægige getagelser af eksperimetet At getagelsere er uafhægige betyder, at udfaldet af et eksperimet ikke afhæger af udfaldet af de forrige eksperimeter Lad os betragte stokastiske variable X 1, X,, X, hvor X i 1 hvis i' te getagelse af eksperimetet giver succes 0 ellers Vi har E( Xi) xi f ( xi) 1 p0( 1 p) p, og i V( Xi) ( xi ) f ( xi) ( 1 p) p( 0 p) ( 1 p) p p p( 1 p) i Idet X X1 X X er biomialfordelt b (, p) fås af liearitetsregle (kapitel 1afsit 5), at E( X) E( X1) E( X) E( X3) E( X ) p p p p p Edvidere fås af kvadratregle i kapitel 1 afsit 5, idet vi har uafhægige getagelser, at V( X) V( X1) V( X) V( X ) p( 1 p) p( 1 p) p( 1 p), eller V( X) p( 1 p) Eksempel 95: Tæthedsfuktio for biomialfordelt variabel Lad der på to af sidefladere på e terig være skrevet tallet 1, på to adre sideflader være skrevet tallet og på de sidste to sideflader være skrevet tallet 3Vi betragter det tilfældige eksperimet: "7 kast med e terige og observatio af det fremkome tal Lad X betege atallet af toere ved de 7 kast X atages at være biomialfordelt b 7, 1 3 1) Agiv tæthedsfuktioe f (x) for X (3 betydede cifre), og teg et stolpediagram for f (x) ) Fid middelværdi og spredig for X E perso foretager eksperimetet 11 gage, dvs foretager 11 gage e serie på 7 kast med terige Stikprøve gav følgede resultat Atal toere i e serie Atal gage dette skete ) Giv på grudlag af stikprøve et estimat for p i biomialfordelige 4) Giv på grudlag af stikprøve et estimat for middelværdi og spredig Løsig: 1 1) f(x) = P(X = x) = 1 1 hvor x = 0, 1, osv x x 3 3 TI-Nspire: biompdf(7,1/3,x) x 0 og derefter x = 1 osv 84

89 93 Biomialfordelige 0059 for x 0 05 for x for x 0 56 for x 3 f ( x) P( X x) 018 for x for x for x for x 7 ellers 0 0 Stolpediagram for biomialfordelige ) E( X) p og ( X) p( 1 p) ) Der er i alt toere i 77 kast 3 Et estimat for p er p ) Stikprøves middelværdi er x 09, og stikprøves spredig er 11 ( X) p( 1 p) Approksimatio af hypergeometrisk fordelig med biomialfordelig At erstatte de hypergeometriske fordelig h (N, M, ) med biomialfordelige b (, p) vil for de fleste avedelser kue gøres med e passede øjagtighed, hvis stikprøvestørrelse er N 1 midre ed eller lig 10% af partistørrelse N ( ) 10 N 10 M I så fald sættes i biomialfordelige p N Eksempel 96 Approksimatio af hypergeometrisk fordelig til biomialfordelig I eksempel 93, hvor ma udtog 5 kompoeter fra æsker på 600 kompoeter, skete udtagige logisk ok ude tilbagelægig Imidlertid er det klart, at da æskere ideholder mage kompoeter vil sadsylighede for at få e defekt ikke ædrer sig meget, hvis ma i stedet havde foretaget udtagige med tilbagelægig Der blev ataget, at der var 10 defekte i e såda æske med 600, og dette atal defekte vil så være kostat, uder hver udtrækig Vi har derfor, at P(at få e defekt) = Betigelsere for at beytte biomialfordelige er u til stede Løsige af problemet i eksempel 93 vil derfor u være: pa P( X 1) P( X 0) P( X 1) = biomcdf(5,1/60,0,1) = Det ses, at vi får praktisk samme resultat som i eksempel 93 85

90 9 Vigtige diskrete fordeliger Hypotesetest for biomialfordelt variabel I kapitel 6 geemgik vi ved e række eksempler de grudlæggede begreber for hypotesetestig for é ormalfordelt variabel Disse begreber ka uædret overføres til hypotesetestig for biomialfordelt variabel Kofidesitervaller Ved løsig af e passede ligig (se oversigt 98 ) ka ma fide de eksakte græser for kofidesitervallere Som beskrevet i appedix er det ofte muligt at approksimere med e ormalfordelig Derved fremkommer de formler som er oversigt 98 Ide de avedes skal ma udersøge om approximatioe gælder De følgede to eksempler viser beregig af test og kofidesitervaller Eksempel 97 Esidet biomialfordeligstest E levedsmiddelproducet fremstiller et levedsmiddel A, som imidlertid har e ret rige holdbarhed Efter e række eksperimeter lykkedes det at frembrige et produkt B, som i alt væsetligt er idetisk med A, me som har e bedre holdbarhed Af markedsmæssige grude er det vigtigt, at der ikke er forskel på smage af B og af det velkedte produkt A For at udersøge dette, lader producete et pael af 4 ekspertsmagere vurdere, om ma ka smage forskel Ma foretog derfor følgede smagsprøvigseksperimet Hver ekspertsmager fik 3 es udseede portioer, hvoraf e portio var af det ee levedsmiddel og de to adre portioer var af det adet levedsmiddel Hvilket af de 3 portioer der skulle ideholde et adet levedsmiddel ed de to adre, og om det skulle være levedsmiddel A eller B, afgjordes hver gag ved lodtrækig Ku forsøgsledere havde kedskab til resultatet Hver ekspertsmager fik besked på, at de skulle fortælle forsøgsledere hvilke af de tre portioer der smagte aderledes Hvis ma ikke kue smage forskel, skulle ma gætte Resultatet viste, at af de 4 svar var 13 svar rigtige 1 Ved re gætig kue ma forvete ca 3 dvs ca 8 rigtige svar 13 rigtige svar er betydeligt flere, me ka det alligevel tilskrives tilfældigheder ved gætig? Ka der på et sigifikasiveau på 5% statistisk påvist, at ekspertsmagere ka smage forskel på smage af A og B? Løsig: Lad X = atallet af rigtige svar X er biomialfordelt b (, p), hvor = 4 og p er ukedt 1 Nulhypotese H0: p mod de alterative hypotese Hp : TI-Nspire: P - værdi = P( X 13) biomcdf(4, 1/3, 13, 4) = 0084 = 84% Da P - værdi = 84% < 5% forkastes ulhypotese (estjeret), dvs der må kokluderes, at der er e smagsforskel mellem produkt A og B 86

91 93 Biomialfordelige Eksempel 98 Kofidesiterval for parametere p i biomialfordelig E plastikfabrik har udviklet e y type affaldsbeholdere Ma overvejer at give e 6 års garati for holdbarhede For at få et skø over om det er økoomisk retabelt, bliver 100 beholdere udsat for et accelereret livstidstest som simulerer 6 års brug af beholdere Det viste sig, at af de 100 beholdere overlevede de 85 teste Idet atallet af overlevede beholdere atages at være biomialfordelt, skal ma 1) Agive et estimat for sadsylighede p for at e beholder overlever i 6 år ) Agive et 95% kofidesiterval for p Løsig: 1) Lad X være atallet af overlevede beholdere X forudsættes biomialfordelt b (100, p) Ifølge oversigt 98 er et estimat for p: ~ x 85 p ) Eksakt løsig: Beyttes formel i oversigt 98 Øvre græse: Løs ligige P( X 85) = 005 med hesy til p TI-Nspire + TI89:solve(biomCdf(100, p,0,85)=005,p) p 0 Resultatet blev p = 0914 Nedre græse: Løs ligige P( X 85) = 005 med hesy til p TI-Nspire+TI89: solve(biomcdf(100, p,85,100)=005,p) p 0 Resultatet blev p = % Kofidesiterval: [0765; 0914] Bemærk, at kofidesitervallet ikke ligger helt symmetrisk omkrig 085, da biomialfordelige ikke er helt symmetrisk omkrig 085 Forklarig på formle: Udefor et 95% kofidesiterval ligger 5%, og af symmetrigrude ligger der,5% på hver side Er de sade værdi for p eksempelvis 90% vil der i middel være 90 ud af 100 overlevede beholdere Nu fadt vi ku 85 ud af 100 Sadsylighede P(X#85) for at få 85 eller færre overlevede beholdere ud af 100 er derfor ret rige Vi har P(X#85) =biomcdf(100,09085) = 0076 Selv om 76% er et lille tal, så er det dog over 5%, så e P-værdi på 90% ligger ide i kofidesitervallet For at fide de øvre græse må vi derfor løse ligige P(X#85) = 005 med hesy til p Deræst fides edre græse ved at lade p falde, idtil PX ( 85) 0 05 Approksimativ løsig Da 10#85# er forudsætigere for at beytte ormalfordeligsapproksimatio opfyldt TI-Nspire har et program (Z-iterval for e adel) som beytter dee formel Før ma bruger det program, skal ma altid først udersøge om forudsætige er opfyldt Statistik Kofidesitervaller z-iterval for e adel Udfyld meu ENTER Meue udfyldes med x: 85 : 100 C-level: 095 ENTER Resultat: 95% kofidesiterval : [078 ; 09 ] Som det ses, er forskelle i forhold til de eksakte metode meget lille Bestemmelse af stikprøves størrelse Før ma starter sie måliger, kue det være yttigt på forhåd at vide ogelude hvor mage måliger ma skal foretage, for at få resultat med e give øjagtighed Hvis ma atager, at ma ka approksimere med ormalfordelige, ved vi, at radius for et 95% p ( 1 p ) kofidesiterval er r z

92 9 Vigtige diskrete fordeliger Løses dee ligig med hesy til fås z p p 0975 ( 1 ) r Det grudlæggede problem er her, at ma æppe keder p eksakt Ma keder muligvis på basis af tidligere erfariger størrelsesordee af p Hvis ikke kue ma evetuelt udtage e lille stikprøve, og berege et p på basis heraf Edelig er der de mulighed, at sætter p = 05, som er maksimumsværdie af p ( 1 p) Beyttes dee værdi får ma de størst mulige værdi af for e give værdi af r Ulempe er, at dette fører til e større stikprøvestørrelse ed ødvedigt Det følgede eksempel illustrerer fremgagsmåde Eksempel 99 Bestemmelse af atal i stikprøve I e opiiosudersøgelse vil ma spørge et repræsetativt atal vælgere om hvilket parti de vilde stemme på, hvis der var valg i morge I dee udersøgelse øskes ide udtagig af stikprøve, at atallet skal være så stort, at radius i kofidesitervallet højst er % Løsig: Metode 1 For at få e øvre græse, sættes p = 05 Vi får z ivnorm p p r ( 0 975) 1 1 ( 1 ) Metode Da ma på forhåd ved, at ved sidste valg fik ige partier mere ed 30% af stemmere sættes p = 03 z ivnorm p p 0975 r ( 0 975) ( 1 ) POISSONFORDELINGEN Poissofordeliger beyttes ofte som statistisk model for atallet af "impulser" pr tidsehed Disse impulser atages at komme tilfældigt og uafhægigt af hiade Som eksempler ka æves: Atal trafikuheld på e bestemt vejstrækig i løbet af et år, atal biler, der passerer e militær kotrolpost, atal varevoge der akommer pr time til et stort varehus og atal telefosamtaler der føres fra e telefocetral, der er oprettet uder e øvelse Modelle ka dog også avedes på adet ed pr tidsehed, eksempelvis også på atal rever pr km kabel, hvis disse rever forekommer tilfældigt og uafhægigt af hiade Uder sådae omstædigheder ka ma ofte beytte de i det følgede omtalte Poissofordelig som statistisk model for atallet af "impulser" pr tidsehed eller volumeehed eller lægdeehed osv 88

93 94 Poissofordelige SÆTNING 9 (Poissofordelig) Lad X være e stokastisk variabel, som agiver atallet af impulser i et givet tidsrum (eller areal, volume, produktiosehed osv), idet ethvert tidspukt i tidsrummet har samme mulighed for at være impulstidspukt som ethvert adet tidspukt Edvidere skal impulsere idtræffe tilfældigt og uafhægigt af hiade * ) Hvis det geemsitlige atal impulser i tidsrummet er 0, så siges X at være Poissofordelt p ( ) med sadsylighedsfordelige (tæthedsfuktioe) f(x) = P(X = x) bestemt ved x f ( x) P( X x) e x! 0 for ellers x {,,,} 01 Middelværdie for p( ) er E ( X ) = og spredige er ( X ) I formulerige af de oveævte betigelser ka efter behov "et lille tidsrum t" erstattes med "e lille lægde ", "et lille areal A" eller "et lille volume V" *) Præcis formulerig: Følgede 3 betigelser skal være opfyldt: 1) Sadsylighede for etop é impuls i et meget lille tidsrum t er med tilærmelse proportioal med t P (Matematisk formulerig lim ( X 1 ) ( er e positiv kostat) t 0 t ) Sadsylighede for eller flere impulser i det meget lille tidsrum t er lille sammeliget med t P (Matematisk formulerig lim ( X 1 ) 0 ) t 0 t 3) Atal impulser i forskellige, ikke overlappede tidsrum er statistisk uafhægige E bevisskitse for sætige ka ses i Supplemet til statistiske grudbegreber afsit 9C Eksempel 910: Atal rever p meter i et tydt kobberkabel På e fabrik fremstilles kobberkabler af e bestemt tykkelse Mikroskopiske rever forekommer tilfældigt lags disse kabler Ma har erfarig for, at der i geemsit er 13 af de type rever p 10 meter kabel Bereg sadsylighede for, at der 1) ige ridser er i 1 meter tilfældigt udvalgt kabel ) er midst ridser i 1 meter tilfældigt udvalgt kabel 3) er højst 4 ridser i meter tilfældigt udvalgt kabel Fabrikke går u over til e ade og billigere produktiosmetode For at få et estimat for middelværdie ved de ye metode måltes atallet af rever på 1 kabelstykker på hver 10 meter Resultatere var Kabel r Atal rever ) Agiv på basis heraf et estimat for middelværdie af atal rever pr 10 m kabel 89

94 Vigtige diskrete fordeliger Løsig: X = atal rever i 1 meter kabel X atages Poissofordelt p ( ) (idet vi med tilærmelse ka atage, at betigelsere i sætig 9 er opfyldt (impuls er her ridser) Da det geemsitlige atal rever pr 1m kabel er 13 0! 13 1) P( X 0) e TI-Nspire: Statistik, Fordeliger, PoissoPdf(13,0), Resultat: 09 ) 1-PoissCdf(13, 0, 1) = 0348 P( X ) 1 P( X 1) 3) Y = atal rever i meter kabel Da der i geemsit er,46 rever i meter kabel, er 46 et estimat for Vi har derfor P( X 4) = poisscdf(46, 0, 4) = ) Der er i alt 94 rever i 1 kabelstykker på hver 10 meter Et estimat for er derfor ~ Hypotesetest og kofidesitervaller for Poissofordelt variabel I kapitel 5 geemgik vi ved e række eksempler de grudlæggede begreber for hypotesetestig og kofidesitervaller for é ormalfordelt variabel Disse begreber ka uædret overføres til hypotesetestig og kofidesitervaller for Possofordelt variabel Har ma rådighed over et program med kumuleret Poissofordelig ka testee geemføres eksakt (se oversigt 98) Eksempel 911 Esidet Poissotest I eksempel 910 betragtede vi mikroskopiske rever i et kobberkabel Fabrikke gik over til e ade og billigere produktiosmetode 1) Test, om de ye metode giver færre rever ed de gamle metode ) Forudsat, de ye metode giver sigifikat færre rever ed de gamle metode, skal ma a) Agiv et 95% kofidesiterval for middelværdie af atal rever pr 10 meter kabel b) Agiv et 95% kofidesiterval for middelværdie 1 af atal rever pr 10 meter kabel Løsig: 1) Lad X betege atallet af rever i 10 meter kabel ved y metode X atages Poissofordelt p( ), hvor vi i eksempel 98 fadt at et estimat for var ~ 94 Ved gammel metode er atal rever i 10 m kabel i middel μ 0 = Nulhypotese H 0 : mod de alterative hypotese H: PY ( 94) fås: TI-Nspire: P - værdi = PoissCdf(1476, 0, 94) =

95 97 Approksimatioer Da P - værdi < 005 forkastes ulhypotese (stærkt),dvs vi er sikre på, at middelatallet af rever er blevet formidsket ved at avede de ye metode a) oversigt 98 avedes 10 m kabel: m = 94 Øvre græse x: Løs ligige P( X x) = 0975 med hesy til x TI-Nspire: solve(poissocdf(94,0,x)=0975,x) x > 0 Resultatet blev x =1130 Nedre græse: Løs ligige P( X x) = 005 med hesy til x TI-Nspire: solve(poissocdf(94,0,x)=005,p) x > 0 Resultatet blev x = % Kofidesiterval: [750; 1130] Forklarig på formle: Udefor et 95% kofidesiterval ligger 5%, og af symmetrigrude ligger der,5% på hver side (jævfør figure) Jo midre de sade værdi af middelværdie er, jo midre er sadsylighede for, at geemsittet blev 94 b) 10 m kabel: Vi leder derfor i græse efter et x, så P( X x) = ; 65 ; APPROKSIMATIONER Vi har udertide beyttet os af, at det uder visse forudsætiger er muligt med e rimelig øjagtighed, at foretage approksimatioer, feks at approksimere e biomialfordelig eller e Poissofordelig med e ormalfordelig Dette ka give ogle simplere beregiger, eksempelvis år ma approksimerer e hypergeometrisk fordelig med e biomialfordelig eller år ma ved udregig af kofidesitervaller for biomialfordelig approksimerer med ormalfordelig I appedix 91 er agivet e samlet oversigt over de mulige approksimatioer 96 De geeraliserede hypergeometriske fordelig De hypergeometriske fordelig beyttes som model ved stikprøveudtagig ude tilbagelægig, hvor hvert elemet har ete e bestemt egeskab (defekt) eller ikke har dee egeskab (ikke defekt) Hvis der foreligger flere ed to egeskaber, feks udtagig af møtrikker, hvis diameter ete tilhører et givet toleraceiterval eller er for stor eller for lille, ka ma geeralisere de hypergeometriske fordelig Dette illustreres ved følgede eksempel: 91

96 Vigtige diskrete fordeliger Eksempel 91 Geeraliseret hypergeometrisk fordelig I e ure fides 1 kugler, hvoraf 5 er sorte, 4 er hvide og 3 er røde Vi betragter det tilfældige eksperimet: "Udtrækig af 6 kugler ude tilbagelægig og observatio af farve på kuglere Bereg sadsylighede for at få sorte, 3 hvide og 1 rød kugle LØSNING: Lad X 1 være atallet af sorte kugler, X være atallet af hvide kugler og X 3 være atallet af røde kugler Aalogt med begrudelse for de hypergeometriske fordelig fås: K(,) 5 K(,) 43 K(,) P( X1, X 3, X3 1) 013 K( 1, 6) Polyomialfordelige Biomialfordelige beyttes som model ved uafhægige getagelser af samme eksperimet Eksperimetet har to udfald succes eller ikke succes og der er e kostat sadsylighed for succes Hvis der foreligger flere ed to udfald, feks udtagig af møtrikker fra e løbede produktio, hvor diameter ete tilhører et givet toleraceiterval eller er for stor eller for lille, ka ma geeralisere til polyomialfordelige Idet formle for biomialfordelige ka skrives f x p x p x! p x p x! ( ) ( ) ( ) p x p x, hvor x x!( x)! x! x! p p og x x fås aalogt DEFINITION af polyomialfordelig Lad være et positivt helt tal, og lad p 1 p p k 1 og x x x hvor alle pér er positive 1 1 tal og alle xér er hele tal Sadsylighedsfordelige for e polyomialfordelt stokastisk variabel P( X x, X x,, X x ) 1 1 k k! x1 x p1 p p x! x! x! 1 k k ( X 1, X,, X k ) Dette illustreres ved følgede eksempel: Eksempel 911 Polyomialfordelige E stor produktio af glaskugler ideholder 40% sorte, 35% hvide og 5% røde kugler Vi betragter det tilfældige eksperimet: "Udtrækig af 6 kugler observatio af farve på kuglere Bereg sadsylighede for at få sorte, 3 hvide og 1 rød kugle LØSNING: Lad X 1 være atallet af sorte kugler, X være atallet af hvide kugler og X 3 være atallet af røde kugler Vi får u P( X!, X, X )!!! x k k er 9

97 98 OVERSIGT over cetrale formler i kapitel 9 98 Oversigt over cetrale formler i kapitel 9 X er biomialfordelt b(,p), hvor er kedt og p ukedt Givet stikprøveværdi x Kofidesiterval Forudsætiger Estimat for p 100 (1 - ) % kofidesiterval for parameter eksakt ~ x p edre græse: Løs ligig PX ( x) med hesy til p solve(biomcdf(,p,x, )=α/,p) p > 0 øvre græse: Løs ligig P( X x) med hesy til p solve(biomcdf(,p,0, x)=1-α/,p) p > 0 approksimatio med ormalfordelig 10 x x 10 ~ x p ~ p z ~ p ( 1 ~ p ) ~ ~ p ( 1 ~ p ) p p z 1 1 TI-Nspire;z-iterval for e adel TI89: F7: 1-prop Z-iterval Test af parameter p for biomialfordelt variabel Der foreligger e stikprøve på X Observeret stikprøveværdi x Sigifikasiveau er Y er biomialfordelt bp (, ), hvor er e give kostat 0 p 0 Alterativ hypotese H P - værdi Beregig H 0 forkastes H: p p 0 P( Y x) TI89+TI-Nspire:biomCdf(, p 0, x,) H: p p 0 P( Y x) TI89+TI-Nspire:biomCdf(, p 0,0, x) P-værdi < H: p p 0 P( Y x) for x p0 P( Y x) for x p0 som række 1 som række P-værdi < 1 93

98 Vigtige diskrete fordeliger X er Poissofordelt med middelværdi μ, hvor μ er ukedt Der optælles i alt m impulser i e stikprøve Kofidesiterval Forudsætig Estimat for parameter 100 (1 - ) % kofidesiterval for parameter Approksimatio m $ 10 μ = m edre græse x Løs ligig P( X x) med hesy til x solve(poissocdf(m,0, x)=α/,x) x > 0 øvre græse x: Løs ligig P( X x) 1 med hesy til x solve(biomcdf(,p,0, x)=1-α/,x) x > 0 μ = m m z m m z m 1 1 Test af parameter μ for Poissofordelt variabel Der optælles i alt m impulser i e stikprøve Sigifikasiveau er Y er Poissofordelt p( 0 ), hvor 0 er e give kostat Alterativ hypotese H H: 0 PY ( m) H: H: 0 PY ( m) P - værdi Beregig på TI 89 H 0 forkastes TI89+TI-Nspire: poisscdf ( 0, m, 1000) TI89+TI-Nspire: poisscdf ( 0, 0, m) 0 PY ( m) for x 0 som række 1 PY ( m) for x 0 som række P - værdi P-værdi 1 94

99 Opgaver til kapitel 9 OPGAVER Opgave 91 Ved e lodtrækig fordeles 3 gevister bladt 5 lodsedler E spiller har købt 5 lodsedler 1) Bereg sadsylighede for at spillere vider etop é gevist Lad de stokastiske variable X være bestemt ved X = atal gevister som spillere vider ) Fid og skitser tæthedsfuktioe for X 3) Bereg middelværdie for X Opgave 9 Fra et sædvaligt spil kort udtrækkes på tilfældig måde 3 kort ude tilbagelægig Bestem sadsylighedere for hver af hædelsere A: Der udtrækkes ku 8'ere B: Der udtrækkes lutter hjerter C: Der udtrækkes sorte og 1 rødt kort Opgave 93 På e udervisigsistitutio skal 105 studerede holde fest samme med deres 3 lærere Et festudvalg på 3 persoer vælges tilfældigt Bereg sadsylighede for at der kommer både lærere og studerede med i udvalget Opgave 94 I e kortbuke er der 6 kort, hvoraf etop 4 er spar Kortee fordeles i lige store buker A og B 1) Peter påstår, at sadsylighede for at buke A ideholder etop 3 spar er 487% Har Peter ret? ) Bereg sadsylighede for, at e af bukere ideholder etop 1 spar Opgave 95 E fabrikat fremstiller e bestemt type radiokompoeter Disse leveres i æsker med 30 kompoeter i hver æske E køber har de aftale med fabrikate, at hvis e æske ideholder 4 defekte kompoeter eller derover, ka købere returere æske, i modsat fald skal de godkedes Købere kotrollere hver æske ved e stikprøve, idet ha af æske udtager 10 kompoeter tilfældigt Lad X være atal defekte i stikprøve Der overvejes u to plaer: 1) Hvis X = 0, så godkedes æske, ellers udersøges æske ærmere ) Hvis X 1, så godkedes æske, ellers udersøges æske ærmere Hvad er sadsylighede for, at e æske, der ideholder etop 4 defekte kompoeter, bliver godkedt af købere ved metode 1 og ved metode Opgave 96 E tipskupo har 13 kampe med 3 mulige teg - 1, x og - for hver kamp E perso bestemmer teget, der skal sættes for hver kamp, ved tilfældig udtrækig af e seddel fra 3 sedler med tegee heholdsvis 1, x og Agiv sadsylighede for, at persoe opår etop 8 rigtige tippede kampe på si kupo 95

100 Vigtige diskrete fordeliger Opgave 97 I et elektrisk specialapparat idgår 30 kompoeter, som hver er idkapslet i et heliumfyldt hylster Bereg, idet sadsylighede for, at et kompoethylster lækker, er 0%, sadsylighede for, at midst ét af de 30 kompoethylstre lækker Opgave 98 E sypigetipper (M/K) deltog i tipig 4 gage i løbet af et år På hver tipskupo var der 13 kampe, ved hver af hvilke tippere ved systematisk gætig satte et af de 3 teg: 1, x, Bereg sadsylighede p for, at tippere det pågældede år tippede midst 00 kampe rigtigt Opgave 99 Bladt familier med 3 bør udvælges 50 familier tilfældigt Agiv sadsylighede for, at der i midst 8 af disse familier udelukkede er bør af samme kø Opgave 910 Ved e fabrikatio af plastikposer leveres disse i æsker med 100 poser i hver Ved e godkedelseskotrol af et parti plastikposer udtages og udersøges e tilfældigt udtaget æske, og partiet godkedes, såfremt æske højst ideholder é defekt pose Vi atager, at de løbede produktio af poser er således, at hver produktio med sadsylighede % giver e pose, der er defekt; vi vil seere formulere dette således, at produktioe er i statistisk kotrol med fejlsadsylighede p = % Hvor stor er sadsylighede for, at partiet uder disse omstædigheder accepteres? Opgave 911 Det er oplyst, at der for e give vaccie er 80% sadsylighed for, at de ved avedelse har de øskede virkig På et hospital foretoges vacciatio af 100 persoer med de pågældede vaccie Bereg sadsylighede for, at 15 eller færre af de foretage vacciatioer er ude virkig Opgave 91 Ved et køb af plastikbægre aftaltes med leveradøre, at det skal være e forudsætig for købet, at partiet godkedes ved e stikprøvekotrol Kotrolle udøves ved, at 100 bægre udtages tilfældigt af partiet og kotrolleres Partiet godkedes, såfremt ige af de 100 bægre er defekte Bereg sadsylighede for, at partiet godkedes, hvis det i alt ideholder 50 defekte bægre Opgave 913 E fabrikat får halvfabrikata hjem i partier på eheder Fra hvert parti udtages e stikprøve på 100 eheder og atallet af fejlagtige bladt disse oteres Hvis dette atal er midre ed eller lig med, accepteres hele partiet; i modsat fald udersøges partiet yderligere 1) Hvad er sadsylighede for, at et parti med e fejlprocet på 1 vil blive yderligere udersøgt ) Hvor stor er sadsylighede for, at et parti med e fejlprocet på 5 vil blive accepteret 96

101 Opgaver til kapitel 9 Opgave 914 E maskifabrikat påtæker at købe møtrikker af e bestemt type Ma beslutter sig til at købe et tilbudt parti af de ævte størrelse, såfremt e stikprøve på 150 møtrikker højst ideholder 4% defekte møtrikker 1) Bereg sadsylighede for, at partiet bliver godkedt af maskifabrikke, såfremt det ideholder a) 4% defekte møtrikker, b) 7,5% defekte møtrikker, ) Bestem, for hvilke procetdel defekte møtrikker det oveævte parti har 50% sadsylighed for at blive godkedt af maskifabrikke Opgave 915 E y vaccie formodes med e sadsylighed på midst 85% at have e forebyggede virkig over for e bestemt ifluezatype Før e truede ifluezaepedemi vaccieres et hospitalspersoale på 600 persoer med de pågældede vaccie 15 af disse bliver smittet af sygdomme Ka dette opfattes som e eksperimetel påvisig af, at vaccie er midre virksom ed vetet? Opgave 916 1) Atag, at e vis type af fostermisdaelse ormalt forekommer med hyppighede 164 tilfælde p fødsler Bereg sadsylighede for 3 eller flere fostermisdaelser bladt 56 fødsler ) For at udersøge om forholdee i et bestemt arbejdsmiljø forøger hyppighede af dee type misdaelse, udersøgte ma hyppighede af misdaelser for mødre, som uder graviditete havde haft de aktuelle type af arbejde, og fadt 3 misdaelser bladt 56 fødsler Ka de forøgede relative hyppighed i dette materiale skyldes tilfældigheder? Opgave 917 Udsættes platere af e bestemt sort roser for meldugssmitte, bliver i middel brøkdele p agrebet, hvor p er midst 00 E rosegarter fremavler e rosestamme, som ha påstår er mere modstadsdygtig over for meldugssmitte For at kotrollere dee påstad bliver 100 roser af de ye stamme udsat for meldugssmitte Det viser sig, at 1 roser bliver agrebet 1) Bekræfter dette resultat rosegarteres påstad? (Husk altid at aføre: Hvad X er Atagelser Nulhypotese Beregiger Koklusio) Hvis rosegartere har ret, skal ma ) Agiv et estimat ~ p for de ye stammes p 3) Agiv et 95% kofidesiterval for de ye stammes p Opgave 918 E fabrikat af chip til computere reklamerer med, at højst % af e bestemt type chip, som fabrikke seder ud på markedet er defekte Et stort computerfirma vil købe et meget stort parti af disse chip, hvis påstade er rigtigt For at teste påstade købes 1000 af dem Det viser sig, at 33 ud af de 1000 er defekte Ka fabrikates påstad på dee baggrud forkastes på sigifikasiveau 5%? 97

102 Vigtige diskrete fordeliger Opgave 919 E producet af billigt plastiklegetøj får mage klager over at e bestemt type legetøj er defekt ved salget Legetøjet sælges til butikkere i kasser på 10 stk, og som et led i e kvalitetetskotrol udtages 100 kasser og atallet x af defekt legetøj optaltes Følgede resultater fadtes: x Atal kasser Lad p være sadsylighede for at få et defekt stykke legetøj 1) Fid et estimat ~ p for p ) Agiv et 95% kofidesiterval for p Opgave 90 Af 1000 tilfældigt udvalgte patieter, der led af lugekræft, var 83 døde seest 5 år efter sygdomme blev opdaget Agiv på dette grudlag et 95% kofidesiterval for sadsylighede for at dø af dee sygdom seest 5 år efter at sygdomme bliver opdaget Opgave 91 E fabrikat af lommeregere vurderer, at ca 1% af de producerede lommeregere er defekte For at få e øjere vurderig heraf øskes udtaget e stikprøve, der er så stor, at radius i et 95% kofidesiterval for fejlprocete p er højst 05% Fid stikprøves størrelse Opgave 9 På e fabrik fremstilles gulvtæpper, som har størrelse 0 m Ved fabrikatioe er der geemsitlig 6 vævefejl pr 100 m klæde 1) Bereg sadsylighede for, at et tilfældigt gulvtæppe ige vævefejl har ) Bereg sadsylighede for, at et tilfældigt gulvtæppe højst har vævefejl Fabrikke køber e y væv For at få et estimat for middelværdie måltes atallet af vævefejl i 1 gulvtæpper hver på 0 m Resultatere var Gulvtæppe r Atal vævefejl ) Fid et estimat for middelværdie af atal vævefejl p 0 m klæde Opgave 93 Et radioaktivt præparat udergår geemsitligt 100 desitegratioer (søderdeliger) p miut Lad X betege atal desitegratioer i et sekud (som er lille i forhold til præparatets halverigstid) Fid P( X 1) 98

103 Opgaver til kapitel 9 Opgave 94 Ved e TV-fabrikatio optælles som led i e godkedelseskotrol atal loddefejl p 5 TVapparater Fabrikate øsker at få et overblik over atal loddefejl, og optalte derfor atal loddefejl på 4 tilfældigt udtage TV apparater Resultatet fremgår af skemaet: Atal loddefejl Atal TV apparater Lad X være atallet af loddefejl i 5 TV apparater 1) Agiv de sadsylighedsfordelig X approksimativt ka atages at følge, og giv et estimat for parametere i fordelige ) Bereg på basis af svaret i spørgsmål 1 sadsylighede for, at der på 5 tilfældigt udtage TV-apparater højst er i alt 18 loddefejl? Opgave 95 På et tekisk uiversitet er et cetralt edb-alæg i kostat brug Ma har erfarig for, at alægget i løbet af e 0 ugers periode har geemsitligt 7 maskistop Bereg sadsylighede p for, at alægget i e 4 ugers periode har midst ét maskistop Opgave 96 På e fabrik idtræffer i geemsit 7 ulykker om året Atag, at de forskellige ulykker idtræffer uafhægigt af hiade, og at de er ogelude jævt fordelt over året Bereg, idet et arbejdsår sættes lig med 48 uger, sadsylighede for at der i e uge idtræffer flere ed 3 ulykker Opgave 97 Til et bestemt telefoummer er der i løbet af aftee i middel 300 opkald i time Bereg sadsylighede for, at der i løbet af et miut er højst 8 opkald Opgave 98 E fabrikatio af fortiede plader fider sted ved e kotiuerlig elektrolytisk proces Umiddelbart efter produktioe kotrolleres for pladefejl Ma har erfarig for, at der i middel er 1 pladefejl hvert 5'te miut Bereg sadsylighede for, at der højst er 5 pladefejl ved e halv times produktio Opgave 99 Lastbiler med affald akommer tilfældigt og idbyrdes uafhægigt til e losseplads Lossepladses maksimale kapacitet er bereget til, at der i middel akommer 90 lastbiler p time Ledelse af pladse føler, at travlhede er blevet større i de sidste tid, således at atallet af lastbiler overskrider de maksimale kapacitet For at udersøge dette, foretages e optællig af lastbiler i perioder à 10 miutter Følgede resultater fremkom: ) Bekræfter disse resultater ledelses formodig? (Husk altid at aføre: Hvad X er Atagelser Nulhypotese Beregiger Koklusio) Forudsat ma ka vise, at ledelse har ret på et sigifikasiveau på 5%, skal ma ~ ) Agiv et estimat for middelværdie [lastbiler/time] 3) Agiv et 95% kofidesiterval for middelværdie [lastbiler/time] 99

104 Vigtige diskrete fordeliger Opgave 930 Nedeståede tabel viser fordelige af 400 volumeeheder med hesy til atal gærceller p volumeehed Atal gærceller Atal volumeeheder Lad X være atal gærceller p volumeehed Det atages, at X er e stokastisk variabel der er Poissofordelt p ( ) 1) Fid et estimat ~ for ) Agiv et 95% kofidesiterval for 3) Forudsat at X er Poissofordelt p ( ~ ) øskes bereget det forvetede atal volumeeheder, hvori der forekommer 5 gærceller (for x = 5) Opgave 931 Ved ispektio af e produktio med isolerig af kobberledig taltes der i løbet af 50 miutter i alt 11 isolerigsfejl Idet atallet af isolerigsfejl p 50 miutter atages at være Poissofordelt p ( 1 ), skal ma 1a) agive et estimat for 1 1b) agive et 95% kofidesiterval for 1 Det oplyses u, at ma i hver 5 miutters periode i de ovefor omtalte 50 miutters periode havde observeret følgede atal isolerigsfejl: Periode Atal fejl Idet atallet af isolerigsfejl p 5 miutter atages at være Poissofordelt p ( a) agive et estimat for b) agive et 95% kofidesiterval for ), skal ma Opgave 93 I e ure fides 10 røde kugler, 5 hvide kugler og 3 sorte kugler6 gage efter hiade optages tilfældigt e kugle fra ure Bestem sadsylighede for, at der i alt er optaget 1 rød, hvide og 3 sorte kugler, år 1) kuglere optages ude tilbagelægig ) kuglere optages med tilbagelægig Opgave 933 E virksomhed fabrikerer farvede glasklodser til dekoratiosbrug Defekte glasklodser frasorteres Ma har erfarig for, at af de frasorterede klodser har i middel 50% ku rever, 35% ku farvefejl, medes reste har begge disse fejl Bereg sadsylighede for, at af 1 tilfældige defekte klodser har 6 ku rever, 4 ku farvefejl og begge disse fejl Opgave 934 I et kortspil med de sædvalige 5 spillekort har e spiller modtaget 13 kort Agiv i procet med decimaler sadsylighede for, at 3 af disse er esser og 5 er billedkort 100

105 10 De rektagulære fordelig 10 ANDRE KONTINUERTE FORDELINGER 101 INDLEDNING Vi vil i dette kapitel kort orietere om e række fordeliger, som er vigtige i specielle sammehæge, 10 DEN REKTANGULÆRE FORDELING DEFINITION af rektagulær fordelig med parametree a og b Lad a og b være to reelle tal, hvor a<b Sadsylighedsfordelige for e kotiuert stokastisk variabel X med tæthedsfuktioe f (x) 1 for a xb bestemt ved f ( x) b a 0 ellers siges at være rektagulært fordelt rekt (a, b ) SÆTNING 101 ( Middelværdi og spredig for rektagulær fordelig ) a b b a De rektagulære fordelig har E( X) og ( X ) (a < b) 3 Bevis: E( X) V( X) b a a x b a dx x b a ( ba) b a b a b x x 3 ( b a) dx b a 3( b a) 1 b a Eksempel 101 Kotiuert variabel Lad rade af e roulette være ækvidistat iddelt efter e skala fra 0 til 1, jævfør figure Ved et roulettespil briges roulettes viser til at rotere, hvorefter de stadser ud for et tilfældigt pukt på skalae Lad X være det tal som roulettes viser peger på Idet X må kue atage ethvert tal mellem 0 og 1, må X være e kotiuert variabel Agiv tæthedsfuktio og fordeligsfuktio for X og skitser disse b a 101

106 10 Adre kotiuerte fordeliger Løsig: x Da P( 0 X x) for 0 x 1 1 er fordeligsfuktioe for X 0 for x 0 x F( x) for 0 x for x 1 Ved differetiatio fås tæthedsfuktioe 1 for 0 x 1 f ( x) 1 0 ellers 103 EKSPONENTIALFORDELINGEN I kapitel 7 betragtede vi atallet N af rever pr meter lags et kobberkabel Vi atog, at N var Poissofordelt Hvis vi i stedet havde betragtet afstade X mellem revere, havde vi fået e y stokastisk variabel, som må være kotiuert Som det fremgår af følgede sætig er X ekspoetialfordelt SÆTNING 10 Ekspoetialfordelig Lad W være e Poissofordelt stokastisk variabel Lad det geemsitlige atal impulser i e tidsehed være Lad X være tide idtil æste impuls X er da e kotiuert stokastisk variabel med sadsylighedsfordelige (tæthedsfuktioe) f ( x ) = P ( X = x) bestemt ved x 1 e for x0 f ( x) hvor 1 0 ellers X siges at være ekspoetialfordelt exp ( ) med parametere Middelværdie for exp ( ) er E(X) = og spredige er ( X ) Bevis: I tidsrummet fra x 0 til x 0 + x er der I geemsit [x 0 ; x 0 + x ] W er da Poissofordelt Idet X er tide fra é impuls til de æste, er [x 0 ; x 0 + x ] x p( x) P( X x) P( W 0) impulser Lad W være det aktuelle atal impulser i tidsrummet, da der ige impulser er i tidsrummet 10

107 103 Ekspoetialfordelige 0 ( x) x x x Da PW ( 0) e e, er P( X x) e 0! x Vi har derfor F( x) P( X x) 1 P( X x) 1e x Ved differetiatio fås tæthedsfuktioe: f ( x) F'( x) e Sættes 1 fås formle Bevis for middelværdi og spredig: E X x x x 1 1 ( ) e dx -e ( x 0 0 x V( X) E( X ) E( X) x e dx 0 -e x x x 0 Som det fremgår af beviset for sætig 10, er fordeligsfuktioe for e ekspoetialfordelt variabel bestemt ved udtrykket F( x) P( X x) x 1 e for x 0 0 ellers På edeståede graf er afbildet tæthedsfuktioe for ekspoetialfordeligere exp(10) og exp(0) 1 0,8 0,6 0,4 0, Fig 101 Ekspoetialfordeligere exp(1) og exp() 103

108 10Adre kotiuerte fordeliger Eksempel 10 Afstade mellem successive rever i kabel Vi betragter det i eksempel 1010 omtalte problem, hvor ma fadt, at atallet N af mikroskopiske rever i et kobberkabel er Poissofordelt Der var i geemsit 13 af de type rever pr 10 meter Lad X være afstade mellem to på hiade følgede rever Bereg sadsylighede for, at der er mere ed 1 meter mellem to rever Løsig 1 Da der i geemsit er 13 rever pr meter, må der i geemsit være 081 meter mellem 13 to rever Vi har derfor at X er ekspoetialfordelt med = P( X 1) 1 P( X 1) 1 1 e =e 0 93 Levetider I apparater, som består af elektroiske kompoeter (eksempelvis lommeregere), er der et meget rige mekaisk slid Apparatets fremtidige levetid vil derfor (æste ikke) afhæge af, hvor læge det har fugeret idtil u I sådae tilfælde vil ekspoetialfordelige erfarigsmæssigt være e god approksimativ model for apparatets levetid Det ka emlig vises, at ekspoetialfordelige er de eeste kotiuerte fordelig, som har oveævte egeskab (er ude hukommelse) Bevis: Lad X være ekspoetialfordelt med middelværdi da: P ( X a b) ( X a) P( X a bx a) P( X a) og lad b > a > 0 være vilkårlige kostater Der gælder a b P( X a b) e b =e P( X b) P( X a) e b Eksempel 103 Levetid for elektriske pærer Ma har erfarig for, at e bestemt type elektriske pærer har e "brædtid" T (målt i timer), som approksimativt er ekspoetialfordelt På basis af et stort atal måliger ved ma, at middellevetide er = 1500 timer 1) Hvor stor er sadsylighede for, at e tilfældig pære bræder over, ide de har været tædt i 100 timer? ) Fid sadsylighede for, at e tilfældig pære bræder i mere ed 1800 timer 3) E pære har brædt i 800 timer Hvad er sadsylighede for, at de bræder i midst 1800 timer mere 104

109 Løsig 1) PT ( ) F( ) e = = 551% ) PT ( ) F( ) e = 301% 106 De -dimesioale ormalfordelig 3) Da ekspoetialfordelige ige hukommelse har, vil svaret blive som i spørgsmål, dvs 301% 104 WEIBULLFORDELINGEN Hvis kompoetere i et elektroisk apparat ikke slides, dvs de fremtidige levetid ikke afhæger af de foregåede tid, er som ævt i afsit 103 ekspoetialfordelige veleget som model for apparatets levetid Hvis derimod de pågældede kompoeters evetuelle svigte afhæger af de forløbe tid, ka ma ofte med fordel beytte de i det følgede ævte Weibullfordelig som approksimativ model for apparatets levetid (model for apparatets pålidelighed) DEFINITION af Weibulfordelig Lad k og være positive tal Sadsylighedsfordelige for e kotiuert stokastisk variabel X med tæthedsfuktioe f ( x ) bestemt ved k f ( x) k 0 x k k 1 x e for x0 ellers siges at være Weibullfordelige wei( k, ) k 1 k 1 Det ka vises, at Weibullfordelige wei( k, ) har middelværdie E( X) ) og spredige ( X ) k k 1 k k Det ses, at Weibullfordelige ka opfattes som e geeralisatio af ekspoetialfordelige, idet wei( 1, ) exp( ) Såfremt levetidere for kompoeter i et apparat aftager jo lægere tid apparatet har været i fuktio (på grud af slid), ka ma beytte e Weibullfordelig med k > 1 som approksimativ model for apparatets levetid 1) Gammafuktioe 3A ( x) er defieret i Supplemet til statistiske grudbegreber 105

110 10Adre kotiuerte fordeliger 105 DEN LOGARITMISKE NORMALFORDELING Idefor det biokemiske eller biologiske område (forsøgsdyrs reaktiostid, cellevækst mv) er de stokastiske variabel X ikke ormalfordelt, me hvis ma foretager e logaritmisk trasformatio Y l X er Y (approksimativt) ormalfordelt Ma siger så, at X er logaritmisk ormalfordelt 1 l x 1 1 Tæthedsfuktioe for X er bestemt ved f ( x) for x > 0 x e Det ka vises, at mes Y l X har middelværdi og spredig har X middelværdi E( X) e e 1 og V( X) e e ( e 1) Nedefor er teget e logaritmisk ormalfordelig med middelværdi 8 og spredig 5 Logormal Distributio 0,15 0,1 Mea,Std dev 8,5 desity 0,09 0,06 0, x 106 DEN -DIMENSIONALE NORMALFORDELING Flerdimesioale fordeliger vil blive omtalt ærmere i kapitel 1 Her æves ude forklarig et eksempel herpå DEFINITION af -dimesioal ormalfordelig Lad, være reelle tal og, være positive tal Sadsylighedsfordelige for -dimesioal kotiuert stokastisk variabel (X 1,X ) med tæthedsfuktio bestemt ved 1 f ( x) 1 1 e 1 1 x x x x ( 1 ) 1 1 kaldes de -dimesioale ormalfordelig med parametree 1,, 1 og Det ka vises, at E( X ), E( X ), X ( ), ( ) og ( X, ) X 1 1 Grafe ses overfor X 1 106

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18 15 1 9 6 3 0 Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 17. udgave 016 FORORD Der er i dee bog søgt at give letlæst og askuelig fremstillig af de

Læs mere

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER med avedelse af TI 89 og Excel 8 5 9 6 3 0 Histogram for ph 6,9 7, 7,3 7,5 7,7 7,9 ph. udgave 0 FORORD Der er i dee bog søgt at give letlæst og askuelig

Læs mere

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18 15 1 9 6 3 0 Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 13 udgave 013 FORORD Der er i dee bog søgt at give letlæst og askuelig fremstillig af de statistiske

Læs mere

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i Normalfordeliger For at e stokastisk variabel X ka være ormalfordelt, skal X agive værdie af e eller ade målig, f.eks. tid, lægde, vægt, beløb osv. Notatioe er: Xi ~ N( μ, σ hvor i er observatiosummeret,

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Repetitio: Normalfordelige Ladmåliges fejlteori Lektio Trasformatio af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/udervisig/lf13 Istitut for Matematiske Fag Aalborg Uiversitet

Læs mere

antal gange krone sker i første n kast = n

antal gange krone sker i første n kast = n 1 Uge 15 Teoretisk Statistik, 5. april 004 1. Store tals lov Eksempel: møtkast Koverges i sadsylighed Tchebychevs ulighed Sætig: Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Statistik ved Bachelor-uddaelse i folkesudhedsvideskab Græseværdisætiger Det hadler om geemsit Statistikere elsker geemsit Det er oplagt e god ide at tage geemsit. Hvis jeg f.eks skal gætte på vægte af

Læs mere

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Epidemiologi og biostatistik. Forelæsig Uge, tirsdag. Niels Trolle Aderse, Afdelige for Biostatistik. Geerelt om kurset: - Formål - Forelæsiger - Øvelser - Forelæsigsoter - Bøger - EpiBasic: http://www.biostat.au.dk/teachig/software

Læs mere

9. Binomialfordelingen

9. Binomialfordelingen 9. Biomialfordelige 9.. Gekedelse Hvert forsøg ka ku resultere i to mulige udfald; succes og fiasko. I modsætig til poissofordelige er atallet af forsøg edeligt. 9.. Model X : Stokastisk variabel, der

Læs mere

Diskrete og kontinuerte stokastiske variable

Diskrete og kontinuerte stokastiske variable Diskrete og kotiuerte stokastiske variable Beroulli Biomial fordelig Negativ biomial fordelig Hypergeometrisk fordelig Poisso fordelig Kotiuerte stokastiske variable Uiform fordelig Ekspoetial fordelig

Læs mere

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning) Dages program Estimatio: Kapitel 9.4-9.7 Eksempler på middelrette og/eller kosistete estimator (de sidste fra sidste forelæsig) Ko desiterval for store datasæt kap. 9.4 Ko desiterval for små datasæt kap.

Læs mere

Generelle lineære modeller

Generelle lineære modeller Geerelle lieære modeller Regressiosmodeller med é uafhægig itervalskala variabel: Y e eller flere uafhægige variable: X,..,X k De betigede fordelig af Y givet X,..,X k atages at være ormal med e middelværdi,

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet. Matematik A Studetereksame Forsøg med digitale eksamesopgaver med adgag til iterettet Forberedelsesmateriale Vejledede opgave Forår 0 til stx-a-net MATEMATIK Der skal afsættes 6 timer af holdets sædvalige

Læs mere

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik. Epidemiologi og biostatistik Forelæsig Uge 1, torsdag. februar 006 ichael Væth, Afdelig for Biostatistik. Sammeligig af to middelværdier sikkerhedsitervaller statistisk test Sammeligig af to proportioer

Læs mere

Løsninger til kapitel 7

Løsninger til kapitel 7 Løsiger til kapitel 7 Opgave 7.1 a) HpoStat giver resultatet: Pop. varias er ukedt, me 30, så Normalf. bruges approksimativt = 54,400 s 1.069,90 = 00,000 0,95 49,868 58,93 Dette betder, at med 95% sikkerhed

Læs mere

Motivation. En tegning

Motivation. En tegning Motivatio Scatter-plot at det mådelige salg mod det måedlige reklamebudget. R: plot(salg ~ budget, data = salg) Økoometri Lektio Simpel Lieær Regressio salg 400 450 500 550 20 25 30 35 40 45 50 budget

Læs mere

Estimation ved momentmetoden. Estimation af middelværdiparameter

Estimation ved momentmetoden. Estimation af middelværdiparameter Statistik og Sadsylighedsregig 1 STAT kapitel 4.2 4.3 Susae Ditlevse Istitut for Matematiske Fag Email: susae@math.ku.dk http://math.ku.dk/ susae Estimatio ved mometmetode Idimellem ka det være svært (eller

Læs mere

x-klasserne Gammel Hellerup Gymnasium

x-klasserne Gammel Hellerup Gymnasium SANDSYNLIGHEDSREGNING OG KOMBINATORIK x-klassere Gammel Hellerup Gymasium Idholdsfortegelse SANDSYNLIGHEDSREGNING... 3 SANDSYNLIGHEDSFELT... 3 DE STORE TALS LOV... 4 Sadsyligheder og frekveser:... 4 STOKASTISK

Læs mere

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside : Statistiske test Efteråret 00 Jes Friis, AAU Hjemmeside : http://akaaudk/jfj Kotiuerte fordeliger Defiitio: Tæthedsfuktio E sadsylighedstæthedsfuktio på R er e itegrabel fuktio f : R [0; [ hvor f d = Defiitio:

Læs mere

Stikprøvefordelinger og konfidensintervaller

Stikprøvefordelinger og konfidensintervaller Stikprøvefordeliger og kofidesitervaller Stikprøvefordelige for middelværdi De Cetrale Græseværdi Sætig Egeskaber Ved Estimatore Kofidesitervaller t-fordelige Estimator og estimat E stikprøve statistik

Læs mere

Vejledende opgavebesvarelser

Vejledende opgavebesvarelser Vejledede opgavebesvarelser 1. Atal hæder er lig med K(52,5), altså 2598960. Ved brug af multiplikatiospricippet ka atal hæder med 3 ruder og 2 spar udreges som K(13, 3) K(13, 2), hvilket giver 22308.

Læs mere

Teoretisk Statistik, 9. februar Beskrivende statistik

Teoretisk Statistik, 9. februar Beskrivende statistik Uge 7 I Teoretisk Statistik, 9 februar 004 Beskrivede statistik Kategoriserede variable 3 Kvatitative variable 4 Fraktiler for ugrupperede observatioer 5 Fraktiler for grupperede observatioer 6 Beliggeheds-

Læs mere

Den flerdimensionale normalfordeling

Den flerdimensionale normalfordeling De flerdimesioale ormalfordelig Stokastiske vektorer Ved e stokastisk vektor skal vi forstå e vektor, hvor de ekelte kompoeter er sædvalige stokastiske variable. For de stokastiske vektor Y = Y,..., Y

Læs mere

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n Ladmåliges fejlteori Lektio 3 Estimatio af σ Dobbeltmåliger Geometrisk ivellemet Lieariserig - rw@math.aau.dk Istitut for Matematiske Fag Aalborg Uiversitet Repetitio: Middelværdi og Varias Sætig: Middelværdi

Læs mere

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ ) 3. februar 003 Epidemiologi og biostatistik. Uge, torag d. 3. februar 003 Morte Frydeberg, Istitut for Biostatistik. Type og type fejl Nogle specielle metoder: Test i RxC tabeller Test i x tabeller Fishers

Læs mere

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager Program Statistik og Sadsylighedsregig 2 Sadsylighedstætheder og kotiuerte fordeliger på R Helle Sørese Uge 6, madag Velkomme I dag: Praktiske bemærkiger Hvad skal vi lave på SaSt2? Sadsylighedstætheder

Læs mere

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk! Statistik Lektio 8 Parrede test Test for forskel i adele Test for es varias Gesy med flyskræk! Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og kviders

Læs mere

Elementær Matematik. Polynomier

Elementær Matematik. Polynomier Elemetær Matematik Polyomier Ole Witt-Hase 2008 Køge Gymasium Idhold 1. Geerelle polyomier...1 2. Divisio med hele tal....1 3. Polyomiers divisio...2 4. Polyomiers rødder....4 5. Bestemmelse af røddere

Læs mere

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6 Dee udgave er til geemkig på ettet. Boge ka købes for kr. 5 hos EH-Mat. E y og udvidet udgave med title»symbol- og formelskrivig«er udkommet september 00. Se mere om de her. Idholdsfortegelse Formelskrivig

Læs mere

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner Projekter: Kapitel 4 Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Kotiuitet og kotiuerte fuktioer Ord som kotiuert og kotiuerlig

Læs mere

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter Matematikkes mysterier - på et obligatorisk iveau af Keeth Hase 7. Ligiger, polyomier og asymptoter Hvad er e asymotote? Og hvorda fides de? 7. Ligiger, polyomier og asymptoter Idhold 7.0 Idledig 7.1 Udsag

Læs mere

Analyse 1, Prøve maj 2009

Analyse 1, Prøve maj 2009 Aalyse, Prøve 5. maj 009 Alle hevisiger til TL er hevisiger til Kalkulus (006, Tom Lidstrøm). Direkte opgavehevisiger til Kalkulus er agivet med TLO, ellers er alle hevisiger til steder i de overordede

Læs mere

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6. enote 5 enote 5 Determiater I dee enote ser vi på kvadratiske matricer. Deres type er altså for 2, se enote 4. Det er e fordel, me ikke absolut ødvedigt, at kede determiatbegrebet for (2 2)-matricer på

Læs mere

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik. 30. august 005 Epidemiologi og biostatistik. Forelæsig 3 Uge, torag d. 8. september 005 Michael Væth, Afdelig for Biostatistik. Mere om kategoriske data Test for uafhægighed I RxC tabeller Test for uafhægighed

Læs mere

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk! Test i to populatioer Hypotesetest for parrede observatioer Test for es varias Gesy med flyskræk! Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og

Læs mere

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik Noter om ombiatori, Kirste Roseilde, februar 008 Kombiatori Disse oter er e itrodutio til ombiatori og starter helt fra bude, så e del af det idledede er siert edt for dig allerede, me der ommer også hurtigt

Læs mere

og Fermats lille sætning

og Fermats lille sætning Projekter: Kaitel 0. Projekt 0. Modulo-regig, restklassegruer og Fermats lille sætig Projekt 0. Modulo-regig, restklassegruere ( { 0 }, ) og Fermats lille sætig Vi aveder moduloregig og restklasser mage

Læs mere

Projekt 1.3 Brydningsloven

Projekt 1.3 Brydningsloven Projekt 1.3 Brydigslove Når e bølge, fx e lysbølge, rammer e græseflade mellem to stoffer, vil bølge ormalt blive spaltet i to: Noget af bølge kastes tilbage (spejlig), hvor udfaldsvikle u er de samme

Læs mere

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros Brachevejledig ulykker idefor lager området Brachearbejdsmiljørådet for trasport og egros Baggrud Udersøgelser på lager- og trasportområdet har vist, at beskrivelse af hædelsesforløbet ved udfyldelse

Læs mere

Sandsynlighedsregning i biologi

Sandsynlighedsregning i biologi Om begrebet sadsylighed Sadsylighedsregig i biologi Hvis vi kaster e almidelig, symmetrisk terig, er det klart for de fleste af os, hvad vi meer, år vi siger, at sadsylighede for at få e femmer er 1/6.

Læs mere

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer Statistik Lektio 7 Hpotesetest og kritiske værdier Tpe I og Tpe II fejl Strke af e test Sammeligig af to populatioer 1 Tri I e Hpotesetest E hpotesetest består af 5 elemeter: I. Atagelser Primært hvilke

Læs mere

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave 14. 20. december 2007

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave 14. 20. december 2007 Mikroøkoomi, matematik og statistik Eksameshjemmeopgave 14. 20. december 2007 Helle Buzel, Tom Egsted og Michael H.J. Stæhr 14. december 2007 R E T N I N G S L I N I E R F O R E K S A M E N S H J E M M

Læs mere

Noter om kombinatorik, Kirsten Rosenkilde, februar 2008 1. Kombinatorik

Noter om kombinatorik, Kirsten Rosenkilde, februar 2008 1. Kombinatorik Noter om ombiatori, Kirste Roseilde, februar 008 Kombiatori Disse oter er e itrodutio til ombiatori og starter helt fra bude, så e del af det idledede er siert edt for dig allerede, me der ommer også hurtigt

Læs mere

Lys og gitterligningen

Lys og gitterligningen Fysik rapport: Lys og gitterligige Forfatter: Bastia Emil Jørgese.z Øvelse blev udført osdag de 25. jauar 202 samme med Lise Kjærgaard Paulse 2 - Bastia Emil Jørgese Fysik rapport (4 elevtimer), februar

Læs mere

Branchevejledning. ulykker indenfor. godschauffør. området. Branchearbejdsmiljørådet for transport og engros

Branchevejledning. ulykker indenfor. godschauffør. området. Branchearbejdsmiljørådet for transport og engros Brachevejledig ulykker idefor godschauffør området Brachearbejdsmiljørådet for trasport og egros Baggrud Udersøgelser på lager- og trasportområdet har vist, at beskrivelse af hædelsesforløbet ved udfyldelse

Læs mere

STATISTIKNOTER Simple normalfordelingsmodeller

STATISTIKNOTER Simple normalfordelingsmodeller STATISTIKNOTER Simple ormalfordeligsmodeller Jørge Larse IMFUFA Roskilde Uiversitetsceter Februar 1999 IMFUFA, Roskilde Uiversitetsceter, Postboks 260, DK-4000 Roskilde. Jørge Larse: STATISTIKNOTER: Simple

Læs mere

Konfidens intervaller

Konfidens intervaller Kofides itervaller Kofides itervaller for: Kofides iterval for middelværdi, varias kedt Kofides iterval for middelværdi, varias ukedt Kofides iterval for adel Kofides iterval for varias Bestemmelse af

Læs mere

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable Idholdsfortegelse Geerelt:...3 Stokastisk variabel:...3 Tæthedsfuktio/sadsylighedsfuktio for stokastisk variabel:...3 Fordeligsfuktio/sumfuktio for stokastisk variabel:...3 Middelværdi:...4 Geemsit:...4

Læs mere

Renteformlen. Erik Vestergaard

Renteformlen. Erik Vestergaard Reteformle Erik Vestergaard 2 Erik Vestergaard www.matematikfysik.dk Erik Vestergaard, 2010. Billeder: Forside: istock.com/ilbusca Side 4: istock.com/adresrimagig Desude ege illustratioer. Erik Vestergaard

Læs mere

Undersøgelse af numeriske modeller

Undersøgelse af numeriske modeller Udersøgelse af umeriske modeller Formål E del af målsætige med dette delprojekt er at give kedskab til de begræsiger, fejl og usikkerheder, som optræder ved modellerig. I de forbidelse er følgede udersøgelse

Læs mere

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol Simpel Lieær Regressio Opsplitig af variatioe Determiatios koefficiet Variasaalse F-test Model-kotrol Opbgig af statistisk model Specificer model Ligiger og atagelser Estimer parametre Modelkotrol Er modelle

Læs mere

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504) Gamle eksamesopgaver Diskret Matematik med Avedelser (DM72) & Diskrete Strukturer(DM504) Istitut for Matematik& Datalogi Syddask Uiversitet, Odese Alle sædvalige hjælpemidler(lærebøger, otater etc.), samt

Læs mere

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger Faculty of Life Scieces Program Esidet variasaalyse Normalfordelige Claus Ekstrøm E-mail: ekstrom@life.ku.dk Esidet variasaalyse (oe-way ANOVA) Hvilke type data? Hvad er problemstillige? Variatio mellem

Læs mere

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion Statistik 8. gag 1 KONIDENSINTERVALLER Kofidesitervaller: kapitel 11 Valg og test af fordeligsfuktio Statistik 8. gag 11. KONIDENS INTERVALLER Et kofides iterval udtrykker itervallet hvori de rigtige værdi

Læs mere

Bjørn Grøn. Analysens grundlag

Bjørn Grøn. Analysens grundlag Bjør Grø Aalyses grudlag Aalyses grudlag Side af 4 Idholdsfortegelse Kotiuerte og differetiable fuktioer 3 Differetial- og itegralregiges udviklig 5 3 Hovedsætiger om differetiable fuktioer 8 Opgaver til

Læs mere

Program. Middelværdi af Y = t(x ) Transformationssætningen

Program. Middelværdi af Y = t(x ) Transformationssætningen Program Statistik og Sadsylighedsregig 2 Trasformatio af kotiuerte fordeliger på R, flerdimesioale kotiuerte fordeliger, mere om ormalfordelige Helle Sørese Uge 7, osdag I formiddag: Opfølgig på trasformatiossætige

Læs mere

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353 Takegagskompetece Hesigte med de følgede afsit er først og fremmest at skabe klarhed over de mere avacerede regeregler i skole og give resultatet i de almee form, der er karakteristisk for algebra. Vi

Læs mere

DATV: Introduktion til optimering og operationsanalyse, 2007. Følsomhed af Knapsack Problemet

DATV: Introduktion til optimering og operationsanalyse, 2007. Følsomhed af Knapsack Problemet DATV: Itroduktio til optimerig og operatiosaalyse, 2007 Følsomhed af Kapsack Problemet David Pisiger, Projektopgave 1 Dette er de første obligatoriske projektopgave på kurset DATV: Itroduktio til optimerig

Læs mere

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset. STATISTIK Skriftlig evaluerig, 3. semester, madag de 30. auar 006 kl. 9.00-3.00. Alle hælpemidler er tilladt. Opgaveløsige forsyes med av og CPR-r. OPGAVE Ved e produktio af viduer er der mulighed for,

Læs mere

GENEREL INTRODUKTION.

GENEREL INTRODUKTION. Study Guide til Matematik C. OVERSIGT. Dee study guide ideholder følgede afsit - Geerel itroduktio. - Emeliste. - Eksame. - Bilag. Udervisigsmiisteriets bekedtgørelse for matematik C. GENEREL INTRODUKTION.

Læs mere

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger Faculty of Life Scieces Program Populatioer og stikprøver Claus Ekstrøm E-mail: ekstrom@life.ku.dk Praktiske oplysiger Populatioer og stikprøver Data Datatyper Visualiserig Cetrum og spredig af e fordelig

Læs mere

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18 15 1 9 6 3 0 Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 15.b udgave 015 FORORD Der er i denne bog søgt at give letlæst og anskuelig fremstilling af

Læs mere

DATV: Introduktion til optimering og operationsanalyse, 2007. Bin Packing Problemet

DATV: Introduktion til optimering og operationsanalyse, 2007. Bin Packing Problemet DATV: Itroduktio til optimerig og operatiosaalyse, 2007 Bi Packig Problemet David Pisiger, Projektopgave 2 Dette er de ade obligatoriske projektopgave på kurset DATV: Itroduktio til optimerig og operatiosaalyse.

Læs mere

MOGENS ODDERSHEDE LARSEN. Fourieranalyse

MOGENS ODDERSHEDE LARSEN. Fourieranalyse MOGENS ODDERSHEDE LARSEN Fourieraalyse. udgave 7 FORORD Dette otat giver e kort idførig i teorie for fourierrækker og fouriertrasformatio. Det forudsættes i dette otat, at ma har rådighed over matematiklommeregere

Læs mere

Dagens forelæsning. Claus Munk. kap. 1-3. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Dagens forelæsning. Claus Munk. kap. 1-3. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro Dages forelæsig Grudlæggede itroduktio til obligatioer Claus Muk kap. - 3 Betaligsrækker og låeformer Det daske obligatiosmarked Effektive reter 2 Obligatioer Grudlæggede Itro Obligatioer Grudlæggede Itro

Læs mere

Claus Munk. kap. 1-3

Claus Munk. kap. 1-3 Claus Muk kap. 1-3 1 Dages forelæsig Grudlæggede itroduktio til obligatioer Betaligsrækker og låeformer Det daske obligatiosmarked Pris og kurs Effektive reter 2 1 Obligatioer Grudlæggede Itro Debitor

Læs mere

Sandsynlighedsregning

Sandsynlighedsregning Sadsylighedsregig E ote om sadsylighedsregig. Via basal sadsylighedsregig gøres læsere klar til forstå biomialfordelige. Herik S. Hase, Sct. Kud Versio 5.0 Opgaver til hæftet ka hetes her. PDF Facit til

Læs mere

StudyGuide til Matematik B.

StudyGuide til Matematik B. StudyGuide til Matematik B. OVERSIGT. Dee study guide ideholder følgede afsit Geerel itroduktio. Emeliste. Eksame. Bilag 1: Udervisigsmiisteriets bekedtgørelse for matematik B. Bilag 2: Bilag 3: Uddrag

Læs mere

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18 15 1 9 6 3 0 Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 15. udgave 015 FORORD Der er i denne bog søgt at give letlæst og anskuelig fremstilling af

Læs mere

Sammenligning af to grupper

Sammenligning af to grupper Sammeligig af to gruer Reetitio, heruder om kritiske værdier Sammeligig af to gruer Sammeligig af to middelværdier Sammeligig af to adele Sammeligig af to variaser yoteser og hyotesetest. E hyotese er

Læs mere

Modul 14: Goodness-of-fit test og krydstabelanalyse

Modul 14: Goodness-of-fit test og krydstabelanalyse Forskigsehede for Statistik ST01: Elemetær Statistik Bet Jørgese Modul 14: Goodess-of-fit test og krydstabelaalyse 14.1 Idledig....................................... 1 14.2 χ 2 -test i e r c krydstabel.............................

Læs mere

Asymptotisk optimalitet af MLE

Asymptotisk optimalitet af MLE Kapitel 4 Asymptotisk optimalitet af MLE Lad Y 1, Y 2,... være uafhægige, idetisk fordelte variable med værdier i et rum (Y,K). Vi har givet e model (ν θ ) θ Θ for fordelige af Y 1 (og dermed også for

Læs mere

Sandsynlighedsteori 1.2 og 2 Uge 5.

Sandsynlighedsteori 1.2 og 2 Uge 5. Istitut for Matematiske Fag Aarhus Uiversitet De 27. jauar 25. Sadsylighedsteori.2 og 2 Uge 5. Forelæsiger: Geemgage af emere karakteristiske fuktioer og Mometproblemet afsluttes, og vi starter på afsittet

Læs mere

Vejledende besvarelser til opgaver i kapitel 15

Vejledende besvarelser til opgaver i kapitel 15 Vejledede besvarelser til opgaver i apitel 5 Opgave a) De teststatistier, ma aveder til at teste om to middelværdier er es, består af et estimat på forselle mellem middelværdiere,, divideret med et udtry

Læs mere

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen TEKST NR 435 2004 Basisstatistik 2. udgave Jørge Larse August 2006 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING

Læs mere

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier Noter om polyomier, Kirste Rosekilde, Marts 2006 1 Polyomier Disse oter giver e kort itroduktio til polyomier, og de fleste sætiger æves ude bevis. Udervejs er der forholdsvis emme opgaver, mes der til

Læs mere

Estimation og test i normalfordelingen

Estimation og test i normalfordelingen af Birger Stjerholm Made Samfudlitteratur 07 Etimatio og tet i ormalfordelige Dee tekt ideholder et overblik over ogle grudlæggede pricipper for etimatio og tet i ormalfordelige i hyppigt forekommede ituatioer:

Læs mere

Begreber og definitioner

Begreber og definitioner Begreber og defiitioer Daske husstades forbrug på de medierelaterede udgiftsposter stiger og udgør i 2012*) 11,3 % af husstadees samlede forbrug mod 5,5 % i 1994. For husstade med de laveste idkomster

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Dages program Kvatitative metoder De multiple regressiosmodel 6. februar 007 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.- 3.+appedix E.) Defiitio og motivatio Fortolkig af

Læs mere

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test: Statistik for biologer 005-6, modul 7: Tests for forskel i cetral tedes for data på ordial- og itervalskala M7, slide M7, slide Typer af statistiske test: Parametrisk statistik: - Tester for forskel i

Læs mere

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006 Dages program Økoometri De multiple regressiosmodel 5. februar 006 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.-3.3+appedix E.-E.) Defiitio og motivatio Fortolkig af parametree

Læs mere

Bestemmelse af vandføring i Østerå

Bestemmelse af vandføring i Østerå Bestemmelse af vadførig i Østerå Geerelt varierer vadstade og vadførige i daske vadløb over året. Normalt er vadførige lille om sommere for derpå at øge om efteråret. Om vitere ses ormalt de højeste vadføriger

Læs mere

Morten Frydenberg version dato:

Morten Frydenberg version dato: Morte Frdeberg versio dato: 4--4 Itroduktio til kurset Statistik Forelæsig Morte Frdeberg, Sektio for Biostatistik af Biostatistik dele af. semester kurset. Statistiske modeller Biomialfordelige Normalfordelige

Læs mere

Længde [cm] Der er frit vandspejle i sandkassen. Herudover er sandkassen åben i højden cm i venstresiden og 0-20 cm i højresiden.

Længde [cm] Der er frit vandspejle i sandkassen. Herudover er sandkassen åben i højden cm i venstresiden og 0-20 cm i højresiden. Vadtrasportmodel Formål For beregig af vadtrasporte i sadkasse er der lavet e boksmodel. Formålet med boksmodelle er at beskrive vadtrasporte i sadkasse. Herover er formålet at bestemme de hydrauliske

Læs mere

MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER

MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18. udgave 2017 FORORD Der er i denne bog søgt at give letlæst og anskuelig fremstilling af de statistiske grundbegreber til brug ved en indledende undervisning

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1 Økoometri 1 Iferes i de lieære regressiosmodel 9. september 006 Økoometri 1: F7 1 Dages program Opsamlig af hemmeopgave om Mote Carlo eksperimeter Mere om hypotesetest: Ekelt lieær restriktio på koefficieter

Læs mere

Introduktion til Statistik

Introduktion til Statistik Itroduktio til Statistik 4. udgave Susae Ditlevse og Helle Sørese Susae Ditlevse, susae@math.ku.dk Helle Sørese, helle@math.ku.dk Istitut for Matematiske Fag Købehavs Uiversitet Uiversitetsparke 5 2100

Læs mere

Introduktion til uligheder

Introduktion til uligheder Itroduktio til uligheder, marts 0, Kirste Rosekilde Itroduktio til uligheder Dette er e itroduktio til ogle basale uligheder om det aritmetiske geemsit, det geometriske geemsit, det harmoiske geemsit og

Læs mere

RESEARCH PAPER. Nr. 2, En model for lagerstørrelsen som determinant for købs- og brugsadfærden for et kortvarigt forbrugsgode.

RESEARCH PAPER. Nr. 2, En model for lagerstørrelsen som determinant for købs- og brugsadfærden for et kortvarigt forbrugsgode. RESEARCH PAPER Nr., 005 E model for lagerstørrelse som determiat for købs- og brugsadfærde for et kortvarigt forbrugsgode af Jørge Kai Olse INSTITUT FOR AFSÆTNINGSØKONOMI COPENHAGEN BUSINESS SCHOOL SOLBJERG

Læs mere

EGA Vejledning om EGA og monotont arbejde

EGA Vejledning om EGA og monotont arbejde EGA og mootot arbejde 04/09/02 14:27 Side 1 Orgaisatioer repræseteret i Idustries Brachearbejdsmiljøråd: Arbejdstagerside: Arbejdsgiverside: Dask Metal Specialarbejderforbudet Kvideligt Arbejderforbud

Læs mere

Talfølger og -rækker

Talfølger og -rækker Da Beltoft og Klaus Thomse Aarhus Uiversitet 2009 Talfølger og -rækker Itroduktio til Matematisk Aalyse Zeos paradoks om Achilleus og skildpadde Achilleus løber om kap med e skildpadde. Achilleus løber

Læs mere

TEKST NR 435 2004. TEKSTER fra IMFUFA

TEKST NR 435 2004. TEKSTER fra IMFUFA TEKST NR 435 2004 Basisstatisti 2. udgave Jørge Larse August 2006 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING

Læs mere

Georg Mohr Konkurrencen Noter om uligheder. Søren Galatius Smith

Georg Mohr Konkurrencen Noter om uligheder. Søren Galatius Smith Georg Mohr Kokurrece Noter om uligheder Søre Galatius Smith. juli 2000 Resumé Kapitel geemgår visse metoder fra gymasiepesum, som ka bruges til at løse ulighedsopgaver, og ideholder ikke egetligt yt stof.

Læs mere

Projekt 2.3 Det gyldne snit og Fibonaccitallene

Projekt 2.3 Det gyldne snit og Fibonaccitallene Projekter: Kapitel Projekt.3 Det glde sit og Fiboaccitallee Forslag til hvorda klasses arbejde med projektet ka tilrettelægges: Forløbet:. Præsetatio af emet med vægt på det glde sit.. Grppere arbejder

Læs mere

- et værktøj til fejlrettende QR-koder. Projekt 0.3 Galois-legemerne. Indhold. Hvad er matematik? A, i-bog

- et værktøj til fejlrettende QR-koder. Projekt 0.3 Galois-legemerne. Indhold. Hvad er matematik? A, i-bog Projekt 0.3 Galois-legemere GF é ëp û - et værktøj til fejlrettede QR-koder Idhold De karakteristiske egeskaber ved de tre mest almidelige talsystemer, og... De kommutative, associative og distributive

Læs mere

Rettevejledning til HJEMMEOPGAVE 1 Makro 1, 2. årsprøve, foråret 2007 Peter Birch Sørensen

Rettevejledning til HJEMMEOPGAVE 1 Makro 1, 2. årsprøve, foråret 2007 Peter Birch Sørensen Rettevejledig til HJEMMEOPGAVE Makro, 2. årsprøve, foråret 2007 Peter Birch Sørese Opgave... Udsaget er forkert. De omtalte skatteomlægig må atages at øge beskæftigelse p.gr.a. e positiv substitutioseffekt

Læs mere

Termodynamik. Indhold. Termodynamik. Første og anden hovedsætning 1/18

Termodynamik. Indhold. Termodynamik. Første og anden hovedsætning 1/18 ermodyamik. Første og ade hovedsætig /8 ermodyamik Idhold. Isoterme og adiabatiske tilstadsædriger for gasser...3 3. ermodyamikkes. hovedsætig....5 4. Reversibilitet...6 5. Reversibel maskie og maksimalt

Læs mere

6 Populære fordelinger

6 Populære fordelinger 6 Populære fordeliger I apitel 4 itroducerede vi stoastise variabler so e åde at repræsetere udfald af et esperiet på. De stoastise variabler ue være både disrete (fx terigslag) og otiuerte (fx vareægder).

Læs mere

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger. Eksamesspørgsmål mac7100 maj/jui 013. Spørgsmål 1: Ligiger Du skal redegøre for løsig af ligiger og heruder behadle omformigsreglere for ligiger. Giv eksempler på hvorda forskellige ligigstyper (lieære,

Læs mere