IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

Størrelse: px
Starte visningen fra side:

Download "IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen"

Transkript

1 TEKST NR Basisstatistik 2. udgave Jørge Larse August 2006 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING OG ANVENDELSER

2 IMFUFA Roskilde Uiversitetsceter Postboks 260 DK-4000 Roskilde Jørge Larse: BASISSTATISTIK, 2. udgave t f m imfufa@ruc.dk w imfufa.ruc.dk IMFUFA tekst r sider iss Erstatter IMFUFA tekst r Dee bog er udarbejdet til brug som udervisigsmateriale til et idledede kursus i statistik og statistiske modeller. Boge beskæftiger sig med simple eksempler på statistiske modeller. Statistiske modeller er e særlig type matematiske modeller som bruges for at beskrive talmaterialer som er behæftet med e eller ade form for tilfældig variatio. Der præseteres e del af de simple og klassiske modeller for bladt adet biomialfordelte, poissofordelte og ormalfordelte observatioer, me der er også eksempler på mere komplicerede modeller så som logistisk regressio og multiplikative poissomodeller. I alle tilfælde er der illustrative geemregede eksempler. Når ma beskæftiger sig med statistik og statistiske metoder, har ma brug for hesigtsmæssige rege- og tegeredskaber. I ærværede fremstillig er idføjet små afsit der viser hvorda ma ka rege og tege med brug af programmet R (se http: // August 2006: rettet ogle fejl og foretaget adskillige typografiske justeriger.

3 Idhold Idledig 7 1 Biomialfordelige Et eksempel og e statistisk model Biomialkoefficieter Egeskaber ved biomialfordelige Reg og teg Opgaver De simple biomialfordeligsmodel Estimatio af parametere p E simpel statistisk hypotese Kvotietteststørrelse Reg og teg Opgaver Sammeligig af biomialfordeliger Modelle Hypoteseprøvig Det eksakte test i e 2 2-tabel Reg og teg Opgaver Normalfordelige Udledig af ormalfordelige Egeskaber ved ormalfordelige Reg og teg Opgaver Estikprøveproblemet i ormalfordelige Estimatio af µ og σ

4 4 Idhold 5.2 Test af hypotese om middelværdie Histogrammer og fraktildiagrammer Reg og teg Opgaver Tostikprøveproblemer i ormalfordelige Tostikprøveproblemet med uparrede observatioer Tostikprøveproblemet med parrede observatioer Reg og teg Opgaver Esidet variasaalyse Estimatio af parametree Hypotese om es grupper Bartletts test for variashomogeitet Reg og teg Opgaver Simpel lieær regressiosaalyse Præsetatio af modelle Estimatio af parametree Parameterestimateres middelfejl E ade formulerig af modelle Modelkotrol Test af hypoteser om lijes parametre Reg og teg Opgaver Multipel lieær regressiosaalyse Estimatio af parametree Modelkotrol Udvælgelse af baggrudsvariable Reg og teg Opgaver Logistisk regressio Grudmodelle E dosis-respos model Estimatio Modelkotrol

5 Hypoteser om parametree Reg og teg Opgaver Poissofordelige Udledig Defiitio og egeskaber Afrudig Opgaver E- og flerstikprøveproblemer i poissofordelige Estikprøveproblemet Sammeligig af to poissofordeliger Et sværere eksempel Reg og teg Opgaver Multiplikative poissomodeller Præsetatio af eksemplet: Lugekræft i Fredericia Modelopstillig De multiplikative model Es byer? E ade mulighed Sammeligig af de to fremgagsmåder Om teststørrelser Reg og teg Multiomialfordelige De grudlæggede multiomialfordeligsmodel Sammeligig af multiomialfordeliger Reg og teg Opgaver Tosidede kotigestabeller Grudmodelle Uafhægighedshypotese Jævførig med adre tilsvarede modeller Reg og teg Opgaver

6 6 Idhold 16 Et større eksempel: Torsk i Østersøe Præsetatio af eksemplet Hardy-Weiberg ligevægt Hypotese om Hardy-Weiberg ligevægt E samlet model Reg og teg Referecer 223 Kort om statistikprogrammet R 225 Tabeller 227 Stikord 235

7 Idledig Dee bog beskæftiger sig med simple eksempler på statistiske modeller. Statistiske modeller er e særlig type matematiske modeller som bruges for at beskrive talmaterialer som er behæftet med e eller ade form for tilfældig variatio. De statistiske modellers force er at de ka bruges til at skille det systematiske fra det tilfældige. Der melder sig forskellige slags spørgsmål i forbidelse med statistiske modeller: hvorda ser modellere ud, og hvad er det for ogle matematiske igredieser der idgår? hvorda fider ma på e model der ka bruges i e give situatio? hvad stiller ma så op med modelle i forhold til de kokrete tal? hvad er det for typer af spørgsmål ma ka stille til e statistisk model, og hvad er det for typer af svar ma får? Disse spørgsmål diskuteres idgåede. Der præseteres ogle af de simple og klassiske modeller for bladt adet biomialfordelte, poissofordelte og ormalfordelte observatioer, me der er også eksempler på mere komplicerede modeller så som logistisk regressio og multiplikative poissomodeller. I alle tilfælde er der illustrative geemregede eksempler. Fremstillige er baseret på likelihood-metode hvis grudlæggede idéer præseteres omhyggeligt; derimod må vi af tekiske grude give afkald på de matematiske beviser for metodes fortræffeligheder. Allerede e hastig geembladre af boge vil måske give aledig til bekymrede spørgsmål om hvorfor der er så meget matematik, og om det u også virkelig er ødvedigt med alle de formler. Der er flere forskellige svar herpå: 1. Et dårligt, me dog ikke uvæsetligt svar er at boge skal bruges som kursusmateriale på et kursus med status af matematikholdigt kursus. 2. Statistiske modeller er e uderafdelig af matematiske modeller, og det ka derfor ikke udre at modellere og metodere formuleres i matematiksprog. For bare at forstå e give statistisk model og des relatio til de virkelige problemstillig er det ødvedigt med e vis matematik-vathed, og hvis ma skal kue arbejde med og tilpasse modelle og forholde sig kritisk til des fuktio som model, 7

8 8 Idledig fordres edu flere matematikkompetecer. Hvis ma derfor føler sig alvorligt skræmt af de mage formlers tilstedeværelse, skulle ma måske søge professioel hjælp, ete til at få løst sie statistiske problemer eller til at få et bedre forhold til matematik. 3. Ét er at få at vide at ma ud fra formel A ka deducere formel B, oget adet er at have set hvorda det foregår, oget tredje er selv at have reget det igeem, og oget fjerde er selv at have udledt e deduktio af B fra A. De første mulighed ka ikke være eerådede i oget udervisigsforløb i matematik eller et matematikbaseret fag, og af praktiske og tidsmæssige grude ka ma ikke basere et helt udervisigsforløb på de fjerde mulighed. Mulighed to bør altid idgå i et udervisigsforløb, og ærværede bog ideholder derfor e del geemregede matematiske udlediger. 4. Faget statistik har i ogle sammehæge et lidt blakket ry (»ma ka vise alt med statistik, også det modsatte«), og bladt adet af de grud er det vigtigt i e itroduktio til faget også at klargøre hvor der er tale om idiskutable matematiske deduktioer, og hvor der er grud til at være på vagt, eller sagt på e ade måde: at tydeliggøre fagets bladig af vedtage grudpricipper, eksakt videskab og ikke spor eksakt hådværk. Matematik idgår på uudværlig vis i alle tre dele. Når ma beskæftiger sig med statistik og statistiske metoder, har ma brug for hesigtsmæssige rege- og tegeredskaber. Mage af de grudlæggede modeller ka ude vaskeligheder aalyseres med e almidelig lommereger som regeredskab og med blyat og teret papir til tegiger, me så sart modellere bliver lidt mere idviklede, er det e fordel at beytte e computer med et statistikprogram. I ærværede fremstillig er idføjet små afsit med overskrifte»reg og teg«der viser hvorda ma ka rege og tege med programmet R. R er et freeware program, se Vi giver ikke e lærebogsagtig præsetatio af R. De bedste måde at lære R på er formetlig ved e kombiatio af at se hvorda adre har gjort og selv at prøve sig frem, og udervejs bør ma beytte o-lie hjælpe (som er relativt god). Det er dog ok yttigt med e ultrakort itroduktio, så e såda gives på side 225.

9 1 Biomialfordelige Biomialfordeligsmodeller ka komme på tale i situatioer af følgede art: Ma har et bestemt elemetarforsøg der ka resultere i et af to mulige udfald som vi kalder 1 og 0 (eller Gustig og Ikke-gustig, eller Succes og Fiasko). Det er bestemt af tilfældigheder om elemetarforsøget giver det ee eller det adet udfald. Ma udfører getagelser af elemetarforsøget, hvor er et på forhåd fastlagt tal. Derefter ma tæller op hvor mage af de getagelser der giver udfaldet 1. Resultatet bliver et atal y der i sages atur er et heltal mellem 0 og. De forskellige mulige værdier af y vil idtræffe med visse sadsyligheder der afhæger af tilfældighedsmekaismes ærmere idretig. Det samlede forsøg, altså det som består af de elemetarforsøg og som resulterer i atallet y, kaldes et biomialforsøg. 1.1 Et eksempel og e statistisk model Her er et eksempel som vi vil bruge flere gage (eksemplet er hetet fra [16]): I e udersøgelse af isekters reaktio på isektgifte pyrethrum har ma udsat ogle rismelsbiller, Tribolium castaeum, for forskellige mægder gift og derpå set hvor mage der var døde efter 13 dages forløb. Bladt adet blev 144 ha-biller udsat for e giftpåvirkig på 0.20 mg/cm 2 ; af disse døde de 43 i løbet af de fastsatte periode. Her ka vi sige at et elemetarforsøg består i at udsætte é ha-bille for giftpåvirkige 0.20 mg/cm 2 og så se om de er død eller ej efter 13 dage (dvs.»død«1»gustigt udfald«). Vi vil opstille e matematisk model for de beskreve situatio. Vi deler ræsoemetet op i e række pukter: 1. For hvert elemetarforsøg idfører vi e såkaldt idikatorvariabel X der agiver om forsøget giver et 0 eller et 1. Idikatorvariable hørede til elemetarforsøg r. j er X j : 1 hvis bille r. j dør X j = 0 hvis bille r. j ikke dør 9

10 10 Biomialfordelige 2. Det samlede atal døde biller ka da skrives som Y = X 1 +X 2 + +X. I eksemplet keder vi ikke de ekelte X j -er, me ku Y; Y har værdie y = Idikatorvariablee X 1, X 2,..., X er stokastiske variable. E stokastisk variabel er kort fortalt et symbol der repræseterer det tilfældige udfald af et bestemt tilfældighedseksperimet. Om X j -ere atages det at a) de har alle de samme sadsylighed p for at atage værdie 1, det vil sige P(X j = 1) = p for ethvert j, b) de er stokastisk uafhægige, det vil sige for vilkårlige x 1, x 2,..., x gælder P(X 1 = x 1, X 2 = x 2,... X = x ) = P(X 1 = x 1 ) P(X 2 = x 2 )... P(X = x ). Da X j ku ka atage værdiere 0 og 1, og da summe af sadsylighedere er 1, er P(X j = 0) = 1 p for ethvert j. 4. Vi ka skrive sadsylighedsfuktioe for X j som p hvis x = 1 f (x) = P(X j = x) = 1 p hvis x = 0 eller kortere som f (x) = P(X j = x) = p x (1 p) 1 x, x = 0, 1. [Sadsylighedsfuktioe for e stokastisk variabel X er de fuktio der til hvert tal x kytter sadsylighede for at X atager værdie x.] 5. De simultae sadsylighedsfuktio for de stokastiske variable X 1, X 2,..., X er e fuktio f (x 1, x 2,..., x ) der agiver sadsylighede for at der samtidigt gælder at X 1 = x 1 og X 2 = x 2 og... og X = x. Da X j -ere er stokastisk uafhægige, er de simultae sadsylighedsfuktio for X j -ere produktet af de ekelte sadsylighedsfuktioer: f (x 1, x 2,..., x ) = P(X 1 = x 1 ) P(X 2 = x 2 )... P(X = x ) = p x 1 (1 p) 1 x 1 p x 2 (1 p) 1 x 2... p x (1 p) 1 x = p x 1+x 2 + +x (1 p) (x 1+x 2 + +x ) år (x 1, x 2,..., x ) er et talsæt beståede af 0-er og 1-er. Hvis der i talsættet (x 1, x 2,..., x ) er etop y 1-er og ( y) 0-er, så er f (x 1, x 2,..., x ) = p y (1 p) y. 6. Da vi u keder de simultae sadsylighedsfuktio for X j -ere, ka vi bestemme sadsylighedsfuktioe for Y = X 1 + X X. Sadsylighede for at Y er lig med y, ka fides ved at summere sadsylighedere for alle de sæt af elemetarforsøg som består af præcis y 1-udfald og ( y) 0-udfald: P(Y = y) = f (x 1, x 2,..., x ) x 1 +x 2 + +x =y

11 1.1 Et eksempel og e statistisk model 11 Tabel 1.1 Her ses 15 eksempler på udfald af 01-variable X 1, X 2,..., X 12, frembragt af e tilfældighedsmekaisme med p = 1 3, samt de tilsvarede værdier af Y = X 1 + X X 12. Tallee i y-søjle er således 15 observatioer fra e biomialfordelig med = 12 og p = 1 3. x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 10 x 11 x 12 y hvor meige er at der summeres over alle talsæt (x 1, x 2,..., x ) der består af 0-er og 1-er og hvor x 1 + x x = y (dvs. hvor der er etop y 1-er og ( y) 0-er). Vi fadt frem til at ethvert af disse talsæt har sadsylighed p y (1 p) y, så derfor bliver P(Y = y) = A p y (1 p) y hvor A er atal forskellige talsæt (x 1, x 2,..., x ) med y 1-er og ( y) 0-er. 7. Atallet A af forskellige talsæt (x 1, x 2,..., x ) beståede af y 1-er og ( y) 0-er afhæger af værdiere af og y; ma plejer at betege det med symbolet ( y ) (udtales» over y«). Størrelse ( ) y kaldes e biomialkoefficiet. 8. Alt i alt er vi dermed ået frem til at sadsylighedsfuktioe for Y er P(Y = y) = ( y ) py (1 p) y, y = 0, 1, 2,...,. Dee sadsylighedsfordelig hedder biomialfordelige med sadsylighedsparameter p og atalsparameter, og ma siger at Y er biomialfordelt med parametre og p. Atalsparametere er et kedt heltal, og sadsylighedsparametere p, som typisk er ukedt, er et tal mellem 0 og 1. Stokastiske variable der som X j -ere ku ka atage værdiere 0 og 1, kaldes udertide for 01-variable. Der gælder altså at hvis Y er e sum af et bestemt atal uafhægige idetisk fordelte 01-variable, så er Y biomialfordelt.

12 12 Biomialfordelige De statistiske model for bille-forsøget ka u kort formuleres således: Observatioe y = 43 er e observeret værdi af e stokastisk variabel Y som er biomialfordelt med atalsparameter = 144 og ukedt sadsylighedsparameter p [0, 1]. Før vi ka give os i kast med statistisk aalyse af biomialfordelte observatioer, er det ødvedigt at lære forskelligt om biomialfordelige og om biomialkoefficieter. 1.2 Biomialkoefficieter Defiitio 1.1: Biomialkoefficiet Biomialkoefficiete ( ) k er et symbol der beteger atallet af forskellige måder hvorpå ma ka placere to symboler 1 og 0 på pladser således at symbolet 1 kommer på k af pladsere og symbolet 0 kommer på de resterede ( k) pladser. Deraf følger at der er ( k ) forskellige talsæt (x 1, x 2,..., x ) beståede af etop k 1-er og ( k) 0-er. Ud fra defiitioe ka ma i pricippet bestemme talværdier af ehver biomialkoefficiet ved simpel optællig, eksempelvis er ( 4 ) 3 lig med 4, fordi der er de fire placeriger (1, 1, 1, 0), (1, 1, 0, 1), (1, 0, 1, 1) og (0, 1, 1, 1) af tre 1-er og et 0 på de fire pladser. I praksis er optælligsmetode dog ikke særlig hesigtsmæssig (prøv f.eks. at bestemme ( 37 ) 15 ved optælligsmetode); over de æste par sider udledes ogle formler der ka gøre beregigsarbejdet lidt mere overkommeligt. I defiitioe af ( ) k skal ma placere k 1-er og ( k) 0-er. Hvis ma i e såda placerig kalder 1-ere for 0 og 0-ere for 1, så får vi i stedet e placerig af ( k) 1-er og k 0-er. Heraf følger at ( k ) = ( ) for k = 0, 1, 2,..., og = 0, 1, 2,... (1.1) k Hvis k er 0 eller 1 eller eller ( 1), er det let at udrege ( ); k af defiitioe og formel (1.1) får ma ( 0 ) = 1 og dermed ( ) = 1, for = 0, 1, 2,... ( ) = 1 og dermed ( ) =, 1 for = 1, 2, 3,... De forskellige placeriger af k 1-er og ( k) 0-er ka opdeles i to grupper:

13 1.2 Biomialkoefficieter Placeriger der har et 1 på sidstepladse. På de første ( 1) pladser er der da etop (k 1) 1-er, og de ka placeres på ( 1 ) k 1 forskellige måder. Dee gruppe består derfor af ( 1 ) k 1 forskellige placeriger. 2. Placeriger der har et 0 på sidstepladse. På de første ( 1) pladser er der da etop k 1-er, og de ka placeres på ( 1 ) k forskellige måder. Dee gruppe består derfor af ( 1 ) k forskellige placeriger. Det samlede atal er lig summe af de to; dermed er vist at Eksempel ( k ) = ( 1 k ) + ( 1 ) for k = 1, 2, 3,..., og = 1, 2, 3,... (1.2) k 1 Som illustratio bestemmes talværdie af ( 5 2 ). Ifølge formel (1.2) er ( 5 2 ) = (4 2 ) + (4 1 ), så hvis vi keder talværdiere af (4 2 ) og (4 1 ), ka vi løse opgave. Der gælder at ( 4 1 ) = 4 (fordi geerelt er ( 1 ) = ). For at udrege ( 4 2 ) beytter vi formel (1.2) e gag til: (4 2 ) = (3 2 ) + (3 1 ). Der gælder at ( 3 1 ) = 3. Der gælder også at ( 3 2 ) = 3 (fordi ( 1 ) = ). Dermed er ( 4 2 ) = = 6. Dermed er ( 5 2 ) = (4 2 ) + (4 ) 1 = = 10 hvad ma jo også ka se ved simpel optællig. Pascals trekat Formel (1.2) er ikke særlig veleget år ma øsker at berege e ekelt biomialkoefficiet, me de er overordetlig praktisk hvis ma øsker at berege alle biomialkoefficieter op til e eller ade øvre græse for. Vi keder på forhåd biomialkoefficietere med = 0 og = 1 (de er ( 0 0 ) = 1 og ( 1 0 ) = (1 ) 1 = 1). Ved hjælp af formel (1.2) ka vi berege alle koefficieter med = 2, derefter alle med = 3, derefter alle med = 4, osv. Ma plejer at stille resultatere op i et skema der kaldes Pascals trekat, se figur 1.1. Heraf ses at f.eks. er ( 7 ) 2 lig 21. Hvert tal i Pascals trekat fremkommer ifølge formel (1.2) som summe af de to ærmeste tal i række lige oveover, f.eks. er 21 = Pascals trekat er opkaldt efter de fraske videskabsmad og tæker Blaise Pascal ( ). Flere formler Ved brug af Pascals trekat vil det være muligt at bestemme talværdier af ehver biomialkoefficiet; ma skulle dog udføre e hel del additioer og have et temmelig stort ark papir for at udrege f.eks. ( 37 ). 15 Heldigvis fides der også e ade og midre pladskrævede metode hvor ma så til gegæld skal lave ogle multiplikatioer og divisioer. Som forberedelse til dee metode skal vi bruge edu e formel for biomialkoefficieter.

14 14 Biomialfordelige biomialkoefficietere ( k ) Figur 1.1 Pascals trekat. Atag ige at vi skal fordele k 1-er og ( k) 0-er på pladser, me u er et af 1-ere mærket. Vi ka bestemme atallet af syligt forskellige placeriger på to måder: 1. Bestem først hvilke pladser der skal have et 0: Det ka gøres på ( k ) = ( k ) måder. Nu er der k pladser reserveret til 1-er, og der er derfor k forskellige måder at placere det mærkede 1 på. I alt er der derfor k ( ) k syligt forskellige placeriger. 2. Bestem først hvilke pladser der skal have et umærket 1. Det ka gøres på ( k 1 ) måder. Derefter ka det mærkede 1 placeres på e af de resterede ( k + 1) pladser. I alt er der derfor ( k + 1) ( ) k 1 syligt forskellige placeriger. Da de to atal er es, er k ( ) k = ( k + 1) ( ), k 1 og ved at flytte rudt på faktorere fås ( k ) = k + 1 k ( ) for k = 1, 2,..., og = 1, 2,... (1.3) k 1 Dee formel fortæller hvorda ma fider ( ) k hvis ma keder ( k 1 ). Ved getage avedelser af formel (1.3) fås i øvrigt dvs. ( ( k + 1) ) = k k ( k + 1) = k ( k + 1) = k = ( k ) = 1 = ( k + 1) k ( k 1 ) ( k + 2) ( k 1 k 2 ) ( k + 2) k 1 ( k + 2) k 1 ( k + 3) k 2... ( 1) ( 2) ( k + 1) k ( 2) 3 for ( k 3 ) ( 1) 2 1, k = 1, 2,..., = 1, 2,... (1.4)

15 1.3 Egeskaber ved biomialfordelige 15 (Hvis k er 0, er højreside»det tomme produkt«som er 1.) Hvis ma på højreside af (1.4) gager med ( k 1) ( k) i tæller og æver, får ma ( k ) =! k! ( k)! for k = 1, 2,..., = 1, 2,... (Når m er et positivt heltal, så er m! = (m 1) m; edvidere er 0! = 1.) Ved hjælp af formel (1.4) og papir og blyat og lommereger fider ma let at ) = ( Biomialformle Hvorfor hedder det»biomialkoefficiet«? Et bi-omium er e to-leddet størrelse som f.eks. a + b. E velkedt formel fortæller hvad kvadratet på e toleddet størrelse er: (a + b) 2 = a 2 + 2ab + b 2. Dee formel ka geeraliseres til at hadle om de -te potes af e toleddet størrelse. Hvis ma i (a + b) = (a + b)(a + b)... (a + b) faktorer gager paretesere ud, får ma 2 led der hver især er et produkt af faktorer, e fra hvert af de biomier. Af disse 2 led er der etop ( ) k der består af k a-er og ( k) b-er. Derfor er (a + b) = ( 0 )a0 b + ( 1 )a1 b 1 + ( 2 )a2 b ( )a b 0 = k=0 ( k )ak b k. Dee formel hedder biomialformle, fordi de hadler om -te potese af et biomium. De koefficieter der idgår i biomialformle, kaldes aturligt ok biomialkoefficieter. (1.5) 1.3 Egeskaber ved biomialfordelige Defiitio 1.2: Biomialfordelig Biomialfordelige med sadsylighedsparameter p og atalsparameter er de diskrete sadsylighedsfordelig givet ved sadsylighedsfuktioe f (y) = ( y ) py (1 p) y, y = 0, 1, 2,...,. Her er p et (som oftest ukedt) tal mellem 0 og 1, og er et positivt heltal.

16 16 Biomialfordelige Middelværdi og varias Når ma har at gøre med e sadsylighedsfordelig, ka ma udrege visse talstørrelser der beskriver forskellige træk ved fordelige. Ma udreger ofte fordeliges middelværdi (= de forvetede værdi =»tygdepuktet«i fordelige). Hvis Y er e stokastisk variabel der har e fordelig med sadsylighedsfuktio f, så er middelværdie pr. defiitio tallet E Y = y f (y) hvor der summeres over alle de mulige y-værdier. For biomialfordeliges vedkommede er middelværdie altså tallet E Y = y ( y=0 y ) py (1 p) y. Dee sum ser ikke så rar ud, me heldigvis ka vi fide middelværdie på e ade og smartere måde. Som omtalt på side 11 ka e biomialfordelt stokastisk variabel Y fremkomme som e sum af uafhægige idetisk fordelte 01-variable, så lad os sige at Y = X 1 + X X hvor X 1, X 2,..., X er uafhægige 01-variable med P(X j = 1) = p for alle j. Ifølge regeregler for middelværdi er middelværdie af e sum lig summe af middelværdiere: E Y = E X 1 + E X E X = E X 1, så problemet er u reduceret til at bestemme E X 1, og det er overkommeligt ud fra defiitioe af middelværdi: E X 1 = 0 P(X 1 = 0) + 1 P(X 1 = 1) = 0 (1 p) + 1 p = p. Vi har dermed fudet at E Y = p. Deræst ser vi på variase. Variase af e stokastisk variabel Y med sadsylighedsfuktio f er pr. defiitio Var Y = E((Y E Y) 2 ) = (y E Y) 2 f (y) hvor der summeres over de mulige y-værdier. For at fide variase af vores biomialfordelte stokastiske variabel Y = X 1 +X 2 + +X ka vi beytte et smart trick: Det er e egeskab ved varias at variase af e sum af uafhægige størrelser er lig summe af variasere af de ekelte led. Derfor er Var Y = Var X 1 + Var X Var X = Var X 1, og vi behøver u blot fide variase af X 1 ; da X 1 ku atager værdiere 0 og 1, bliver udregigere simple: Var X 1 = E((X 1 E X 1 ) 2 ) = E((X 1 p) 2 )

17 1.4 Reg og teg 17 Vi har hermed fudet at Var Y = p(1 p). = (0 p) 2 P(X 1 = 0) + (1 p) 2 P(X 1 = 1) = p 2 (1 p) + (1 p) 2 p = p(1 p). Sammefattede gælder at hvis de stokastiske variabel Y er biomialfordelt med parametre og p, så er E Y = p og Var Y = p(1 p). E fordeligs stadardafvigelse er pr. defiitio kvadratrode af variase, dvs. for biomialfordeliges vedkommede p(1 p). Udregig af biomialsadsyligheder Hvis ma øsker at udrege biomialsadsylighedere f (y) = ( y ) py (1 p) y for y = 0, 1, 2,...,, er det som regel ikke hesigtsmæssigt bare ude videre at idsætte i formle. Ma ka med fordel beytte e rekursiosformel. Ved simple omskriviger fider ma at f (y) f (y 1) = y + 1 y p, y = 1, 2,...,, 1 p således at f (y) let ka bereges ud fra f (y 1). Metode bliver dermed f (0) = (1 p), f (y) = f (y 1) y + 1 y p, y = 1, 2,...,. 1 p Eksempel 1.1 Som eksempel vil vi berege og tege sadsylighedsfuktioe for biomialfordelige med = 18 og p = 1 6. (Dee fordelig kue f.eks. beskrive atallet af seksere ved 18 kast med e almidelig terig.) Fordelige har i øvrigt middelværdi = 3 og varias = 2.5 (svarede til stadardafvigelse 1.58). Ved at bruge de beskreve metode udreges fordeliges sadsylighedsfuktio f og ma får tabelle i figur Reg og teg Her omtales hvorda ma ka foretage de forskellige beregiger med R-programmet. Biomialkoefficieter Biomialkoefficieter udreges med fuktioe choose, f.eks. giver choose(5,2) værdie af ( 5 2 ).

18 18 Biomialfordelige y f (y) = ( 18 y )( 1 6 )y ( 5 6 )18 y ssh Figur 1.2 Tabel hhv. pidediagram over sadsylighedsfuktioe for biomialfordelige med = 18 og p = 1 6. y Biomialsadsyligheder Biomialsadsyligheder udreges med fuktioe dbiom. Eksempelvis ka sadsylighedere i biomialfordelige med = 18 og p = 1 6 udreges såda: <- 18 # får værdie 18 y <- 0: # y bliver vektore (0, 1, 2,..., 18) ssh <- dbiom(y, size=, prob=1/6) # udreg ( y )( 1 6 )y (1 1 6 ) y ssh # udskriv resultatet roud(ssh, digits=3) # udskriv resultatet afrudet til 3 decimaler: Pidediagrammet i figur 1.2 ka derefter fremstilles såda: barplot(ssh, space=1.5, ames.arg=y, las=1, xlab="y", ylab="ssh") Tabel 1.1 Ma ka fremstille e tabel som tabel 1.1 på følgede måde, hvor kaldet af rbiom leverer 180 tilfældige tal fra e biomialfordelig med = 1 og p = 1 3, fuktioe matrix putter tallee id i e matrix med det øskede atal rækker, fuktioe rowsums udreger rækkesummer, og fuktioe cbid sætter matricer samme lags søjler (c = colums):

19 1.5 Opgaver 19 t <- matrix(rbiom(180, size=1, prob=1/3), row=15) cbid(t, rowsums(t)) 1.5 Opgaver Opgave 1.1 Tabel 1.1 (side 11) er fremstillet på de måde at ma har sat et computerprogram til at frembrige udfald af 01-variable X 1, X 2,..., X såda at sadsylighede for værdie 1 hver gag er et givet tal p (som er 1 3 ). 1. Udreg sadsylighede for at få det talsæt x 1, x 2,..., x der står i række ummer Udreg sadsylighede for at få det talsæt x 1, x 2,..., x der står i række ummer Opskriv sadsylighedsfuktioe for X 1, X 2,..., X. 4. Opskriv sadsylighedsfuktioe for Y = Opgave 1.2 På side 11 åede vi frem til e tilstrækkelig betigelse for at e stokastisk variabel Y er biomialfordelt. Overvej med dee betigelse i mete om ma ka beytte biomialfordeligsmodeller i edeståede kort skitserede situatioer (agiv i givet fald hvad elemetarforsøgee og hvad parametree og p er): X j. 1. Atal toere ved fem kast med e almidelig terig. 2. Atal toere ved et kast med fem almidelige teriger. 3. Atal gage ma skal kaste e almidelig terig for at få e toer. 4. Atal bør i e skoleklasse som bruger briller. 5. Atal yregistrerede aids-tilfælde i Damark i maj år Atal yregistrerede aids-tilfælde i Damark i maj år Atal passagerer i e ht-bus som ved forrige valg stemte på Dask Folkeparti. 8. Atal trykfejl i e bog. Opgave 1.3 Udreg biomialkoefficiete ( 12 ), dels ved hjælp af Pascals trekat, dels ved hjælp af formel 5 (1.4) (og ude at bruge lommeregere). Opgave 1.4 I tabel 1.1 er vist udfald y 1, y 2,..., y 15 af e stokastisk variabel Y som er biomialfordelt med atalsparameter 12 og sadsylighedsparameter Udreg e tabel over fordelige af Y (altså e tabel over sadsylighedsfuktioe for biomialfordelige med atalsparameter 12 og sadsylighedsparameter 1 3 ). Sammelig med de empiriske fordelig af y 1, y 2,..., y 15 (altså de relative hyppigheder hvormed udfaldee 0, 1, 2,..., 12 faktisk er forekommet).

20 20 Biomialfordelige 2. Teg et pidediagram over fordelige af Y (altså e tegig i stil med figur 1.2). Teg desude et pidediagram over de empiriske fordelig. Liger de to fordeliger hiade? 3. Hvor mage gage ud af 15 getagelser skulle ma forvete at få observatioe Y = 5? Hvor mage gage har ma faktisk fået observatioe 5? 4. Udreg middelværdie af Y. Udreg variase og stadardafvigelse af Y. Opgave 1.5 (Fru Hase spiller bako) Fru Hase går til bako-spil de fem af uges dage. Hu ka derfor opleve at der er 0, 1, 2, 3, 4 eller 5 dage i løbet af uge hvor hu går hjem med e gevist, me det er tilfældigt hvad det faktiske atal»gevistdage«bliver. Ma ka derfor for e give uge idføre e stokastisk variabel Y som skal stå for»atal gevistdage i de pågældede uge«. Ma vil gere vide oget om fordelige af Y, især oget om E Y, det forvetede atal gevistdage på e uge. Atag at der hver dag er sadsylighede p for at hu vider. 1. Formulér e passede statistisk model for atallet Y af gevistdage. 2. Hvad er det forvetede atal gevistdage E Y? Teg grafe for E Y som fuktio af p. 3. For at få et idtryk af hvor meget Y ka variere fra uge til uge, vil ma også gere vide oget om Var Y. Hvad er variase af Y? Teg grafe for Var Y som fuktio af p; hvorår er variase størst, og hvor stor er de da? 4. Bakospilarragøre vil idrette det såda at hvis ma spiller hver af uges fem»arbejdsdage«, så skal ma kue forvete etop é gevistdag. a) Hvad skal ha da vælge p til at være? b) Teg de tilsvarede fordelig af Y. c) Hvor stor er variase i fordelige? 5. Fru Hase vil spille i 10 uger. Hvor mage uger må hu forvete at hu ikke får e eeste gevistdag? Opgave 1.6 (Eksempel på simpel forsøgsplalægig) Ved e meigsmålig vil ma spørge persoer om de er for eller mod et bestemt eme; derefter vil ma udrege atallet Y af svarpersoer der er for. 1. Formulér e passede statistisk model for dee situatio (dvs. agiv e sadsylighedsfuktio for Y). 2. Beyt modelle til at fide stadardafvigelse af Y (for at få e idé om størrelse af de tilfældige variatio). Hvad er stadardafvigelse af de relative hyppighed Y/? 3. Hvorda afhæger stadardafvigelse af de idgåede parametre? Hvor stor skal være for at stadardafvigelse af de relative hyppighed er 0.02 (eller midre)? Opgave 1.7 (Hypergeometriske sadsyligheder) Kombiatorik er lære om at tælle. Mage kombiatoriske problemer formuleres på de måde at ma taler om forskelligtfarvede kugler der lægges ed i og tages op af kasser (eller urer) efter bestemte regler. Atag at ma har e kasse med R røde og H hvide kugler.

21 1.5 Opgaver Vis med udgagspukt i defiitio 1.1 at der er ( R ) forskellige måder hvorpå ma ka r udtage r røde kugler ude tilbagelægig. 2. Ma vil udtage kugler i alt fra kasse, stadig ude tilbagelægig. Fid atallet af forskellige måder det ka gøres på således at ma får etop r røde og ( r) hvide kugler. Svaret er ( R ) ( H ). Det er uderforstået at r et et heltal der opfylder visse betigelser: r r a) 0 r : atal udtage røde kugler må ligge mellem 0 og det totale atal udtage kugler (). b) r R: ma ka ikke udtage flere røde kugler ed der er. c) r H: ma ka ikke udtage flere hvide kugler ed der er. 3. Vis at ( R r ) ( H r ) = (R+H ). alle r 4. Hvis ma roder godt rudt i kasse ide ma udtager de kugler, ka ma sige at ma får udvalgt e tilfældig delmægde beståede af kugler således at ehver af de ( R+H ) forskellige delmægder har samme sadsylighed for at blive udvalgt. Vis at sadsylighede for at e tilfældig delmægde ideholder etop r røde og ( r) hvide kugler, er (R r ) ( H r ) ( R+H ). (Dette er et eksempel på e hypergeometrisk sadsylighed.)

22 22

23 2 De simple biomialfordeligsmodel I forrige kapitel opstillede vi e statistisk model i de simple biomialfordeligssituatio. I modelle optræder to størrelser og p der tilsamme specificerer biomialfordelige. Størrelse er et kedt tal, me p er ukedt: værdie af fastsættes ved plalægige af forsøget, hvorimod p beskriver e egeskab ved de tilfældighedsmekaisme der frembriger observatioere; i ogle situatioer vil ma sige at p beskriver e egeskab ved ature eller virkelighede. E størrelse som p er e parameter i modelle. Ma siger ofte de sade værdi af parametere p år ma meer de værdi som p»i virkelighede«har (i modsætig til e værdi som ma selv foreslår). I dette kapitel skal vi se hvorda ma ka få oget at vide om de sade værdi af p. 2.1 Estimatio af parametere p Ved hjælp af de statistiske model er det muligt at hete iformatio om de sade parameterværdi ud af observatioere: på grudlag af model plus observartioer udreger ma et skø eller et estimat over værdie af p, og selve processe hedder estimatio. I eksemplet med rismelsbillere i kapitel 1 var = 144 og det observerede atal gustige udfald var y = 43. Da p skal fortolkes som sadsylighede for at få et gustigt udfald, og da ma har observeret 43 gustige ud af 144, er det ærliggede at foreslå at estimere p som de relative hyppighed y/ = 43/144 = I det følgede vil vi præsetere e geerel estimatiosmetode der ka bruges i»ehver«situatio, og vi vil eftervise at de geerelle metode fører frem til at sadsylighedsparametere p faktisk skal estimeres som y/. Likelihoodmetode Det er i ekelte simple tilfælde ret klart hvorda ma»selvfølgelig«skal aalysere si statistiske model, idet der er e»umiddelbart idlysede«fremgagsmåde osv. I de fleste tilfælde er det kap så klart. Vi vil itroducere et sæt overordede pricipper for hvorda ma bør aalysere e statistisk model. Disse pricipper gælder (med visse tilføjelser) for»ehver«model. Idførelse af pricippere betyder ikke at ma slipper for overvejelser over hvad ma»selvfølgelig«skal gøre, og hvad der er»umiddelbart idlysede«, me at ma i stedet for at skulle gøre overvejelsere ige og ige i hvert ekelt tilfælde, så at sige 23

24 24 De simple biomialfordeligsmodel ssh y Figur 2.1 E»typisk«sadsylighedsfuktio y f (y; p). overstår dem alle på e gag ved at hæve dem fra ekelttilfældee op til et overordet iveau hvor de udæves til geerelle pricipper. Et pricip er i dee sammehæg e orm, e retigslije, som ikke bliver logisk-deduktivt bevist, me som retfærdiggøres dels geem geerelle betragtiger og overvejelser, dels ved at de leverer foruftige resultater i kokrete situatioer. Vi vil i al stilfærdighed præsetere et sådat sæt pricipper og vise hvorda de udmøtes i e geerel metode til estimatio af ukedte parametre i statistiske modeller. I dette kapitel skal vi se på hvorda de geerelle metode ser ud i eksemplet»de simple biomialfordeligsmodel«, og som geemgåede eksempel på»de simple biomialfordeligsmodel«bruger vi rismelsbille-eksemplet. (Der er altså flere iveauer af eksempler: Rismelsbille-eksemplet er et eksempel på e simpel biomialfordeligsmodel, og de simple biomialfordeligsmodel er et eksempel på e statistisk model.) De statistiske model i rismelsbille-eksemplet siger at y = 43 opfattes som e observatio af e stokastisk variabel Y som er biomialfordelt med atalsparameter = 144 og ukedt sadsylighedsparameter p [0, 1]. Sadsylighedsfuktioe for Y er f (y) = ( y ) py (1 p) y, y = 0, 1, 2,...,. For at fremhæve at udtrykket afhæger af både y og p, skriver vi f (y; p) i stedet for f (y): f (y; p) = ( y ) py (1 p) y, y = 0, 1, 2,..., ; 0 p 1. Fuktioe f er u e fuktio af to variable, e observatiosvariabel y og e parametervariabel p. Fuktioe kaldes modelfuktioe for de statistiske model fordi de specificerer modelle fuldstædigt: for ehver kombiatio af e mulig observatio y

25 2.1 Estimatio af parametere p 25 ssh log(ssh) p p Figur 2.2 Til vestre: e»typisk«likelihoodfuktio p L(p; y) = f (y; p). Til højre: de tilsvarede log-likelihoodfuktio. og e mulig parameterværdi p agiver de sadsylighede for at observere etop det y hvis etop det p er de rigtige parameterværdi. Modelfuktioe er flere fuktioer i é: Hvis vi i modelfuktioe fikserer p og opfatter fuktioe som e fuktio af y alee, så har vi sadsylighedsfuktioe svarede til parameterværdie p. E»typisk«sadsylighedsfuktio er vist i figur 2.1. Hvis vi i modelfuktioe fikserer y og opfatter fuktioe som e fuktio af p alee, så har vi likelihoodfuktioe svarede til observatioe y. Likelihoodfuktioe beteges ofte L( ) eller L( ; y): L(p) = L(p; y) = ( y ) py (1 p) y, 0 p 1. Figur 2.2 viser e»typisk«likelihoodfuktio. I vort eksempel er modelfuktioe f (y; p) = ( 144 y ) p43 (1 p) 101, y = 0, 1, 2,..., 144; 0 p 1, og likelihoodfuktioe svarede til observatioe y = 43 er L(p) = L(p; 43) = ( ) p43 (1 p) 101, 0 p 1. Likelihoodfuktiosværdie L(p; y) er sadsylighede for at observere det y ma faktisk har observeret, forudsat at de ukedte parameter har værdie p. Likelihoodfuktioe ka derfor avedes til at sammelige forskellige parameterværdiers eve til

26 26 De simple biomialfordeligsmodel at beskrive de faktiske observatio y. For hvis f.eks. L(p 1 ; y) < L(p 2 ; y), så er chace for at observere etop dette y større år p er lig p 2, ed år p er lig p 1, og det må betyde at p 2 giver e bedre beskrivelse af data ed p 1 gør. De parameterværdi som giver de bedste beskrivelse efter disse retigslijer, er da de værdi som maksimaliserer likelihoodfuktioe, og de kaldes maksimaliserigsestimatet (eller maximum likelihood estimatet) for p og beteges p (»p hat«). Tallet p er altså bestemt ved at L( p; y) L(p; y) for alle p. Bemærk at p er e fuktio af y. Af bekvemmelighedsgrude opererer ma tit med log-likelihoodfuktioe, dvs. fuktioe l L(p), og ma bestemmer p som maksimumspuktet for l L (resultatet bliver jo det samme). I vort eksempel er log-likelihoodfuktioe l L(p) = l ( 144 ) + 43 l p l(1 p). 43 Imidlertid vil talværdiere let gøre ræsoemetere ugeemskuelige, så vi veder tilbage til de geerelle biomialfordeligsmodel hvor log-likelihoodfuktioe er l L(p) = l ( ) + y l p + ( y) l(1 p). y Hvad er p i dee model? Svaret herpå får vi ved at løse de matematikopgave der hedder:»bestem maksimumspukt(er) for fuktioe p l L(p) år p [0, 1]«, så det gør vi. Fra matematikke ved vi at kadidater til maksimumspukter er dels itervaledepuktere p = 0 og p = 1, dels de statioære pukter, dvs. de pukter hvor d dp l L(p) = 0. For 0 < p < 1 er d dp l L(p) = y p y 1 p = y p p (1 p). Det er hesigtsmæssigt at dele op i tre tilfælde: 0 < y < : Så er puktet p = y/ det eeste statioære pukt for l L, og da l L(0) og l L(1) begge er, er p = y/ et etydigt maksimumspukt. y = : Så er l L(p) = l p, hvilket er e voksede fuktio af p. De atager derfor si største værdi år p er størst mulig, dvs. år p = 1. y = 0: Så er l L(p) = l(1 p), hvilket er e aftagede fuktio af p. De atager derfor si største værdi år p er midst mulig, dvs. år p = 0. I alle tre tilfælde er der således et etydigt maksimumspukt der ka udreges som y/. Vi er hermed ået frem til at i biomialmodelle med modelfuktio f (y; p) = ( y ) py (1 p) y, y = 0, 1, 2,..., ; 0 p 1,

27 2.2 E simpel statistisk hypotese 27 er maksimaliserigsestimatet p for p givet som p = y/. At p skal estimeres ved de relative hyppighed y/ ka æppe overraske oge, det er æste hvad ma ka sige sig selv. Det iteressate er at det altså også er det svar ma år frem til ved at beytte de geerelle fremgagsmåde som er opstil modelfuktioe, da derudfra likelihoodfuktioe, bestem p som maksimumspuktet for likelihoodfuktioe. Det er vigtigt at have i mete at der tækes at eksistere e sad parameterværdi som er et bestemt, ukedt tal. Vi ka pricipielt aldrig erfare de sade parameterværdi, me ud fra foreliggede observatioer ka vi estimere de. Middelfejle på p Maksimaliserigsestimatet p = y/ er det bedste bud vi ka give på de ukedte p-værdi år vi har observeret atallet y ud af. De statistiske model fortæller at y er at opfatte som e observatio af e stokastisk variabel Y; det medfører at vi også må opfatte estimatet y/ som e observatio af e stokastisk variabel, emlig Y/; de stokastiske variabel p = p(y) = Y/ kaldes maksimaliserigsestimatore for p. Da Y er biomialfordelt med parametre og p, er middelværdie af Y lig p, og ifølge regereglere for middelværdi er så E p(y) = (E Y)/ = p, hvilket betyder at maksimaliserigsestimatore p for p i middel giver det rigtige svar p, me deraf følger ikke oget om det kokrete ekelttilfælde. E estimator hvis middelværdi er lig de parameter der skal estimeres, kaldes e cetral estimator (på egelsk: a ubiased estimator). For at få e idé om størrelse af maksimaliserigsestimatores tilfældige variatio omkrig si middelværdi p ka ma bestemme de såkaldte middelfejl på p, dvs. stadardafvigelse på p(y). Da Y er biomialfordelt med parametre og p, er Var Y = p(1 p), og ifølge regeregler for variaser er Var( p(y)) = Var(Y/) = (Var Y)/ 2 = p(1 p)/, så middelfejle på p(y) er p(1 p)/. I billeeksemplet er stadardafvigelse på p lig p(1 p)/144, og de estimerede stadardafvigelse er p(1 p)/ = /144 = Sammefattede ka vi sige at biomialparametere p i billeeksemplet estimeres til p = 0.30 med e stadardafvigelse på E simpel statistisk hypotese Det er ikke altid at ma er tilfreds med blot at estimere de ukedte parameter i de statistiske model, udertide øsker ma også at opstille og teste statistiske hypoteser vedrørede de sade værdi af parametere.

28 28 De simple biomialfordeligsmodel Atag at det i rismelsbilleeksemplet er såda at ma har e referecegift hvorom ma véd at år ma doserer de med 0.20 mg/cm 2, så dør 23% af billere [ såda er det ikke; dee del af eksemplet er opdigtet til lejlighede!]. De gift der er afprøvet, er ligeledes doseret med 0.20 mg/cm 2, og der skete som ævt det at 43 ud af 144 biller døde. Spørgsmålet er om de afprøvede gift virker på samme måde som referecegifte. Hvad»på samme måde«ærmere skal betyde, ka ma sikkert diskutere læge og iderligt, me formuleret i de statistiske models sprog er det emt ok: det betyder at p = p 0, altså at sadsylighede for at e bille dør år de er blevet udsat for de afprøvede gift, er lig p 0, hvor p 0 er e kedt værdi (her 0.23). Påstade at p = p 0, er et eksempel på e såkaldt statistisk hypotese; statistiske hypoteser avgives ofte med symboler som H 0, H 1, osv., så her vil vi tale om hypotese H 0 p = p 0. Hvorda passer de statistiske hypotese og de foreliggede observatioer samme? Ma ka se at de estimerede værdi p = ikke er lig med 0.23, me eksakt lighed ville også være mere ed ma kue forvete, taget i betragtig at modelle siger at tallet y = 43 er e observatio fra e sadsylighedsfordelig. Ma ka ku sige at hvis der ikke er stor afvigelse mellem p og p 0, så er der ikke klare teg på at de afprøvede gift virker aderledes ed referecegifte der er ikke oge sigifikat forskel, og hvis der er stor afvigelse mellem p og p 0, så er det teg på at de afprøvede gift ikke virker på samme måde som referecegifte der er e sigifikat forskel. Her er der to tig der behøver e ærmere præciserig: hvorda måler ma afvigelse mellem p og p 0, og hvorda afgør ma hvorår afvigelse er stor og hvorår ikke. I afsit 2.3 præseteres e geerel metode hvormed ma ka hådtere disse spørgsmål. Det faglige problem blev præseteret på de måde at ma øskede at vide om de afprøvede gift virkede på samme måde som referecegifte, og det førte til hypotese H 0 p = p 0. Me hvis ma i stedet havde stillet spørgsmålet om der var forskel på de to gifte, hvorda skulle ma så have grebet sage a? Svaret er: på øjagtig samme måde, altså stadig ved at udersøge H 0 p = p 0. Statistiske hypoteser er emlig altid forsimplede i de forstad at ma går fra det mere detaljerede til det midre detaljerede. I eksemplet begyder ma derfor med de mest detaljerede model, de hvor p ka være hvad som helst, og så opstiller ma som statistisk hypotese at modelle er midre detaljeret, emlig at p ku har lov til at have de ee værdi p Kvotietteststørrelse Det blev påstået at ma ved hjælp af likelihoodfuktioe ka sammelige forskellige parameterværdiers eve til at beskrive det faktisk observerede y: hvis L(p 1 ; y) < L(p 2 ; y), så giver parameterværdie p 2 e bedre beskrivelse ed parameterværdie p 1 gør, ide for rammere af de aktuelle statistiske model. I særdeleshed giver maksimaliserigsesti-

29 2.3 Kvotietteststørrelse 29 matet p = p(y) de bedst mulige beskrivelse af observatioe y. Parameterværdier der giver e værdi af likelihoodfuktioe som ligger tæt på de maksimale værdi L( p), må give e æste lige så god beskrivelse af observatioe y som p gør. Når vi derfor skal teste e statistisk hypotese H 0 p = p 0 om at de ukedte parameter p ka atages at have de kedte værdi p 0, så må det foregå ved at sammelige likelihoodfuktioes værdi i puktet p 0 med des maksimale værdi, altså ved at sammelige de to tal L(p 0 ) og L( p). Hvis L(p 0 ) er æste lige så stor som L( p), betyder det at p 0 beskriver observatioe y æste lige så godt som p gør, og det betyder ige at ma ka tillade sig at mee at p 0 er de sade værdi af p: ma accepterer eller godkeder hypotese H 0. Hvis derimod L(p 0 ) er væsetligt midre ed L( p), betyder det at p 0 giver e væsetligt dårligere beskrivelse af observatioe y ed p gør, og det er derfor ikke rimeligt at mee at p 0 skulle være de sade værdi af p: ma forkaster H 0. Når ma sammeliger L(p 0 ) og L( p), skal det gøres ved at dividere de midste med de største: ma daer kvotiete Resultatet bliver et tal mellem 0 og 1, og Q = Q(y) = L(p 0) L( p) = L(p 0; y) L( p; y). e Q-værdi ær 1 viser at p 0 er stort set lige så god som p: ma accepterer H 0, e Q-værdi lagt fra 1 viser at p 0 er væsetligt dårligere ed p: ma forkaster H 0. Ma kalder Q for kvotietteststørrelse for de statistiske hypotese H 0. I biomialfordeligsmodelle er L(p) = ( y ) py (1 p) y, så Q = Q(y) = py 0 (1 p 0) y p y (1 p) y = ( p y 0 y ) ( (1 p y 0) ) y (2.1) idet p = y/. I eksemplet er = 144, y = 43 og p 0 = 0.23, så de observerede værdi Q obs af Q er Q obs = ( ) ( ) = Tallet Q obs = i sig selv ka vi ikke stille oget op med det giver ige meig at spørge om er ær 1 eller lagt fra 1 så læge vi ikke har e målestok eller et sammeligigsgrudlag. De statistiske model fortæller at vi skal betragte y som e observatio af e stokastisk variabel Y; dermed skal vi også betragte Q obs = Q(y) som e observatio af de stokastiske variabel Q(Y). Fordelige af Y beskriver hvilke y-værdier ma også kue have fået (i stedet for de faktisk observerede) og med hvilke sadsyligheder, og de tilsvarede fordelig af Q(Y) beskriver dermed hvilke

30 30 De simple biomialfordeligsmodel Q-værdier ma også kue have fået (i stedet for 0.165) og med hvilke sadsyligheder. Takket være de statistiske model ka vi altså sammeholde de faktiske værdi Q obs = med alle de adre Q-værdier ma også kue have fået år p har værdie p 0. Hvis det er såda at der år p = p 0 er e pæ chace (f.eks. over 5%) for at få Q-værdier som ligger lægere væk fra 1 ed Q obs gør, dvs. for at få Q-værdier for hvilke Q Q obs, så vil ma sige at Q obs ikke ligger specielt lagt fra 1, og ma vil acceptere hypotese H 0 p = p 0. Hvis det derimod er såda at der år p = p 0 er meget lille chace (f.eks. uder 5%) for at få Q-værdier som ligger lægere fra 1 ed Q obs gør, dvs. for at få Q-værdier for hvilke Q Q obs, så vil ma fortolke det som at Q obs i sig selv ligger usædvaligt lagt fra 1, og ma vil forkaste hypotese H 0 p = p 0. Når ma skal teste hypotese H 0, skal ma derfor bestemme testsadsylighede ε = P 0 (Q Q obs ). Testsadsylighede er sadsylighede uder H 0 for at få e værre, dvs. midre, Q- værdi ed de faktisk observerede værdi Q obs. (Fodteget 0 på P-et agiver at sadsylighede skal udreges uder atagelse af at hypotese H 0 er rigtig.) 1. Hvis testsadsylighede ε er meget lille, så forkaster ma H 0 på grud af følgede ræsoemet: a) Vi har fået e Q obs -værdi der er så lagt fra 1 at der, forudsat at H 0 er rigtig, ku er de meget lille sadsylighed ε for at få e værre Q-værdi. b) I praksis plejer ma ikke at få særligt ekstreme observatioer, så der må være oget galt med forudsætigere for beregige af ε. c) Da vi ikke ka lave om på observatioere, må det være hypotese H 0 derer oget galt med. 2. Hvis testsadsylighede ε har e pæ størrelse, så ka ma ikke forkaste H 0. Ræsoemetet er dee gag således: a) Vi har fået e Q obs -værdi der ikke ligger specielt lagt fra 1, thi der er emlig, forudsat at H 0 er rigtig, e pæ chace ε for at få e værre Q-værdi. b) De faktiske værdi Q obs er derfor udmærket foreelig med hypotese H 0, og der er dermed ikke grudlag for at forkaste H 0. Hvis testsadsylighede ε er så lille at ma forkaster hypotese, så siger ma at teststørrelse Q obs er sigifikat, eller at der er sigifikas.

antal gange krone sker i første n kast = n

antal gange krone sker i første n kast = n 1 Uge 15 Teoretisk Statistik, 5. april 004 1. Store tals lov Eksempel: møtkast Koverges i sadsylighed Tchebychevs ulighed Sætig: Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder

Læs mere

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i Normalfordeliger For at e stokastisk variabel X ka være ormalfordelt, skal X agive værdie af e eller ade målig, f.eks. tid, lægde, vægt, beløb osv. Notatioe er: Xi ~ N( μ, σ hvor i er observatiosummeret,

Læs mere

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017 Meigsmåliger KLADDE Thomas Heide-Jørgese, Rosborg Gymasium & HF, 2017 Idhold 1 Meigsmåliger 2 1.1 Idledig................................. 2 1.2 Hvorda skal usikkerhede forstås?................... 3 1.3

Læs mere

TEKST NR 435 2004. TEKSTER fra IMFUFA

TEKST NR 435 2004. TEKSTER fra IMFUFA TEKST NR 435 2004 Basisstatisti 2. udgave Jørge Larse August 2006 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING

Læs mere

Motivation. En tegning

Motivation. En tegning Motivatio Scatter-plot at det mådelige salg mod det måedlige reklamebudget. R: plot(salg ~ budget, data = salg) Økoometri Lektio Simpel Lieær Regressio salg 400 450 500 550 20 25 30 35 40 45 50 budget

Læs mere

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags. Praktisk ifo Liste med rettelser og meigsforstyrrede trykfejl i DS på Absalo. Statistisk aalyse af e ekelt stikprøve: kedt eller ukedt varias Sadsylighedsregig og Statistik (SaSt) Helle Sørese Projekt

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Statistik ved Bachelor-uddaelse i folkesudhedsvideskab Græseværdisætiger Det hadler om geemsit Statistikere elsker geemsit Det er oplagt e god ide at tage geemsit. Hvis jeg f.eks skal gætte på vægte af

Læs mere

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528) Løsigsforslag til skriftlig eksame i Kombiatorik, sadsylighed og radomiserede algoritmer (DM58) Istitut for Matematik & Datalogi Syddask Uiversitet Madag de 3 Jauar 011, kl. 9 13 Alle sædvalige hjælpemidler

Læs mere

9. Binomialfordelingen

9. Binomialfordelingen 9. Biomialfordelige 9.. Gekedelse Hvert forsøg ka ku resultere i to mulige udfald; succes og fiasko. I modsætig til poissofordelige er atallet af forsøg edeligt. 9.. Model X : Stokastisk variabel, der

Læs mere

Elementær Matematik. Polynomier

Elementær Matematik. Polynomier Elemetær Matematik Polyomier Ole Witt-Hase 2008 Køge Gymasium Idhold 1. Geerelle polyomier...1 2. Divisio med hele tal....1 3. Polyomiers divisio...2 4. Polyomiers rødder....4 5. Bestemmelse af røddere

Læs mere

Estimation ved momentmetoden. Estimation af middelværdiparameter

Estimation ved momentmetoden. Estimation af middelværdiparameter Statistik og Sadsylighedsregig 1 STAT kapitel 4.2 4.3 Susae Ditlevse Istitut for Matematiske Fag Email: susae@math.ku.dk http://math.ku.dk/ susae Estimatio ved mometmetode Idimellem ka det være svært (eller

Læs mere

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning) Dages program Estimatio: Kapitel 9.4-9.7 Eksempler på middelrette og/eller kosistete estimator (de sidste fra sidste forelæsig) Ko desiterval for store datasæt kap. 9.4 Ko desiterval for små datasæt kap.

Læs mere

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik. Epidemiologi og biostatistik Forelæsig Uge 1, torsdag. februar 006 ichael Væth, Afdelig for Biostatistik. Sammeligig af to middelværdier sikkerhedsitervaller statistisk test Sammeligig af to proportioer

Læs mere

STATISTIKNOTER Simple normalfordelingsmodeller

STATISTIKNOTER Simple normalfordelingsmodeller STATISTIKNOTER Simple ormalfordeligsmodeller Jørge Larse IMFUFA Roskilde Uiversitetsceter Februar 1999 IMFUFA, Roskilde Uiversitetsceter, Postboks 260, DK-4000 Roskilde. Jørge Larse: STATISTIKNOTER: Simple

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Repetitio: Normalfordelige Ladmåliges fejlteori Lektio Trasformatio af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/udervisig/lf13 Istitut for Matematiske Fag Aalborg Uiversitet

Læs mere

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner Projekter: Kapitel 4 Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Kotiuitet og kotiuerte fuktioer Ord som kotiuert og kotiuerlig

Læs mere

Generelle lineære modeller

Generelle lineære modeller Geerelle lieære modeller Regressiosmodeller med é uafhægig itervalskala variabel: Y e eller flere uafhægige variable: X,..,X k De betigede fordelig af Y givet X,..,X k atages at være ormal med e middelværdi,

Læs mere

Maja Tarp AARHUS UNIVERSITET

Maja Tarp AARHUS UNIVERSITET AARHUS UNIVERSITET Maja Tarp AARHUS UNIVERSITET HVEM ER JEG? Maja Tarp, 4 år Folkeskole i Ulsted i Nordjyllad Studet år 005 fra Droiglud Gymasium Efter gymasiet: Militæret Australie Startede på matematik

Læs mere

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning Hvad er matematik? Projekter: Kaitel 9 Projekt 9 Regeregler for stokastiske variable middelværdi, varias og sredig Projekt 9 Regeregler for stokastiske variable middelværdi, varias og sredig Sætig : Regeregler

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet. Matematik A Studetereksame Forsøg med digitale eksamesopgaver med adgag til iterettet Forberedelsesmateriale Vejledede opgave Forår 0 til stx-a-net MATEMATIK Der skal afsættes 6 timer af holdets sædvalige

Læs mere

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside : Statistiske test Efteråret 00 Jes Friis, AAU Hjemmeside : http://akaaudk/jfj Kotiuerte fordeliger Defiitio: Tæthedsfuktio E sadsylighedstæthedsfuktio på R er e itegrabel fuktio f : R [0; [ hvor f d = Defiitio:

Læs mere

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk! Test i to populatioer Hypotesetest for parrede observatioer Test for es varias Gesy med flyskræk! Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og

Læs mere

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik Noter om ombiatori, Kirste Roseilde, februar 008 Kombiatori Disse oter er e itrodutio til ombiatori og starter helt fra bude, så e del af det idledede er siert edt for dig allerede, me der ommer også hurtigt

Læs mere

Asymptotisk optimalitet af MLE

Asymptotisk optimalitet af MLE Kapitel 4 Asymptotisk optimalitet af MLE Lad Y 1, Y 2,... være uafhægige, idetisk fordelte variable med værdier i et rum (Y,K). Vi har givet e model (ν θ ) θ Θ for fordelige af Y 1 (og dermed også for

Læs mere

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Epidemiologi og biostatistik. Forelæsig Uge, tirsdag. Niels Trolle Aderse, Afdelige for Biostatistik. Geerelt om kurset: - Formål - Forelæsiger - Øvelser - Forelæsigsoter - Bøger - EpiBasic: http://www.biostat.au.dk/teachig/software

Læs mere

Noter om kombinatorik, Kirsten Rosenkilde, februar 2008 1. Kombinatorik

Noter om kombinatorik, Kirsten Rosenkilde, februar 2008 1. Kombinatorik Noter om ombiatori, Kirste Roseilde, februar 008 Kombiatori Disse oter er e itrodutio til ombiatori og starter helt fra bude, så e del af det idledede er siert edt for dig allerede, me der ommer også hurtigt

Læs mere

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk! Statistik Lektio 8 Parrede test Test for forskel i adele Test for es varias Gesy med flyskræk! Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og kviders

Læs mere

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ ) 3. februar 003 Epidemiologi og biostatistik. Uge, torag d. 3. februar 003 Morte Frydeberg, Istitut for Biostatistik. Type og type fejl Nogle specielle metoder: Test i RxC tabeller Test i x tabeller Fishers

Læs mere

Renteformlen. Erik Vestergaard

Renteformlen. Erik Vestergaard Reteformle Erik Vestergaard 2 Erik Vestergaard www.matematikfysik.dk Erik Vestergaard, 2010. Billeder: Forside: istock.com/ilbusca Side 4: istock.com/adresrimagig Desude ege illustratioer. Erik Vestergaard

Læs mere

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6 Dee udgave er til geemkig på ettet. Boge ka købes for kr. 5 hos EH-Mat. E y og udvidet udgave med title»symbol- og formelskrivig«er udkommet september 00. Se mere om de her. Idholdsfortegelse Formelskrivig

Læs mere

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse Avedt Statistik Lektio 3 Pukt- og itervalestimater Kofidesitervaller Valg af stikprøvestørrelse Pukt- og itervalestimater: Motivatio Motiverede eksempel: I e udersøgelse er adele af rygere 0.27. Det aslås

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala Statistik for biologer 005-6, modul 5: Sadsylighedsfordeliger for kotiuerte data på iterval/ratioskala M6, slide Gægse matematiske sadsylighedsfordeliger: Diskrete data: De positive biomialfordelig Poisso-fordelige

Læs mere

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353 Takegagskompetece Hesigte med de følgede afsit er først og fremmest at skabe klarhed over de mere avacerede regeregler i skole og give resultatet i de almee form, der er karakteristisk for algebra. Vi

Læs mere

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer Statistik Lektio 7 Hpotesetest og kritiske værdier Tpe I og Tpe II fejl Strke af e test Sammeligig af to populatioer 1 Tri I e Hpotesetest E hpotesetest består af 5 elemeter: I. Atagelser Primært hvilke

Læs mere

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol Simpel Lieær Regressio Opsplitig af variatioe Determiatios koefficiet Variasaalse F-test Model-kotrol Opbgig af statistisk model Specificer model Ligiger og atagelser Estimer parametre Modelkotrol Er modelle

Læs mere

Sandsynlighedsregning

Sandsynlighedsregning Sadsylighedsregig E ote om sadsylighedsregig. Via basal sadsylighedsregig gøres læsere klar til forstå biomialfordelige. Herik S. Hase, Sct. Kud Versio 5.0 Opgaver til hæftet ka hetes her. PDF Facit til

Læs mere

Introduktion til Statistik

Introduktion til Statistik Itroduktio til Statistik 4. udgave Susae Ditlevse og Helle Sørese Susae Ditlevse, susae@math.ku.dk Helle Sørese, helle@math.ku.dk Istitut for Matematiske Fag Købehavs Uiversitet Uiversitetsparke 5 2100

Læs mere

Projekt 1.3 Brydningsloven

Projekt 1.3 Brydningsloven Projekt 1.3 Brydigslove Når e bølge, fx e lysbølge, rammer e græseflade mellem to stoffer, vil bølge ormalt blive spaltet i to: Noget af bølge kastes tilbage (spejlig), hvor udfaldsvikle u er de samme

Læs mere

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave 14. 20. december 2007

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave 14. 20. december 2007 Mikroøkoomi, matematik og statistik Eksameshjemmeopgave 14. 20. december 2007 Helle Buzel, Tom Egsted og Michael H.J. Stæhr 14. december 2007 R E T N I N G S L I N I E R F O R E K S A M E N S H J E M M

Læs mere

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6. enote 5 enote 5 Determiater I dee enote ser vi på kvadratiske matricer. Deres type er altså for 2, se enote 4. Det er e fordel, me ikke absolut ødvedigt, at kede determiatbegrebet for (2 2)-matricer på

Læs mere

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n Ladmåliges fejlteori Lektio 3 Estimatio af σ Dobbeltmåliger Geometrisk ivellemet Lieariserig - rw@math.aau.dk Istitut for Matematiske Fag Aalborg Uiversitet Repetitio: Middelværdi og Varias Sætig: Middelværdi

Læs mere

Projekt 9.10 St. Petersborg paradokset

Projekt 9.10 St. Petersborg paradokset Hvad er matematik? ISBN 978877066879 Projekt 9.0 St. Petersborg paradokset. De store tals lov & viderchacer I grudboges kapitel 9 omtales de store tals lov, som ka formuleres således: Hvis e spiller i

Læs mere

Vejledende besvarelser til opgaver i kapitel 15

Vejledende besvarelser til opgaver i kapitel 15 Vejledede besvarelser til opgaver i apitel 5 Opgave a) De teststatistier, ma aveder til at teste om to middelværdier er es, består af et estimat på forselle mellem middelværdiere,, divideret med et udtry

Læs mere

Den flerdimensionale normalfordeling

Den flerdimensionale normalfordeling De flerdimesioale ormalfordelig Stokastiske vektorer Ved e stokastisk vektor skal vi forstå e vektor, hvor de ekelte kompoeter er sædvalige stokastiske variable. For de stokastiske vektor Y = Y,..., Y

Læs mere

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset. STATISTIK Skriftlig evaluerig, 3. semester, madag de 30. auar 006 kl. 9.00-3.00. Alle hælpemidler er tilladt. Opgaveløsige forsyes med av og CPR-r. OPGAVE Ved e produktio af viduer er der mulighed for,

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Dages program Kvatitative metoder De multiple regressiosmodel 6. februar 007 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.- 3.+appedix E.) Defiitio og motivatio Fortolkig af

Læs mere

DATV: Introduktion til optimering og operationsanalyse, 2007. Bin Packing Problemet

DATV: Introduktion til optimering og operationsanalyse, 2007. Bin Packing Problemet DATV: Itroduktio til optimerig og operatiosaalyse, 2007 Bi Packig Problemet David Pisiger, Projektopgave 2 Dette er de ade obligatoriske projektopgave på kurset DATV: Itroduktio til optimerig og operatiosaalyse.

Læs mere

og Fermats lille Projekt 0.4 Modulo-regning, restklassegrupperne sætning ..., 44, 20,4,28,52,... Hvad er matematik? 3 ISBN

og Fermats lille Projekt 0.4 Modulo-regning, restklassegrupperne sætning ..., 44, 20,4,28,52,... Hvad er matematik? 3 ISBN Projekt 0.4 Modulo-regig, restklassegruppere sætig ( p 0, ) og Fermats lille Vi aveder moduloregig og restklasser mage gage om dage, emlig år vi taler om tid, om hvad klokke er, om hvor lag tid der er

Læs mere

og Fermats lille sætning

og Fermats lille sætning Projekter: Kaitel 0. Projekt 0. Modulo-regig, restklassegruer og Fermats lille sætig Projekt 0. Modulo-regig, restklassegruere ( { 0 }, ) og Fermats lille sætig Vi aveder moduloregig og restklasser mage

Læs mere

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik. 30. august 005 Epidemiologi og biostatistik. Forelæsig 3 Uge, torag d. 8. september 005 Michael Væth, Afdelig for Biostatistik. Mere om kategoriske data Test for uafhægighed I RxC tabeller Test for uafhægighed

Læs mere

x-klasserne Gammel Hellerup Gymnasium

x-klasserne Gammel Hellerup Gymnasium SANDSYNLIGHEDSREGNING OG KOMBINATORIK x-klassere Gammel Hellerup Gymasium Idholdsfortegelse SANDSYNLIGHEDSREGNING... 3 SANDSYNLIGHEDSFELT... 3 DE STORE TALS LOV... 4 Sadsyligheder og frekveser:... 4 STOKASTISK

Læs mere

Skitse til notat om hvor de forskellige sandsynlighedsfordelinger kan tænkes at komme fra

Skitse til notat om hvor de forskellige sandsynlighedsfordelinger kan tænkes at komme fra E6 efterår 1999 Notat 8 Jørge Larse 12. oktober 1999 Skitse til otat om hvor de forskellige sadsylighedsfordeliger ka tækes at komme fra I statistik opererer ma i vid udstrækig med et lille atal»stadardfordeliger«.

Læs mere

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504) Gamle eksamesopgaver Diskret Matematik med Avedelser (DM72) & Diskrete Strukturer(DM504) Istitut for Matematik& Datalogi Syddask Uiversitet, Odese Alle sædvalige hjælpemidler(lærebøger, otater etc.), samt

Læs mere

Vejledende opgavebesvarelser

Vejledende opgavebesvarelser Vejledede opgavebesvarelser 1. Atal hæder er lig med K(52,5), altså 2598960. Ved brug af multiplikatiospricippet ka atal hæder med 3 ruder og 2 spar udreges som K(13, 3) K(13, 2), hvilket giver 22308.

Læs mere

Stikprøvefordelinger og konfidensintervaller

Stikprøvefordelinger og konfidensintervaller Stikprøvefordeliger og kofidesitervaller Stikprøvefordelige for middelværdi De Cetrale Græseværdi Sætig Egeskaber Ved Estimatore Kofidesitervaller t-fordelige Estimator og estimat E stikprøve statistik

Læs mere

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2 Idhold 1 Pukt- og itervalestimatio 2 1.1 Puktestimatorer: Cetralitet(bias) og efficies.................... 2 2 Kofidesiterval 3 2.1 Kofidesiterval for adel................................ 4 2.2 Kofidesiterval

Læs mere

Modul 14: Goodness-of-fit test og krydstabelanalyse

Modul 14: Goodness-of-fit test og krydstabelanalyse Forskigsehede for Statistik ST01: Elemetær Statistik Bet Jørgese Modul 14: Goodess-of-fit test og krydstabelaalyse 14.1 Idledig....................................... 1 14.2 χ 2 -test i e r c krydstabel.............................

Læs mere

Noter om Kombinatorik 2, Kirsten Rosenkilde, februar

Noter om Kombinatorik 2, Kirsten Rosenkilde, februar Noter om Kombiatori, Kirste Roseilde, februar 008 1 Kombiatori Disse oter itroducerer ogle cetrale metoder som ofte beyttes i ombiatoriopgaver, og ræver et grudlæggede edsab til ombiatori (se fx Kombiatori

Læs mere

Lys og gitterligningen

Lys og gitterligningen Fysik rapport: Lys og gitterligige Forfatter: Bastia Emil Jørgese.z Øvelse blev udført osdag de 25. jauar 202 samme med Lise Kjærgaard Paulse 2 - Bastia Emil Jørgese Fysik rapport (4 elevtimer), februar

Læs mere

Bjørn Grøn. Analysens grundlag

Bjørn Grøn. Analysens grundlag Bjør Grø Aalyses grudlag Aalyses grudlag Side af 4 Idholdsfortegelse Kotiuerte og differetiable fuktioer 3 Differetial- og itegralregiges udviklig 5 3 Hovedsætiger om differetiable fuktioer 8 Opgaver til

Læs mere

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter Matematikkes mysterier - på et obligatorisk iveau af Keeth Hase 7. Ligiger, polyomier og asymptoter Hvad er e asymotote? Og hvorda fides de? 7. Ligiger, polyomier og asymptoter Idhold 7.0 Idledig 7.1 Udsag

Læs mere

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger Faculty of Life Scieces Program Esidet variasaalyse Normalfordelige Claus Ekstrøm E-mail: ekstrom@life.ku.dk Esidet variasaalyse (oe-way ANOVA) Hvilke type data? Hvad er problemstillige? Variatio mellem

Læs mere

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006 Dages program Økoometri De multiple regressiosmodel 5. februar 006 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.-3.3+appedix E.-E.) Defiitio og motivatio Fortolkig af parametree

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1 Økoometri 1 Iferes i de lieære regressiosmodel 9. september 006 Økoometri 1: F7 1 Dages program Opsamlig af hemmeopgave om Mote Carlo eksperimeter Mere om hypotesetest: Ekelt lieær restriktio på koefficieter

Læs mere

Program. Middelværdi af Y = t(x ) Transformationssætningen

Program. Middelværdi af Y = t(x ) Transformationssætningen Program Statistik og Sadsylighedsregig 2 Trasformatio af kotiuerte fordeliger på R, flerdimesioale kotiuerte fordeliger, mere om ormalfordelige Helle Sørese Uge 7, osdag I formiddag: Opfølgig på trasformatiossætige

Læs mere

Løsninger til kapitel 7

Løsninger til kapitel 7 Løsiger til kapitel 7 Opgave 7.1 a) HpoStat giver resultatet: Pop. varias er ukedt, me 30, så Normalf. bruges approksimativt = 54,400 s 1.069,90 = 00,000 0,95 49,868 58,93 Dette betder, at med 95% sikkerhed

Læs mere

Matematisk Modellering 1 Hjælpeark

Matematisk Modellering 1 Hjælpeark Matematisk Modellerig Hjælpeark Kaare B. Mikkelse 2005090 3. september 2007 Idhold Formler 2 2 Aalyse af k ormalfordelte prøver 2 2. Modelcheck............................................ 2 2.2 Test af

Læs mere

Dagens forelæsning. Claus Munk. kap. 1-3. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Dagens forelæsning. Claus Munk. kap. 1-3. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro Dages forelæsig Grudlæggede itroduktio til obligatioer Claus Muk kap. - 3 Betaligsrækker og låeformer Det daske obligatiosmarked Effektive reter 2 Obligatioer Grudlæggede Itro Obligatioer Grudlæggede Itro

Læs mere

Claus Munk. kap. 1-3

Claus Munk. kap. 1-3 Claus Muk kap. 1-3 1 Dages forelæsig Grudlæggede itroduktio til obligatioer Betaligsrækker og låeformer Det daske obligatiosmarked Pris og kurs Effektive reter 2 1 Obligatioer Grudlæggede Itro Debitor

Læs mere

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion Statistik 8. gag 1 KONIDENSINTERVALLER Kofidesitervaller: kapitel 11 Valg og test af fordeligsfuktio Statistik 8. gag 11. KONIDENS INTERVALLER Et kofides iterval udtrykker itervallet hvori de rigtige værdi

Læs mere

Morten Frydenberg version dato:

Morten Frydenberg version dato: Morte Frdeberg versio dato: 4--4 Itroduktio til kurset Statistik Forelæsig Morte Frdeberg, Sektio for Biostatistik af Biostatistik dele af. semester kurset. Statistiske modeller Biomialfordelige Normalfordelige

Læs mere

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier Noter om polyomier, Kirste Rosekilde, Marts 2006 1 Polyomier Disse oter giver e kort itroduktio til polyomier, og de fleste sætiger æves ude bevis. Udervejs er der forholdsvis emme opgaver, mes der til

Læs mere

Hovedpointer fra SaSt

Hovedpointer fra SaSt Hovedpoiter fra SaSt Marti Nørgaard Peterse 13. februar 2018 Følgede geemgår udvalgte begreber fra E Itroduktio til Sadsylighedsregig af M. Sørese (9. udgave), Itroductio to Likelihood-based Estimatio

Læs mere

Diskrete og kontinuerte stokastiske variable

Diskrete og kontinuerte stokastiske variable Diskrete og kotiuerte stokastiske variable Beroulli Biomial fordelig Negativ biomial fordelig Hypergeometrisk fordelig Poisso fordelig Kotiuerte stokastiske variable Uiform fordelig Ekspoetial fordelig

Læs mere

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a Matematik A Højere hadelseksame hhx151-mat/a-26052015 Tirsdag de 26. maj 2015 kl. 9.00-14.00 Matematik A Prøve består af to delprøver. Delprøve ude hjælpemidler består af opgave 1 til 5 med i alt 5 spørgsmål.

Læs mere

DATV: Introduktion til optimering og operationsanalyse, 2007. Følsomhed af Knapsack Problemet

DATV: Introduktion til optimering og operationsanalyse, 2007. Følsomhed af Knapsack Problemet DATV: Itroduktio til optimerig og operatiosaalyse, 2007 Følsomhed af Kapsack Problemet David Pisiger, Projektopgave 1 Dette er de første obligatoriske projektopgave på kurset DATV: Itroduktio til optimerig

Læs mere

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager Program Statistik og Sadsylighedsregig 2 Sadsylighedstætheder og kotiuerte fordeliger på R Helle Sørese Uge 6, madag Velkomme I dag: Praktiske bemærkiger Hvad skal vi lave på SaSt2? Sadsylighedstætheder

Læs mere

GENEREL INTRODUKTION.

GENEREL INTRODUKTION. Study Guide til Matematik C. OVERSIGT. Dee study guide ideholder følgede afsit - Geerel itroduktio. - Emeliste. - Eksame. - Bilag. Udervisigsmiisteriets bekedtgørelse for matematik C. GENEREL INTRODUKTION.

Læs mere

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE) (VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE) x-klassere Gammel Hellerup Gymasium Idholdsfortegelse INDLEDNING... 3 DESKRIPTIV STATISTIK... 3 Eksempler ide for deskriptiv statistik... 12 Normalfordeligskurver...

Læs mere

Talfølger og -rækker

Talfølger og -rækker Da Beltoft og Klaus Thomse Aarhus Uiversitet 2009 Talfølger og -rækker Itroduktio til Matematisk Aalyse Zeos paradoks om Achilleus og skildpadde Achilleus løber om kap med e skildpadde. Achilleus løber

Læs mere

Analyse 1, Prøve maj 2009

Analyse 1, Prøve maj 2009 Aalyse, Prøve 5. maj 009 Alle hevisiger til TL er hevisiger til Kalkulus (006, Tom Lidstrøm). Direkte opgavehevisiger til Kalkulus er agivet med TLO, ellers er alle hevisiger til steder i de overordede

Læs mere

Sandsynlighedsregning i biologi

Sandsynlighedsregning i biologi Om begrebet sadsylighed Sadsylighedsregig i biologi Hvis vi kaster e almidelig, symmetrisk terig, er det klart for de fleste af os, hvad vi meer, år vi siger, at sadsylighede for at få e femmer er 1/6.

Læs mere

Teoretisk Statistik, 9. februar Beskrivende statistik

Teoretisk Statistik, 9. februar Beskrivende statistik Uge 7 I Teoretisk Statistik, 9 februar 004 Beskrivede statistik Kategoriserede variable 3 Kvatitative variable 4 Fraktiler for ugrupperede observatioer 5 Fraktiler for grupperede observatioer 6 Beliggeheds-

Læs mere

FUNKTIONER del 1 Funktionsbegrebet Lineære funktioner Eksponentialfunktioner Logaritmefunktioner Rentesregning Indekstal

FUNKTIONER del 1 Funktionsbegrebet Lineære funktioner Eksponentialfunktioner Logaritmefunktioner Rentesregning Indekstal FUNKTIONER del Fuktiosbegrebet Lieære fuktioer Ekspoetialfuktioer Logaritmefuktioer Retesregig Idekstal -klassere Gammel Hellerup Gymasium November 08 ; Michael Szymaski ; mz@ghg.dk Idholdsfortegelse FUNKTIONSBEGREBET...

Læs mere

RESEARCH PAPER. Nr. 2, En model for lagerstørrelsen som determinant for købs- og brugsadfærden for et kortvarigt forbrugsgode.

RESEARCH PAPER. Nr. 2, En model for lagerstørrelsen som determinant for købs- og brugsadfærden for et kortvarigt forbrugsgode. RESEARCH PAPER Nr., 005 E model for lagerstørrelse som determiat for købs- og brugsadfærde for et kortvarigt forbrugsgode af Jørge Kai Olse INSTITUT FOR AFSÆTNINGSØKONOMI COPENHAGEN BUSINESS SCHOOL SOLBJERG

Læs mere

Estimation og test i normalfordelingen

Estimation og test i normalfordelingen af Birger Stjerholm Made Samfudlitteratur 07 Etimatio og tet i ormalfordelige Dee tekt ideholder et overblik over ogle grudlæggede pricipper for etimatio og tet i ormalfordelige i hyppigt forekommede ituatioer:

Læs mere

Introduktion til uligheder

Introduktion til uligheder Itroduktio til uligheder Dette er e itroduktio til ogle basale uligheder om det aritmetiske geemsit, det geometriske geemsit, det harmoiske geemsit og det kvadratiske geemsit. Først skal vi ved fælles

Læs mere

STATISTIK x-klasserne Gammel Hellerup Gymnasium

STATISTIK x-klasserne Gammel Hellerup Gymnasium STATISTIK x-klassere Gammel Hellerup Gymasium Jui 209 ; Michael Szymaski ; mz@ghg.dk Idholdsfortegelse INDLEDNING...3 DESKRIPTIV STATISTIK...4 Skemaer...5 Diagrammer...8 Statistiske deskriptorer... 0 Typetal

Læs mere

Introduktion til uligheder

Introduktion til uligheder Itroduktio til uligheder, marts 0, Kirste Rosekilde Itroduktio til uligheder Dette er e itroduktio til ogle basale uligheder om det aritmetiske geemsit, det geometriske geemsit, det harmoiske geemsit og

Læs mere

Forslag til besvarelser af opgaver m.m. i ε-bogen, Matematik for lærerstuderende

Forslag til besvarelser af opgaver m.m. i ε-bogen, Matematik for lærerstuderende Forslag til besvarelser af opgaver m.m. i ε-boge, Matematik for lærerstuderede Dette er førsteudgave af opgavebesvarelser udarbejdet i sommere 008. Dokumetet ideholder forslag til besvarelser af de fleste

Læs mere

Sammenligning af to grupper

Sammenligning af to grupper Sammeligig af to gruer Reetitio, heruder om kritiske værdier Sammeligig af to gruer Sammeligig af to middelværdier Sammeligig af to adele Sammeligig af to variaser yoteser og hyotesetest. E hyotese er

Læs mere

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros Brachevejledig ulykker idefor lager området Brachearbejdsmiljørådet for trasport og egros Baggrud Udersøgelser på lager- og trasportområdet har vist, at beskrivelse af hædelsesforløbet ved udfyldelse

Læs mere

De reelle tal. Morten Grud Rasmussen 5. november Se Sætning 3.6 og 3.7 for forskellige formuleringer af egenskaben og dens negation.

De reelle tal. Morten Grud Rasmussen 5. november Se Sætning 3.6 og 3.7 for forskellige formuleringer af egenskaben og dens negation. De reelle tal Morte Grud Rasmusse 5. ovember 2015 Ordede mægder Defiitio 3.1 (Ordet mægde). pm, ăq kaldes e ordet mægde såfremt: For alle x, y P M gælder etop ét af følgede: x ă y, x y, y ă x @x, y, z

Læs mere

StudyGuide til Matematik B.

StudyGuide til Matematik B. StudyGuide til Matematik B. OVERSIGT. Dee study guide ideholder følgede afsit Geerel itroduktio. Emeliste. Eksame. Bilag 1: Udervisigsmiisteriets bekedtgørelse for matematik B. Bilag 2: Bilag 3: Uddrag

Læs mere

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Itroducerede Statistik Forelæsig 12: Iferes for adele Klaus K. Aderse og Per Bruu Brockhoff DTU Compute, Statistik og Dataaalyse Damarks Tekiske Uiversitet 2800 Lygby Damark e-mail:

Læs mere

Projekt 9.8 Betingede sandsynligheder og paradokser i sandsynlighedsregningen

Projekt 9.8 Betingede sandsynligheder og paradokser i sandsynlighedsregningen Projekt 9.8 Betigede sadsyligheder og paradokser i sadsylighedsregige Et forløb om betigede sadsyligheder ka itroduceres via et selvstædigt elevarbejde med materialet i projekt 9.7 Testet positiv? samme

Læs mere

Konfidens intervaller

Konfidens intervaller Kofides itervaller Kofides itervaller for: Kofides iterval for middelværdi, varias kedt Kofides iterval for middelværdi, varias ukedt Kofides iterval for adel Kofides iterval for varias Bestemmelse af

Læs mere

Projekt 3.2 Anlægsøkonomien i Storebæltsforbindelsen. Indhold. Hvad er matematik? 1 ISBN

Projekt 3.2 Anlægsøkonomien i Storebæltsforbindelsen. Indhold. Hvad er matematik? 1 ISBN Projekt 3.2 Alægsøkoomie i Storebæltsforbidelse Dette projekt hadler, hvorda økoomie var skruet samme, da ma byggede storebæltsforbidelse. Store alægsprojekter er æste altid helt eller delvist låefiasieret.

Læs mere

- et værktøj til fejlrettende QR-koder. Projekt 0.3 Galois-legemerne. Indhold. Hvad er matematik? A, i-bog

- et værktøj til fejlrettende QR-koder. Projekt 0.3 Galois-legemerne. Indhold. Hvad er matematik? A, i-bog Projekt 0.3 Galois-legemere GF é ëp û - et værktøj til fejlrettede QR-koder Idhold De karakteristiske egeskaber ved de tre mest almidelige talsystemer, og... De kommutative, associative og distributive

Læs mere

Undersøgelse af numeriske modeller

Undersøgelse af numeriske modeller Udersøgelse af umeriske modeller Formål E del af målsætige med dette delprojekt er at give kedskab til de begræsiger, fejl og usikkerheder, som optræder ved modellerig. I de forbidelse er følgede udersøgelse

Læs mere