TEKST NR TEKSTER fra IMFUFA

Størrelse: px
Starte visningen fra side:

Download "TEKST NR 435 2004. TEKSTER fra IMFUFA"

Transkript

1 TEKST NR Basisstatisti 2. udgave Jørge Larse August 2006 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING OG ANVENDELSER

2 IMFUFA Rosilde Uiversitetsceter Postbos 260 DK-4000 Rosilde Jørge Larse: BASISSTATISTIK, 2. udgave t f m imfufa@ruc.d w imfufa.ruc.d IMFUFA test r sider iss Erstatter IMFUFA test r Idhold Idledig 7 Dee bog er udarbejdet til brug som udervisigsmateriale til et idledede ursus i statisti og statistise modeller. Boge besæftiger sig med simple esempler på statistise modeller. Statistise modeller er e særlig type matematise modeller som bruges for at besrive talmaterialer som er behæftet med e eller ade form for tilfældig variatio. Der præseteres e del af de simple og lassise modeller for bladt adet biomialfordelte, poissofordelte og ormalfordelte observatioer, me der er også esempler på mere omplicerede modeller så som logistis regressio og multipliative poissomodeller. I alle tilfælde er der illustrative geemregede esempler. Når ma besæftiger sig med statisti og statistise metoder, har ma brug for hesigtsmæssige rege- og tegeredsaber. I ærværede fremstillig er idføjet små afsit der viser hvorda ma a rege og tege med brug af programmet R (se http: // August 2006: rettet ogle fejl og foretaget adsillige typografise justeriger. Biomialfordelige 9. Et esempel og e statistis model Biomialoefficieter Egesaber ved biomialfordelige Reg og teg Opgaver De simple biomialfordeligsmodel Estimatio af parametere p E simpel statistis hypotese Kvotietteststørrelse Reg og teg Opgaver Sammeligig af biomialfordeliger Modelle Hypoteseprøvig Det esate test i e 2 2-tabel Reg og teg Opgaver Normalfordelige Udledig af ormalfordelige Egesaber ved ormalfordelige Reg og teg Opgaver Estiprøveproblemet i ormalfordelige 6 5. Estimatio af µ og σ

3 4 Idhold Test af hypotese om middelværdie Histogrammer og fratildiagrammer Reg og teg Opgaver Tostiprøveproblemer i ormalfordelige Tostiprøveproblemet med uparrede observatioer Tostiprøveproblemet med parrede observatioer Reg og teg Opgaver Esidet variasaalyse Estimatio af parametree Hypotese om es grupper Bartletts test for variashomogeitet Reg og teg Opgaver Simpel lieær regressiosaalyse Præsetatio af modelle Estimatio af parametree Parameterestimateres middelfejl E ade formulerig af modelle Modelotrol Test af hypoteser om lijes parametre Reg og teg Opgaver Multipel lieær regressiosaalyse 3 9. Estimatio af parametree Modelotrol Udvælgelse af baggrudsvariable Reg og teg Opgaver Logistis regressio 4 0. Grudmodelle E dosis-respos model Estimatio Modelotrol Hypoteser om parametree Reg og teg Opgaver Poissofordelige 55. Udledig Defiitio og egesaber Afrudig Opgaver E- og flerstiprøveproblemer i poissofordelige Estiprøveproblemet Sammeligig af to poissofordeliger Et sværere esempel Reg og teg Opgaver Multipliative poissomodeller Præsetatio af esemplet: Lugeræft i Fredericia Modelopstillig De multipliative model Es byer? E ade mulighed Sammeligig af de to fremgagsmåder Om teststørrelser Reg og teg Multiomialfordelige De grudlæggede multiomialfordeligsmodel Sammeligig af multiomialfordeliger Reg og teg Opgaver Tosidede otigestabeller Grudmodelle Uafhægighedshypotese Jævførig med adre tilsvarede modeller Reg og teg Opgaver

4 6 Idhold 6 Et større esempel: Tors i Østersøe Præsetatio af esemplet Hardy-Weiberg ligevægt Hypotese om Hardy-Weiberg ligevægt E samlet model Reg og teg Referecer 223 Kort om statistiprogrammet R 225 Tabeller 227 Stiord 235 Idledig Dee bog besæftiger sig med simple esempler på statistise modeller. Statistise modeller er e særlig type matematise modeller som bruges for at besrive talmaterialer som er behæftet med e eller ade form for tilfældig variatio. De statistise modellers force er at de a bruges til at sille det systematise fra det tilfældige. Der melder sig forsellige slags spørgsmål i forbidelse med statistise modeller: hvorda ser modellere ud, og hvad er det for ogle matematise igredieser der idgår? hvorda fider ma på e model der a bruges i e give situatio? hvad stiller ma så op med modelle i forhold til de orete tal? hvad er det for typer af spørgsmål ma a stille til e statistis model, og hvad er det for typer af svar ma får? Disse spørgsmål disuteres idgåede. Der præseteres ogle af de simple og lassise modeller for bladt adet biomialfordelte, poissofordelte og ormalfordelte observatioer, me der er også esempler på mere omplicerede modeller så som logistis regressio og multipliative poissomodeller. I alle tilfælde er der illustrative geemregede esempler. Fremstillige er baseret på lielihood-metode hvis grudlæggede idéer præseteres omhyggeligt; derimod må vi af teise grude give afald på de matematise beviser for metodes fortræffeligheder. Allerede e hastig geembladre af boge vil måse give aledig til beymrede spørgsmål om hvorfor der er så meget matemati, og om det u også virelig er ødvedigt med alle de formler. Der er flere forsellige svar herpå:. Et dårligt, me dog ie uvæsetligt svar er at boge sal bruges som ursusmateriale på et ursus med status af matematiholdigt ursus. 2. Statistise modeller er e uderafdelig af matematise modeller, og det a derfor ie udre at modellere og metodere formuleres i matematisprog. For bare at forstå e give statistis model og des relatio til de virelige problemstillig er det ødvedigt med e vis matemati-vathed, og hvis ma sal ue arbejde med og tilpasse modelle og forholde sig ritis til des futio som model, 7

5 8 Idledig fordres edu flere matematiompetecer. Hvis ma derfor føler sig alvorligt sræmt af de mage formlers tilstedeværelse, sulle ma måse søge professioel hjælp, ete til at få løst sie statistise problemer eller til at få et bedre forhold til matemati. 3. Ét er at få at vide at ma ud fra formel A a deducere formel B, oget adet er at have set hvorda det foregår, oget tredje er selv at have reget det igeem, og oget fjerde er selv at have udledt e dedutio af B fra A. De første mulighed a ie være eerådede i oget udervisigsforløb i matemati eller et matematibaseret fag, og af pratise og tidsmæssige grude a ma ie basere et helt udervisigsforløb på de fjerde mulighed. Mulighed to bør altid idgå i et udervisigsforløb, og ærværede bog ideholder derfor e del geemregede matematise udlediger. 4. Faget statisti har i ogle sammehæge et lidt blaet ry (»ma a vise alt med statisti, også det modsatte«), og bladt adet af de grud er det vigtigt i e itrodutio til faget også at largøre hvor der er tale om idisutable matematise dedutioer, og hvor der er grud til at være på vagt, eller sagt på e ade måde: at tydeliggøre fagets bladig af vedtage grudpricipper, esat videsab og ie spor esat hådvær. Matemati idgår på uudværlig vis i alle tre dele. Når ma besæftiger sig med statisti og statistise metoder, har ma brug for hesigtsmæssige rege- og tegeredsaber. Mage af de grudlæggede modeller a ude vaseligheder aalyseres med e almidelig lommereger som regeredsab og med blyat og teret papir til tegiger, me så sart modellere bliver lidt mere idvilede, er det e fordel at beytte e computer med et statistiprogram. I ærværede fremstillig er idføjet små afsit med oversrifte»reg og teg«der viser hvorda ma a rege og tege med programmet R. R er et freeware program, se Vi giver ie e lærebogsagtig præsetatio af R. De bedste måde at lære R på er formetlig ved e ombiatio af at se hvorda adre har gjort og selv at prøve sig frem, og udervejs bør ma beytte o-lie hjælpe (som er relativt god). Det er dog o yttigt med e ultraort itrodutio, så e såda gives på side 225. Biomialfordelige Biomialfordeligsmodeller a omme på tale i situatioer af følgede art: Ma har et bestemt elemetarforsøg der a resultere i et af to mulige udfald som vi alder og 0 (eller Gustig og Ie-gustig, eller Succes og Fiaso). Det er bestemt af tilfældigheder om elemetarforsøget giver det ee eller det adet udfald. Ma udfører getagelser af elemetarforsøget, hvor er et på forhåd fastlagt tal. Derefter ma tæller op hvor mage af de getagelser der giver udfaldet. Resultatet bliver et atal y der i sages atur er et heltal mellem 0 og. De forsellige mulige værdier af y vil idtræffe med visse sadsyligheder der afhæger af tilfældighedsmeaismes ærmere idretig. Det samlede forsøg, altså det som består af de elemetarforsøg og som resulterer i atallet y, aldes et biomialforsøg.. Et esempel og e statistis model Her er et esempel som vi vil bruge flere gage (esemplet er hetet fra [6]): I e udersøgelse af iseters reatio på isetgifte pyrethrum har ma udsat ogle rismelsbiller, Tribolium castaeum, for forsellige mægder gift og derpå set hvor mage der var døde efter 3 dages forløb. Bladt adet blev 44 ha-biller udsat for e giftpåvirig på 0.20 mg/cm 2 ; af disse døde de 43 i løbet af de fastsatte periode. Her a vi sige at et elemetarforsøg består i at udsætte é ha-bille for giftpåvirige 0.20 mg/cm 2 og så se om de er død eller ej efter 3 dage (dvs.»dødgustigt udfald«). Vi vil opstille e matematis model for de besreve situatio. Vi deler ræsoemetet op i e ræe puter:. For hvert elemetarforsøg idfører vi e såaldt idiatorvariabel X der agiver om forsøget giver et 0 eller et. Idiatorvariable hørede til elemetarforsøg r. j er X j : hvis bille r. j dør X j = 0 hvis bille r. j ie dør 9

6 0 Biomialfordelige. Et esempel og e statistis model 2. Det samlede atal døde biller a da srives som Y = X +X 2 + +X. I esemplet eder vi ie de eelte X j -er, me u Y; Y har værdie y = Idiatorvariablee X, X 2,..., X er stoastise variable. E stoastis variabel er ort fortalt et symbol der repræseterer det tilfældige udfald af et bestemt tilfældighedsesperimet. Om X j -ere atages det at a) de har alle de samme sadsylighed p for at atage værdie, det vil sige P(X j = ) = p for ethvert j, b) de er stoastis uafhægige, det vil sige for vilårlige x, x 2,..., x gælder P(X = x, X 2 = x 2,... X = x ) = P(X = x ) P(X 2 = x 2 )... P(X = x ). Da X j u a atage værdiere 0 og, og da summe af sadsylighedere er, er P(X j = 0) = p for ethvert j. 4. Vi a srive sadsylighedsfutioe for X j som p hvis x = f (x) = P(X j = x) = p hvis x = 0 eller ortere som f (x) = P(X j = x) = p x ( p) x, x = 0,. [Sadsylighedsfutioe for e stoastis variabel X er de futio der til hvert tal x ytter sadsylighede for at X atager værdie x.] 5. De simultae sadsylighedsfutio for de stoastise variable X, X 2,..., X er e futio f (x, x 2,..., x ) der agiver sadsylighede for at der samtidigt gælder at X = x og X 2 = x 2 og... og X = x. Da X j -ere er stoastis uafhægige, er de simultae sadsylighedsfutio for X j -ere produtet af de eelte sadsylighedsfutioer: f (x, x 2,..., x ) = P(X = x ) P(X 2 = x 2 )... P(X = x ) = p x ( p) x p x2 ( p) x2... p x ( p) x = p x+x2+ +x ( p) (x+x2+ +x) år (x, x 2,..., x ) er et talsæt beståede af 0-er og -er. Hvis der i talsættet (x, x 2,..., x ) er etop y -er og ( y) 0-er, så er f (x, x 2,..., x ) = p y ( p) y. 6. Da vi u eder de simultae sadsylighedsfutio for X j -ere, a vi bestemme sadsylighedsfutioe for Y = X + X X. Sadsylighede for at Y er lig med y, a fides ved at summere sadsylighedere for alle de sæt af elemetarforsøg som består af præcis y -udfald og ( y) 0-udfald: P(Y = y) = x +x 2+ +x =y f (x, x 2,..., x ) Tabel. Her ses 5 esempler på udfald af 0-variable X, X 2,..., X 2, frembragt af e tilfældighedsmeaisme med p = 3, samt de tilsvarede værdier af Y = X + X X 2. Tallee i y-søjle er således 5 observatioer fra e biomialfordelig med = 2 og p = 3. x x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x 0 x x 2 y hvor meige er at der summeres over alle talsæt (x, x 2,..., x ) der består af 0-er og -er og hvor x + x x = y (dvs. hvor der er etop y -er og ( y) 0-er). Vi fadt frem til at ethvert af disse talsæt har sadsylighed p y ( p) y, så derfor bliver P(Y = y) = A p y ( p) y hvor A er atal forsellige talsæt (x, x 2,..., x ) med y -er og ( y) 0-er. 7. Atallet A af forsellige talsæt (x, x 2,..., x ) beståede af y -er og ( y) 0-er afhæger af værdiere af og y; ma plejer at betege det med symbolet ( y ) (udtales» over y«). Størrelse ( ) y aldes e biomialoefficiet. 8. Alt i alt er vi dermed ået frem til at sadsylighedsfutioe for Y er P(Y = y) = ( y ) py ( p) y, y = 0,, 2,...,. Dee sadsylighedsfordelig hedder biomialfordelige med sadsylighedsparameter p og atalsparameter, og ma siger at Y er biomialfordelt med parametre og p. Atalsparametere er et edt heltal, og sadsylighedsparametere p, som typis er uedt, er et tal mellem 0 og. Stoastise variable der som X j -ere u a atage værdiere 0 og, aldes udertide for 0-variable. Der gælder altså at hvis Y er e sum af et bestemt atal uafhægige idetis fordelte 0-variable, så er Y biomialfordelt.

7 2 Biomialfordelige.2 Biomialoefficieter 3 De statistise model for bille-forsøget a u ort formuleres således: Observatioe y = 43 er e observeret værdi af e stoastis variabel Y som er biomialfordelt med atalsparameter = 44 og uedt sadsylighedsparameter p [0, ]. Før vi a give os i ast med statistis aalyse af biomialfordelte observatioer, er det ødvedigt at lære forselligt om biomialfordelige og om biomialoefficieter..2 Biomialoefficieter Defiitio.: Biomialoefficiet Biomialoefficiete ( ) er et symbol der beteger atallet af forsellige måder hvorpå ma a placere to symboler og 0 på pladser således at symbolet ommer på af pladsere og symbolet 0 ommer på de resterede ( ) pladser. Deraf følger at der er ( ) forsellige talsæt (x, x 2,..., x ) beståede af etop -er og ( ) 0-er. Ud fra defiitioe a ma i pricippet bestemme talværdier af ehver biomialoefficiet ved simpel optællig, esempelvis er ( 4 ) 3 lig med 4, fordi der er de fire placeriger (,,, 0), (,, 0, ), (, 0,, ) og (0,,, ) af tre -er og et 0 på de fire pladser. I prasis er optælligsmetode dog ie særlig hesigtsmæssig (prøv f.es. at bestemme ( 37 ) 5 ved optælligsmetode); over de æste par sider udledes ogle formler der a gøre beregigsarbejdet lidt mere overommeligt. I defiitioe af ( ) sal ma placere -er og ( ) 0-er. Hvis ma i e såda placerig alder -ere for 0 og 0-ere for, så får vi i stedet e placerig af ( ) -er og 0-er. Heraf følger at ( ) = ( ) for = 0,, 2,..., og = 0,, 2,... (.) Hvis er 0 eller eller eller ( ), er det let at udrege ( ); af defiitioe og formel (.) får ma ( 0 ) = og dermed ( ) =, for = 0,, 2,... ( ) = og dermed ( ) =, for =, 2, 3,... De forsellige placeriger af -er og ( ) 0-er a opdeles i to grupper:. Placeriger der har et på sidstepladse. På de første ( ) pladser er der da etop ( ) -er, og de a placeres på ( ) forsellige måder. Dee gruppe består derfor af ( ) forsellige placeriger. 2. Placeriger der har et 0 på sidstepladse. På de første ( ) pladser er der da etop -er, og de a placeres på ( ) forsellige måder. Dee gruppe består derfor af ( ) forsellige placeriger. Det samlede atal er lig summe af de to; dermed er vist at Esempel ( ) = ( ) + ( ) for =, 2, 3,..., og =, 2, 3,... (.2) Som illustratio bestemmes talværdie af ( 5 2 ). Ifølge formel (.2) er ( 5 2 ) = (4 2 ) + (4 ), så hvis vi eder talværdiere af (4 2 ) og (4 ), a vi løse opgave. Der gælder at ( 4 ) = 4 (fordi geerelt er ( ) = ). For at udrege ( 4 2 ) beytter vi formel (.2) e gag til: (4 2 ) = (3 2 ) + (3 ). Der gælder at ( 3 ) = 3. Der gælder også at ( 3 2 ) = 3 (fordi ( ) = ). Dermed er ( 4 2 ) = = 6. Dermed er ( 5 2 ) = (4 2 ) + (4 ) = = 0 hvad ma jo også a se ved simpel optællig. Pascals treat Formel (.2) er ie særlig veleget år ma øser at berege e eelt biomialoefficiet, me de er overordetlig pratis hvis ma øser at berege alle biomialoefficieter op til e eller ade øvre græse for. Vi eder på forhåd biomialoefficietere med = 0 og = (de er ( 0 0 ) = og ( 0 ) = ( ) = ). Ved hjælp af formel (.2) a vi berege alle oefficieter med = 2, derefter alle med = 3, derefter alle med = 4, osv. Ma plejer at stille resultatere op i et sema der aldes Pascals treat, se figur.. Heraf ses at f.es. er ( 7 ) 2 lig 2. Hvert tal i Pascals treat fremommer ifølge formel (.2) som summe af de to ærmeste tal i ræe lige oveover, f.es. er 2 = Pascals treat er opaldt efter de frase videsabsmad og tæer Blaise Pascal (623-62). Flere formler Ved brug af Pascals treat vil det være muligt at bestemme talværdier af ehver biomialoefficiet; ma sulle dog udføre e hel del additioer og have et temmelig stort ar papir for at udrege f.es. ( 37 ). 5 Heldigvis fides der også e ade og midre pladsrævede metode hvor ma så til gegæld sal lave ogle multipliatioer og divisioer. Som forberedelse til dee metode sal vi bruge edu e formel for biomialoefficieter.

8 4 Biomialfordelige.3 Egesaber ved biomialfordelige 5 biomialoefficietere ( ) Figur. Pascals treat. Atag ige at vi sal fordele -er og ( ) 0-er på pladser, me u er et af -ere mæret. Vi a bestemme atallet af syligt forsellige placeriger på to måder:. Bestem først hvile pladser der sal have et 0: Det a gøres på ( ) = ( ) måder. Nu er der pladser reserveret til -er, og der er derfor forsellige måder at placere det mærede på. I alt er der derfor ( ) syligt forsellige placeriger. 2. Bestem først hvile pladser der sal have et umæret. Det a gøres på ( ) måder. Derefter a det mærede placeres på e af de resterede ( + ) pladser. I alt er der derfor ( + ) ( ) syligt forsellige placeriger. Da de to atal er es, er ( ) = ( + ) ( ), og ved at flytte rudt på fatorere fås ( ) = + ( ) for =, 2,..., og =, 2,... (.3) Dee formel fortæller hvorda ma fider ( ) hvis ma eder ( ). Ved getage avedelser af formel (.3) fås i øvrigt dvs. ( ( + ) ) = ( ) ( + ) ( + 2) = ( 2 ) ( + ) ( + 2) ( + 3) = ( 2 3 ) = ( ) = = ( + ) ( ) 2 ( + 2)... ( 2) ( + )... 3 ( 2) 3 for ( ) 2, =, 2,..., =, 2,... (.4) (Hvis er 0, er højreside»det tomme produt«som er.) Hvis ma på højreside af (.4) gager med ( ) ( ) i tæller og æver, får ma ( ) =!! ( )! for =, 2,..., =, 2,... (Når m er et positivt heltal, så er m! = 2 3 (m ) m; edvidere er 0! =.) Ved hjælp af formel (.4) og papir og blyat og lommereger fider ma let at ) = ( 37 5 Biomialformle Hvorfor hedder det»biomialoefficiet«? Et bi-omium er e to-leddet størrelse som f.es. a + b. E veledt formel fortæller hvad vadratet på e toleddet størrelse er: (a + b) 2 = a 2 + 2ab + b 2. Dee formel a geeraliseres til at hadle om de -te potes af e toleddet størrelse. Hvis ma i (a + b) = (a + b)(a + b)... (a + b) fatorer gager paretesere ud, får ma 2 led der hver især er et produt af fatorer, e fra hvert af de biomier. Af disse 2 led er der etop ( ) der består af a-er og ( ) b-er. Derfor er (a + b) = ( 0 )a0 b + ( )a b + ( 2 )a2 b ( )a b 0 = ( )a b. =0 Dee formel hedder biomialformle, fordi de hadler om -te potese af et biomium. De oefficieter der idgår i biomialformle, aldes aturligt o biomialoefficieter..3 Egesaber ved biomialfordelige Defiitio.2: Biomialfordelig Biomialfordelige med sadsylighedsparameter p og atalsparameter er de disrete sadsylighedsfordelig givet ved sadsylighedsfutioe f (y) = ( y ) py ( p) y, y = 0,, 2,...,. Her er p et (som oftest uedt) tal mellem 0 og, og er et positivt heltal. (.5)

9 6 Biomialfordelige.4 Reg og teg 7 Middelværdi og varias Når ma har at gøre med e sadsylighedsfordelig, a ma udrege visse talstørrelser der besriver forsellige træ ved fordelige. Ma udreger ofte fordeliges middelværdi (= de forvetede værdi =»tygdeputet«i fordelige). Hvis Y er e stoastis variabel der har e fordelig med sadsylighedsfutio f, så er middelværdie pr. defiitio tallet E Y = y f (y) hvor der summeres over alle de mulige y-værdier. For biomialfordeliges vedommede er middelværdie altså tallet E Y = y ( y ) py ( p) y. y=0 Dee sum ser ie så rar ud, me heldigvis a vi fide middelværdie på e ade og smartere måde. Som omtalt på side a e biomialfordelt stoastis variabel Y fremomme som e sum af uafhægige idetis fordelte 0-variable, så lad os sige at Y = X + X X hvor X, X 2,..., X er uafhægige 0-variable med P(X j = ) = p for alle j. Ifølge regeregler for middelværdi er middelværdie af e sum lig summe af middelværdiere: E Y = E X + E X E X = E X, så problemet er u reduceret til at bestemme E X, og det er overommeligt ud fra defiitioe af middelværdi: E X = 0 P(X = 0) + P(X = ) = 0 ( p) + p = p. Vi har dermed fudet at E Y = p. Deræst ser vi på variase. Variase af e stoastis variabel Y med sadsylighedsfutio f er pr. defiitio Var Y = E((Y E Y) 2 ) = (y E Y) 2 f (y) hvor der summeres over de mulige y-værdier. For at fide variase af vores biomialfordelte stoastise variabel Y = X +X 2 + +X a vi beytte et smart tric: Det er e egesab ved varias at variase af e sum af uafhægige størrelser er lig summe af variasere af de eelte led. Derfor er Var Y = Var X + Var X Var X = Var X, og vi behøver u blot fide variase af X ; da X u atager værdiere 0 og, bliver udregigere simple: Var X = E((X E X ) 2 ) = E((X p) 2 ) Vi har hermed fudet at Var Y = p( p). = (0 p) 2 P(X = 0) + ( p) 2 P(X = ) = p 2 ( p) + ( p) 2 p = p( p). Sammefattede gælder at hvis de stoastise variabel Y er biomialfordelt med parametre og p, så er E Y = p og Var Y = p( p). E fordeligs stadardafvigelse er pr. defiitio vadratrode af variase, dvs. for biomialfordeliges vedommede p( p). Udregig af biomialsadsyligheder Hvis ma øser at udrege biomialsadsylighedere f (y) = ( y ) py ( p) y for y = 0,, 2,...,, er det som regel ie hesigtsmæssigt bare ude videre at idsætte i formle. Ma a med fordel beytte e reursiosformel. Ved simple omsriviger fider ma at f (y) f (y ) = y + p, y =, 2,...,, y p således at f (y) let a bereges ud fra f (y ). Metode bliver dermed f (0) = ( p), f (y) = f (y ) y + y p, y =, 2,...,. p Esempel. Som esempel vil vi berege og tege sadsylighedsfutioe for biomialfordelige med = 8 og p = 6. (Dee fordelig ue f.es. besrive atallet af sesere ved 8 ast med e almidelig terig.) Fordelige har i øvrigt middelværdi 8 6 = 3 og varias = 2.5 (svarede til stadardafvigelse.58). Ved at bruge de besreve metode udreges fordeliges sadsylighedsfutio f og ma får tabelle i figur.2..4 Reg og teg Her omtales hvorda ma a foretage de forsellige beregiger med R-programmet. Biomialoefficieter Biomialoefficieter udreges med futioe choose, f.es. giver choose(5,2) værdie af ( 5 2 ).

10 8 Biomialfordelige.5 Opgaver 9 y f (y) = ( 8 y )( 6 )y ( 5 6 )8 y ssh Figur.2 Tabel hhv. pidediagram over sadsylighedsfutioe for biomialfordelige med = 8 og p = 6. Biomialsadsyligheder Biomialsadsyligheder udreges med futioe dbiom. Esempelvis a sadsylighedere i biomialfordelige med = 8 og p = 6 udreges såda: <- 8 # får værdie 8 y <- 0: # y bliver vetore (0,, 2,..., 8) ssh <- dbiom(y, size=, prob=/6) # udreg ( y )( 6 )y ( 6 ) y ssh # udsriv resultatet roud(ssh, digits=3) # udsriv resultatet afrudet til 3 decimaler: Pidediagrammet i figur.2 a derefter fremstilles såda: Tabel. barplot(ssh, space=.5, ames.arg=y, las=, xlab="y", ylab="ssh") Ma a fremstille e tabel som tabel. på følgede måde, hvor aldet af rbiom leverer 80 tilfældige tal fra e biomialfordelig med = og p = 3, futioe matrix putter tallee id i e matrix med det øsede atal ræer, futioe rowsums udreger ræesummer, og futioe cbid sætter matricer samme lags søjler (c = colums): y t <- matrix(rbiom(80, size=, prob=/3), row=5) cbid(t, rowsums(t)).5 Opgaver Opgave. Tabel. (side ) er fremstillet på de måde at ma har sat et computerprogram til at frembrige udfald af 0-variable X, X 2,..., X såda at sadsylighede for værdie hver gag er et givet tal p (som er 3 ).. Udreg sadsylighede for at få det talsæt x, x 2,..., x der står i ræe ummer Udreg sadsylighede for at få det talsæt x, x 2,..., x der står i ræe ummer Opsriv sadsylighedsfutioe for X, X 2,..., X. 4. Opsriv sadsylighedsfutioe for Y = Opgave.2 På side åede vi frem til e tilstræelig betigelse for at e stoastis variabel Y er biomialfordelt. Overvej med dee betigelse i mete om ma a beytte biomialfordeligsmodeller i edeståede ort sitserede situatioer (agiv i givet fald hvad elemetarforsøgee og hvad parametree og p er): X j.. Atal toere ved fem ast med e almidelig terig. 2. Atal toere ved et ast med fem almidelige teriger. 3. Atal gage ma sal aste e almidelig terig for at få e toer. 4. Atal bør i e solelasse som bruger briller. 5. Atal yregistrerede aids-tilfælde i Damar i maj år Atal yregistrerede aids-tilfælde i Damar i maj år Atal passagerer i e ht-bus som ved forrige valg stemte på Das Foleparti. 8. Atal tryfejl i e bog. Opgave.3 Udreg biomialoefficiete ( 2 ), dels ved hjælp af Pascals treat, dels ved hjælp af formel 5 (.4) (og ude at bruge lommeregere). Opgave.4 I tabel. er vist udfald y, y 2,..., y 5 af e stoastis variabel Y som er biomialfordelt med atalsparameter 2 og sadsylighedsparameter 3.. Udreg e tabel over fordelige af Y (altså e tabel over sadsylighedsfutioe for biomialfordelige med atalsparameter 2 og sadsylighedsparameter 3 ). Sammelig med de empirise fordelig af y, y 2,..., y 5 (altså de relative hyppigheder hvormed udfaldee 0,, 2,..., 2 fatis er foreommet).

11 20 Biomialfordelige.5 Opgaver 2 2. Teg et pidediagram over fordelige af Y (altså e tegig i stil med figur.2). Teg desude et pidediagram over de empirise fordelig. Liger de to fordeliger hiade? 3. Hvor mage gage ud af 5 getagelser sulle ma forvete at få observatioe Y = 5? Hvor mage gage har ma fatis fået observatioe 5? 4. Udreg middelværdie af Y. Udreg variase og stadardafvigelse af Y. Opgave.5 (Fru Hase spiller bao) Fru Hase går til bao-spil de fem af uges dage. Hu a derfor opleve at der er 0,, 2, 3, 4 eller 5 dage i løbet af uge hvor hu går hjem med e gevist, me det er tilfældigt hvad det fatise atal»gevistdage«bliver. Ma a derfor for e give uge idføre e stoastis variabel Y som sal stå for»atal gevistdage i de pågældede uge«. Ma vil gere vide oget om fordelige af Y, især oget om E Y, det forvetede atal gevistdage på e uge. Atag at der hver dag er sadsylighede p for at hu vider.. Formulér e passede statistis model for atallet Y af gevistdage. 2. Hvad er det forvetede atal gevistdage E Y? Teg grafe for E Y som futio af p. 3. For at få et idtry af hvor meget Y a variere fra uge til uge, vil ma også gere vide oget om Var Y. Hvad er variase af Y? Teg grafe for Var Y som futio af p; hvorår er variase størst, og hvor stor er de da? 4. Baospilarragøre vil idrette det såda at hvis ma spiller hver af uges fem»arbejdsdage«, så sal ma ue forvete etop é gevistdag. a) Hvad sal ha da vælge p til at være? b) Teg de tilsvarede fordelig af Y. c) Hvor stor er variase i fordelige? 5. Fru Hase vil spille i 0 uger. Hvor mage uger må hu forvete at hu ie får e eeste gevistdag?. Vis med udgagsput i defiitio. at der er ( R ) forsellige måder hvorpå ma a r udtage r røde ugler ude tilbagelægig. 2. Ma vil udtage ugler i alt fra asse, stadig ude tilbagelægig. Fid atallet af forsellige måder det a gøres på således at ma får etop r røde og ( r) hvide ugler. Svaret er ( R ) ( H ). Det er uderforstået at r et et heltal der opfylder visse betigelser: r r a) 0 r : atal udtage røde ugler må ligge mellem 0 og det totale atal udtage ugler (). b) r R: ma a ie udtage flere røde ugler ed der er. c) r H: ma a ie udtage flere hvide ugler ed der er. 3. Vis at ( R r ) ( H r ) = (R+H ). alle r 4. Hvis ma roder godt rudt i asse ide ma udtager de ugler, a ma sige at ma får udvalgt e tilfældig delmægde beståede af ugler således at ehver af de ( R+H ) forsellige delmægder har samme sadsylighed for at blive udvalgt. Vis at sadsylighede for at e tilfældig delmægde ideholder etop r røde og ( r) hvide ugler, er (R r ) ( H r ) ( R+H ). (Dette er et esempel på e hypergeometris sadsylighed.) Opgave.6 (Esempel på simpel forsøgsplalægig) Ved e meigsmålig vil ma spørge persoer om de er for eller mod et bestemt eme; derefter vil ma udrege atallet Y af svarpersoer der er for.. Formulér e passede statistis model for dee situatio (dvs. agiv e sadsylighedsfutio for Y). 2. Beyt modelle til at fide stadardafvigelse af Y (for at få e idé om størrelse af de tilfældige variatio). Hvad er stadardafvigelse af de relative hyppighed Y/? 3. Hvorda afhæger stadardafvigelse af de idgåede parametre? Hvor stor sal være for at stadardafvigelse af de relative hyppighed er 0.02 (eller midre)? Opgave.7 (Hypergeometrise sadsyligheder) Kombiatori er lære om at tælle. Mage ombiatorise problemer formuleres på de måde at ma taler om forselligtfarvede ugler der lægges ed i og tages op af asser (eller urer) efter bestemte regler. Atag at ma har e asse med R røde og H hvide ugler.

12 2 De simple biomialfordeligsmodel I forrige apitel opstillede vi e statistis model i de simple biomialfordeligssituatio. I modelle optræder to størrelser og p der tilsamme specificerer biomialfordelige. Størrelse er et edt tal, me p er uedt: værdie af fastsættes ved plalægige af forsøget, hvorimod p besriver e egesab ved de tilfældighedsmeaisme der frembriger observatioere; i ogle situatioer vil ma sige at p besriver e egesab ved ature eller virelighede. E størrelse som p er e parameter i modelle. Ma siger ofte de sade værdi af parametere p år ma meer de værdi som p»i virelighede«har (i modsætig til e værdi som ma selv foreslår). I dette apitel sal vi se hvorda ma a få oget at vide om de sade værdi af p. 2. Estimatio af parametere p Ved hjælp af de statistise model er det muligt at hete iformatio om de sade parameterværdi ud af observatioere: på grudlag af model plus observartioer udreger ma et sø eller et estimat over værdie af p, og selve processe hedder estimatio. I esemplet med rismelsbillere i apitel var = 44 og det observerede atal gustige udfald var y = 43. Da p sal fortoles som sadsylighede for at få et gustigt udfald, og da ma har observeret 43 gustige ud af 44, er det ærliggede at foreslå at estimere p som de relative hyppighed y/ = 43/44 = I det følgede vil vi præsetere e geerel estimatiosmetode der a bruges i»ehver«situatio, og vi vil eftervise at de geerelle metode fører frem til at sadsylighedsparametere p fatis sal estimeres som y/. Lielihoodmetode Det er i eelte simple tilfælde ret lart hvorda ma»selvfølgelig«sal aalysere si statistise model, idet der er e»umiddelbart idlysede«fremgagsmåde osv. I de fleste tilfælde er det ap så lart. Vi vil itroducere et sæt overordede pricipper for hvorda ma bør aalysere e statistis model. Disse pricipper gælder (med visse tilføjelser) for»ehver«model. Idførelse af pricippere betyder ie at ma slipper for overvejelser over hvad ma»selvfølgelig«sal gøre, og hvad der er»umiddelbart idlysede«, me at ma i stedet for at sulle gøre overvejelsere ige og ige i hvert eelt tilfælde, så at sige 22 23

13 24 De simple biomialfordeligsmodel 2. Estimatio af parametere p ssh ssh log(ssh) y p p Figur 2. E»typis«sadsylighedsfutio y f (y; p). overstår dem alle på e gag ved at hæve dem fra eelttilfældee op til et overordet iveau hvor de udæves til geerelle pricipper. Et pricip er i dee sammehæg e orm, e retigslije, som ie bliver logis-dedutivt bevist, me som retfærdiggøres dels geem geerelle betragtiger og overvejelser, dels ved at de leverer foruftige resultater i orete situatioer. Vi vil i al stilfærdighed præsetere et sådat sæt pricipper og vise hvorda de udmøtes i e geerel metode til estimatio af uedte parametre i statistise modeller. I dette apitel sal vi se på hvorda de geerelle metode ser ud i esemplet»de simple biomialfordeligsmodel«, og som geemgåede esempel på»de simple biomialfordeligsmodel«bruger vi rismelsbille-esemplet. (Der er altså flere iveauer af esempler: Rismelsbille-esemplet er et esempel på e simpel biomialfordeligsmodel, og de simple biomialfordeligsmodel er et esempel på e statistis model.) De statistise model i rismelsbille-esemplet siger at y = 43 opfattes som e observatio af e stoastis variabel Y som er biomialfordelt med atalsparameter = 44 og uedt sadsylighedsparameter p [0, ]. Sadsylighedsfutioe for Y er f (y) = ( y ) py ( p) y, y = 0,, 2,...,. For at fremhæve at udtryet afhæger af både y og p, sriver vi f (y; p) i stedet for f (y): f (y; p) = ( y ) py ( p) y, y = 0,, 2,..., ; 0 p. Futioe f er u e futio af to variable, e observatiosvariabel y og e parametervariabel p. Futioe aldes modelfutioe for de statistise model fordi de specificerer modelle fuldstædigt: for ehver ombiatio af e mulig observatio y Figur 2.2 Til vestre: e»typis«lielihoodfutio p L(p; y) = f (y; p). Til højre: de tilsvarede log-lielihoodfutio. og e mulig parameterværdi p agiver de sadsylighede for at observere etop det y hvis etop det p er de rigtige parameterværdi. Modelfutioe er flere futioer i é: Hvis vi i modelfutioe fiserer p og opfatter futioe som e futio af y alee, så har vi sadsylighedsfutioe svarede til parameterværdie p. E»typis«sadsylighedsfutio er vist i figur 2.. Hvis vi i modelfutioe fiserer y og opfatter futioe som e futio af p alee, så har vi lielihoodfutioe svarede til observatioe y. Lielihoodfutioe beteges ofte L( ) eller L( ; y): L(p) = L(p; y) = ( y ) py ( p) y, 0 p. Figur 2.2 viser e»typis«lielihoodfutio. I vort esempel er modelfutioe f (y; p) = ( 44 y ) p43 ( p) 0, y = 0,, 2,..., 44; 0 p, og lielihoodfutioe svarede til observatioe y = 43 er L(p) = L(p; 43) = ( ) p43 ( p) 0, 0 p. Lielihoodfutiosværdie L(p; y) er sadsylighede for at observere det y ma fatis har observeret, forudsat at de uedte parameter har værdie p. Lielihoodfutioe a derfor avedes til at sammelige forsellige parameterværdiers eve til

14 26 De simple biomialfordeligsmodel 2.2 E simpel statistis hypotese 27 at besrive de fatise observatio y. For hvis f.es. L(p ; y) < L(p 2 ; y), så er chace for at observere etop dette y større år p er lig p 2, ed år p er lig p, og det må betyde at p 2 giver e bedre besrivelse af data ed p gør. De parameterværdi som giver de bedste besrivelse efter disse retigslijer, er da de værdi som masimaliserer lielihoodfutioe, og de aldes masimaliserigsestimatet (eller maximum lielihood estimatet) for p og beteges p (»p hat«). Tallet p er altså bestemt ved at L( p; y) L(p; y) for alle p. Bemær at p er e futio af y. Af bevemmelighedsgrude opererer ma tit med log-lielihoodfutioe, dvs. futioe l L(p), og ma bestemmer p som masimumsputet for l L (resultatet bliver jo det samme). I vort esempel er log-lielihoodfutioe l L(p) = l ( 44 ) + 43 l p + 0 l( p). 43 Imidlertid vil talværdiere let gøre ræsoemetere ugeemsuelige, så vi veder tilbage til de geerelle biomialfordeligsmodel hvor log-lielihoodfutioe er l L(p) = l ( ) + y l p + ( y) l( p). y Hvad er p i dee model? Svaret herpå får vi ved at løse de matematiopgave der hedder:»bestem masimumsput(er) for futioe p l L(p) år p [0, ]«, så det gør vi. Fra matematie ved vi at adidater til masimumsputer er dels itervaledeputere p = 0 og p =, dels de statioære puter, dvs. de puter hvor d dp l L(p) = 0. For 0 < p < er d dp l L(p) = y p y p = y p p ( p). Det er hesigtsmæssigt at dele op i tre tilfælde: 0 < y < : Så er putet p = y/ det eeste statioære put for l L, og da l L(0) og l L() begge er, er p = y/ et etydigt masimumsput. y = : Så er l L(p) = l p, hvilet er e vosede futio af p. De atager derfor si største værdi år p er størst mulig, dvs. år p =. y = 0: Så er l L(p) = l( p), hvilet er e aftagede futio af p. De atager derfor si største værdi år p er midst mulig, dvs. år p = 0. I alle tre tilfælde er der således et etydigt masimumsput der a udreges som y/. Vi er hermed ået frem til at i biomialmodelle med modelfutio f (y; p) = ( y ) py ( p) y, y = 0,, 2,..., ; 0 p, er masimaliserigsestimatet p for p givet som p = y/. At p sal estimeres ved de relative hyppighed y/ a æppe overrase oge, det er æste hvad ma a sige sig selv. Det iteressate er at det altså også er det svar ma år frem til ved at beytte de geerelle fremgagsmåde som er opstil modelfutioe, da derudfra lielihoodfutioe, bestem p som masimumsputet for lielihoodfutioe. Det er vigtigt at have i mete at der tæes at esistere e sad parameterværdi som er et bestemt, uedt tal. Vi a pricipielt aldrig erfare de sade parameterværdi, me ud fra foreliggede observatioer a vi estimere de. Middelfejle på p Masimaliserigsestimatet p = y/ er det bedste bud vi a give på de uedte p-værdi år vi har observeret atallet y ud af. De statistise model fortæller at y er at opfatte som e observatio af e stoastis variabel Y; det medfører at vi også må opfatte estimatet y/ som e observatio af e stoastis variabel, emlig Y/; de stoastise variabel p = p(y) = Y/ aldes masimaliserigsestimatore for p. Da Y er biomialfordelt med parametre og p, er middelværdie af Y lig p, og ifølge regereglere for middelværdi er så E p(y) = (E Y)/ = p, hvilet betyder at masimaliserigsestimatore p for p i middel giver det rigtige svar p, me deraf følger ie oget om det orete eelttilfælde. E estimator hvis middelværdi er lig de parameter der sal estimeres, aldes e cetral estimator (på egels: a ubiased estimator). For at få e idé om størrelse af masimaliserigsestimatores tilfældige variatio omrig si middelværdi p a ma bestemme de såaldte middelfejl på p, dvs. stadardafvigelse på p(y). Da Y er biomialfordelt med parametre og p, er Var Y = p( p), og ifølge regeregler for variaser er Var( p(y)) = Var(Y/) = (Var Y)/ 2 = p( p)/, så middelfejle på p(y) er p( p)/. I billeesemplet er stadardafvigelse på p lig p( p)/44, og de estimerede stadardafvigelse er p( p)/ = /44 = Sammefattede a vi sige at biomialparametere p i billeesemplet estimeres til p = 0.30 med e stadardafvigelse på E simpel statistis hypotese Det er ie altid at ma er tilfreds med blot at estimere de uedte parameter i de statistise model, udertide øser ma også at opstille og teste statistise hypoteser vedrørede de sade værdi af parametere.

15 28 De simple biomialfordeligsmodel 2.3 Kvotietteststørrelse 29 Atag at det i rismelsbilleesemplet er såda at ma har e referecegift hvorom ma véd at år ma doserer de med 0.20 mg/cm 2, så dør 23% af billere [ såda er det ie; dee del af esemplet er opdigtet til lejlighede!]. De gift der er afprøvet, er ligeledes doseret med 0.20 mg/cm 2, og der sete som ævt det at 43 ud af 44 biller døde. Spørgsmålet er om de afprøvede gift virer på samme måde som referecegifte. Hvad»på samme måde«ærmere sal betyde, a ma siert disutere læge og iderligt, me formuleret i de statistise models sprog er det emt o: det betyder at p = p 0, altså at sadsylighede for at e bille dør år de er blevet udsat for de afprøvede gift, er lig p 0, hvor p 0 er e edt værdi (her 0.23). Påstade at p = p 0, er et esempel på e såaldt statistis hypotese; statistise hypoteser avgives ofte med symboler som H 0, H, osv., så her vil vi tale om hypotese H 0 p = p 0. Hvorda passer de statistise hypotese og de foreliggede observatioer samme? Ma a se at de estimerede værdi p = ie er lig med 0.23, me esat lighed ville også være mere ed ma ue forvete, taget i betragtig at modelle siger at tallet y = 43 er e observatio fra e sadsylighedsfordelig. Ma a u sige at hvis der ie er stor afvigelse mellem p og p 0, så er der ie lare teg på at de afprøvede gift virer aderledes ed referecegifte der er ie oge sigifiat forsel, og hvis der er stor afvigelse mellem p og p 0, så er det teg på at de afprøvede gift ie virer på samme måde som referecegifte der er e sigifiat forsel. Her er der to tig der behøver e ærmere præciserig: hvorda måler ma afvigelse mellem p og p 0, og hvorda afgør ma hvorår afvigelse er stor og hvorår ie. I afsit 2.3 præseteres e geerel metode hvormed ma a hådtere disse spørgsmål. Det faglige problem blev præseteret på de måde at ma øsede at vide om de afprøvede gift virede på samme måde som referecegifte, og det førte til hypotese H 0 p = p 0. Me hvis ma i stedet havde stillet spørgsmålet om der var forsel på de to gifte, hvorda sulle ma så have grebet sage a? Svaret er: på øjagtig samme måde, altså stadig ved at udersøge H 0 p = p 0. Statistise hypoteser er emlig altid forsimplede i de forstad at ma går fra det mere detaljerede til det midre detaljerede. I esemplet begyder ma derfor med de mest detaljerede model, de hvor p a være hvad som helst, og så opstiller ma som statistis hypotese at modelle er midre detaljeret, emlig at p u har lov til at have de ee værdi p Kvotietteststørrelse Det blev påstået at ma ved hjælp af lielihoodfutioe a sammelige forsellige parameterværdiers eve til at besrive det fatis observerede y: hvis L(p ; y) < L(p 2 ; y), så giver parameterværdie p 2 e bedre besrivelse ed parameterværdie p gør, ide for rammere af de atuelle statistise model. I særdeleshed giver masimaliserigsesti- matet p = p(y) de bedst mulige besrivelse af observatioe y. Parameterværdier der giver e værdi af lielihoodfutioe som ligger tæt på de masimale værdi L( p), må give e æste lige så god besrivelse af observatioe y som p gør. Når vi derfor sal teste e statistis hypotese H 0 p = p 0 om at de uedte parameter p a atages at have de edte værdi p 0, så må det foregå ved at sammelige lielihoodfutioes værdi i putet p 0 med des masimale værdi, altså ved at sammelige de to tal L(p 0 ) og L( p). Hvis L(p 0 ) er æste lige så stor som L( p), betyder det at p 0 besriver observatioe y æste lige så godt som p gør, og det betyder ige at ma a tillade sig at mee at p 0 er de sade værdi af p: ma accepterer eller godeder hypotese H 0. Hvis derimod L(p 0 ) er væsetligt midre ed L( p), betyder det at p 0 giver e væsetligt dårligere besrivelse af observatioe y ed p gør, og det er derfor ie rimeligt at mee at p 0 sulle være de sade værdi af p: ma foraster H 0. Når ma sammeliger L(p 0 ) og L( p), sal det gøres ved at dividere de midste med de største: ma daer votiete Resultatet bliver et tal mellem 0 og, og Q = Q(y) = L(p 0) L( p) = L(p 0; y) L( p; y). e Q-værdi ær viser at p 0 er stort set lige så god som p: ma accepterer H 0, e Q-værdi lagt fra viser at p 0 er væsetligt dårligere ed p: ma foraster H 0. Ma alder Q for votietteststørrelse for de statistise hypotese H 0. I biomialfordeligsmodelle er L(p) = ( y ) py ( p) y, så Q = Q(y) = py 0 ( p 0) y p y ( p) y = ( p y 0 y ) ( ( p y 0) ) y idet p = y/. I esemplet er = 44, y = 43 og p 0 = 0.23, så de observerede værdi Q obs af Q er Q obs = ( ) ( ) = Tallet Q obs = 0.65 i sig selv a vi ie stille oget op med det giver ige meig at spørge om 0.65 er ær eller lagt fra så læge vi ie har e målesto eller et sammeligigsgrudlag. De statistise model fortæller at vi sal betragte y som e observatio af e stoastis variabel Y; dermed sal vi også betragte Q obs = Q(y) som e observatio af de stoastise variabel Q(Y). Fordelige af Y besriver hvile y-værdier ma også ue have fået (i stedet for de fatis observerede) og med hvile sadsyligheder, og de tilsvarede fordelig af Q(Y) besriver dermed hvile (2.)

16 30 De simple biomialfordeligsmodel 2.3 Kvotietteststørrelse 3 Q-værdier ma også ue have fået (i stedet for 0.65) og med hvile sadsyligheder. Taet være de statistise model a vi altså sammeholde de fatise værdi Q obs = 0.65 med alle de adre Q-værdier ma også ue have fået år p har værdie p 0. Hvis det er såda at der år p = p 0 er e pæ chace (f.es. over 5%) for at få Q-værdier som ligger lægere væ fra ed Q obs gør, dvs. for at få Q-værdier for hvile Q Q obs, så vil ma sige at Q obs ie ligger specielt lagt fra, og ma vil acceptere hypotese H 0 p = p 0. Hvis det derimod er såda at der år p = p 0 er meget lille chace (f.es. uder 5%) for at få Q-værdier som ligger lægere fra ed Q obs gør, dvs. for at få Q-værdier for hvile Q Q obs, så vil ma fortole det som at Q obs i sig selv ligger usædvaligt lagt fra, og ma vil foraste hypotese H 0 p = p 0. Når ma sal teste hypotese H 0, sal ma derfor bestemme testsadsylighede ε = P 0 (Q Q obs ). Testsadsylighede er sadsylighede uder H 0 for at få e værre, dvs. midre, Q- værdi ed de fatis observerede værdi Q obs. (Fodteget 0 på P-et agiver at sadsylighede sal udreges uder atagelse af at hypotese H 0 er rigtig.). Hvis testsadsylighede ε er meget lille, så foraster ma H 0 på grud af følgede ræsoemet: a) Vi har fået e Q obs -værdi der er så lagt fra at der, forudsat at H 0 er rigtig, u er de meget lille sadsylighed ε for at få e værre Q-værdi. b) I prasis plejer ma ie at få særligt estreme observatioer, så der må være oget galt med forudsætigere for beregige af ε. c) Da vi ie a lave om på observatioere, må det være hypotese H 0 derer oget galt med. 2. Hvis testsadsylighede ε har e pæ størrelse, så a ma ie foraste H 0. Ræsoemetet er dee gag således: a) Vi har fået e Q obs -værdi der ie ligger specielt lagt fra, thi der er emlig, forudsat at H 0 er rigtig, e pæ chace ε for at få e værre Q-værdi. b) De fatise værdi Q obs er derfor udmæret foreelig med hypotese H 0, og der er dermed ie grudlag for at foraste H 0. Hvis testsadsylighede ε er så lille at ma foraster hypotese, så siger ma at teststørrelse Q obs er sigifiat, eller at der er sigifias. Bestemmelse af testsadsylighede ε Vi vil u for e stud holde ide med geerelle betragtiger over tests og i stedet vede tilbage til de orete biomialfordeligsmodel, hvor der viser sig et påtrægede problem, emlig hvorda bestemmer ma ret fatis testsadsylighede ε? Pr. defiitio er ε lig med sadsylighede for at Q(Y) Q obs, udreget uder forudsætig af at de sade parameterværdi er lig p 0. Af forsellige grude, hvoraf ogle er regeteise og adre vil fremgå lidt seere, opererer ma ofte med 2 l Q i stedet for Q, og testsadsylighede er da sadsylighede for at 2 l Q(Y) 2 l Q obs. Ud fra det tidligere fude udtry for Q (formel (2.)) får vi at så i talesemplet er og dermed 2 l Q(y) = 2(y l y y + ( y) l p 0 ( p 0 ) ), (2.2) 2 l Q(y) = 2(y l y l Q obs = 2 l Q(43) = (44 y) l 44 y 0.88 ) (2.3) Testsadsylighede ε a u fås ved at summere sadsylighedere for alle de y-er som har de egesab at 2 l Q(y) 2 l Q obs idet sadsylighedere udreges uder atagelse af at hypotese er rigtig, dvs. det atages at p = p 0 : ε = ( y 2 l Q(y) 2 l Q obs y )py 0 ( p 0) y. Her har vi ε udtryt ved lutter edte størrelse. Fremgagsmåde til bestemmelse af testsadsylighede ε er derfor ort fortalt. Udreg 2 l Q obs. 2. Udreg 2 l Q(y) for y = 0,, 2,...,. (NB: Når ma udreger 2 l Q(0) og 2 l Q(), sal ma sætte 0 l 0 til 0.) 3. Bestem de y-er for hvile 2 l Q(y) 2 l Q obs. 4. Bestem biomialsadsylighedere for de således udpegede y-er. 5. Testsadsylighede ε er summe af disse sadsyligheder. I talesemplet er ε = y 2 l Q(y) 3.60 ( 44 y ) 0.23y y

17 32 De simple biomialfordeligsmodel hvor 2 l Q(y) er givet ved formel (2.3). Ved almidelig udregig fider ma at ulighede 2 l Q(y) 3.60 er opfyldt for y = 0,, 2,..., 23 og for y = 43, 44, 45,..., 44. Videre fider ma at P 0 (Y 23) = og at P 0 (Y 43) = , så de esate testsadsylighed er ε = = %. χ 2 -approsimatioe Gase vist er der i afsit.3 aført e udmæret algoritme til beregig af biomialsadsyligheder, me alligevel må ma o sige at oveævte regestye o ie er oget ma lige larer i e hådevedig, medmidre ma da har e computer eller e programmerbar lommereger til si rådighed. Heldigvis a de matematise statisti omme os til hjælp, idet de a fortælle hvorda ma ude større besvær a bestemme e god tilærmet værdi af testsadsylighede. Ma a bevise at for biomialmodelle og for e lag ræe adre statistise modeller gælder at de sadsylighedsfordelig som votietteststørrelse 2 l Q følger år de testede hypotese er rigtig, med god tilærmelse er af e gase bestemt type, emlig e såaldt χ 2 -fordelig (»hi-i-ade fordelig«) med et vist atal frihedsgrader der i vores atuelle tilfælde er lig. Da testsadsylighede ε jo er sadsylighede for at få e 2 l Q-værdi som er større ed 2 l Q obs, betyder det at ε med god tilærmelse er lig med sadsylighede for at få e værdi større ed 2 l Q obs i e χ 2 -fordelig med frihedsgrad, og de sadsylighed a let fides, ete med et statistiprogram på computere eller ved hjælp af tabeller over fratiler i χ 2 -fordelige, se f.es. tabelle side 228. [E fratil i e fordelig er et tal x med de egesab at der er e vis foresreve sadsylighed for at få værdier x. Esempelvis er 90%-fratile et tal x således at der er sadsylighed 90% for at få værdier x.] Ved tabelopslag fider ma at i χ 2 -fordelige med frihedsgrad er 90%-fratile 2.7 og 95%-fratile De atuelle 2 l Q obs -værdi 3.60 ligger mellem disse to fratiler, hvilet betyder at (det tilærmede) ε ligger mellem 0% og 5%. (Dette harmoerer udmæret med at de esate testsadsylighed er 5.9%.) Som ævt er χ 2 -fordelige u e approsimatio til de rigtige fordelig af 2 l Q uder H 0. E retigslije for hvorår approsimatioe er god, er at hvis begge de forvetede atal p 0 og ( p 0 ) (det forvetede atal døde hhv. ie døde) er midst fem, så a ma avede χ 2 -approsimatioe. Ellers må ma rege de esate testsadsylighed ud efter»slavemetode«. De mage udregiger må følges op af e olusio: Vi fadt e testsadsylighed på 5.9%, dvs. hvis hypotese H 0 er rigtig, så er der e sadsylighed på 5.9% for at få e større værdi ed de fatis observerede værdi 2 l Q = E såda testsadsylighed vil almideligvis ie føre til at ma foraster hypotese H 0. Vi må altså oludere at der ie er oge sigifiat forsel mellem de afprøvede gift og referecegifte. 2.4 Reg og teg Reg og teg Her omtales hvorda ma a foretage beregigere med R. Testsadsylighede Testsadsylighede ε udreges med futioe biom.test. I det geemgåede esempel med = 44, y = 43 og p 0 = 0.23 sriver ma biom.test(43, 44, 0.23) som resulterer i dee udsrift: Exact biomial test data: 43 ad 44 umber of successes = 43, umber of trials = 44, p-value = alterative hypothesis: true probability of success is ot equal to percet cofidece iterval: sample estimates: probability of success Testsadsylighede er det der i udsrifte hedder p-value, og p er det der hedder sample estimates: probability of success. χ 2 -fordelige Sadsyligheder i χ 2 -fordelige udreges med futioe pchisq, esempelvis giver -pchisq(3.60, df=) sadsylighede for at få e værdi som er større ed 3.60 i χ 2 -fordelige med frihedsgrad. Fratiler i χ 2 -fordelige udreges med qchisq, f.es. giver qchisq(0.95, df=) 95%-fratile i χ 2 -fordelige med frihedsgrad. 2.5 Opgaver Opgave 2. I tabel. på side er vist udfald y, y 2,..., y 5 af e stoastis variabel Y som er biomialfordelt med atalsparameter 2 og sadsylighedsparameter 3.. Udreg for hver af de 5 observerede y-værdier de tilsvarede værdi af p. 2. Teg et pidediagram over de empirise fordelig af p. 3. Teg et pidediagram over de teoretise fordelig af p. Vi: Da Y er biomialfordelt, er fordelige af p = Y/ e»edsaleret biomialfordelig«på mægde {0,, 2,...,, }.

18 34 De simple biomialfordeligsmodel 2.5 Opgaver Hvor stor er middelfejle på p? Vi: Tabelle var også gestad for udersøgelse i opgave.4. Opgave 2.2 E haveejer går ud på e eg og idsamler frø af e plate der fides i to udgaver, e med røde blomster og e med hvide blomster. (På ege var der esemplarer af begge slags.) Næste år sår ha frøee hjemme i have; det viser sig at der ommer 0 plater, hvoraf syv har røde og tre har hvide blomster.. a) Udreg sadsylighede for at få observatioe 7 i e biomialfordelig med = 0 og p = 2. b) Udreg sadsylighede for at få observatioe 7 i e biomialfordelig med = 0 og p = 3 4. c) Udreg sadsylighede for at få observatioe 7 i e biomialfordelig med = 0 og p = Haveejeres veer og beedte a ved fælles hjælp fide følgede mulige forlariger på fæomeet: a) Det er tilfældigt om e plate får røde eller hvide blomster, og der er samme sadsylighed for hver af de to muligheder. b) Det er geetis bestemt om e plate får røde eller hvide blomster, og»røde blomster«er domiat; i så fald er sadsylighede 3 4 for at e plate har røde blomster. c) Det er geetis bestemt om e plate får røde eller hvide blomster, og»hvide blomster«er domiat; i så fald er sadsylighede 4 for at e plate har røde blomster. Hvile af de tre forlariger forlarer det observerede bedst? 3. E fjerde forlarig er at det simpelt he forholder sig såda med de eg, at de ideholder rødblomstrede og hvidblomstrede esemplarer af plate i et gase bestemt forhold. Hvis det er tilfældet, hvad er da det bedste bud på talværdie af dette forhold? Opgave 2.3 Georg har slået Plat eller Kroe 5 gage med e almidelig møt og fået etop é gag Kroe. Gerda siger at det da må tyde på at møte er sæv, ellers sulle ma have fået 2 eller 3 gage Kroe. For at afgøre om ma på dee baggrud a sige at møte er sæv, a ma opstille e statistis model og ide for rammere af de formulere og teste e statistis hypotese. Gør det, dvs. opstil modelle og formulér og test hypotese:. Opstil e hesigtsmæssig statistis model og omsæt det give problem til e statistis hypotese. 2. Opsriv lielihoodfutioe svarede til observatioe é gag Kroe. Teg grafe for lielihoodfutioe. Hvorår er de størst? Samme spørgsmål for log-lielihoodfutioe. 3. Opsriv votietteststørrelse Q for at teste hypotese. 4. Udreg 2 l Q(y) for alle de mulige y-værdier, og fid mægde af y-er for hvile 2 l Q(y) 2 l Q obs (svarede til at Q(y) Q obs ), og udreg sadsylighede for dee mægde. Hvor stor er testsadsylighede? Forastes hypotese? Opgave 2.4 Formulér e hesigtsmæssig statistis model og hypotese for at besvare følgede: Fys Amtsavis oplyser at bladet tryer alle idlæg om fremmede. I e tremåeders periode bragte bladet 2 læserbreve med et positivt sy på fremmede og 5 med et egativt sy. Modtager bladet stort set lige mage positive og egative idlæg? Opgave 2.5 I e af sie forsøgsræer med ærteplater udersøgte Medel om ærtere var rude eller atede. Først dyrede ha 253 selvbestøvede heterozygote plater, og det viste sig at de ærter der om, fordelte sig med 5474 rude og 850 atede. Derpå dyrede og selvbestøvede ha plater af 565 af de rude ærter fra det første forsøg. Det viste sig at 93 af disse plater udeluede fi rude ærter, mes de resterede 372 fi både rude og atede ærter. Ma a u opstille e geetis model gåede ud på at det er et eelt ge der bestemmer om ærter bliver rude eller atede, og at geet for rude ærter er domiat. E oseves af dee model er at efterommere af de 253 selvbestøvede heterozygote plater i det første forsøg sal fordele sig på rude og atede i forholdet 3 :, og at ud af de 565 plater i det adet forsøg sal 3 have udeluede rudærtede efterommere. Hvorda stemmer Medels tal overes med de geetise models forudsigelser? Opgave 2.6 Formulér e hesigtsmæssig statistis model og hypotese for at besvare følgede: Kodrodystrofi er e form for dværgvæst som reges domiat arvelig. Geet D er sygdomsgeet og d er det tilsvarede ormalge. I e udersøgelse af e ræe ægtepar hvor de ee ægtefælle var odrodystrof og de ade ormal (formodet geotypeombiatio Dd dd) fadt ma at bladt 27 bør var 0 odrodystrofe og 7 ormale. Er dette i strid med at odrodystrofi arves domiat? [At odrodystrofi arves domiat betyder i dee forbidelse at et bar med de ævte forældre med sadsylighed 2 bliver odrodystroft.] Opgave 2.7 På side 26 står at ma a bestemme p ete som masimumsputet for lielihoodfutioe eller som masimumsputet for log-lielihoodfutioe, for»resultatet bliver jo det samme«; det lille ord jo atyder at det er e selvfølgelighed at det forholder sig såda. Hvorfor er det det? Opgave 2.8 (E approsimatiosformel for 2 l Q) Hvis f er e to gage otiuert differetiabel futio af y, så a ma som beedt approsimere f (y) med følgede ræeudvilig (Taylorudvilig) år y er tæt på y 0 : f (y) f (y 0 ) + (y y 0 ) f (y 0 ) + 2 (y y 0) 2 f (y 0 ). Ma a avede dette på futioe f (y) = 2 l Q(y), hvor 2 l Q(y) er som i formel (2.2) på side 3, og hvor y 0 = p 0.

19 36 De simple biomialfordeligsmodel. Vis at de første afledede af 2 l Q er ( 2 l Q) (y) = l y l y. p 0 p 0 2. Vis at de ade afledede af 2 l Q er ( 2 l Q) (y) = 3. Vis derved at 2 l Q (y p 0) 2 p 0 ( p 0 ) = ( y p 0 p0 ( p 0 ) ) 2. y( y). (Det sidste udtry er vadratet på e størrelse der a fortoles som forselle mellem det observerede y og de forvetede værdi p 0, divideret med stadardafvigelse på Y.) 3 Sammeligig af biomialfordeliger I forrige apitel studerede vi de simple biomialfordeligsmodel, dvs. e model med é observatio y fra e biomialfordelig, é sadsylighedsparameter p der sulle estimeres, og hvor ma evetuelt havde e hypotese af forme H 0 p = p 0. I dette apitel går vi et sridt videre og betragter situatioer med flere biomialfordelte observatioer der a have hver si edte atalsparameter og hver si uedte sadsylighedsparameter. Det a være af iteresse at udersøge om sadsylighedsparametree a atages at være es, eller om de er sigifiat forsellige. Som geemgåede esempel bruger vi stadig rismelsbille-esemplet fra [6], me u iddrager vi e lidt større del af datamaterialet: Ma har udsat ogle rismelsbiller for gift i forsellige ocetratioer, emlig 0.20, 0.32, 0.50 og 0.80 mg/cm 2, og deræst set hvor mage af dem der var døde efter 3 dages forløb. (Gifte strøs ud på gulvet hvor billere færdes, derfor måles ocetratioe i mægde pr. areal.) Forsøgsresultatere er vist i tabel 3. på æste side. Ma a være iteresseret i at udersøge om der er forsel på virige af de forsellige ocetratioer. Hvis der ie er oge forsel, så sulle brødele af døde i hver af de fire grupper være stort set de samme, og derfor ue det være e god idé at udrege disse brødele; ma får dem til 0.30, 0.72, 0.87 og Hvis der ie er forsel på de forsellige ocetratioer, så sal forsellighedere i disse fire tal ue forlares udeluede ved tilfældigheder; me hvis forsellee er så store at det er urimeligt at forlare dem ved tilfældigheder alee, så er der e sigifiat forsel mellem ocetratioere. Opgave er derfor først at opstille e statistis model for datamaterialet, og deræst ide for rammere af dee model at ofrotere de foreliggede observatioer med hypotese om at der ie er forsel på ocetratioere. For at vi sal ue udtale os om hvorvidt forsellee a forlares udeluede ved tilfældigheder, må vi have e statistis model der ærmere specificerer på hvile puter der ommer tilfældigheder id i billedet. Da formålet er at sammelige sadsylighedere for at dø ved forsellige ocetratioer, sal modelle idrettes på de måde at totalatallee 44, 69, 54 og 50 opfattes som faste tal, hvorimod atal døde 43, 50, 47 og 48 (og dermed også atal overlevede 0, 9, 7 og 2) opfattes som frembragt af e tilfældighedsmeaisme, i modelsprog: de er observatioer af stoastise variable. Det 37

20 38 Sammeligig af biomialfordeliger Tabel 3. Rismelsbillers overlevelse ved forsellige giftdoser. ocetratio atal døde atal ie døde i alt er ærliggede at forsøge sig med e model der går ud på, at for hver ocetratio har vi e situatio der svarer til e simpel biomialfordeligsmodel, og at de fire situatioer er uafhægige af hveradre. De fire grupper (»situatioer«) svarede til de fire ocetratioer ummereres med ides j der altså a have værdiere, 2, 3, 4. Totalatallet i gruppe j er j, hvor = 44, 2 = 69, 3 = 54 og 4 = 50. Det observerede atal døde i gruppe j er y j, hvor y = 43, y 2 = 50, y 3 = 47 og y 4 = 48. Totalatallee opfattes som faste tal, me de observerede atal opfattes som observerede værdier af stoastise variable Y, Y 2, Y 3 og Y 4. At gruppe r. j modelleres med e simpel biomialfordeligsmodel betyder at Y j er biomialfordelt med atalsparameter j (edt) og e eller ade sadsylighedsparameter p j som er uedt; sadsylighede for at observere værdie y j er i dee model P(Y j = y j ) = ( j y j )p y j j ( p j ) j y j. Hvis de fire grupper er uafhægige af hveradre, er edvidere P(Y = y og Y 2 = y 2 og Y 3 = y 3 og Y 4 = y 4 ) så modelfutioe for det samlede forsøg er = P(Y = y ) P(Y 2 = y 2 ) P(Y 3 = y 3 ) P(Y 4 = y 4 ), f (y, y 2, y 3, y 4 ; p, p 2, p 3, p 4 ) = ( 44 y ) p y ( p ) 44 y ( 69 y 2 ) p y2 2 ( p 2) 69 y2 ( 54 y 3 ) p y3 3 ( p 3) 54 y3 ( 50 y 4 ) p y4 4 ( p 4) 50 y4. Det ses at modelle ideholder fire uedte parametre p, p 2, p 3 og p 4, é for hver gruppe. Opgave er u på grudlag af modelle plus observatioere y = 43, y 2 = 50, y 3 = 47 og y 4 = 48 at estimere parametree og vurdere om ma a tillade sig at atage at de fire parametre i virelighede er es, svarede til at giftstoffet virer es i alle fire ocetratioer. Vi vil vise hvorda ma løser dee opgave ved hjælp af de pricipper der blev laceret i apitel 2. Vi vil dog gøre det e aelse mere geerelt ved at se på e situatio med s biomialfordeliger der sal sammeliges. 3. Modelle Modelle Atag at vi har lassificeret ogle idivider i to forsellige lasser»«og»0«. Idividere er på forhåd iddelt i s forsellige grupper med hhv., 2,..., s idivider. Det har vist sig at i gruppe j hører y j af idividere til lasse»«og de resterede j y j af idividere til lasse»0«, j =, 2,..., s. Sematis ser det såda ud: gruppe r s lasse y y 2 y 3... y s lasse 0 y 2 y 2 3 y 3... s y s i alt s De statistise model der beyttes til at besrive dee situatio, er at y, y 2,..., y s betragtes som observerede værdier af stoastise variable Y, Y 2,..., Y s der er idbyrdes uafhægige og biomialfordelte således at Y j har edt atalsparameter j og uedt sadsylighedsparameter p j, j =, 2,..., s. Modelle tillader at gruppere er forsellige idet der er e sadsylighedsparameter for hver gruppe. Opgave er at udersøge om gruppere a ases for es, dvs. at teste de statistise hypotese H 0 p = p 2 = = p s. De geerelle retigslijer for hvorda ma aalyserer e give statistis model, siger at vi sal tage udgagsput i modelfutioe og lielihoodfutioe. Modelfutioe er de simultae sadsylighedsfutio for Y-ere, opfattet som e futio af både observatioer og parametre, altså f (y, y 2,..., y s ; p, p 2,..., p s ) = ( ) p y y ( p ) y ( 2 ) p y2 2 y ( p 2) 2 y2... ( s ) ps ys ( p s ) s ys 2 y s = s ( j y j ) p y j j ( p j ) j y j. Når vi her holder y-ere fast og u opfatter udtryet som e futio af p-ere, får vi lielihoodfutioe svarede til observatioere y, y 2,..., y s ; ved derpå at tage logaritme får vi log-lielihoodfutioe: l L(p, p 2,..., p s ) = s l ( j ) + y j = ostat + s s (y j l p j + ( j y j ) l( p j )) (y j l p j + ( j y j ) l( p j )). (3.)

Noter om kombinatorik, Kirsten Rosenkilde, februar 2008 1. Kombinatorik

Noter om kombinatorik, Kirsten Rosenkilde, februar 2008 1. Kombinatorik Noter om ombiatori, Kirste Roseilde, februar 008 Kombiatori Disse oter er e itrodutio til ombiatori og starter helt fra bude, så e del af det idledede er siert edt for dig allerede, me der ommer også hurtigt

Læs mere

Vejledende besvarelser til opgaver i kapitel 15

Vejledende besvarelser til opgaver i kapitel 15 Vejledede besvarelser til opgaver i apitel 5 Opgave a) De teststatistier, ma aveder til at teste om to middelværdier er es, består af et estimat på forselle mellem middelværdiere,, divideret med et udtry

Læs mere

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik Noter om ombiatori, Kirste Roseilde, februar 008 Kombiatori Disse oter er e itrodutio til ombiatori og starter helt fra bude, så e del af det idledede er siert edt for dig allerede, me der ommer også hurtigt

Læs mere

Noter om Kombinatorik 2, Kirsten Rosenkilde, februar

Noter om Kombinatorik 2, Kirsten Rosenkilde, februar Noter om Kombiatori, Kirste Roseilde, februar 008 1 Kombiatori Disse oter itroducerer ogle cetrale metoder som ofte beyttes i ombiatoriopgaver, og ræver et grudlæggede edsab til ombiatori (se fx Kombiatori

Læs mere

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i Normalfordeliger For at e stokastisk variabel X ka være ormalfordelt, skal X agive værdie af e eller ade målig, f.eks. tid, lægde, vægt, beløb osv. Notatioe er: Xi ~ N( μ, σ hvor i er observatiosummeret,

Læs mere

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen TEKST NR 435 2004 Basisstatistik 2. udgave Jørge Larse August 2006 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING

Læs mere

Motivation. En tegning

Motivation. En tegning Motivatio Scatter-plot at det mådelige salg mod det måedlige reklamebudget. R: plot(salg ~ budget, data = salg) Økoometri Lektio Simpel Lieær Regressio salg 400 450 500 550 20 25 30 35 40 45 50 budget

Læs mere

6 Populære fordelinger

6 Populære fordelinger 6 Populære fordeliger I apitel 4 itroducerede vi stoastise variabler so e åde at repræsetere udfald af et esperiet på. De stoastise variabler ue være både disrete (fx terigslag) og otiuerte (fx vareægder).

Læs mere

9. Binomialfordelingen

9. Binomialfordelingen 9. Biomialfordelige 9.. Gekedelse Hvert forsøg ka ku resultere i to mulige udfald; succes og fiasko. I modsætig til poissofordelige er atallet af forsøg edeligt. 9.. Model X : Stokastisk variabel, der

Læs mere

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017 Meigsmåliger KLADDE Thomas Heide-Jørgese, Rosborg Gymasium & HF, 2017 Idhold 1 Meigsmåliger 2 1.1 Idledig................................. 2 1.2 Hvorda skal usikkerhede forstås?................... 3 1.3

Læs mere

Elementær Matematik. Polynomier

Elementær Matematik. Polynomier Elemetær Matematik Polyomier Ole Witt-Hase 2008 Køge Gymasium Idhold 1. Geerelle polyomier...1 2. Divisio med hele tal....1 3. Polyomiers divisio...2 4. Polyomiers rødder....4 5. Bestemmelse af røddere

Læs mere

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner Projekter: Kapitel 4 Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Kotiuitet og kotiuerte fuktioer Ord som kotiuert og kotiuerlig

Læs mere

Generelle lineære modeller

Generelle lineære modeller Geerelle lieære modeller Regressiosmodeller med é uafhægig itervalskala variabel: Y e eller flere uafhægige variable: X,..,X k De betigede fordelig af Y givet X,..,X k atages at være ormal med e middelværdi,

Læs mere

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik. Epidemiologi og biostatistik Forelæsig Uge 1, torsdag. februar 006 ichael Væth, Afdelig for Biostatistik. Sammeligig af to middelværdier sikkerhedsitervaller statistisk test Sammeligig af to proportioer

Læs mere

STATISTIKNOTER Simple normalfordelingsmodeller

STATISTIKNOTER Simple normalfordelingsmodeller STATISTIKNOTER Simple ormalfordeligsmodeller Jørge Larse IMFUFA Roskilde Uiversitetsceter Februar 1999 IMFUFA, Roskilde Uiversitetsceter, Postboks 260, DK-4000 Roskilde. Jørge Larse: STATISTIKNOTER: Simple

Læs mere

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer Statistik Lektio 7 Hpotesetest og kritiske værdier Tpe I og Tpe II fejl Strke af e test Sammeligig af to populatioer 1 Tri I e Hpotesetest E hpotesetest består af 5 elemeter: I. Atagelser Primært hvilke

Læs mere

Uge 40 I Teoretisk Statistik, 30. september 2003

Uge 40 I Teoretisk Statistik, 30. september 2003 Uge 40 Teoretis tatisti, 30. september 003 Esidet variasaalyse Model, otatio, hypotese og hælpehypotese Test af hælpehypotese Opdaterig af variasestimat Test af hypotese om es middelværdier Variasaalysesema

Læs mere

Om Følger og Rækker. Nyttige Grænseværdier. Nyttige Rækker. Carsten Lunde Petersen. lim. lim = 0. lim (1 + x n n )n = e x. n n n.

Om Følger og Rækker. Nyttige Grænseværdier. Nyttige Rækker. Carsten Lunde Petersen. lim. lim = 0. lim (1 + x n n )n = e x. n n n. IMFUFA Carste Lude Peterse Om Følger og Ræer Nyttige Græseværdier lim = 1 lim! = x = 0! lim lim (1 + x ) = e x! lim = e 1 Nyttige Ræer 1 p < p > 1 1 log p ( + 1) < p > 1 x = = x 1 x for x < 1 og Z, diverget

Læs mere

Test i polynomialfordelingen

Test i polynomialfordelingen Statisti og Sadsylighedsregig STAT apitel 4.4 Test i polyomialfordelige Lad X (X,..., X ) Poly (, p). Observatio: (,..., ) der agiver atal udfald, 2,..., Susae Ditlevse Istitut for Matematise Fag Email:

Læs mere

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk! Statistik Lektio 8 Parrede test Test for forskel i adele Test for es varias Gesy med flyskræk! Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og kviders

Læs mere

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags. Praktisk ifo Liste med rettelser og meigsforstyrrede trykfejl i DS på Absalo. Statistisk aalyse af e ekelt stikprøve: kedt eller ukedt varias Sadsylighedsregig og Statistik (SaSt) Helle Sørese Projekt

Læs mere

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6 Dee udgave er til geemkig på ettet. Boge ka købes for kr. 5 hos EH-Mat. E y og udvidet udgave med title»symbol- og formelskrivig«er udkommet september 00. Se mere om de her. Idholdsfortegelse Formelskrivig

Læs mere

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528) Løsigsforslag til skriftlig eksame i Kombiatorik, sadsylighed og radomiserede algoritmer (DM58) Istitut for Matematik & Datalogi Syddask Uiversitet Madag de 3 Jauar 011, kl. 9 13 Alle sædvalige hjælpemidler

Læs mere

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Epidemiologi og biostatistik. Forelæsig Uge, tirsdag. Niels Trolle Aderse, Afdelige for Biostatistik. Geerelt om kurset: - Formål - Forelæsiger - Øvelser - Forelæsigsoter - Bøger - EpiBasic: http://www.biostat.au.dk/teachig/software

Læs mere

Estimation ved momentmetoden. Estimation af middelværdiparameter

Estimation ved momentmetoden. Estimation af middelværdiparameter Statistik og Sadsylighedsregig 1 STAT kapitel 4.2 4.3 Susae Ditlevse Istitut for Matematiske Fag Email: susae@math.ku.dk http://math.ku.dk/ susae Estimatio ved mometmetode Idimellem ka det være svært (eller

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet. Matematik A Studetereksame Forsøg med digitale eksamesopgaver med adgag til iterettet Forberedelsesmateriale Vejledede opgave Forår 0 til stx-a-net MATEMATIK Der skal afsættes 6 timer af holdets sædvalige

Læs mere

antal gange krone sker i første n kast = n

antal gange krone sker i første n kast = n 1 Uge 15 Teoretisk Statistik, 5. april 004 1. Store tals lov Eksempel: møtkast Koverges i sadsylighed Tchebychevs ulighed Sætig: Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder

Læs mere

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk! Test i to populatioer Hypotesetest for parrede observatioer Test for es varias Gesy med flyskræk! Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Statistik ved Bachelor-uddaelse i folkesudhedsvideskab Græseværdisætiger Det hadler om geemsit Statistikere elsker geemsit Det er oplagt e god ide at tage geemsit. Hvis jeg f.eks skal gætte på vægte af

Læs mere

Renteformlen. Erik Vestergaard

Renteformlen. Erik Vestergaard Reteformle Erik Vestergaard 2 Erik Vestergaard www.matematikfysik.dk Erik Vestergaard, 2010. Billeder: Forside: istock.com/ilbusca Side 4: istock.com/adresrimagig Desude ege illustratioer. Erik Vestergaard

Læs mere

Asymptotisk optimalitet af MLE

Asymptotisk optimalitet af MLE Kapitel 4 Asymptotisk optimalitet af MLE Lad Y 1, Y 2,... være uafhægige, idetisk fordelte variable med værdier i et rum (Y,K). Vi har givet e model (ν θ ) θ Θ for fordelige af Y 1 (og dermed også for

Læs mere

og Fermats lille sætning

og Fermats lille sætning Projekter: Kaitel 0. Projekt 0. Modulo-regig, restklassegruer og Fermats lille sætig Projekt 0. Modulo-regig, restklassegruere ( { 0 }, ) og Fermats lille sætig Vi aveder moduloregig og restklasser mage

Læs mere

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol Simpel Lieær Regressio Opsplitig af variatioe Determiatios koefficiet Variasaalse F-test Model-kotrol Opbgig af statistisk model Specificer model Ligiger og atagelser Estimer parametre Modelkotrol Er modelle

Læs mere

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ ) 3. februar 003 Epidemiologi og biostatistik. Uge, torag d. 3. februar 003 Morte Frydeberg, Istitut for Biostatistik. Type og type fejl Nogle specielle metoder: Test i RxC tabeller Test i x tabeller Fishers

Læs mere

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6. enote 5 enote 5 Determiater I dee enote ser vi på kvadratiske matricer. Deres type er altså for 2, se enote 4. Det er e fordel, me ikke absolut ødvedigt, at kede determiatbegrebet for (2 2)-matricer på

Læs mere

Projekt 1.3 Brydningsloven

Projekt 1.3 Brydningsloven Projekt 1.3 Brydigslove Når e bølge, fx e lysbølge, rammer e græseflade mellem to stoffer, vil bølge ormalt blive spaltet i to: Noget af bølge kastes tilbage (spejlig), hvor udfaldsvikle u er de samme

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Repetitio: Normalfordelige Ladmåliges fejlteori Lektio Trasformatio af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/udervisig/lf13 Istitut for Matematiske Fag Aalborg Uiversitet

Læs mere

Bilag 5: DEA-modellen Bilaget indeholder en teknisk beskrivelse af DEA-modellen

Bilag 5: DEA-modellen Bilaget indeholder en teknisk beskrivelse af DEA-modellen Bilag 5: DEA-odelle Bilaget ideholder e teis besrivelse af DEA-odelle FRSYNINGSSERETARIATET FEBRUAR 2013 INDLEDNING... 3 INPUTSTYRET DEA-MDEL... 3 UTPUTSTYRET DEA-MDEL... 7 SALAAFAST... 12 2 Idledig Data

Læs mere

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning) Dages program Estimatio: Kapitel 9.4-9.7 Eksempler på middelrette og/eller kosistete estimator (de sidste fra sidste forelæsig) Ko desiterval for store datasæt kap. 9.4 Ko desiterval for små datasæt kap.

Læs mere

Den flerdimensionale normalfordeling

Den flerdimensionale normalfordeling De flerdimesioale ormalfordelig Stokastiske vektorer Ved e stokastisk vektor skal vi forstå e vektor, hvor de ekelte kompoeter er sædvalige stokastiske variable. For de stokastiske vektor Y = Y,..., Y

Læs mere

Maja Tarp AARHUS UNIVERSITET

Maja Tarp AARHUS UNIVERSITET AARHUS UNIVERSITET Maja Tarp AARHUS UNIVERSITET HVEM ER JEG? Maja Tarp, 4 år Folkeskole i Ulsted i Nordjyllad Studet år 005 fra Droiglud Gymasium Efter gymasiet: Militæret Australie Startede på matematik

Læs mere

Vejledende opgavebesvarelser

Vejledende opgavebesvarelser Vejledede opgavebesvarelser 1. Atal hæder er lig med K(52,5), altså 2598960. Ved brug af multiplikatiospricippet ka atal hæder med 3 ruder og 2 spar udreges som K(13, 3) K(13, 2), hvilket giver 22308.

Læs mere

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik. 30. august 005 Epidemiologi og biostatistik. Forelæsig 3 Uge, torag d. 8. september 005 Michael Væth, Afdelig for Biostatistik. Mere om kategoriske data Test for uafhægighed I RxC tabeller Test for uafhægighed

Læs mere

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter Matematikkes mysterier - på et obligatorisk iveau af Keeth Hase 7. Ligiger, polyomier og asymptoter Hvad er e asymotote? Og hvorda fides de? 7. Ligiger, polyomier og asymptoter Idhold 7.0 Idledig 7.1 Udsag

Læs mere

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353 Takegagskompetece Hesigte med de følgede afsit er først og fremmest at skabe klarhed over de mere avacerede regeregler i skole og give resultatet i de almee form, der er karakteristisk for algebra. Vi

Læs mere

og Fermats lille Projekt 0.4 Modulo-regning, restklassegrupperne sætning ..., 44, 20,4,28,52,... Hvad er matematik? 3 ISBN

og Fermats lille Projekt 0.4 Modulo-regning, restklassegrupperne sætning ..., 44, 20,4,28,52,... Hvad er matematik? 3 ISBN Projekt 0.4 Modulo-regig, restklassegruppere sætig ( p 0, ) og Fermats lille Vi aveder moduloregig og restklasser mage gage om dage, emlig år vi taler om tid, om hvad klokke er, om hvor lag tid der er

Læs mere

DATV: Introduktion til optimering og operationsanalyse, 2007. Bin Packing Problemet

DATV: Introduktion til optimering og operationsanalyse, 2007. Bin Packing Problemet DATV: Itroduktio til optimerig og operatiosaalyse, 2007 Bi Packig Problemet David Pisiger, Projektopgave 2 Dette er de ade obligatoriske projektopgave på kurset DATV: Itroduktio til optimerig og operatiosaalyse.

Læs mere

Stikprøvefordelinger og konfidensintervaller

Stikprøvefordelinger og konfidensintervaller Stikprøvefordeliger og kofidesitervaller Stikprøvefordelige for middelværdi De Cetrale Græseværdi Sætig Egeskaber Ved Estimatore Kofidesitervaller t-fordelige Estimator og estimat E stikprøve statistik

Læs mere

Sammenligning af to grupper

Sammenligning af to grupper Sammeligig af to gruer Reetitio, heruder om kritiske værdier Sammeligig af to gruer Sammeligig af to middelværdier Sammeligig af to adele Sammeligig af to variaser yoteser og hyotesetest. E hyotese er

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala Statistik for biologer 005-6, modul 5: Sadsylighedsfordeliger for kotiuerte data på iterval/ratioskala M6, slide Gægse matematiske sadsylighedsfordeliger: Diskrete data: De positive biomialfordelig Poisso-fordelige

Læs mere

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning Hvad er matematik? Projekter: Kaitel 9 Projekt 9 Regeregler for stokastiske variable middelværdi, varias og sredig Projekt 9 Regeregler for stokastiske variable middelværdi, varias og sredig Sætig : Regeregler

Læs mere

Modul 14: Goodness-of-fit test og krydstabelanalyse

Modul 14: Goodness-of-fit test og krydstabelanalyse Forskigsehede for Statistik ST01: Elemetær Statistik Bet Jørgese Modul 14: Goodess-of-fit test og krydstabelaalyse 14.1 Idledig....................................... 1 14.2 χ 2 -test i e r c krydstabel.............................

Læs mere

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n Ladmåliges fejlteori Lektio 3 Estimatio af σ Dobbeltmåliger Geometrisk ivellemet Lieariserig - rw@math.aau.dk Istitut for Matematiske Fag Aalborg Uiversitet Repetitio: Middelværdi og Varias Sætig: Middelværdi

Læs mere

Sandsynlighedsregning i biologi

Sandsynlighedsregning i biologi Om begrebet sadsylighed Sadsylighedsregig i biologi Hvis vi kaster e almidelig, symmetrisk terig, er det klart for de fleste af os, hvad vi meer, år vi siger, at sadsylighede for at få e femmer er 1/6.

Læs mere

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse Avedt Statistik Lektio 3 Pukt- og itervalestimater Kofidesitervaller Valg af stikprøvestørrelse Pukt- og itervalestimater: Motivatio Motiverede eksempel: I e udersøgelse er adele af rygere 0.27. Det aslås

Læs mere

Løsninger til kapitel 7

Løsninger til kapitel 7 Løsiger til kapitel 7 Opgave 7.1 a) HpoStat giver resultatet: Pop. varias er ukedt, me 30, så Normalf. bruges approksimativt = 54,400 s 1.069,90 = 00,000 0,95 49,868 58,93 Dette betder, at med 95% sikkerhed

Læs mere

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504) Gamle eksamesopgaver Diskret Matematik med Avedelser (DM72) & Diskrete Strukturer(DM504) Istitut for Matematik& Datalogi Syddask Uiversitet, Odese Alle sædvalige hjælpemidler(lærebøger, otater etc.), samt

Læs mere

Projekt 9.10 St. Petersborg paradokset

Projekt 9.10 St. Petersborg paradokset Hvad er matematik? ISBN 978877066879 Projekt 9.0 St. Petersborg paradokset. De store tals lov & viderchacer I grudboges kapitel 9 omtales de store tals lov, som ka formuleres således: Hvis e spiller i

Læs mere

Matematisk Modellering 1 Hjælpeark

Matematisk Modellering 1 Hjælpeark Matematisk Modellerig Hjælpeark Kaare B. Mikkelse 2005090 3. september 2007 Idhold Formler 2 2 Aalyse af k ormalfordelte prøver 2 2. Modelcheck............................................ 2 2.2 Test af

Læs mere

Lys og gitterligningen

Lys og gitterligningen Fysik rapport: Lys og gitterligige Forfatter: Bastia Emil Jørgese.z Øvelse blev udført osdag de 25. jauar 202 samme med Lise Kjærgaard Paulse 2 - Bastia Emil Jørgese Fysik rapport (4 elevtimer), februar

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Dages program Kvatitative metoder De multiple regressiosmodel 6. februar 007 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.- 3.+appedix E.) Defiitio og motivatio Fortolkig af

Læs mere

Bjørn Grøn. Analysens grundlag

Bjørn Grøn. Analysens grundlag Bjør Grø Aalyses grudlag Aalyses grudlag Side af 4 Idholdsfortegelse Kotiuerte og differetiable fuktioer 3 Differetial- og itegralregiges udviklig 5 3 Hovedsætiger om differetiable fuktioer 8 Opgaver til

Læs mere

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave 14. 20. december 2007

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave 14. 20. december 2007 Mikroøkoomi, matematik og statistik Eksameshjemmeopgave 14. 20. december 2007 Helle Buzel, Tom Egsted og Michael H.J. Stæhr 14. december 2007 R E T N I N G S L I N I E R F O R E K S A M E N S H J E M M

Læs mere

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger Faculty of Life Scieces Program Esidet variasaalyse Normalfordelige Claus Ekstrøm E-mail: ekstrom@life.ku.dk Esidet variasaalyse (oe-way ANOVA) Hvilke type data? Hvad er problemstillige? Variatio mellem

Læs mere

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset. STATISTIK Skriftlig evaluerig, 3. semester, madag de 30. auar 006 kl. 9.00-3.00. Alle hælpemidler er tilladt. Opgaveløsige forsyes med av og CPR-r. OPGAVE Ved e produktio af viduer er der mulighed for,

Læs mere

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2 Idhold 1 Pukt- og itervalestimatio 2 1.1 Puktestimatorer: Cetralitet(bias) og efficies.................... 2 2 Kofidesiterval 3 2.1 Kofidesiterval for adel................................ 4 2.2 Kofidesiterval

Læs mere

Estimation og test i normalfordelingen

Estimation og test i normalfordelingen af Birger Stjerholm Made Samfudlitteratur 07 Etimatio og tet i ormalfordelige Dee tekt ideholder et overblik over ogle grudlæggede pricipper for etimatio og tet i ormalfordelige i hyppigt forekommede ituatioer:

Læs mere

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside : Statistiske test Efteråret 00 Jes Friis, AAU Hjemmeside : http://akaaudk/jfj Kotiuerte fordeliger Defiitio: Tæthedsfuktio E sadsylighedstæthedsfuktio på R er e itegrabel fuktio f : R [0; [ hvor f d = Defiitio:

Læs mere

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier Noter om polyomier, Kirste Rosekilde, Marts 2006 1 Polyomier Disse oter giver e kort itroduktio til polyomier, og de fleste sætiger æves ude bevis. Udervejs er der forholdsvis emme opgaver, mes der til

Læs mere

Kommunikation over støjfyldte kanaler

Kommunikation over støjfyldte kanaler Istitut for Matematise Fag wwwmathaaud Kommuiatio over støjfyldte aaler MAT2-projetrapport af G3-7 forårssemestret 2008 Istitut for Matematise Fag Fredri Bajers Vej 7G 9220 Aalborg Øst Telefo 99 40 88

Læs mere

Analyse 1, Prøve maj 2009

Analyse 1, Prøve maj 2009 Aalyse, Prøve 5. maj 009 Alle hevisiger til TL er hevisiger til Kalkulus (006, Tom Lidstrøm). Direkte opgavehevisiger til Kalkulus er agivet med TLO, ellers er alle hevisiger til steder i de overordede

Læs mere

Introduktion til uligheder

Introduktion til uligheder Itroduktio til uligheder, marts 0, Kirste Rosekilde Itroduktio til uligheder Dette er e itroduktio til ogle basale uligheder om det aritmetiske geemsit, det geometriske geemsit, det harmoiske geemsit og

Læs mere

DATV: Introduktion til optimering og operationsanalyse, 2007. Følsomhed af Knapsack Problemet

DATV: Introduktion til optimering og operationsanalyse, 2007. Følsomhed af Knapsack Problemet DATV: Itroduktio til optimerig og operatiosaalyse, 2007 Følsomhed af Kapsack Problemet David Pisiger, Projektopgave 1 Dette er de første obligatoriske projektopgave på kurset DATV: Itroduktio til optimerig

Læs mere

Introduktion til uligheder

Introduktion til uligheder Itroduktio til uligheder Dette er e itroduktio til ogle basale uligheder om det aritmetiske geemsit, det geometriske geemsit, det harmoiske geemsit og det kvadratiske geemsit. Først skal vi ved fælles

Læs mere

Dagens forelæsning. Claus Munk. kap. 1-3. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Dagens forelæsning. Claus Munk. kap. 1-3. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro Dages forelæsig Grudlæggede itroduktio til obligatioer Claus Muk kap. - 3 Betaligsrækker og låeformer Det daske obligatiosmarked Effektive reter 2 Obligatioer Grudlæggede Itro Obligatioer Grudlæggede Itro

Læs mere

Claus Munk. kap. 1-3

Claus Munk. kap. 1-3 Claus Muk kap. 1-3 1 Dages forelæsig Grudlæggede itroduktio til obligatioer Betaligsrækker og låeformer Det daske obligatiosmarked Pris og kurs Effektive reter 2 1 Obligatioer Grudlæggede Itro Debitor

Læs mere

Talfølger og -rækker

Talfølger og -rækker Da Beltoft og Klaus Thomse Aarhus Uiversitet 2009 Talfølger og -rækker Itroduktio til Matematisk Aalyse Zeos paradoks om Achilleus og skildpadde Achilleus løber om kap med e skildpadde. Achilleus løber

Læs mere

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006 Dages program Økoometri De multiple regressiosmodel 5. februar 006 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.-3.3+appedix E.-E.) Defiitio og motivatio Fortolkig af parametree

Læs mere

Facilitering ITU 15. maj 2012

Facilitering ITU 15. maj 2012 Faciliterig ITU 15. maj 2012 Facilitatio is like movig with the elemets ad sailig the sea Vejvisere Velkomst de gode idflyvig Hvad er faciliterig? Kedeteg ved rolle som facilitator Facilitatores drejebog

Læs mere

GENEREL INTRODUKTION.

GENEREL INTRODUKTION. Study Guide til Matematik C. OVERSIGT. Dee study guide ideholder følgede afsit - Geerel itroduktio. - Emeliste. - Eksame. - Bilag. Udervisigsmiisteriets bekedtgørelse for matematik C. GENEREL INTRODUKTION.

Læs mere

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Itroducerede Statistik Forelæsig 12: Iferes for adele Klaus K. Aderse og Per Bruu Brockhoff DTU Compute, Statistik og Dataaalyse Damarks Tekiske Uiversitet 2800 Lygby Damark e-mail:

Læs mere

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros Brachevejledig ulykker idefor lager området Brachearbejdsmiljørådet for trasport og egros Baggrud Udersøgelser på lager- og trasportområdet har vist, at beskrivelse af hædelsesforløbet ved udfyldelse

Læs mere

StudyGuide til Matematik B.

StudyGuide til Matematik B. StudyGuide til Matematik B. OVERSIGT. Dee study guide ideholder følgede afsit Geerel itroduktio. Emeliste. Eksame. Bilag 1: Udervisigsmiisteriets bekedtgørelse for matematik B. Bilag 2: Bilag 3: Uddrag

Læs mere

De reelle tal. Morten Grud Rasmussen 5. november Se Sætning 3.6 og 3.7 for forskellige formuleringer af egenskaben og dens negation.

De reelle tal. Morten Grud Rasmussen 5. november Se Sætning 3.6 og 3.7 for forskellige formuleringer af egenskaben og dens negation. De reelle tal Morte Grud Rasmusse 5. ovember 2015 Ordede mægder Defiitio 3.1 (Ordet mægde). pm, ăq kaldes e ordet mægde såfremt: For alle x, y P M gælder etop ét af følgede: x ă y, x y, y ă x @x, y, z

Læs mere

Teoretisk Statistik, 9. februar Beskrivende statistik

Teoretisk Statistik, 9. februar Beskrivende statistik Uge 7 I Teoretisk Statistik, 9 februar 004 Beskrivede statistik Kategoriserede variable 3 Kvatitative variable 4 Fraktiler for ugrupperede observatioer 5 Fraktiler for grupperede observatioer 6 Beliggeheds-

Læs mere

Kombinatorik. 1 Kombinationer. Indhold

Kombinatorik. 1 Kombinationer. Indhold Kombator, marts 04, Krste Roselde Georg Mohr-Kourrece Kombator Kombator går ud på at tælle atallet af ombatoer af et eller adet, og for at ue tælle atallet af ombatoer smart har ma brug for forsellge tællestrateger

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1 Økoometri 1 Iferes i de lieære regressiosmodel 9. september 006 Økoometri 1: F7 1 Dages program Opsamlig af hemmeopgave om Mote Carlo eksperimeter Mere om hypotesetest: Ekelt lieær restriktio på koefficieter

Læs mere

Sandsynlighedsregning

Sandsynlighedsregning Sadsylighedsregig E ote om sadsylighedsregig. Via basal sadsylighedsregig gøres læsere klar til forstå biomialfordelige. Herik S. Hase, Sct. Kud Versio 5.0 Opgaver til hæftet ka hetes her. PDF Facit til

Læs mere

Vindmøllesekretariatet og Biogassekretariatet

Vindmøllesekretariatet og Biogassekretariatet og Biogass Brugertilfredshedsudersøgelse af og Biogasss sagsbehadlig og ydelser bladt ommuer Tabelrapport, telefoudersøgelse December Projetosuleter Asger H. Nielse Coie F. Larse Alle rettigheder til udersøgelsesmaterialet

Læs mere

Den hurtige Fouriertransformation

Den hurtige Fouriertransformation Polyomier De hurtige Fouriertrasformatio Polyomium: Geerelt: p + 2 3 4 ( x) = 5 + 2x + 8x + 3x 4x p(x) =! " eller x i p(x) = a + a x + a 2 x 2 +!+ a! x! Jea Baptiste Joseph Fourier (768-83) 2 Evaluerig

Læs mere

- et værktøj til fejlrettende QR-koder. Projekt 0.3 Galois-legemerne. Indhold. Hvad er matematik? A, i-bog

- et værktøj til fejlrettende QR-koder. Projekt 0.3 Galois-legemerne. Indhold. Hvad er matematik? A, i-bog Projekt 0.3 Galois-legemere GF é ëp û - et værktøj til fejlrettede QR-koder Idhold De karakteristiske egeskaber ved de tre mest almidelige talsystemer, og... De kommutative, associative og distributive

Læs mere

Projekt 3.2 Anlægsøkonomien i Storebæltsforbindelsen. Indhold. Hvad er matematik? 1 ISBN

Projekt 3.2 Anlægsøkonomien i Storebæltsforbindelsen. Indhold. Hvad er matematik? 1 ISBN Projekt 3.2 Alægsøkoomie i Storebæltsforbidelse Dette projekt hadler, hvorda økoomie var skruet samme, da ma byggede storebæltsforbidelse. Store alægsprojekter er æste altid helt eller delvist låefiasieret.

Læs mere

FUNKTIONER del 1 Funktionsbegrebet Lineære funktioner Eksponentialfunktioner Logaritmefunktioner Rentesregning Indekstal

FUNKTIONER del 1 Funktionsbegrebet Lineære funktioner Eksponentialfunktioner Logaritmefunktioner Rentesregning Indekstal FUNKTIONER del Fuktiosbegrebet Lieære fuktioer Ekspoetialfuktioer Logaritmefuktioer Retesregig Idekstal -klassere Gammel Hellerup Gymasium November 08 ; Michael Szymaski ; mz@ghg.dk Idholdsfortegelse FUNKTIONSBEGREBET...

Læs mere

Forslag til besvarelser af opgaver m.m. i ε-bogen, Matematik for lærerstuderende

Forslag til besvarelser af opgaver m.m. i ε-bogen, Matematik for lærerstuderende Forslag til besvarelser af opgaver m.m. i ε-boge, Matematik for lærerstuderede Dette er førsteudgave af opgavebesvarelser udarbejdet i sommere 008. Dokumetet ideholder forslag til besvarelser af de fleste

Læs mere

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion Statistik 8. gag 1 KONIDENSINTERVALLER Kofidesitervaller: kapitel 11 Valg og test af fordeligsfuktio Statistik 8. gag 11. KONIDENS INTERVALLER Et kofides iterval udtrykker itervallet hvori de rigtige værdi

Læs mere

STATISTIK x-klasserne Gammel Hellerup Gymnasium

STATISTIK x-klasserne Gammel Hellerup Gymnasium STATISTIK x-klassere Gammel Hellerup Gymasium Jui 209 ; Michael Szymaski ; mz@ghg.dk Idholdsfortegelse INDLEDNING...3 DESKRIPTIV STATISTIK...4 Skemaer...5 Diagrammer...8 Statistiske deskriptorer... 0 Typetal

Læs mere

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER med avedelse af TI 89 og Excel 8 5 9 6 3 0 Histogram for ph 6,9 7, 7,3 7,5 7,7 7,9 ph. udgave 0 FORORD Der er i dee bog søgt at give letlæst og askuelig

Læs mere

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a Matematik A Højere hadelseksame hhx151-mat/a-26052015 Tirsdag de 26. maj 2015 kl. 9.00-14.00 Matematik A Prøve består af to delprøver. Delprøve ude hjælpemidler består af opgave 1 til 5 med i alt 5 spørgsmål.

Læs mere

Konfidens intervaller

Konfidens intervaller Kofides itervaller Kofides itervaller for: Kofides iterval for middelværdi, varias kedt Kofides iterval for middelværdi, varias ukedt Kofides iterval for adel Kofides iterval for varias Bestemmelse af

Læs mere

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable Idholdsfortegelse Geerelt:...3 Stokastisk variabel:...3 Tæthedsfuktio/sadsylighedsfuktio for stokastisk variabel:...3 Fordeligsfuktio/sumfuktio for stokastisk variabel:...3 Middelværdi:...4 Geemsit:...4

Læs mere