STATISTIKNOTER Simple normalfordelingsmodeller
|
|
- Philippa Poulsen
- 8 år siden
- Visninger:
Transkript
1 STATISTIKNOTER Simple ormalfordeligsmodeller Jørge Larse IMFUFA Roskilde Uiversitetsceter Februar 1999
2 IMFUFA, Roskilde Uiversitetsceter, Postboks 260, DK-4000 Roskilde. Jørge Larse: STATISTIKNOTER: Simple ormalfordeligsmodeller IMFUFA tekst r. 304b/ sider ISSN Dette hæfte er e del af udervisigsmaterialet til et kursus i statistik og statistiske modeller. Udervisigsmaterialet omfatter bladt adet følgede titler: a. Simple biomialfordeligsmodeller b. Simple ormalfordeligsmodeller c. Simple Poissofordeligsmodeller d. Simple multiomialfordeligsmodeller e. Midre matematisk-statistisk opslagsværk, ideholdede bl.a. ordforklariger, resuméer og tabeller Om kurset og kursusmaterialet ka bladt adet siges at år det er et geemgåede tema at påpege at likelihoodmetode ka beyttes som et overordet pricip for valg af estimatorer og teststørrelser, er det bladt adet begrudet i at likelihoodmetode har mage egeskaber der fra et matematisk-statistisk syspukt ases for øskelige, at likelihoodmetode er meget udbredt og yder stor aerkedelse ikke midst i Damark), og at det i al almidelighed er værd at gøre opmærksom på at ma også ide for faget statistik har overordede og strukturerede begreber og metoder; år kursusmaterialet er skrevet på dask og ikke for eksempel på scietific Eglish ), er det for at bidrage til at vedligeholde traditioere for hvorda og at ma ka tale om slige emer på dask, og så sadelig også fordi dask er det sprog som forfattere og vel også de forvetede læser er bedst til; år hæftere forude de sædvalige simple modeller, metoder og eksempler også ideholder eksempler der er væsetligt sværere, er det for at atyde ogle af de retiger ma ka arbejde videre i, og for at der ka være lidt udfordriger til de krævede læser.
3 Idhold 1 Normalfordelige Udledig af ormalfordelige Egeskaber ved ormalfordelige Opgaver Estikprøveproblemet i ormalfordelige Estimatio af µ og σ Test af hypotese om middelværdie Histogrammer og fraktildiagrammer Opgaver Tostikprøveproblemer i ormalfordelige Tostikprøveproblemet med uparrede observatioer Tostikprøveproblemet med parrede observatioer Opgaver Esidet variasaalyse Estimatio af parametree Hypotese om es grupper Bartletts test for variashomogeitet Opgaver Simpel lieær regressiosaalyse Præsetatio af modelle Estimatio af parametree Parameterestimateres middelfejl E ade formulerig af modelle Modelkotrol Test af hypoteser om liies parametre Opgaver Multipel lieær regressiosaalyse Estimatio af parametree Modelkotrol Udvælgelse af baggrudsvariable Opgaver Stikord 97 3
4 4 Idhold 8 De»maglede«figurer 99
5 1 Normalfordelige Ma har meget ofte brug for e type sadsylighedsfordeliger der ka beskrive hvorda måliger varierer tilfældigt omkrig et bestemt iveau, år det skal være såda at de faktisk observerede værdier lige så godt tilfældigvis ka være lidt over som lidt uder det teoretisk rigtige iveau. For at kue fide frem til sådae fordeliger må vi præcisere lidt øjere hvad det er der søges. Fordeligere skal beyttes til at beskrive de tilfældige variatio af måliger af lægder, masser, kocetratioer osv., altsamme størrelser der måles på e kotiuert skala. Første pukt i problempræciserige er derfor: Der søges e type kotiuerte fordeliger. Fordeligere skal beskrive de tilfældige variatio omkrig et vist iveau. Dette iveau skal idgå som e parameter µ, så modelfuktioe skal derfor være e fuktio af både e observatiosvariabel x og e parametervariabel µ: Modelfuktioe er f x; µ). Parametere µ skal beskrive hvor på talliie fordelige er beliggede, og e ædrig af parameterværdie skal svare til e forskydig af sadsylighedsfordelige he ad talliie ude at fordeliges form i øvrigt ædres. Mere præcist vil vi atage at Fordelige svarede til parameterværdie µ fås ved at forskyde fordelige svarede til parameterværdie 0 stykket µ, dvs. f x; µ) = f x µ; 0) hvor µ i pricippet ka atage alle mulige værdier. Dee betigelse udtrykker ma også på de måde at µ skal være e positiosparameter. Disse tre betigelser er ikke ok til at fastlægge fordelige, så ma er ødt til at stille ogle flere krav. Vi vil stille e statistisk betigelse, e betigelse der hadler om hvorda ma skal aalysere data fra de søgte fordelig: Da parametere µ skal beskrive det iveau hvoromkrig observatioere fordeler sig, ka ma mee at det må være rimeligt at de ukedte parameter µ skal estimeres ved geemsittet af observatioere. Da det tillige er et geemgåede pricip at ma altid skal beytte maksimaliserigsestimater, vil vi stille følgede krav: 5
6 6 Normalfordelige Maksimaliserigsestimatet for µ skal være geemsittet af observatioere. I æste afsit viser vi at disse betigelser fører frem til de såkaldte ormalfordelig med middelværdiparameter µ og variasparameter σ 2, det vil sige fordelige med tæthedsfuktio f x; µ,σ 2 ) = 1 exp 1 x µ) 2 ) 2πσ 2 2 σ 2, x R. 1.1 Udledig af ormalfordelige Vi vil i dette afsit gøre rede for at ormalfordelige faktisk er svaret på øsket om e type kotiuerte fordeliger på de reelle akse således at fordeligere er parametriseret med e positiosparameter, og således at maksimaliserigsestimatet for positiosparametere er geemsittet af observatioere. Det går for sig på dee måde: 1. Modelfuktioe hørede til et forsøg med é observatio kaldes som ævt f x; µ). Modelfuktioe svarede til et forsøg med observatioer x 1, x 2,..., x er da f x i ; µ), så likelihoodfuktioe er Lµ) = f x i ; µ). 2. Da der skal være tale om e positiosparameter må der gælde at f x; µ) = f x µ; 0) = f 0 x µ), hvor f 0 er brugt som e kort betegelse for f ; 0). Likelihoodfuktioe ka derfor skrives som Lµ) = f 0 x i µ), og log-likelihoodfuktioe er tilsvarede l Lµ) = l f 0 x i µ). 3. Vi har stillet som krav at l L skal atage si maksimale værdi i puktet µ = x. Hvis vi desude går ud fra at f 0 og dermed også l L er e pæ differetiabel fuktio, så er de afledede l L) lig 0 i dette maksimumspukt: l L) x) = 0.
7 1.1 Udledig af ormalfordelige 7 4. Af udtrykket for l L fås l L) µ) = = l f 0 ) x i µ) gx i µ), hvor g er e kort betegelse for l f 0 ). Kravet om at maksimaliserigsestimatet skal være lig geemsittet x, betyder derfor at fuktioe g skal opfylde betigelse gx i x) = ) 5. Fiduse er u at formel 1.1) skal gælde for alle valg af x 1, x 2,..., x, og ved at idsætte ogle tilpas sedigt valgte x-er ka ma få at vide hvorda fuktioe g ødvedigvis må se ud. a) Ved at vælge = 2 og x 2 = x 1 = y hvorved x = 0) fås af formel 1.1) at g y) + gy) = 0, dvs. for vilkårligt y. Specielt er g0) = 0. g y) = gy) 1.2) b) Ved at vælge = k + 1 og lade de k første x-er være es og lade geemsittet være 0, mere præcist ved at vælge x 1 = x 2 =... = x k = y og x k+1 = ky, fås at k g y) + gk y) = 0, der ved brug af formel 1.2) ka formuleres som gk y) = k gy) 1.3) gældede for vilkårligt y og k = 1, 2, 3,.... Ved at bruge formel 1.2) edu e gag ka ma u slutte at formel 1.3) gælder for vilkårlige reelle tal y og for vilkårlige hele tal k. c) I formel 1.3) ka vi vælge y = j / k hvor j og k er heltal. Derved fås at g j) = k g j / k ), dvs. at g j / k ) = 1 / k g j). Me vi ka også vælge y = 1 og k = j i formel 1.3), og derved får vi g j) = j g1). Alt i alt er dermed g j / k ) = j / k g1), hvilket vi formulerer såda: for alle ratioale tal y. gy) = y g1) 1.4) = g1) y Medmidre g skal være e gaske overordetlig usædvalig fuktio, er det såda at år formel 1.4) gælder for alle ratioale tal y, så gælder de også for alle reelle tal y. Vi vil gå ud fra at formel 1.4) gælder for alle
8 8 Normalfordelige y, og vi er altså så ået frem til at fuktioe g er e almidelig lieær fuktio: for e passede valgt kostat c. gx) = c x 6. Da g blot var e kort betegelse for fuktioe l f 0 ), ka vi deræst fide f 0 : Hvis l f 0 ) x) = c x, så er l f 0 x) = 1 2 c x2 + kostat, dvs. f 0 x) = kostat exp 2 1 c x2). 7. Dee fuktio f 0 skal være e sadsylighedstæthed hvilket vil sige at de skal være ikke-egativ og itegrere til 1, altså + f 0 x)dx = 1. For at dette sidste skal kue lade sig gøre må kostate c ødvedigvis være positiv; traditioe tro omdøber vi c til 1/σ 2 hvorved tæthedsfuktioe får udseedet f 0 x) = kostat exp 2 1 x 2 ) σ 2. De betigelse at f 0 skal itegrere til 1 fastlægger kostate; ma ka vise at de skal være 1/ 2πσ 2. Dermed har vi fudet at 1 f 0 x) = exp 1 x 2 ) 2πσ 2 2 σ 2 og dermed f x; µ) = f 0 x µ) = 1 2πσ 2 exp 1 2 x µ) 2 8. Det opridelige problem bestod i at fide e type fordeliger hvor der idgik e positiosparameter µ. I de fude løsig optræder imidlertid også e størrelse σ 2 der er kommet id i billedet som e itegratioskostat. Dee størrelse udæver vi til e parameter, og samtidig omdøbes f x; µ) til f x; µ,σ 2 ): f x; µ,σ 2 ) = 1 2πσ 2 exp 1 2 σ 2 x µ) 2 Der gælder at for ethvert valg af µ R og σ 2 > 0 er dette e sadsylighedstæthedsfuktio, emlig for ormalfordelige med positiosparameter eller middelværdiparameter) µ og kvadratisk skalaparameter eller variasparameter) σ 2, kort N µ,σ 2 ). σ 2 ). ).
9 1.2 Egeskaber ved ormalfordelige 9 Resultatet af oveståede udlediger er således at hvis vi er på jagt efter e type kotiuerte sadsylighedsfordeliger hvor der optræder e positiosparameter, og hvis vi forlager at dee positiosparameter skal estimeres ved geemsittet af observatioere, så er ormalfordeliger de eeste type fordeliger der ka komme på tale. Stregt taget har vi ikke vist at ormalfordeligere faktisk har de øskede egeskab, me det kommer i det følgede.) Normalfordeliger kaldes også Gauß-fordeliger. K.F.Gauß ) beyttede ormalfordeliger til at beskrive bl.a. astroomiske måligers tilfældige fra de sade værdi. I værket Theoria Motus Corporum Coelestium i Sectioibus Coicus Arbietium dvs. Teori om de himmelske legemers bevægelser i keglesit omkrig sole) argumeterede ha for ormalfordelige på e måde der meget liger de der er beyttet her. 1.2 Egeskaber ved ormalfordelige Her gives e oversigt ude beviser) over forskellige egeskaber ved ormalfordelige: Normalfordelige med parametre µ og σ 2, kort N µ,σ 2 )-fordelige, er de sadsylighedsfordelig på de reelle talakse R som har tæthedsfuktioe f x; µ,σ 2 ) = 1 2πσ 2 exp 1 2 x µ) 2 Her ka parametere µ være et vilkårligt reelt tal og parametere σ 2 et vilkårligt positivt tal. Parametere µ er e positiosparameter, dvs. hvis X er N µ,σ 2 )-fordelt og a e kostat, så vil a + X være N a + µ,σ 2 )-fordelt. Desude er µ middelværdie i N µ,σ 2 )-fordelige. Edvidere er µ mediae i N µ,σ 2 )-fordelige. Parametere σ 2 er e kvadratisk skalaparameter, hvilket vil sige at hvis X er N 0,σ 2 )-fordelt og b e kostat, så vil bx være N 0, b 2 σ 2 )-fordelt. Desude er σ 2 variase i N µ,σ 2 )-fordelige, og dermed er σ stadardafvigelse i N µ,σ 2 )-fordelige. Udertide kaldes 1/σ 2 for præcisioe i fordelige, fordi 1/σ 2 er et udtryk for hvor sævert fordelige er kocetreret om si middelværdi. Hvis X er N µ,σ 2 )-fordelt, så vil a + bx være N a + bµ, b 2 σ 2 )-fordelt; her beteger a og b kostater. De ormerede ormale fordelig er N 0, 1)-fordelige. Des tæthed beteges ofte ϕ: σ 2 ). ϕx) = 1 2π exp 1 2 x2 ), x R.
10 10 Normalfordelige Figur 1.1 Tæthedsfuktioer for ormalfordeliger med middelværdi 0 og varias hhv. 0.5, 1, 2, 4 og 8. Des kumulerede fordeligsfuktio beteges tilsvarede Φ, dvs. Φu) er sadsylighede for at e N 0, 1)-variabel er midre ed eller lig u: Φu) = = u ϕx) dx 1 2π u E N µ,σ 2 )-variabel har tæthedsfuktio x 1 σ ϕ x µ σ og kumuleret fordeligsfuktio ) x µ x Φ. σ exp 1 2 x2 ) dx. Hvis α er et tal mellem 0 og 1 så har ligige Φu) = α etop é løsig, emlig α-fraktile u α i de ormerede ormale fordelig. Ved at lægge fem til fraktilere fås de såkaldte probits dvs. probability uits): ) probitα) = u α + 5. I statistiske tabelværker fides tabeller over Φu) og over fraktilere u α eller u α + 5.
11 1.3 Opgaver Opgaver Opgave 1.1 Diskutér om det vil være rimeligt at beytte ormalfordeligsmodeller med uafhægige observatioer) i de situatioer der kort atydes her: 1. Bredde af kraiet på 20 toårige grøladske seharer faget ved Sødre Strømfjord e bestemt sommer. 2. Vidstyrke kl. 12 på e bestemt lokalitet på 50 på hiade følgede dage. 3. Vægte af 100 tilfældigt udvalgte sild ladet i Gilleleje e bestemt dag. 4. Kocetratioe af NO x kl ved Nørreport Statio hver dag i ovember måed. 5. Høstudbyttet på hver af 10 forsøgsparceller à 500 m 2 ) med e y sort viterbyg. 6. Vægte af levere i 27 fem uger gamle forsøgsmus. 7. Atal yregistrerede AIDS-tilfælde i Damark i hver af 12 på hiade følgede måeder. 8. Atal yregistrerede leukæmi-tilfælde i Damark i hver af 12 på hiade følgede måeder. 9. Levetide af 50 elektriske 40W pærer af samme fabrikat. 10. Det årlige atal trafikulykker i Købehav og Frederiksberg kommuer hvor cyklister er idbladet, for hvert af åree Opgave 1.2 Løs ved hjælp af passede tabeller følgede delopgaver: 1. Fid 25%-fraktile i de ormerede ormalfordelig N 0, 1). 2. Fid 75%-fraktile i de ormerede ormalfordelig N 0, 1). 3. Fid et iterval af forme [ x, x] som ideholder 50% af sadsylighedsmasse i de ormerede ormalfordelig N 0, 1). 4. Fid et iterval af forme [ x, x] som ideholder 95% af sadsylighedsmasse i de ormerede ormalfordelig N 0, 1). 5. Hvor stor e del af sadsylighedsmasse i de ormerede ormalfordelig N 0, 1) er ideholdt i itervallet [ 1, 1]? Opgave 1.3 Løs ved hjælp af passede tabeller følgede delopgaver:
12 12 Normalfordelige 1. Udtryk 25%-fraktile i ormalfordelige N µ,σ 2 ) ved µ og σ Udtryk 75%-fraktile i ormalfordelige N µ,σ 2 ) ved µ og σ Agiv et iterval af forme [µ x, µ + x] som ideholder 50% af sadsylighedsmasse i ormalfordelige N µ,σ 2 ). 4. Agiv et iterval af forme [µ x, µ + x] som ideholder 95% af sadsylighedsmasse i ormalfordelige N µ,σ 2 ). 5. Hvor stor e del af sadsylighedsmasse i ormalfordelige N µ,σ 2 ) er ideholdt i itervallet [µ σ, µ + σ]? TIP: Udyt evetuelt Opgave 1.2 Opgave 1.4 Geerelt er e α-fraktil i e fordelig et tal x α med de egeskab at brøkdele α af fordelige ligger til vestre for x α. Fid α-fraktile x α i N µ,σ 2 )-fordelige udtrykt ved µ, σ 2 og ved α-fraktile u α i de ormerede ormalfordelig. TIP: Værdie af de kumulerede fordeligsfuktio for N µ,σ 2 )) udreget i x α skal være lig α. De kumulerede fordeligsfuktio ka udtrykkes ved Φ.
13 2 Estikprøveproblemet i ormalfordelige Normalfordelige blev i Kapitel 1 udledt i forbidelse med søgige efter e fordelig hvor positiosparametere estimeres ved geemsittet af observatioere. Vi magler imidlertid at gøre rede for at ormalfordelige faktisk har dee eftertragtede egeskab, me det vil ske i ideværede Kapitel som led i behadlige af»estikprøveproblemet i ormalfordelige«. Estikprøveproblemet i ormalfordelige hadler om e ekelt stikprøve, altså et atal uafhægige observatioer, y 1, y 2,..., y, fra e N µ,σ 2 )-fordelig. Parametree µ og σ 2 er ukedte, og problemet er at bestemme estimater over dem og måske teste hypoteser om dem. E ade side af sage er modelkotrolproblemet, dvs. spørgsmålet om hvorda ma vurderer om observatioere u også med rimelighed ka beskrives som værede ormalfordelte. Eksempel 2.1 Lysets hastighed) I åree foretog de amerikaske fysiker A.A.Michelso og de amerikaske matematiker og astroom S.Newcomb e række efter de tids forhold temmelig øjagtige bestemmelser af lysets hastighed i luft. Deres metoder var baseret på Foucaults idé med at sede e lysstråle fra et hurtigt roterede spejl he på et fjert fast spejl som returerer lysstråle til det roterede hvor ma måler des vikelforskydig i forhold til de opridelige lysstråle. Hvis ma keder rotatioshastighede samt afstade mellem spejlee, ka ma derved bestemme lyshastighede. I Tabel 2.1 er vist resultatere af de 66 måliger som Newcomb foretog i periode 24. juli til 5. september 1882 i Washigto, D.C. I Newcombs opstillig var der 3721 m Tabel 2.1 Newcombs bestemmelser af lysets passagetid af e strækig på 7442 m. Tabelværdiere er passagetide i 10 6 sek
14 14 Estikprøveproblemet i ormalfordelige mellem det roterede spejl der var placeret i Fort Myer på vestbredde af Potomac-flode, og det faste spejl der var abragt på George Washigto-moumetets fudamet. De størrelse som Newcomb rapporterer, er lysets passagetid, altså de tid som det er om at tilbagelægge de pågældede distace. Af de 66 værdier i Tabel 2.1 skiller to sig ud, emlig 44 og 2, der syes at være»outliers«, altså tal der tilsyeladede ligger for lagt væk fra flertallet af observatioere. Det er altid et vaskeligt spørgsmål at afgøre om det er forsvarligt at se bort fra»outliere«. I aalyse af tallee i Tabel 2.1 vil vi vælge at se bort fra de to ævte observatioer således at vi ku har at gøre med 64 observatioer. I de geerelle situatio foreligger der størrelser y 1, y 2,..., y der atages at være observerede værdier af stokastiske variable Y 1, Y 2,..., Y som er uafhægige idetisk N µ,σ 2 )-fordelte; her er µ og σ 2 ukedte parametre. Modelfuktioe er f y 1, y 2,..., y ; µ,σ 2 ) = = 1 2πσ 2 exp πσ 2 ) exp ) y j µ) 2 1 2σ 2 σ 2 y j µ) 2 ).2.1) Likelihoodfuktioe svarede til observatioere y 1, y 2,..., y er derfor Lµ,σ 2 ) = kostat σ 2 ) /2 exp 1 2σ 2 y j µ) 2 ). 2.2) 2.1 Estimatio af µ og σ 2 Vi vil bestemme maksimaliserigsestimatere for µ og σ 2. Af udtrykket for likelihoodfuktioe ses at ligegyldigt hvilke værdi σ 2 måtte have, så er de bedste µ-værdi, altså de µ-værdi som maksimaliserer µ Lµ,σ 2 ), de værdi som miimaliserer kvadratsumme y j µ) 2. Ved at beytte formle for kvadratet på e toleddet størrelse ka kvadratsumme omskrives på
15 2.1 Estimatio af µ og σ 2 15 følgede måde hvor y beteger geemsittet af y-ere: altså y j µ) 2 = = = = = y j y) + y µ) ) 2 y j y) 2 + 2y j y)y µ) + y µ) 2) y j y) 2 + y j y) 2 + 2y µ) y j y) 2 + y µ) 2, y j µ) 2 = 2y j y)y µ) + y µ) 2 y j y) + y µ) 2 y j y) 2 + y µ) ) Heraf ses at kvadratsumme er midst etop år µ er lig med y. Derfor er maksimaliserigsestimatet for µ faktisk geemsittet af observatioere, ˆµ = y, således som det jo også var take at det skulle være. Herefter ka ma bestemme maksimaliserigsestimatet for σ 2 som maksimumspuktet for fuktioe σ 2 Ly,σ 2 ), og ma fider at de atager sit maksimum år σ 2 har værdie ˆσ 2 = 1 y j y) 2. Imidlertid beytter ma som regel ikke dette estimat over σ 2, me derimod s 2 = 1 1 y j y) 2, 2.4) hvor divisore 1 i dee forbidelse kaldes for atallet af frihedsgrader for variasestimatet s 2. Eksempel 2.2 Lysets hastighed, fortsat) Hvis vi går ud fra at de 64 positive værdier i Tabel 2.1 ka betragtes som observatioer fra e og samme ormalfordelig, så skal dee ormalfordeligs middelværdi estimeres til y = og des varias til s 2 = 25.8 med 63 frihedsgrader. Det betyder at passagetides middelværdi estimeres til ) 10 6 sek = sek
16 16 Estikprøveproblemet i ormalfordelige og passagetides varias estimeres til sek) 2 = sek) 2 med 63 frihedsgrader, dvs. stadardafvigelse estimeres til sek = sek. Beregigstips og -tricks Når ma skal udrege e kokret s 2 -værdi, ka ma aturligvis bare idsætte talværdiere i formel 2.4), det vil sige først udrege geemsittet y, så trække det fra alle y j -ere og kvadrere og summere, og til sidst dividere med 1. Hvis ma reger med hådkraft/lommereger, er det imidlertid ofte e fordel at udytte at summe af de kvadratiske afvigelser ka omskrives på følgede måde: y j y) 2 = = = y 2 j 2y iy + y 2) y 2 j y2 ) 2 y 2 j 1 y j. Summe af de kvadratiske afvigelser ka altså udreges ved at ma først fider summe og summe af kvadratere af observatioere, og så idsætter dem i oveståede forholdsvis simple formel. 1 Bemærk dog at metode er temmelig følsom overfor afrudigsfejl fordi de eder med at ma skal trække to ofte meget store positive tal fra hiade). Metode illustreres med et eksempel der samtidig omtaler edu et par smarte tricks. Betragt følgede kostruerede!) talmateriale: y 1 = y 2 = y 3 = y 4 = y 5 = y 6 = y 7 = Når vi her skal udrege geemsittet y af y j -ere, er det smart at idføre et såkaldt beregigsulpukt a, f.eks. a = , og så udrege y som 1 Mage lommeregere har e»statistikkap«σ+) der gør det let at udrege y og s 2. Lommeregere beytter tre hukommelsesregistre hvor de gemmer heholdsvis, y og y 2. Når ma idtaster et tal og trykker på Σ+-taste, opdateres de tre registre. Til sidst trykker ma på ogle passede taster, og lommeregere udreger y på de oplagte måde og s 2 ved hjælp af de her præseterede formel.
17 2.1 Estimatio af µ og σ 2 17 a + y a. Med det omtalte valg af a bliver y a = )/7 = 23 7 = , og dermed y = Summe af de kvadratiske afvigelser ædres ikke år ma trækker det samme tal a fra alle y j -ere fordi det etop drejer sig om afvigelser). Ved beregige ka vi derfor lade som om observatioere er tallee y j a, altså 1, 3, 2, 1, 8, 3, 5; summe af disse tal fadt vi ovefor til 23, og summe af deres kvadrater er = 113 så summe af de kvadratiske afvigelser af y j -ere eller af y j a-ere) er = ; edelig er så s 2 = = Me hvad u hvis observatioere havde været f.eks gage midre: y 1 = y 2 = y 3 = y 4 = y 5 = y 6 = y 7 = Så ville geemsittet ligeledes være blevet 10 6 gage midre, og s 2 ville være blevet = gage midre, altså y = og s 2 = Hvorfor beyttes s 2? Det ka der argumeteres for på forskellige måder. Det lettest hådterlige og forståelige argumet er at s 2 i modsætig til ˆσ 2 ) er e cetral estimator over σ 2, hvilket vil sige at middelværdie af de stokastiske variabel s 2 er lig σ 2, altså E s 2 = σ 2, således at estimatore»i middel«rammer de rigtige værdi. Bevis for at s 2 er cetral: Atag at Y 1, Y 2,..., Y er uafhægige N µ,σ 2 )-variable. Der gælder at Y j Y) 2 = = Y j µ) 2 + 2Y j µ)µ Y) + µ Y) 2) Y j µ) 2 Y µ) 2. Ved at tage middelværdi fås idet vi udervejs beytter at EY) = µ og VarY) = σ 2 /): dvs. E Y j Y) 2 = E EY j µ) 2 EY µ) 2 = VarY) VarY) = 1)VarY) = 1)σ 2, ) 1 1 Y j Y) 2 = σ 2.
18 18 Estikprøveproblemet i ormalfordelige Mod dette argumet ka ma idvede at det er baseret på et yt pricip pricippet om cetrale estimatorer) der tilsyeladede blot er hetet id på scee til dee lejlighed. Hvis likelihoodmetode virkelig skal være oget der er værd at beskæftige sig med, så burde ma kue basere si argumetatio udelukkede på de. Det ka ma også til e vis grad, og det skal u atydes hvorda. De to parametre µ og σ 2 i ormalfordelige opfattes sædvaligvis ikke som værede ligestillede. Ma plejer at tæke på middelværdiparametere µ som de primære da de jo beskriver de systematiske variatio, emlig det iveau hvorom observatioere fordeler sig, hvorimod variasparametere σ 2 der»ku«beskriver de tilfældige variatio, kommer i ade række. Som e kosekves heraf ka ma mee at ma ikke skal estimere de to parametre samtidigt, me at ma først skal estimere µ og deræst σ 2. Ma skal derfor til estimatioe af σ 2 ku beytte det der er tilbage af iformatioe i) talmaterialet efter at ma først har estimeret µ. Hvis der f.eks. foreligger de fem observatioer 3.2, 5.7, 2.1, 7.4, 3.1 som tækes at stamme fra e N µ,σ 2 )-fordelig, så estimeres først de»væsetlige«parameter µ ved geemsittet )/5 = 21.5/5 = 4.3. Deræst skal ma estimere σ 2 der skal beskrive de tilfældige variatio omkrig iveauet 4.3. Da det u ka siges at være givet at de fem værdier skal have geemsit 4.3, dvs. at de fem afvigelser fra geemsittet skal summere til 0, så er der på si vis ku fire forskellige afvigelser. Når ma skal estimere variase der jo er de forvetede kvadratiske afvigelse af e observatio fra middelværdie), bliver det derfor som summe af de kvadratiske afvigelser divideret med fire: ) ) ) ) ) 2) /4 = 1.1) ) ) 2) /4 = 19.08/4 = 4.77 Ma siger at der er fire frihedsgrader fordi år det er fixeret at de fem observatioer skal have et bestemt geemsit f.eks. 4.3), så ka ma vælge fire af de fem afvigelser fra geemsittet frit. Oveståede argumet for at dividere summe af de kvadratiske afvigelser med 1 i stedet for med ka jo roligt siges at være oget løst og upræcist, me det ka faktisk godt præciseres. Det forhold at variasparametere σ 2 tækes at spille e uderordet rolle i forhold til middelværdiparametere µ, og at dette skal afspejles i de måde parametree skal estimeres på, ka formaliseres på følgede måde: Ma skal først estimere µ på sædvalig måde, me deræst skal ma estimere σ 2 i de betigede model hvor ma betiger med ˆµ, altså med y. Estimatet over σ 2 skal være maximum likelihood estimatet, me ma skal vel at mærke beytte likelihoodfuktioe svarede til de betigede fordelig af Y 1, Y 2,..., Y givet at Y er lig med y. Hvis det skal gå bare ogelude matematisk korrekt til, er det ikke oget simpelt problem at bestemme dee betigede fordelig det skyldes at der er tale om kotiuerte fordeliger. Me hvis ma i al aivitet reger med at der gælder ogelude det samme som for diskrete fordeliger, blot med tæthedsfuktioer i stedet for sadsylighedsfuktioer, så skulle de betigede tæthedsfuktio være tæthedsfuktioe for Y 1, Y 2,..., Y tæthedsfuktioe for Y. Da Y 1, Y 2,..., Y er uafhægige N µ,σ 2 )-variable, vil geemsittet Y være N µ,σ 2 /)-fordelt. Derfor bliver de betigede tæthedsfuktio ) ) 1 exp 1 2πσ 2 2σ 2 y j µ) 2 1 2πσ 2 / exp 1 2 y µ) 2 ) σ 2 / = kostat σ 2 ) 1 2 exp 1 2σ 2 y j y) 2 ) Opfattet som fuktio af σ 2 skulle dette så være de betigede likelihoodfuktio hvor i øvrigt µ meget bekvemt er forsvudet ud af billedet), altså de likelihoodfuktio der skal beyttes ved estimatio af σ 2. De betigede likelihoodfuktio er e fuktio af é variabel σ 2, og ma fider.
19 2.2 Test af hypotese om middelværdie 19 at de atager sit maksimum i ét pukt, emlig år σ 2 har værdie s 2. Der gælder altså at i de betigede model er størrelse s 2 = 1 1 y j y) 2 et maximum likelihood estimat over σ Test af hypotese om middelværdie Ma er udertide iteresseret i at udersøge om de foreliggede data er foreelige med e atagelse om at de teoretiske middelværdi µ har e bestemt værdi f.eks. 0). Mere formelt øsker ma at teste de statistiske hypotese H 0 : µ = µ 0 hvor µ 0 er et kedt tal. Hypoteser om parametre i ormalfordeliger testes pricipielt på samme måde som alle adre statistiske hypoteser, emlig ved brug af et kvotiettest der sammeliger likelihoodfuktioes maksimale værdi uder hypotese med de maksimale værdi overhovedet uder de give model. Likelihoodfuktioe er givet i formel 2.2) på side 14, og des maksimale værdi er Ly, ˆσ 2 ). Uder H 0 er likelihoodfuktioe L 0 σ 2 ) = Lµ 0,σ 2 ) og de atager si maksimumsværdi år σ 2 er lig med ˆσ 2 = 1 Kvotietteststørrelse bliver derfor Q = Lµ 0, ˆσ 2 ) Ly, ˆσ 2 ) = ˆσ 2 ) /2 ˆσ 2 exp y j µ 0 ) 2. y j µ 0 ) 2 2 ˆσ 2 y j y) 2 2 ˆσ 2 = = y j µ 0 ) 2 y j y) 2 y j µ 0 ) 2 y j y) 2 /2 /2 exp 2 ) 2 ).
20 20 Estikprøveproblemet i ormalfordelige Her omskrives kvadratsumme i tællere ved hjælp af formel 2.3) på side 15 med µ erstattet af µ 0 ), og ma får Q = = = = y j y) 2 + y µ 0 ) 2 y j y) y µ 0) 2 y j y) y µ 0) 2 1)s /2 ) /2 y µ 0 s 2 / ) 2 Størrelse y µ 0 )/ s 2 / plejer ma at betege t: og med dee betegelse har vi at Q = t = y µ 0 s 2 /, ) /2 1 + t2. 1 /2 /2 Nu er det jo såda at små værdier af Q tyder på at hypotese H 0 ikke er foreelig med data, og det ses at små Q-værdier er esbetydede med t-værdier lagt fra 0, dvs. med store t -værdier. Ma ka derfor beytte t som teststørrelse i stedet for Q, hvilket er praktisk da t er lettere at berege ed Q. Udertide kaldes t-teststørrelse for Studet s t fordi W.S.Gosset der skrev de første artikel om t-testet i 1908), skrev uder pseudoymet Studet. Bemærk at t-teststørrelse også ud fra e umiddelbar betragtig forekommer at være e foruftig teststørrelse idet de måler afvigelse y µ 0 mellem de observerede og de teoretiske middelværdi i forhold til s 2 / som er de estimerede middelfejl på på y dvs. stadardafvigelse på y). Når ma har fudet værdie af teststørrelse t, er æste skridt i testprocedure at bestemme testsadsylighede, altså sadsylighede for at få e mere ekstrem værdi af teststørrelse ed de faktisk opåede, forudsat at hypotese H 0 er rigtig. E matematisk sætig fortæller at år H 0 er rigtig, så følger t-størrelse e bestemt fordelig, emlig e såkaldt t-fordelig med f = 1 frihedsgrader; frihedsgradsatallet i t-fordelige arves fra frihedsgradsatallet for variasestimatet s 2 i ævere. 2 2 Når H 0 er er rigtig, afhæger fordelige af t hverke af µ 0 eller af σ 2, hvilket er bekvemt da vi jo ikke keder de øjagtige værdier heraf..
21 2.3 Histogrammer og fraktildiagrammer 21 I statistiske tabelværker ka ma fide tabeller over fraktiler i t-fordelige, og ved hjælp af sådae tabeller er det let at bestemme testsadsyligheder i t-testet. Ma skal dog være opmærksom på at e»mere ekstrem t-værdi«som oftest vil sige e t-værdi således at t > t obs, dvs. t > t obs eller t < t obs. Ma vil altså forkaste hypotese både hvis t obs er meget stor og hvis de er meget lille. 3 Der gælder at t-fordelige er symmetrisk omkrig 0, hvilket medfører at og dermed P 0 t > tobs ) = P 0 t < tobs ) P 0 t > tobs ) = 2 P 0 t > tobs ). Eksempel 2.3 Lysets hastighed, fortsat) I vore dage er e meter pr. defiitio de strækig som lyset i vacuum geemløber på 1/ sekud, hvoraf følger at lysets hastighed er meter pr. sekud. Med dee hastighed vil lyset være τ 0 = sekuder om at tilbagelægge strækige på de 7442 meter. Størrelse τ 0 svarer til e tabelværdi på τ ) 24.8) 10 3 = 23.8, så det ville være iteressat at udersøge om de foreliggede data er foreelige med hypotese om at de ukedte middelværdi µ har værdie µ 0 = Derfor vil vi teste de statistiske hypotese H 0 : µ = Vi har tidligere fudet at y = og s 2 = 25.8, så t-teststørrelse er t = /64 = 6.2. Da der ikke er oge grud til at tro at der ku skulle kue forekomme afvigelser i é retig, skal testet være tosidet. Testsadsylighede er derfor sadsylighede for at få t-værdier som ete er større ed 6.2 eller midre ed 6.2. Ved tabelopslag ka ma fide at i t-fordelige med 63 frihedsgrader er 99.95%-fraktile lidt over 3.4, dvs. der midre ed 0.05% sadsylighed for at få e værdi som er større ed 6.2, og testsadsylighede er dermed midre % = 0.1%. E så lille testsadsylighed betyder at ma må forkaste hypotese. Newcombs måliger af lysets passagetid stemmer altså ikke overes med hvad vi i dag ved om lysets hastighed. Vi ser at Newcombs passagetider er e smule for store, og da de lyshastighed vi her har beyttet, er lysets hastighed i vacuum, ka oget af forklarige være at lyset bevæger sig e smule lagsommere i luft ed i vacuum. 2.3 Histogrammer og fraktildiagrammer For at få e idé om modelles rimelighed vil ma ofte i et»estikprøveproblem i ormalfordelige«tege histogrammer og fraktildiagrammer. 3 Et sådat test kaldes et tosidet test, i modsætig til et esidet test der reger med at de»ekstreme«afvigelser ku ka være til de ee side, f.eks. de positive, så at ma ku forkaster hvis de observerede t-værdi er meget stor.
22 22 Estikprøveproblemet i ormalfordelige Figur 2.1 Histogram over 64 målte værdier af lysets passagetid. De idtegede kurve er tæthede for ormalfordelige med parametre y = og s 2 = Histogrammer Et histogram over et sæt observatioer y 1, y 2,..., y fås på følgede måde: 1. Iddel observatiosakse i et atal delitervaller, gere lige store, såda at der ikke er oge observatioer i itervaledepuktere. 2. Tæl op hvor mage observatioer der er i hvert iterval. 3. Teg rektagler hvis grudflader er delitervallere, og hvis arealer er lig med de brøkdel af observatioere som ligger ide for det pågældede deliterval. Hvis der er a observatioer i et iterval af lægde l, skal rektaglets højde være a/l.) 4. Histogrammet skal lige tæthedsfuktioe for de formodede sadsylighedsfordelig her e ormalfordelig). Det er derfor e god idé at idtege de estimerede fordeligs tæthedsfuktio i samme figur som histogrammet, se Figur 2.1. Ved udarbejdelse af et histogram ka det være lidt af et kuststykke at vælge de rigtige itervaliddelig således at fluktuatioere bliver passede udglattet ude at tæthedes form bliver alt for udjævet. Hvis itervallere er for korte, bliver fluktuatioere ikke udglattet ok, er de for lage, sker der e for stor udjævig af tæthedes form. Ma ka godt opskrive defiitioe på et histogram over et sæt observatioer y 1, y 2,..., y lidt mere formelt: 1. I det område hvor observatioere falder vælges delepukter der som regel bør være ækvidistate) x 0 < x 1 < x 2 <... < x m hvor x 0 er midre ed de midste og x m større ed de største af y-observatioere. 2. Bestem atallet j af y-er i det j-te iterval som er ]x j 1, x j ]). 3. Defier de stykkevis kostate fuktio h som hy) = j / x j x j 1 år y ]x j 1, x j ], 0 år y x 0 eller y > x m. Så er histogrammet svarede til de valgte iddelig) over observatioere y 1, y 2,..., y gaske simpelt grafe for h.
23 2.3 Histogrammer og fraktildiagrammer 23 Figur 2.2 Fraktildiagram over 64 målte værdier af lysets passagetid. Fraktildiagrammer Når ma har et sæt observatioer y 1, y 2,..., y, beytter ma traditioelt betegelse y 1), y 2),..., y ) for de ordede observatioer, dvs. y-ere stillet op i voksede rækkefølge. Nu er det såda at hvis alle de observerede y-er er forskellige, så er brøkdele i 1)/ af observatioere stregt midre ed tallet y i), og brøkdele i/ af dem er midre ed eller lig med tallet y i). Som et kompromis ka ma da sige at brøkdele i 0.5)/ af dem er midre ed tallet y i), med adre ord er y i) e i 0.5 -fraktil i de empiriske fordelig. Geerelt defieres e α-fraktil i e fordelig som et tal y α med de egeskab at brøkdele α af fordelige ligger til vestre for y α. Et fraktildiagram er kort fortalt e tegig hvor ma afsætter teoretiske fraktiler mod empiriske fraktiler. Hvis y-ere er observatioer fra N µ,σ 2 )- fordelige, så er de teoretiske fordeligsfuktio fuktioe y Φ y µ σ ) side 10). Derfor fider ma de teoretiske α-fraktil y α ved at løse ligige Φ y α µ σ ) = α, hvilket giver y α = µ + σ Φ 1 α). De pukter hvis førstekoordiater er de empiriske fraktiler, og hvis adekoordiater er de tilsvarede teoretiske fraktiler, det vil sige puktere med koordiater ) y i), µ + σ Φ 1 i 0.5 ), i = 1, 2,...,, bør da ligge ogelude omkrig e ret liie geem 0, 0) med hældig 1. Dette er esbetydede med at puktere med koordiater ) y i), Φ 1 i 0.5 ), i = 1, 2,...,, ligger ogelude omkrig de rette liie geem µ, 0) med hældig 1/σ. Kokret fremstiller ma fraktildiagrammet ved at idtege puktere ) y i), Φ 1 i 0.5 ), i = 1, 2,..., i et koordiatsystem hvor ma desude idteger de rette liie geem y, 0) med hældig 1/s; fuktioe Φ 1 fides tabelleret i statistiske tabelværker og er e stadardfuktio i statistikprogrammer til computere. Med sadsylighedspapir ka ma fremstille fraktildiagrammer med hådkraft uhyre let og ude at skulle bekymre sig om fuktioe Φ 1 de er emlig idbygget i sadsylighedspapiret). Sadsylighedspapiret er idrettet på de måde at ordiatakse har to skalaer: e probit-skala som er ækvidistat og går fra kap 2 til godt 8, og e ikke-ækvidistat) sadsylighedsskala med sadsyligheder i procet, gåede fra 0.05 til Ma afsætter u puktere
24 24 Estikprøveproblemet i ormalfordelige Tabel 2.2 Data til Opgave y i), i 0.5 ) idet ma beytter sadsylighedsskalae på ordiatakse; hvis tallee er ormalfordelte, skal puktere fordele sig omkrig de rette liie der ka idteges ved at beytte probit-skalae på ordiatakse og lade liie gå geem puktere y s, 4), y, 5), y + s, 6) osv. Figur 2.2 viser et fraktildiagram over de 64 målte værdier af lysets passagetid. Såvel histogrammet side 22) som fraktildiagrammet viser, at det ikke er gaske urimeligt at atage at måleresultatere er ormalfordelte. 2.4 Opgaver Opgave 2.1 Tallee i Tabel 2.2 ka opfattes som et»estikprøveproblem«i ormalfordelige. Vi beteger tallee y 1, y 2,..., y = 18). 1. Udreg geemsittet y af observatioere. 2. Udreg summe af kvadratiske afvigelser y j y) 2 på to måder, a) dels på de»umiddelbare«måde, dvs. udreg de 18 differeser y j y, kvadrér differesere og summér dem, b) dels ved at beytte det sedige trick fra side Udreg variasskøet og skøet over stadardafvigelse. 4. Stadardafvigelse på geemsittet y er 1/ gage stadardafvigelse på y-ere. Udreg de estimerede stadardafvigelse på geemsittet. Stadardafvigelse på geemsittet kaldes ofte middelfejle på y.) 5. Med hvor mage cifre bør ma agive værdie af y? Opgave 2.2 Kviksølv i sværdfisk) Sværdfisk ka være e kuliarisk oplevelse, me de er sudest år de ikke ideholder alt for mage tugmetaller. I e udersøgelse af sværdfisk på det
25 2.4 Opgaver 25 Tabel 2.3 Opgave 2.2: Kviksølvidhold ppm) i 115 sværdfisk, de ordede observatioer amerikaske marked har ma målt kviksølvidholdet i 115 tilfældigt udvalgte sværdfisk og fået resultatere i Tabel Ifølge de amerikaske sudhedsmydigheder bør kosumfisk ikke ideholde over 1 ppm kviksølv. De fisk der sælges via de autoriserede salgskaaler, ka ma kotrollere med stikprøvekotroller), og ma ka så kassere de partier der ideholder for meget kviksølv. Imidlertid sælges der også e del fisk ude om kotrolmydighedere i USA reger ma med ca. 25%. Ma er iteresseret i at vide hvorda ma skal vælge kassatiosgræse for de 75% kotrollerede fisk for at opå at geemsitsidholdet af kviksølv i de fisk der år frem til forbrugere, bliver 1 ppm eller deruder). Hvis ma skal kue berege dee græse, er ma ødt til at kede fordelige af kviksølvidhold i sværdfisk. 1. Det ville være bekvemt hvis observatioere kue beskrives ved e ormalfordelig, så det øsker ma at udersøge. a) Udreg estimatere y og s 2 over µ og σ 2. b) Teg et histogram over kviksølvidholdet i de 115 sværdfisk. Idteg skitsemæssigt) de fittede ormalfordeligstæthed dvs. tæthede for ormalfordelige med parametre y og s 2 ). c) Teg et fraktildiagram f.eks. på sadsylighedspapir). Idteg de rette liie der svarer til de fittede ormalfordelig. 2. I de opridelige aalyse af tallee gik ma ud fra at kviksølvkocetratioe i sværdfisk var logaritmisk ormalfordelt, hvilket betyder at logaritme til kocetratioere er ormalfordelt. Diskutér dee formodig. TIP: Summe af observatioere er , og summe af kvadratere er For logaritme de aturlige logaritme) til observatioere er de tilsvarede tal og Lee & Krutchkoff 1980): Mea ad variace of partially-trucated distributios. Biometrics 36,
26 26 Estikprøveproblemet i ormalfordelige Tabel 2.4 Data til Opgave 2.4: 20 eksempler på udfald af stokastiske variable Y 1, Y 2,..., Y 10 frembragt af e ormalfordeligs-tilfældighedsmekaisme med middelværdi 5 og varias 3. y 1 y 2 y 3 y 4 y 5 y 6 y 7 y 8 y 9 y 10 y s Opgave 2.3 fortsættelse af Opgave 2.2; svær) Løs det der er det overordede problem i Opgave 2.2, emlig hvorda skal ma fastsætte kassatiosgræse for de 75% af fiskee der kotrolleres hvis ma vil opå at forbrugere i geemsit højst udsættes for e kviksølvbelastig på 1 ppm. Opgave 2.4 Tabel 2.4 ideholder 20 stikprøver y 1, y 2,..., y 10 fra e ormalfordelig med parametre µ = 5 og σ 2 = Hvorda fordeler de ekelte stikprøvers estimerede middelværdier y sig omkrig de teoretiske middelværdi µ = 5? 2. Ma ka bevise at geemsittet af N µ,σ 2 )-fordelte størrelser ka opfattes som e observatio fra N µ,σ 2 /)-fordelige. De 20 geemsit y 1, y 2,..., y 20 skulle altså være observatioer fra e ormalfordelig med middelværdi 5 og varias 3/10. Ser det ud til at passe? a) Udreg geemsittet y = y 1 + y y 20 ) /20 og de empiriske varias på y i 1 -ere, dvs. yi y ) Giver det cirka 5 og 0.3? 20
27 2.4 Opgaver 27 b) Teg et fraktildiagram over y 1, y 2,..., y Udreg for hver af de 20 stikprøver t-teststørrelse for hypotese µ = 5. Hvorda fordeler t-værdiere sig? Udreg de 20 testsadsyligheder. Hvor mage af dem er uder 5%? Er tigee som ma skulle forvete og hvad skulle ma egetlig forvete? 4. I realitete foreligger der jo 200 observatioer fra e og samme ormalfordelig. Skitsér hvorda ma ud fra disse 200 observatioer kue teste hypotese om at de teoretiske middelværdi er lig 5.
28 28
29 3 Tostikprøveproblemer i ormalfordelige E ofte forekommede situatio er at der foreligger måliger af e bestemt egeskab hos et atal idivider der på forhåd vides at tilhøre forskellige grupper. Alt afhægigt af karaktere af måligere ka ma så beytte de ee eller ade eller tredje statistiske model/metode for dels at beskrive, dels at sammelige de pågældede grupper. I dette kapitel skal vi diskutere metoder der ka beyttes, år der på hvert idivid er målt é ekelt talværdi, talværdie opfattes som værede e værdi på e kotiuert måleskala, ma vælger at beskrive de tilfældige variatio med e ormalfordelig. Når betigelsere er formuleret i vediger som»opfattes som værede«og»vælger at beskrive«, skyldes det at ormalfordelige ofte beyttes også i situatioer hvor ma kue pege på adre mere rigtige fordeliger. Tit er der e eller to forholdsvis gode grude til alligevel at beytte ormalfordelige. De ee grud er De Cetrale Græseværdisætig der siger at summer af et større atal stokastiske variable uder visse milde omstædigheder med god tilærmelse er ormalfordelt, og de størrelser ma laver statistiske modeller for, er etop tit sådae summer. De ade grud er ret pragmatisk: Normalfordeligsmodeller er fra et matematisk-statistisk syspukt særdeles»pæe«i de forstad at år ma i ormalfordeligsmodeller beytter de geerelle statistiske pricipper, så bliver resultatet æste altid pæe og simple metoder der ofte er lette at forstå og giver emme og forståelige udregiger osv. Som følge heraf er ormalfordeligsmodeller studeret og beskrevet i alle detaljer, og ma ka for det meste fide e teoretisk geemreget model der passer til es behov. Hvori består problemet? Atag at der er tale om e situatio hvor ma på hvert af et atal»idivider«har målt værdie af e bestemt variabel Y. Idivider skal her forstås i meget bred forstad: det ka bl.a. være persoer, forsøgsdyr, jordlodder eller f.eks. de ekelte realisatioer af forsøget»målig af lysets hastighed«. Idividere er opdelt i grupper ud fra ogle kriterier som er kedt på forhåd ide forsøget starter), og som ikke afhæger af hvilke værdi Y u måtte have. I de statistiske model for Y-ere vil ma rege med at de forskel der er mellem 29
30 30 Tostikprøveproblemer i ormalfordelige Y-værdiere hos) idividere ide for e bestemt gruppe, er tilfældig, og at de forskel der er mellem forskellige grupper, er systematisk. E ormalfordeligsmodel til dee situatio er da idrettet på de måde at de systematiske forskel mellem grupper beskrives ved hjælp af middelværdiparametre, og de tilfældige forskel ide for grupper beskrives ved hjælp af dels ormalfordelige, dels variasparametre i ormalfordelige. Det statistiske problem består tit i at ma øsker at sammelige gruppere for at vurdere om de systematiske forskel mellem dem er sigifikat, dvs. om de forskel der er mellem gruppere, er stor målt i forhold til de tilfældige variatio ide for de ekelte grupper. Ma øsker derfor at kue måle forskelle mellem gruppere med e målestok der er kalibreret efter størrelse af de tilfældige variatio ide for gruppere. Det ma egetlig er iteresseret i, er altså iformatio om middelværdiparametree. Me for at der ka være e veldefieret målestok at måle dem med, må ma først sikre sig at det har meig at tale om de tilfældige variatio ide for grupper. Derfor ma i må modelle gøre de atagelse som udertide ka testes) at der er variashomogeitet, dvs. at de forskellige grupper har samme variasparameter. 1 Hermed er problemet beskrevet i geerelle vediger. I reste af dette kapitel og i Kapitel 4 skal vi se hvorda det ka løses. Der er traditio for at ma giver e særlig omtale af de situatio hvor der er to grupper der skal sammeliges, så det gør vi også her. 3.1 Tostikprøveproblemet med uparrede observatioer Ma har to grupper af»idivider«, og på hvert idivid har ma målt værdie af e bestemt variabel Y. Idividere i de ee gruppe hører ikke samme med dem i de ade gruppe på oge måde, de er uparrede. Der behøver heller ikke være lige mage observatioer i de to grupper. Skematisk ser situatioe såda ud: gruppe observatioer 1 y 11 y y 1 j... y 11 2 y 21 y y 2 j... y 22 Her beteger y i j observatio r. j i gruppe r. i, i = 1, 2. Gruppere har heholdsvis 1 og 2 observatioer. Vi vil gå ud fra at forskelle mellem observatioer ide for e gruppe er tilfældig, hvorimod der er e systematisk forskel på to de grupper det er derfor at observatioere er iddelt i grupper! Edelig atages at y i j -ere er observerede værdier af uafhægige stokastiske variable Y i j som er ormalfordelte med samme varias σ 2 og med middelværdier 1 Ma ka dog klare sig med e atagelse om at grupperes variasparametre er kedte påær e kostat faktor.
31 3.1 Tostikprøveproblemet med uparrede observatioer 31 heholdsvis µ 1 og µ 2, kort Y 1 j N µ 1,σ 2 ) Y 2 j N µ 2,σ 2 ). På dee måde beskriver de to middelværdiparametre µ 1 og µ 2 de systematiske variatio, dvs. de to gruppers iveauer, medes variasparametere σ 2 samt ormalfordelige) beskriver de tilfældige variatio der altså er de samme i begge grupper dee atagelse ka ma evetuelt teste, se side 35). Estimatio af µ 1 og µ 2 Estimater over de ukedte middelværdiparametre µ 1 og µ 2 fides ved maximum likelihood metode, altså som de værdier der maksimaliserer likelihoodfuktioe Lµ 1, µ 2,σ 2 ) = = 1 1 2πσ 2 exp πσ 2 ) exp ) y 1 j µ 1 ) 2 1 2σ 2 σ y 1 j µ 1 ) πσ 2 exp y 2 j µ 2 ) 2 )) ) y 2 j µ 2 ) 2 hvor = er det samlede atal observatioer. Det ses at hvis σ 2 er fast, så er det at maksimalisere likelihoodfuktioe L med hesy til µ 1 og µ 2 det samme som det at miimalisere kvadratsumme 1 y 1 j µ 1 ) og de opgave er som vi skal se, let at løse. y 2 j µ 2 ) 2, Vi lader y i betege geemsittet i gruppe i, y i = 1 i i y i j. Det sedige trick er u følgede omskrivig af det j-te led fra gruppe 1 vi beytter formle for kvadratet på e toleddet størrelse): y 1 j µ 1 ) 2 = y 1 j y 1 ) + y 1 µ 1 ) ) 2 = y 1 j y 1 ) 2 + 2y 1 j y 1 )y 1 µ 1 ) + y 1 µ 1 ) 2. Når vi summerer over j, bliver summe af de dobbelte produkter 0 fordi summe af afvigelsere fra y 1 er 0, så, σ 2 1 y 1 j µ 1 ) 2 = = 1 1 y 1 j y 1 ) y 1 µ 1 ) 2 y 1 j y 1 ) y 1 µ 1 ) 2.
32 32 Tostikprøveproblemer i ormalfordelige Fra gruppe 2 kommer der et tilsvarede bidrag, så alt i alt ka de kvadratsum der skal miimaliseres, skrives som 1 y 1 j µ 1 ) y 2 j µ 2 ) 2 = 1 y 1 j y 1 ) y 2 j y 2 ) y 1 µ 1 ) y 2 µ 2 ) 2. Det ses at de værdier af µ 1 og µ 2 der gør kvadratsumme midst, er µ 1 = y 1 og µ 2 = y 2. Vi har dermed fudet at maksimaliserigsestimatere for gruppemiddelværdiere µ 1 og µ 2 er gruppegeemsittee y 1 og y 2. Estimatio af σ 2 Maksimaliserigsestimatet ˆσ 2 for σ 2 ka bestemmes som maksimumspuktet for fuktioe σ 2 Ly 1, y 2,σ 2 ) ; ma fider at ˆσ 2 = 1 1 y 1 j y 1 ) y 2 j y 2 ) 2 ). E størrelse som y i j y i der er forskelle mellem de faktiske observatio og det bedst mulige fit uder de aktuelle model, kaldes udertide for et residual. 2 Derfor kaldes e størrelse som 1 y 1 j y 1 ) y 2 j y 2 ) 2 for e residualkvadratsum, og ma ka sige at maksimaliserigsestimatet ˆσ 2 for σ 2 er lig med residualkvadratsumme divideret med atallet af observatioer. Som regel beytter ma imidlertid et adet estimat over σ 2, emlig residualkvadratsumme divideret med atallet af frihedsgrader 2 atal observatioer mius atal estimerede middelværdiparametre), dvs. ma estimerer variase ved s 2 0 = y 1 j y 1 ) y 2 j y 2 ) 2 ) Ma begruder bruge af s 2 0 frem for ˆσ 2 på ligede måde som i Estikprøveproblemet i ormalfordelige, se side Et residual betyder: oget der er til rest..
hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i
Normalfordeliger For at e stokastisk variabel X ka være ormalfordelt, skal X agive værdie af e eller ade målig, f.eks. tid, lægde, vægt, beløb osv. Notatioe er: Xi ~ N( μ, σ hvor i er observatiosummeret,
Læs mereMikroøkonomi, matematik og statistik Eksamenshjemmeopgave 14. 20. december 2007
Mikroøkoomi, matematik og statistik Eksameshjemmeopgave 14. 20. december 2007 Helle Buzel, Tom Egsted og Michael H.J. Stæhr 14. december 2007 R E T N I N G S L I N I E R F O R E K S A M E N S H J E M M
Læs mereMotivation. En tegning
Motivatio Scatter-plot at det mådelige salg mod det måedlige reklamebudget. R: plot(salg ~ budget, data = salg) Økoometri Lektio Simpel Lieær Regressio salg 400 450 500 550 20 25 30 35 40 45 50 budget
Læs mereKonfidens intervaller
Kofides itervaller Kofides itervaller for: Kofides iterval for middelværdi, varias kedt Kofides iterval for middelværdi, varias ukedt Kofides iterval for adel Kofides iterval for varias Bestemmelse af
Læs mereMeningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017
Meigsmåliger KLADDE Thomas Heide-Jørgese, Rosborg Gymasium & HF, 2017 Idhold 1 Meigsmåliger 2 1.1 Idledig................................. 2 1.2 Hvorda skal usikkerhede forstås?................... 3 1.3
Læs merePraktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.
Praktisk ifo Liste med rettelser og meigsforstyrrede trykfejl i DS på Absalo. Statistisk aalyse af e ekelt stikprøve: kedt eller ukedt varias Sadsylighedsregig og Statistik (SaSt) Helle Sørese Projekt
Læs mereIndholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable
Idholdsfortegelse Geerelt:...3 Stokastisk variabel:...3 Tæthedsfuktio/sadsylighedsfuktio for stokastisk variabel:...3 Fordeligsfuktio/sumfuktio for stokastisk variabel:...3 Middelværdi:...4 Geemsit:...4
Læs mereDefinition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.
Repetitio: Normalfordelige Ladmåliges fejlteori Lektio Trasformatio af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/udervisig/lf13 Istitut for Matematiske Fag Aalborg Uiversitet
Læs mere24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.
Epidemiologi og biostatistik. Forelæsig Uge, tirsdag. Niels Trolle Aderse, Afdelige for Biostatistik. Geerelt om kurset: - Formål - Forelæsiger - Øvelser - Forelæsigsoter - Bøger - EpiBasic: http://www.biostat.au.dk/teachig/software
Læs mereMatematisk Modellering 1 Hjælpeark
Matematisk Modellerig Hjælpeark Kaare B. Mikkelse 2005090 3. september 2007 Idhold Formler 2 2 Aalyse af k ormalfordelte prøver 2 2. Modelcheck............................................ 2 2.2 Test af
Læs mereGamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)
Gamle eksamesopgaver Diskret Matematik med Avedelser (DM72) & Diskrete Strukturer(DM504) Istitut for Matematik& Datalogi Syddask Uiversitet, Odese Alle sædvalige hjælpemidler(lærebøger, otater etc.), samt
Læs mereDATV: Introduktion til optimering og operationsanalyse, 2007. Bin Packing Problemet
DATV: Itroduktio til optimerig og operatiosaalyse, 2007 Bi Packig Problemet David Pisiger, Projektopgave 2 Dette er de ade obligatoriske projektopgave på kurset DATV: Itroduktio til optimerig og operatiosaalyse.
Læs mere9. Binomialfordelingen
9. Biomialfordelige 9.. Gekedelse Hvert forsøg ka ku resultere i to mulige udfald; succes og fiasko. I modsætig til poissofordelige er atallet af forsøg edeligt. 9.. Model X : Stokastisk variabel, der
Læs mereStatistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!
Statistik Lektio 8 Parrede test Test for forskel i adele Test for es varias Gesy med flyskræk! Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og kviders
Læs mere29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.
Epidemiologi og biostatistik Forelæsig Uge 1, torsdag. februar 006 ichael Væth, Afdelig for Biostatistik. Sammeligig af to middelværdier sikkerhedsitervaller statistisk test Sammeligig af to proportioer
Læs mereEstimation ved momentmetoden. Estimation af middelværdiparameter
Statistik og Sadsylighedsregig 1 STAT kapitel 4.2 4.3 Susae Ditlevse Istitut for Matematiske Fag Email: susae@math.ku.dk http://math.ku.dk/ susae Estimatio ved mometmetode Idimellem ka det være svært (eller
Læs mereDagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)
Dages program Estimatio: Kapitel 9.4-9.7 Eksempler på middelrette og/eller kosistete estimator (de sidste fra sidste forelæsig) Ko desiterval for store datasæt kap. 9.4 Ko desiterval for små datasæt kap.
Læs mereStikprøvefordelinger og konfidensintervaller
Stikprøvefordeliger og kofidesitervaller Stikprøvefordelige for middelværdi De Cetrale Græseværdi Sætig Egeskaber Ved Estimatore Kofidesitervaller t-fordelige Estimator og estimat E stikprøve statistik
Læs mereGenerelle lineære modeller
Geerelle lieære modeller Regressiosmodeller med é uafhægig itervalskala variabel: Y e eller flere uafhægige variable: X,..,X k De betigede fordelig af Y givet X,..,X k atages at være ormal med e middelværdi,
Læs mereElementær Matematik. Polynomier
Elemetær Matematik Polyomier Ole Witt-Hase 2008 Køge Gymasium Idhold 1. Geerelle polyomier...1 2. Divisio med hele tal....1 3. Polyomiers divisio...2 4. Polyomiers rødder....4 5. Bestemmelse af røddere
Læs mereantal gange krone sker i første n kast = n
1 Uge 15 Teoretisk Statistik, 5. april 004 1. Store tals lov Eksempel: møtkast Koverges i sadsylighed Tchebychevs ulighed Sætig: Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder
Læs mereTest i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!
Test i to populatioer Hypotesetest for parrede observatioer Test for es varias Gesy med flyskræk! Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og
Læs mereProjekt 1.3 Brydningsloven
Projekt 1.3 Brydigslove Når e bølge, fx e lysbølge, rammer e græseflade mellem to stoffer, vil bølge ormalt blive spaltet i to: Noget af bølge kastes tilbage (spejlig), hvor udfaldsvikle u er de samme
Læs mereMatematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.
Matematik A Studetereksame Forsøg med digitale eksamesopgaver med adgag til iterettet Forberedelsesmateriale Vejledede opgave Forår 0 til stx-a-net MATEMATIK Der skal afsættes 6 timer af holdets sædvalige
Læs mereLøsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)
Løsigsforslag til skriftlig eksame i Kombiatorik, sadsylighed og radomiserede algoritmer (DM58) Istitut for Matematik & Datalogi Syddask Uiversitet Madag de 3 Jauar 011, kl. 9 13 Alle sædvalige hjælpemidler
Læs mereSandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
Statistik for biologer 005-6, modul 5: Sadsylighedsfordeliger for kotiuerte data på iterval/ratioskala M6, slide Gægse matematiske sadsylighedsfordeliger: Diskrete data: De positive biomialfordelig Poisso-fordelige
Læs mereSimpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol
Simpel Lieær Regressio Opsplitig af variatioe Determiatios koefficiet Variasaalse F-test Model-kotrol Opbgig af statistisk model Specificer model Ligiger og atagelser Estimer parametre Modelkotrol Er modelle
Læs mereStatistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion
Statistik 8. gag 1 KONIDENSINTERVALLER Kofidesitervaller: kapitel 11 Valg og test af fordeligsfuktio Statistik 8. gag 11. KONIDENS INTERVALLER Et kofides iterval udtrykker itervallet hvori de rigtige værdi
Læs mereProjekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner
Projekter: Kapitel 4 Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Kotiuitet og kotiuerte fuktioer Ord som kotiuert og kotiuerlig
Læs mereAsymptotisk optimalitet af MLE
Kapitel 4 Asymptotisk optimalitet af MLE Lad Y 1, Y 2,... være uafhægige, idetisk fordelte variable med værdier i et rum (Y,K). Vi har givet e model (ν θ ) θ Θ for fordelige af Y 1 (og dermed også for
Læs mereRenteformlen. Erik Vestergaard
Reteformle Erik Vestergaard 2 Erik Vestergaard www.matematikfysik.dk Erik Vestergaard, 2010. Billeder: Forside: istock.com/ilbusca Side 4: istock.com/adresrimagig Desude ege illustratioer. Erik Vestergaard
Læs mereTalfølger og -rækker
Da Beltoft og Klaus Thomse Aarhus Uiversitet 2009 Talfølger og -rækker Itroduktio til Matematisk Aalyse Zeos paradoks om Achilleus og skildpadde Achilleus løber om kap med e skildpadde. Achilleus løber
Læs mereVejledende opgavebesvarelser
Vejledede opgavebesvarelser 1. Atal hæder er lig med K(52,5), altså 2598960. Ved brug af multiplikatiospricippet ka atal hæder med 3 ruder og 2 spar udreges som K(13, 3) K(13, 2), hvilket giver 22308.
Læs mereProgram. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger
Faculty of Life Scieces Program Esidet variasaalyse Normalfordelige Claus Ekstrøm E-mail: ekstrom@life.ku.dk Esidet variasaalyse (oe-way ANOVA) Hvilke type data? Hvad er problemstillige? Variatio mellem
Læs mereLøsninger til kapitel 7
Løsiger til kapitel 7 Opgave 7.1 a) HpoStat giver resultatet: Pop. varias er ukedt, me 30, så Normalf. bruges approksimativt = 54,400 s 1.069,90 = 00,000 0,95 49,868 58,93 Dette betder, at med 95% sikkerhed
Læs mere13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )
3. februar 003 Epidemiologi og biostatistik. Uge, torag d. 3. februar 003 Morte Frydeberg, Istitut for Biostatistik. Type og type fejl Nogle specielle metoder: Test i RxC tabeller Test i x tabeller Fishers
Læs mereMatematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter
Matematikkes mysterier - på et obligatorisk iveau af Keeth Hase 7. Ligiger, polyomier og asymptoter Hvad er e asymotote? Og hvorda fides de? 7. Ligiger, polyomier og asymptoter Idhold 7.0 Idledig 7.1 Udsag
Læs mereMaja Tarp AARHUS UNIVERSITET
AARHUS UNIVERSITET Maja Tarp AARHUS UNIVERSITET HVEM ER JEG? Maja Tarp, 4 år Folkeskole i Ulsted i Nordjyllad Studet år 005 fra Droiglud Gymasium Efter gymasiet: Militæret Australie Startede på matematik
Læs mereSætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n
Ladmåliges fejlteori Lektio 3 Estimatio af σ Dobbeltmåliger Geometrisk ivellemet Lieariserig - rw@math.aau.dk Istitut for Matematiske Fag Aalborg Uiversitet Repetitio: Middelværdi og Varias Sætig: Middelværdi
Læs mereStatistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer
Statistik Lektio 7 Hpotesetest og kritiske værdier Tpe I og Tpe II fejl Strke af e test Sammeligig af to populatioer 1 Tri I e Hpotesetest E hpotesetest består af 5 elemeter: I. Atagelser Primært hvilke
Læs mereKvantitative metoder 2
Dages program Kvatitative metoder De multiple regressiosmodel 6. februar 007 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.- 3.+appedix E.) Defiitio og motivatio Fortolkig af
Læs mereScorer FCK "for mange" mål i det sidste kvarter?
Uge 7 I Teoretsk Statstk, 9. aprl 2004. Hvor er v? Hvor var v: opstllg af statstske modeller Hvor skal v he: tro om estmato og test 2. Eksempel: FCK Estmato (tutvt) Test Maksmum lkelhood estmato Scorer
Læs mereSammenligning af to grupper
Sammeligig af to gruer Reetitio, heruder om kritiske værdier Sammeligig af to gruer Sammeligig af to middelværdier Sammeligig af to adele Sammeligig af to variaser yoteser og hyotesetest. E hyotese er
Læs mereAnvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse
Avedt Statistik Lektio 3 Pukt- og itervalestimater Kofidesitervaller Valg af stikprøvestørrelse Pukt- og itervalestimater: Motivatio Motiverede eksempel: I e udersøgelse er adele af rygere 0.27. Det aslås
Læs mereKapitel 10 KALIBRERING AF STRØMNINGSMODEL
Kapitel 0 KALIBRERING AF STRØMNINGSMODEL Torbe Obel Soeborg Hydrologisk afdelig, GEUS Nøglebegreber: Kalibrerigsprotokol, observatiosdata, kalibrerigskriterier, idetificerbarhed, etydighed, parameterestimatio,
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab
Statistik ved Bachelor-uddaelse i folkesudhedsvideskab Græseværdisætiger Det hadler om geemsit Statistikere elsker geemsit Det er oplagt e god ide at tage geemsit. Hvis jeg f.eks skal gætte på vægte af
Læs mereStatistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :
Statistiske test Efteråret 00 Jes Friis, AAU Hjemmeside : http://akaaudk/jfj Kotiuerte fordeliger Defiitio: Tæthedsfuktio E sadsylighedstæthedsfuktio på R er e itegrabel fuktio f : R [0; [ hvor f d = Defiitio:
Læs mereAnalyse 1, Prøve maj 2009
Aalyse, Prøve 5. maj 009 Alle hevisiger til TL er hevisiger til Kalkulus (006, Tom Lidstrøm). Direkte opgavehevisiger til Kalkulus er agivet med TLO, ellers er alle hevisiger til steder i de overordede
Læs mereProjekt 2.3 Det gyldne snit og Fibonaccitallene
Projekter: Kapitel Projekt.3 Det glde sit og Fiboaccitallee Forslag til hvorda klasses arbejde med projektet ka tilrettelægges: Forløbet:. Præsetatio af emet med vægt på det glde sit.. Grppere arbejder
Læs mereDen flerdimensionale normalfordeling
De flerdimesioale ormalfordelig Stokastiske vektorer Ved e stokastisk vektor skal vi forstå e vektor, hvor de ekelte kompoeter er sædvalige stokastiske variable. For de stokastiske vektor Y = Y,..., Y
Læs mere1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2
Idhold 1 Pukt- og itervalestimatio 2 1.1 Puktestimatorer: Cetralitet(bias) og efficies.................... 2 2 Kofidesiterval 3 2.1 Kofidesiterval for adel................................ 4 2.2 Kofidesiterval
Læs mereHvordan hjælper trøster vi hinanden, når livet er svært?
Hvorda hjælper trøster vi hiade, år livet er svært? - at være magtesløs med de magtesløse Dask Myelomatoseforeig Temadag, Hotel Scadic, Aalborg Lørdag de 2. april 2016 kl. 14.00-15.30 Ole Raakjær, præst
Læs mereog Fermats lille sætning
Projekter: Kaitel 0. Projekt 0. Modulo-regig, restklassegruer og Fermats lille sætig Projekt 0. Modulo-regig, restklassegruere ( { 0 }, ) og Fermats lille sætig Vi aveder moduloregig og restklasser mage
Læs mereTankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353
Takegagskompetece Hesigte med de følgede afsit er først og fremmest at skabe klarhed over de mere avacerede regeregler i skole og give resultatet i de almee form, der er karakteristisk for algebra. Vi
Læs mereØkonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006
Dages program Økoometri De multiple regressiosmodel 5. februar 006 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.-3.3+appedix E.-E.) Defiitio og motivatio Fortolkig af parametree
Læs mereESBILAC. - modermælkserstatning til hvalpe VEJLEDNING. www.kruuse.com
ESBILAC - modermælkserstatig til hvalpe VEJLEDNING De bedste start på livet, e yfødt hvalp ka få, er aturligvis at stille si sult med si mors mælk. Modermælk ideholder alt, hvad de små har brug for af
Læs mere30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.
30. august 005 Epidemiologi og biostatistik. Forelæsig 3 Uge, torag d. 8. september 005 Michael Væth, Afdelig for Biostatistik. Mere om kategoriske data Test for uafhægighed I RxC tabeller Test for uafhægighed
Læs mereTEKST NR 435 2004. TEKSTER fra IMFUFA
TEKST NR 435 2004 Basisstatisti 2. udgave Jørge Larse August 2006 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING
Læs mereTeoretisk Statistik, 9. februar Beskrivende statistik
Uge 7 I Teoretisk Statistik, 9 februar 004 Beskrivede statistik Kategoriserede variable 3 Kvatitative variable 4 Fraktiler for ugrupperede observatioer 5 Fraktiler for grupperede observatioer 6 Beliggeheds-
Læs mereVelkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager
Program Statistik og Sadsylighedsregig 2 Sadsylighedstætheder og kotiuerte fordeliger på R Helle Sørese Uge 6, madag Velkomme I dag: Praktiske bemærkiger Hvad skal vi lave på SaSt2? Sadsylighedstætheder
Læs merevejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.
enote 5 enote 5 Determiater I dee enote ser vi på kvadratiske matricer. Deres type er altså for 2, se enote 4. Det er e fordel, me ikke absolut ødvedigt, at kede determiatbegrebet for (2 2)-matricer på
Læs mereLys og gitterligningen
Fysik rapport: Lys og gitterligige Forfatter: Bastia Emil Jørgese.z Øvelse blev udført osdag de 25. jauar 202 samme med Lise Kjærgaard Paulse 2 - Bastia Emil Jørgese Fysik rapport (4 elevtimer), februar
Læs mereVejledende besvarelser til opgaver i kapitel 15
Vejledede besvarelser til opgaver i apitel 5 Opgave a) De teststatistier, ma aveder til at teste om to middelværdier er es, består af et estimat på forselle mellem middelværdiere,, divideret med et udtry
Læs mereSpørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.
STATISTIK Skriftlig evaluerig, 3. semester, madag de 30. auar 006 kl. 9.00-3.00. Alle hælpemidler er tilladt. Opgaveløsige forsyes med av og CPR-r. OPGAVE Ved e produktio af viduer er der mulighed for,
Læs merePsyken på overarbejde hva ka du gøre?
Psyke på overarbejde hva ka du gøre? Idhold Hvorår kommer ma uder psykisk pres? 3 Hvad ka øge det psykiske pres på dit arbejde? 4 Typiske reaktioer 6 Hvorda forløber e krise? 7 Hvad ka du selv gøre? 9
Læs mereBegreber og definitioner
Begreber og defiitioer Daske husstades forbrug på de medierelaterede udgiftsposter stiger og udgør i 2012*) 11,3 % af husstadees samlede forbrug mod 5,5 % i 1994. For husstade med de laveste idkomster
Læs mereUndersøgelse af numeriske modeller
Udersøgelse af umeriske modeller Formål E del af målsætige med dette delprojekt er at give kedskab til de begræsiger, fejl og usikkerheder, som optræder ved modellerig. I de forbidelse er følgede udersøgelse
Læs mereNoter om kombinatorik, Kirsten Rosenkilde, februar 2008 1. Kombinatorik
Noter om ombiatori, Kirste Roseilde, februar 008 Kombiatori Disse oter er e itrodutio til ombiatori og starter helt fra bude, så e del af det idledede er siert edt for dig allerede, me der ommer også hurtigt
Læs mereSTATISTISKE GRUNDBEGREBER
MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER 18 15 1 9 6 3 0 Histogram for ph 6,9 7,1 7,3 7,5 7,7 7,9 ph 13 udgave 013 FORORD Der er i dee bog søgt at give letlæst og askuelig fremstillig af de statistiske
Læs mereGENEREL INTRODUKTION.
Study Guide til Matematik C. OVERSIGT. Dee study guide ideholder følgede afsit - Geerel itroduktio. - Emeliste. - Eksame. - Bilag. Udervisigsmiisteriets bekedtgørelse for matematik C. GENEREL INTRODUKTION.
Læs mereSTATISTISKE GRUNDBEGREBER
MOGENS ODDERSHEDE LARSEN STATISTISKE GRUNDBEGREBER med avedelse af TI 89 og Excel 8 5 9 6 3 0 Histogram for ph 6,9 7, 7,3 7,5 7,7 7,9 ph. udgave 0 FORORD Der er i dee bog søgt at give letlæst og askuelig
Læs mereProjekt 3.2 Anlægsøkonomien i Storebæltsforbindelsen. Indhold. Hvad er matematik? 1 ISBN
Projekt 3.2 Alægsøkoomie i Storebæltsforbidelse Dette projekt hadler, hvorda økoomie var skruet samme, da ma byggede storebæltsforbidelse. Store alægsprojekter er æste altid helt eller delvist låefiasieret.
Læs mereBjørn Grøn. Analysens grundlag
Bjør Grø Aalyses grudlag Aalyses grudlag Side af 4 Idholdsfortegelse Kotiuerte og differetiable fuktioer 3 Differetial- og itegralregiges udviklig 5 3 Hovedsætiger om differetiable fuktioer 8 Opgaver til
Læs mereProjekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning
Hvad er matematik? Projekter: Kaitel 9 Projekt 9 Regeregler for stokastiske variable middelværdi, varias og sredig Projekt 9 Regeregler for stokastiske variable middelværdi, varias og sredig Sætig : Regeregler
Læs mereModul 14: Goodness-of-fit test og krydstabelanalyse
Forskigsehede for Statistik ST01: Elemetær Statistik Bet Jørgese Modul 14: Goodess-of-fit test og krydstabelaalyse 14.1 Idledig....................................... 1 14.2 χ 2 -test i e r c krydstabel.............................
Læs mereMorten Frydenberg version dato:
Morte Frdeberg versio dato: 4--4 Itroduktio til kurset Statistik Forelæsig Morte Frdeberg, Sektio for Biostatistik af Biostatistik dele af. semester kurset. Statistiske modeller Biomialfordelige Normalfordelige
Læs mereIntroduktion til uligheder
Itroduktio til uligheder Dette er e itroduktio til ogle basale uligheder om det aritmetiske geemsit, det geometriske geemsit, det harmoiske geemsit og det kvadratiske geemsit. Først skal vi ved fælles
Læs mereClaus Munk. kap. 1-3
Claus Muk kap. 1-3 1 Dages forelæsig Grudlæggede itroduktio til obligatioer Betaligsrækker og låeformer Det daske obligatiosmarked Pris og kurs Effektive reter 2 1 Obligatioer Grudlæggede Itro Debitor
Læs mereDagens forelæsning. Claus Munk. kap. 1-3. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro
Dages forelæsig Grudlæggede itroduktio til obligatioer Claus Muk kap. - 3 Betaligsrækker og låeformer Det daske obligatiosmarked Effektive reter 2 Obligatioer Grudlæggede Itro Obligatioer Grudlæggede Itro
Læs mereIntroduktion til uligheder
Itroduktio til uligheder, marts 0, Kirste Rosekilde Itroduktio til uligheder Dette er e itroduktio til ogle basale uligheder om det aritmetiske geemsit, det geometriske geemsit, det harmoiske geemsit og
Læs mereinfo FRA SÆBY ANTENNEFORENING Lynhurtigt bredbånd til lavpris på vej til hele Sæby! Priser kan ses på bagsiden.
ifo FRA SÆBY ANTENNEFORENING Lyhurtigt bredbåd til lavpris på vej til hele Sæby! Priser ka ses på bagside. Velkomme til SAFet - avet på vores eget lokale Bredbåd! Sæby Ateeforeig har med virkig fra 15.
Læs mereFUNKTIONER del 1 Funktionsbegrebet Lineære funktioner Eksponentialfunktioner Logaritmefunktioner Rentesregning Indekstal
FUNKTIONER del Fuktiosbegrebet Lieære fuktioer Ekspoetialfuktioer Logaritmefuktioer Retesregig Idekstal -klassere Gammel Hellerup Gymasium November 08 ; Michael Szymaski ; mz@ghg.dk Idholdsfortegelse FUNKTIONSBEGREBET...
Læs mereProjekt 9.10 St. Petersborg paradokset
Hvad er matematik? ISBN 978877066879 Projekt 9.0 St. Petersborg paradokset. De store tals lov & viderchacer I grudboges kapitel 9 omtales de store tals lov, som ka formuleres således: Hvis e spiller i
Læs mereSTATISTIK x-klasserne Gammel Hellerup Gymnasium
STATISTIK x-klassere Gammel Hellerup Gymasium Jui 209 ; Michael Szymaski ; mz@ghg.dk Idholdsfortegelse INDLEDNING...3 DESKRIPTIV STATISTIK...4 Skemaer...5 Diagrammer...8 Statistiske deskriptorer... 0 Typetal
Læs mereSandsynlighedsregning i biologi
Om begrebet sadsylighed Sadsylighedsregig i biologi Hvis vi kaster e almidelig, symmetrisk terig, er det klart for de fleste af os, hvad vi meer, år vi siger, at sadsylighede for at få e femmer er 1/6.
Læs mereIMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen
TEKST NR 435 2004 Basisstatistik 2. udgave Jørge Larse August 2006 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING
Læs mereNoter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik
Noter om ombiatori, Kirste Roseilde, februar 008 Kombiatori Disse oter er e itrodutio til ombiatori og starter helt fra bude, så e del af det idledede er siert edt for dig allerede, me der ommer også hurtigt
Læs mereProgram. Middelværdi af Y = t(x ) Transformationssætningen
Program Statistik og Sadsylighedsregig 2 Trasformatio af kotiuerte fordeliger på R, flerdimesioale kotiuerte fordeliger, mere om ormalfordelige Helle Sørese Uge 7, osdag I formiddag: Opfølgig på trasformatiossætige
Læs mere- et værktøj til fejlrettende QR-koder. Projekt 0.3 Galois-legemerne. Indhold. Hvad er matematik? A, i-bog
Projekt 0.3 Galois-legemere GF é ëp û - et værktøj til fejlrettede QR-koder Idhold De karakteristiske egeskaber ved de tre mest almidelige talsystemer, og... De kommutative, associative og distributive
Læs mereAsymptotisk estimationsteori
Kapitel 5 Asymptotisk estimatiosteori De fleste eksperimeter har e idbygget størrelse, som regel kaldet eller N. Dette repræseterer typisk atallet af foretage måliger, atallet af udersøgte idivider, atallet
Læs mereNoter om polynomier, Kirsten Rosenkilde, Marts Polynomier
Noter om polyomier, Kirste Rosekilde, Marts 2006 1 Polyomier Disse oter giver e kort itroduktio til polyomier, og de fleste sætiger æves ude bevis. Udervejs er der forholdsvis emme opgaver, mes der til
Læs mereTests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:
Statistik for biologer 005-6, modul 7: Tests for forskel i cetral tedes for data på ordial- og itervalskala M7, slide M7, slide Typer af statistiske test: Parametrisk statistik: - Tester for forskel i
Læs mereFormelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6
Dee udgave er til geemkig på ettet. Boge ka købes for kr. 5 hos EH-Mat. E y og udvidet udgave med title»symbol- og formelskrivig«er udkommet september 00. Se mere om de her. Idholdsfortegelse Formelskrivig
Læs mereEstimation og test i normalfordelingen
af Birger Stjerholm Made Samfudlitteratur 07 Etimatio og tet i ormalfordelige Dee tekt ideholder et overblik over ogle grudlæggede pricipper for etimatio og tet i ormalfordelige i hyppigt forekommede ituatioer:
Læs mereDårligt arbejdsmiljø koster dyrt
Dårligt arbejdsmiljø F O A f a g o g a r b e j d e koster dyrt Hvad koster et dårligt arbejdsmiljø, og hvad ka vi gøre for at bedre forholdee for de asatte idefor Kost- og Servicesektore? Læs her om de
Læs mereTIMEGLASSETS FASER: Introen er et foto og nogle spørgsmål til hele kapitlet. Meningen med introen er, at du og
TIMEGLASSETS FASER: INTRO Itroe er et foto og ogle spørgsmål til hele kapitlet. Meige med itroe er, at du og di klasse skal få e ide om, hvad kapitlet hadler om, og hvad I skal lære. Prøv at svare på spørgsmålee
Læs mereUge 37 opgaver. Opgave 1. Svar : Starter med at definere sup (M) og inf (M) :
Uge 37 opgaver Opgave Svar : a) Starter med at defiere sup (M) og if (M) : Kigge u på side 3 i kompedie og aveder aksiom (.3) Kotiuitetsaksiomet A = x i x 2 < 2 Note til mig selv : Har søgt på ordet (iequalities)
Læs mereog Fermats lille Projekt 0.4 Modulo-regning, restklassegrupperne sætning ..., 44, 20,4,28,52,... Hvad er matematik? 3 ISBN
Projekt 0.4 Modulo-regig, restklassegruppere sætig ( p 0, ) og Fermats lille Vi aveder moduloregig og restklasser mage gage om dage, emlig år vi taler om tid, om hvad klokke er, om hvor lag tid der er
Læs mereIntroduktion til optimering og operationsanalyse. Asymmetric Traveling Salesman Problem
Itroduktio til optimerig og operatiosaalyse Asymmetric Travelig Salesma Problem David Pisiger, Efterår 2003 Dette er de ade obligatoriske projektopgave på kurset Itroduktio til optimerig og operatiosaalyse.
Læs mereØkonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1
Økoometri 1 Iferes i de lieære regressiosmodel 9. september 006 Økoometri 1: F7 1 Dages program Opsamlig af hemmeopgave om Mote Carlo eksperimeter Mere om hypotesetest: Ekelt lieær restriktio på koefficieter
Læs mere