Vejledende opgavebesvarelser



Relaterede dokumenter
hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Motivation. En tegning

9. Binomialfordelingen

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Generelle lineære modeller

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Elementær Matematik. Polynomier

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Løsninger til kapitel 7

Vejledende besvarelser til opgaver i kapitel 15

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Den flerdimensionale normalfordeling

Diskrete og kontinuerte stokastiske variable

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Projekt 9.10 St. Petersborg paradokset

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

StudyGuide til Matematik B.

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

STATISTIKNOTER Simple normalfordelingsmodeller

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Konfidens intervaller

Projekt 1.3 Brydningsloven

Stikprøvefordelinger og konfidensintervaller

antal gange krone sker i første n kast = n

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

STATISTISKE GRUNDBEGREBER

STATISTISKE GRUNDBEGREBER

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Asymptotisk optimalitet af MLE

Program. Middelværdi af Y = t(x ) Transformationssætningen

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Maja Tarp AARHUS UNIVERSITET

Sammenligning af to grupper

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

DATV: Introduktion til optimering og operationsanalyse, Bin Packing Problemet

Estimation ved momentmetoden. Estimation af middelværdiparameter

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

GENEREL INTRODUKTION.

Teoretisk Statistik, 9. februar Beskrivende statistik

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

x-klasserne Gammel Hellerup Gymnasium

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Lys og gitterligningen

Modul 14: Goodness-of-fit test og krydstabelanalyse

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

3y MA, Steen Toft Jørgensen side 1/5 Helsingør Gymnasium. Definitioner, formler, sætninger og ideen i beviserne så det er muligt at huske beviserne.

Sandsynlighedsregning i biologi

Analyse 1, Prøve maj 2009

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier

Sandsynlighedsteori 1.2 og 2 Uge 5.

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Men tilbage til regression og Chi-i-anden. test. Begge begreber refererer til normalfordelingen med middelværdi μ og spredning σ.

Noter om Kombinatorik 2, Kirsten Rosenkilde, februar

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Estimation og test i normalfordelingen

og Fermats lille sætning

Uge 37 opgaver. Opgave 1. Svar : Starter med at definere sup (M) og inf (M) :

STATISTIK x-klasserne Gammel Hellerup Gymnasium

Termodynamik. Indhold. Termodynamik. Første og anden hovedsætning 1/18

Viden Om Vind oftere, stop i tide

Renteformlen. Erik Vestergaard

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

og Fermats lille Projekt 0.4 Modulo-regning, restklassegrupperne sætning ..., 44, 20,4,28,52,... Hvad er matematik? 3 ISBN

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

Forslag til besvarelser af opgaver m.m. i ε-bogen, Matematik for lærerstuderende

MOGENS ODDERSHEDE LARSEN. Fourieranalyse

Projekt 3.2 Anlægsøkonomien i Storebæltsforbindelsen. Indhold. Hvad er matematik? 1 ISBN

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

Kvantitative metoder 2

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Rettevejledning til HJEMMEOPGAVE 1 Makro 1, 2. årsprøve, foråret 2007 Peter Birch Sørensen

Bjørn Grøn. Analysens grundlag

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Leica Lino. Præcise, selvnivellerende punkt- og linje-lasere

A14 4 Optiske egenskaber

Projekt 2.3 Det gyldne snit og Fibonaccitallene

6 Populære fordelinger

DATV: Introduktion til optimering og operationsanalyse, Følsomhed af Knapsack Problemet

- et værktøj til fejlrettende QR-koder. Projekt 0.3 Galois-legemerne. Indhold. Hvad er matematik? A, i-bog

Morten Frydenberg version dato:

Transkript:

Vejledede opgavebesvarelser 1. Atal hæder er lig med K(52,5), altså 2598960. Ved brug af multiplikatiospricippet ka atal hæder med 3 ruder og 2 spar udreges som K(13, 3) K(13, 2), hvilket giver 22308. Atal hæder, hvor alle kort har samme farve, er ifølge additiospricippet lig med K(13,5) 4, som giver 5148. De 5 kort skal emlig ete være ruder, spar, klør eller hjerter. 2. Atal mulige kombiatioer er 3 6, altså 729, idet hver tast ka stå i 3 positioer. Ma ka evetuelt se bort fra de mulighed, hvor ige af tastere skal id eller ud. I praksis ka ma på et ark papir opskrive samtlige muligheder for ku 3 taster. De ka skrives uder hiade, da der ikke er mere ed 27. Ma ka så systematisk gå disse 27 muligheder igeem svarede til heholdsvis de første 3 taster og de sidste 3 taster. 3. Ehver rute har e lægde på 12, delt op i stykker af lægde 1, som går ete he eller op. Da ma 4 gage skal gå op, er atallet af ruter lig med K(12,4), altså 495. 4. Atal mulige koder udreges ved brug af multiplikatiospricippet: Der er 4 muligheder for hvilke pid, der er rigtig; lad os sige, at det er de røde. Der er 3 muligheder for hvilke pid, der har rigtig farve, me står galt; vi siger, at det er de gule. Der er 2 muligheder for, hvor de gule skulle have stået, emlig på positio 3 eller 4; vi vælger positio 3. Vi magler så at fide de mulige farver på positio 2 og 4. På positio 2 er der 2 muligheder, da det ikke ka være rød, gul, grø eller blå. På positio 4 er der så ku 1 mulighed tilbage. Ialt er der 4 3 2 2 1 = 48 muligheder. 5. Når er lig 3, er der 6 kugler, hvoraf 3 er hvide. Sadsylighede p(3) for, at der udtrækkes 2 hvide kugler, er ifølge formel (11) side 23 lig med K(3, 2)/K(6, 2), som bliver 0.2. På tilsvarede måde får ma p() = K(,2) K(2,2) = ( 1) 2 = 1 2(2 1) 4 2 2 Ved at forkorte med og lade gå mod uedelig, ses at brøkke går mod 0.25. Det bemærkes at dee sadsylighed er de samme som sadsylighede for at trække 2 hvide kugler, år der trækkes 2 kugler med tilbagelægig fra e kasse med lige mage sorte og hvide kugler. 6. Alle sadsylighedere udreges ved hjælp af formel (11) side 23. Sadsylighede for, at de 5 kugler alle er røde, er lig med K(10,5) divideret med K(25,5), og ma får 0.00474. Når ma skal have etop 1 blå, skal de 4 øvrige være røde, og ifølge multiplikatiospricippet er atal gustige udfald derfor lig med K(15, 1) K(10, 4). Divideres med atal mulige udfald, altså K(25,5), får ma 0.0593. Sadsylighede p for, at der trækkes både røde og blå, ka udreges ved at fide sadsylighede 1 p for de modsatte hædelse, at der ku trækkes røde eller ku blå. Ved brug af additiospricippet får ma: hvilket giver p = 0.939. 1 p = K(10,5) K(25,5) + K(15,5) K(25,5) = 0.061 1 2

7. Der skal højst 5 ekstra spil til at få e afgørelse. Hvis A emlig ikke har vudet midst 2 gage efter disse spil, vil B have vudet midst 4. Der er 2 5 mulige udfald i de 5 spil, idet hvert spil giver e sejr til A eller B. Af de 32 udfald er 6 gustige for B, idet der er 6 udfald med midst 4 sejre til B. De 6 udfald består af det, hvor B får 5 sejre, og de 5, hvor A får etop 1 sejr. Pulje skal altså deles i forholdet 6 til 26. 8. Atallet af ruder er biomialfordelt med = 20 og p = 0.25. Sadsylighede for højst 7 ruder ka derfor udreges som biomcdf(20,0.25,7), som er lig med 0.898. Sadsylighede for midst 5 ruder er lig med 1- biomcdf(20,0.25,4), som er 0.585. 9. Atallet af løg, der spirer, er biomialfordelt med = 7 og p = 0.9. Sadsylighede for, at alle spirer, ka derfor udreges som biompdf(7,0.9,7), som er lig med 0.478. Sadsylighede for, at etop 5 spirer, ka udreges som biompdf(7,0.9,5), som er lig med 0.124. 10. Når udtrækige foregår med tilbagelægig, er atallet af ruder biomialfordelt med = 5 og p = 0.25. Sadsylighede for etop 2 ruder ka derfor udreges som biompdf(5,0.25,2), som er lig med 0.264. Når udtrækige foregår ude tilbagelægig, fides sadsylighede ved at berege atal gustige divideret med atal mulige. De gustige består af 2 ruder og 3 kort, der ikke er ruder, så atal gustige er K(13,2) K(39,3). Divideres med atal mulige udfald, altså K(52,5), får ma 0.0274. 11. Atallet af rigtige er biomialfordelt med = 10 og p = 0.5. Det gælder om at fide det midste r, så 1-biomcdf(10,0.5,r-1) er midre eller lig 0.05, det vil sige, så biomcdf(10,0.5,r) er større eller lig 0.95. Ved at prøve sig frem får ma, at r skal være 9. På tilsvarede måde fider ma, at r skal være 59, hvis der laves 100 smagsprøver. Når atallet af smagsprøver er stort, vil sadsylighede for at får etop r rigtige blive lille, selvom om r ligger tæt på det atal rigtige, ma skal forvete, år der gættes, altså tæt på halvdele af smagsprøvere. 12. Sadsylighedsfordelige bliver x -1 1 4 p(x) 23 36 hvor x agiver gevistes størrelse. Ud af de 36 mulige udfald er der emlig 3, der giver e sum på over 10, og 10, der giver e sum på 5 eller deruder. Middelværdie udreges efter formel (14) side 35: 10 36 3 36 µ = 1 23 36 + 1 10 36 + 4 3 36 = 1 36 Bode vider altså i geemsit 1 kr. i løbet af 36 spil. 13. Atallet af kroe er biomialfordelt med et ukedt og p = 0.5. Sadsylighede for midst 1 kroe er 1 mius sadsylighede for 0 kroe. Idsættes i formel (13) side 27 med x = 0 får ma: 1 0.5 0.995 Dee ulighed ka løses ete ved at prøve sig frem eller ved brug af logaritmer. Ma får at skal være midst 8. 3 4

14. Atallet af plat er biomialfordelt med = 20 og p = 0.5. Da biomcdf(20,0.5,5)=0.021, biomcdf(20,0.5,6) er større ed 0.025 og sadsylighedsfordelige er symmetrisk om 10, går ormalområdet fra 6 til 14. 15. X bliver 10, år ma 9 gage ikke får e sekser og derefter e sekser. Sadsylighede for ikke at få e sekser er 5/6 og kastee er uafhægige, så På tilsvarede måde får ma P(X = 10) = ( 1 6 )1 ( 5 6 )9 = 0.0323 P(X = r) = ( 1 6 )1 ( 5 6 )r 1 Summe af sadsylighedere bliver 1, som de jo skal og middelværdie bliver 6, som ma også vil forvete. 16. Middelværdie bliver 176.3 og spredige 6.37, år de udreges ved hjælp af itervalmidtpuktere 158, 163, 168,..., 193 og de tilhørede hyppigheder. Geemsitshøjde er altså vokset fra 1950 til 1996. 17. Hvis de opåede poits var ormalfordelte med middelværdi 514 og spredig 87, skulle adele af elever, der opåede 366 eller deruder kue udreges på lommeregere som ormalcdf(0,366,514,87). Dee sadsylighed bliver 0.044, altså ret tæt på de observerede 5 %. Tilsvarede med de adre kumulerede frekveser. 18. Ved differetiatio af de sammesatte fuktio f (x) får ma Produkregle giver så f (x) = x σ 2 f (x) f (x) = 1 σ 2 f (x) + x x ( σ 2 σ 2 f (x) = 1 + x2 ) f (x) σ 2 σ 2 Ligige f (x) = 0 ka så løses. 19. Sadsylighede for, at et dige med højde 1.4 overskylles, ka udreges på lommeregere som ormalcdf(1.4, 1000, 0.93, 0.2) = 0.00939 For at fide de højde x, som diget skal have, hvis sadsylighede for oversvømmelse skal være 0.02, ka ma lægge ormalcdf(x,1000,0.93,0.2) id på lommeregere som Y 1, og tallet 0.02 som Y 2. Grafere ka så teges på lommeregere og ved hjælp af Calc, Itersect ka x bestemmes. Ma får x = 1.34 20. Geemsit og spredig ka for eksempel bereges ved at lægge de to observatiossæt id i lister på lommeregere og bruge 1-Var Stats. For matematik får ma et geemsit på 8.2 og e spredig på 1.8; for dask får ma et geemsit på 8.0 og e spredig på 1.0. I begge tilfælde er der 23 af observatioere, det vil sige 95.8 %, der afviger midre ed 2 gage spredige fra middelværdie. 5 6

21. Ved brug af 1-Var Stats på lommeregere får ma middelværdie 50 og spredige 5. Sadsylighede for, at atal plat afviger midre ed 2 gage spredige fra middelværdie, ka udreges som biomcdf(100, 0.5, 59) mius biomcdf(100, 0.5, 40), og ma får 0.943. 22. Observatioere skrives som e liste y = (y 1,...,y ). At ædre skalae betyder, at observatiossættet ædres lieært til ay + b, hvor a og b er positive. Formlere (30) og (31) side 74 viser at σ ay+b µ ay+b = aσ y aµ y = σ y µ y altså at variatioskoefficiete er uædret. 23. Resultatere afhæger af de tilfældige tal, me spredige på geemsit af 10 kast skulle gere være cirka 1/ 10 af spredige på et ekelt kast. 24. Histogrammere laves ved hjælp af Statplot, og et Widow, hvor x går fra 0 til 1 med x scl = 0.1. Fordeligere går fra at være at være meget skæve til klokkeformede, år går fra 1 til 20. 25. Ifølge formel (41) side 95 vil kofidesitervallet have edepuktere 1.5 1.5 ± 2 100 det vil sige gå fra 1.2 til 1.8. Da itervallet udelukkede består af positive tal, tyder tallee på at august er varmere ed jui. 26. Ved brug af formel (32) side 77 får ma ligige Ligige har løsige = 1314. 87 = 2.4 27. Det forvetede rigtige atal svar vil være x + (100 x) 13 idet x spørgsmål er rigtige, fordi eleve keder svaret, og ud af reste, hvor der gættes, må ma forvete at e trediedel er rigtige. Sættes udtrykket lig med 57, får ma e ligig, hvis løsig er 35.5. 28. Ifølge formel (49) side 94 har 95 %-kofidesitervallet e forvetet lægde på 0.5 0.5 2 2 år atal kast er stort, idet frekvese af plat må forvetes at ligge tæt på 0.5, hvis møte er symmetrisk. Sættes dette udtryk lig med 0.0001, får ma e ligig, hvis løsig er 400 millioer. 29. Ma ka beytte metode side 108-109. Geemsittet på forskellee er 0.57 og spredige er 0.926. Spredige på geemsittet er 0.926/ 10, som bliver 0.293. Teststørrelse T bliver 0.57/0.293, som er lig med 1.95. Dette resultat er ikke sigifikat på 5 %-iveau, me ligger lige på græse. 7 8

30. De 16 observatioer ragordes som på side 111; de to observatioer på 38 får begge rag 14.5. Summe W af ragee af de 8 august-observatioer er 53.5. Dette er ikke sigifikat, da acceptområdet ifølge tabelle side 113 går fra 50 til 86, år både 1 og 2 er 8. 31. Netafstemiger er stort set aldrig repræsetative, da de, der stemmer, ikke er udvalgt tilfældigt. Hvis afstemige drejer sig om, hvorvidt ma er for eller imod et eller adet, vil det oftest være såda, at de ee holdig er overrepræseteret ved afstemige, fordi persoer med de pågældede holdig er mere egagerede i spørgsmålet og derfor mere tilbøjelige til at deltage i afstemige. 32. Ma får y = 0.189x 0.388. Isoleres x, får ma x = 5.29y + 2.05. Ligige side 122 foretrækkes, hvis absorberet lys skal forudsige fedtprocet, da dee regressiosliie havde absorberet lys som de uafhægige variabel. 33. Ma får e P-værdi på 0.094. Nedbørsmægde i august er altså heller ikke ved dette test sigifikat midre ed i jui. 34. Ma må ok iddrage de studeredes ever som e baggrudsvariabel. Det kue tækes, at de, der have valgt A-iveau i matematik i gymasiet, i forveje havde bedre ever ed dem, der valgte B-iveau. At de så klarer sig bedre på politstudiets første år, kue skyldes de bedre ever og ikke så meget det, de havde lært i gymasiet. 35. Fuktioe f har forskrifte f (a) = (1 a 2) 2 + (4 a 4) 2 + (5 a 6) 2 + (6 a 12) 2 Efter brug af kvadratsætige ka forskrifte skrives (2 2 + 4 2 + 6 2 + 12 2 )a 2 2(2 1 + 4 4 + 6 5 + 12 6)a + (1 2 + 4 2 + 5 2 + 6 2 ) Grafe for f er e parabel og toppuktets førstekoordiat bliver 2 1 + 4 4 + 6 5 + 12 6 2 2 + 4 2 + 6 2 + 12 2 = 0.6 I Excel får ma da også regressiosliie y = 0.6x, år ma beder om at få e tedesliie, der skærer adeakse i 0. På samme måde som ovefor får ma geerelt at a = x iy i x 2 i Hvis x-værdiere ligger i liste L 1 og y-koordiatere i liste L 2 på lommeregere, ka a bereges som sum(l 1 L 1 )/(sum(l 2 1 ). 36. Med-med regressiosliie på ti84 bliver y = 4.63x + 2.58; dette er tæt på geemsittet af liie fra side 122 og liie fra opgave 32; ligigere var y = 4.06x + 3.2 og y = 5.29x + 2.05 år x er absorberet lys og y fedtprocet. Ma ka fide e beskrivelse af metode ved at søge i google på: mediamedia lie regressio idiaapolis auto race. 9 10

37. Ma ka for eksempel bruge Excel eller ti84. Regressiosliie bliver y = 0.055x + 479 Hældige er ikke sigifikat forskellig fra 0, da P-værdie bliver 0.178. 38. E ekspoetiel regressio giver y = 68.1 0.482 x hvor x er sigtdybde og y er chlorophyl-kocetratio. E lieær regressio af log(y) på x giver log(y) = 0.317x + 1.833 og de to ligiger er esbetydede. Ved regressioe af log(y) på x får ma stadardfejle s res = 0.184. Ifølge side 123 må log(y) forvetes at ligge i itervallet fra 0.882 2 0.184 til 0.882+2 0.184 med 95 % sadsylighed ved e sigtdybde på 3 meter. Med 95 % sadsylighed gælder altså 0.514 log(y) 1.25 Heraf får ma at y må ligge mellem 3.27 og 17.8 med 95 % sadsylighed. 39. E sædvalig lieær regressio giver e P-værdi på 0.0379, år der testes om hældige er 0. 40. Vi lader x være liste med x-værdier, altså x = (x 1,x 2,...,x ). Liste med forvetede y-værdier bliver så ŷ = âx + ˆb. Ifølge (31) side 74 er σŷ = σâx+ˆb = σ âx = â σ x Ved divisio med σ y får ma (118) af (117). Hvis tællere i (119) kaldes T, ka (119) skrives r = og formel (59) side 121 ka skrives T σx σy = â = T σ 2 x T σ x σ y Ved at idsætte sidstævte udtryk i (118) får ma r = T σ 2 x og ved at forkorte med σ x får ma (119) i forme ovefor. Med tallee fra opgave 39 får ma r = 0.468; dee korrelatio ka for eksempel bereges ved at lægge x-værdiere i e liste L 1, y-værdiere i e liste L 2 og udrege (119) på lommeregere ved hjælp af listere. De forvetede y-værdier ka udreges som 0.2015 L 2 +3.984 og lægges i e liste L 3. Residualere udreges som L 3 L 2 og lægges i e liste L 4. Ved brug af 1-Var Stats på hver af listere L 2, L 3 og L 4 får ma heholdsvis σ 2 y = 6.19, σŷ2 = 1.35 og σ 2 res = 4.84. Hvis ma ser på de første 10 pukter fra opgave 39 får ma r = 0.472, mes de sidste 10 pukter giver r = 0.343. σ x σ y 11 12

41. E SiReg på ti84 giver y = 8.2 si(0.512x 0.1) + 7.72 Ma atager at ω = 2π/12 og laver e multipel regressio af temperatur på cos(ωt) og si(ωt). Koefficietere til de to variable størrelser vil svare til Asi(ϕ) og Acos(ϕ). 42. Hvis ma vælger at bruge Excel åbes huspriser.xls. Der laves regressioer som beskrevet i file om brug af Excel på boges hjemmeside. Regressio af pris på heholdsvis kvm og grud giver: pris = 8.11 kvm+ 586 og pris = 0.4 grud+ 630 Kostate c ka bestemmes ved at lave e y søjle i regearket således: i F2 skrives: =B2-8.11 D2-0.4 E2; derefter trækkes edad til F56. I for eksempel G2 skrives: =middel(f2:f56); ma får 30.2, som svarer til c. E multipel regressio giver e model af forme: 43. Ved QuadReg på ti84 får ma prisidex = 123 + 7.61 kvm+ 0.36 grud y = 0.53x 2 + 1.29x + 13.3 Det samme får ma i Excel, år ma laver e multipel regressio med y afhægig variabel, og x og x 2 som forklarede variable. I regearket ka x- værdiere lægges i koloe 1, x 2 -værdiere i koloe 2, og y-værdiere i koloe 3. 44. De forvetede atal bliver 6.7, 24.2, 38.3, 24.2 og 6.7. For eksempel udreges 24.2 som 100 ormalcdf(12.5, 13.7, 14.3, 1.2). Idsættes i formel (68) side 146 får ma T = 2.79. Udregige ka for eksempel foretages ved at lægge de observerede atal i e liste L 1, de forvetede atal i e liste L 2 og skrive sum((l 1 L 2 ) 2 /L 2 ). Hypotese accepteres, da P-værdie bliver 0.59. De ka udreges på lommeregere ved hjælp af de kumulerede chi-i-adefordelig med 4 frihedsgrader. 45. Ved et eksakt biomialtest udreges 2biomcdf(306,0.5,133), som giver e P-værdi på 0.0256. Der scores altså sigifikat flere mål i ade halvleg. Ved et chi-i-ade-test bliver de forvetede atal mål i første og ade halvleg lig med 306/2, altså 153, da hypotese er, at der scores lige mage mål i de to halvlege. Idsættes i formel (68) side 146 får ma T = 5.23. Hypotese forkastes også ved dette test, da P-værdie bliver 0.0222. De ka udreges på lommeregere ved hjælp af de kumulerede chi-i-ade-fordelig med 1 frihedsgrad. 46. Formel (72) side 155 brugt på tabelle, som de står i opgave, giver e OR på 1.176; byttes om på de to søjler får ma OR = 1.176 1 = 0.85, som agivet side 157. Ved idsættelse i formle side 156 for spredige på l(ôr) får ma 0.0681. Et 95 %-kofidesiterval for l(or) har derfor edepuktere l(0.85) ± 2 0.0681, det vil sige at det går fra -0.2987 til -0.0263. Et 95 %-kofidesiterval for OR går så fra e 0.2987 til e 0.0263, det vil sige fra 0.741 til 0.974. Et χ 2 -test ka laves ved hjælp af Excel-skabeloe på boges hjemmeside. Ma får e P-værdi på 0.0173; der er altså sigifikat forskel på sadsylighede for at få e dreg i de to grupper. 13 14

47. Resultatere vil aturligvis afhæge lidt af, hvad der simuleres, me tæthede for chi-i-ade-fordelige med 3 frihedsgrader skulle gere give e god beskrivelse af histogrammet. 48. De fire lister ka laves således: radbi(30,0.3,100) L 1 : 30-L 1 L 3 : radbi(40,0.3,100) L 2 : 40-L 2 L 4 Ved (L 1 L 4 )/(L 2 L 3 ) L 5 får ma e liste med tilhørede OR-værdier. Edelig giver l(l 5 ) L 6 e liste med l(or)-værdier. Ma må forvete, at middelværdi og spredig af l(or)-værdiere ligger omkrig 0 og 0.53. 49. Hvis ma på figure i opgavetekste erstatter X med x og sætter w = π/2 v er w = ta 1 (x). Sadsylighede for, at X er midre eller lig x, er de samme som lægde af itervallet fra π/2 til w divideret med lægde af itervallet fra π/2 til π/2; det vil sige w ( π/2) divideret med π. Ma får altså F(x) = P(X x) = w π + 1 2 = 1 π ta 1 (x) + 1 2 Differetiatio giver tæthedsfuktioe p(x) = F (x) = 1 1 π x 2 + 1 Normalfordelige er mere kocetreret om 0 ed Cauchy-fordelige. 50. Middelværdie µ ka ved brug af formel (76) side 159 og tæthede side (161) udreges som µ = xp(x)dx = xλe λ x dx 0 Itegralet udreges som græseværdie af itegralet fra 0 til t, år t går mod uedelig. Ved delvis itegratio får ma: t 0 t xλe λ x dx = [ xe λ x ] t 0 + e λ x dx = te λt λ 1 e λt + λ 1 0 som går mod λ 1, år t går mod uedelig. At te λt går mod 0, år t går mod uedelig, kræver e speciel begrudelse; ma ka bruge sætiger om græseværdi af et produkt af e potesfuktio og e ekspoetialfuktio. Middelværdie er altså λ 1. I eksemplet med vetetid til et scoret mål får ma λ 1 = 30. 51. De kumulerede fordeligsfuktioe for X kaldes F, så F (x) = f (x). Om de kumulerede fordeligsfuktioe G for Y gælder: ( G(y) = P(Y y) = P(aX + b y) = P X y b ) ( y b ) = F a a Differetiatio af de sammesatte fuktio giver som i (121). g(y) = G (y) = 1 a F ( y b ) a = 1 ( y b ) a f a 15 16

52. Der gælder at F(u) = P(X u) = P(Z 2 u) = P( u Z u) Ma ka så omskrive videre F(u) = P(Z u) P(Z u) = 2Φ( u) 1 Ved differetiatio af sammesat fuktio får ma 53. Vi har at f (u) = F (u) = 2 1 2 u Φ ( u) = 1 ϕ( u) = 1 e u/2 u 2πu G(u) = P(Y u) = P(l(Y ) l(u) = F(l(u)) Ved differetiatio af dee sammesatte fuktio får ma g(u) = G (u) = 1 u F 1 (l(u)) = 2 π σu e (l(u) µ)2 2 σ 2 På grudlag af data i file idkomst.txt ka idkomstere grupperes i itervaller med lægde 25 tusid. Vi iteresserer os ku for idkomster mellem 25 tusid og 750 tusid, og det første iterval går således fra 25 til 50, og det sidste fra 725 til 750. Itervalhyppighedere for de itervaller i idkomst.txt, der er lægere ed 25 tusid, deles i lige store dele ved opdelige i itervaller af lægde 25 tusid. Det sidste iterval har således hyppighede 80/10, altså 8. Itervalmidtpuktere lægges i e liste L 1 og hyppighedere i e liste L 2. Lav e y liste ved l(l 1 ) L 3. Fid skø over µ og σ ved hjælp af 1-Var Stats L 3,L 2. Ma får µ 5.1 og σ 0.57. Histogrammet ka teges ved hjælp af Statplot ud fra listere L 1 og L 2, og de logaritmiske ormalfordelig ka lægges ovei ved at skrive Y 1 = 1/x ormalpdf(l x,5.1,0.57) 100000 54. Hvis vi kalder ivnorm for Φ 1 og sætter Z = Φ 1 (rad) gælder at P(Z z) = P(Φ 1 (rad) z) = P(rad Φ(z)) = Φ(z) 55. Ved brug af formlere (90) side 169 og (94) side 170 får ma: V(Z) = t 2 V(X) + (1 t) 2 V (Y) = t 2 σ 2 x + (1 t)2 σ 2 y Grafe for dee fuktio af t, som ka kaldes f (t), er e parabel med et miimumspukt. Miimumspuktet ka bestemmes ved at bruge formle for e parabels toppukt eller ved differetiatio, som edefor: Ligige f (t) = 0 er opfyldt, år f (t) = 2tσ 2 x 2(1 t)σ 2 y t 1 t = σ 2 y σ 2 x De to skø skal altså vægtes omvedt proportioalt med variasere. 56. Størrelsere y i opfattes som uafhægige stokastiske variable, mes x i ere er kostater. I de lieære regressiosmodel har y i middelværdi ax i + b og spredig σ 2. Regereglere (87) side 168 og (88) side 169 viser at middelværdie af tællere i (122) er lig med idet (ax i + b)(x i x) = a (x i x) = 0 x i (x i x) 17 18

Af samme grud ka ævere i (122) skrives (x i x) 2 = x i (x i x) x(x i x) = x i (x i x) Ved at dividere middelværdie af tælle med ævere får ma, at E(â) = a. Ved brug af regereglere (90) og (94) får ma V(â) = σ 2 (x i x) 2 ( (x i x) 2) 2 = σ 2 (x i x) 2 I udskrifte side 128 er stadardfejle 1.744, hvilket er et skø over σ ovefor. Tallee x i er tallee fra 1 til 45 og ævere i formle for V(â) bliver 7590. Udreges kvadratrode af V(â) ved hjælp af formle får ma 0.02002, som svarer til stadardfejle på koefficiete til År i udskrifte. 58. Summe af sadsylighedere ka udreges således i j P 1 (u i )P 2 (v j ) = i P 1 (u i ) j P 2 (v j ) = P 1 (u i ) 1 = 1 i Ma ka evetuelt skrive udregigere op ude brug af summatiosteg i tilfældet = 2 og m = 3. 59. De 500 geemsit vil typisk ikke have midre spredig ed 500 tilfældige tal fra e Cauchy-fordelig. De 9 måliger har geemsittet 7.13 og mediae 4.8. Når grafe for likelihoodfuktioe laves på lommeregere ka ma vælge et vidue, hvor x går fra 2 til 8, og y går fra 0 til 30000. De har et maksimum i x = 4.64. 57. Projektioere y v og y e af y på heholdsvis v og e opfylder v (y y v ) = 0 og e (y y e ) = 0 Vektore y v + y e ligger i plae α. Desude gælder v (y y v y e ) = v (y y v ) v y e = 0 De to vektorer i sidste led er ortogoale, da projektioe af y på e er parallel med e, som står vikelret på v. På tilsvarede måde får ma e (y y v y e ) = 0 Vektore y v + y e er altså lig med projektioe af y på α. 19 20