Mat2SS Vejledende besvarelse uge 11

MatSS Vejledende besvarelse uge Eksamen V99/00 opg. a Kønsfordelingen 996 den samme for de tre skoler Mænd Kvinder I alt København 5 = n x 56 = x 8 = n Odense 9 = n x 06 = x 5 = n Århus 0 = n x 40 = x 70 = n I alt 84 = n x 40 = x 486 = n Lad X, X og X betegne antallet af kvinder optaget på sociale højskoler i hhv. København, Odense og Århus i 996. Da er 56 en observation af X, 06 en observation af X og 40 en observation af X. Vi antager at de tre stokastiske variable X, X og X er indbyrdes uafhængige. Vi antager også at hver X i binn i, p i. Vi har altså en statistisk model som i IH5.. med k = : {0,,..., 8} {0,,..., 5} {0,,..., 70}, P p,p,p p,p,p [0,] 8 5 70 P p X = x = p x x p 8 x p x x p 5 x p x x p 70 x Vi ønsker at undersøge om forholdet mellem mænd og kvinder er det samme i de tre grupper. Vi vil altså teste for om andelen af kvinder kan antages at være den samme i de tre grupper: H : p = p = p = p [0, ] IH5.. giver kvotientteststørrelsen, og vi beregner 40 8 84 8 40 5 log Qx = 56 log + 5 log + 06 log 56 486 5 486 06 486 84 5 40 70 84 70 + 9 log + 40 log + 0 log 9 486 40 486 0 486 =,0 min{n x, x } min{n, n, n } 84 5 = =, 5 n 486 kan vi ifgl. bem. 5.. approksimere testsandsynligheden: ɛx F χ,0 = 0,8% Vi godkender altså hypotesen og kan således antage at kønsfordelingen er den samme på de tre skoler. Kvindeandelen på skolerne estimeres til ˆp = 40 486 = 8,7%, og estimatorens fordeling er givet ved 486ˆp bin486, p, jf. IH5... b Kønsfordelingen ændret sig fra 984 til 996 Mænd Kvinder I alt 984 75 = m y 8 = y 0 = m 996 84 = m y 40 = y 486 = m I alt 59 = m y 60 = y 789 = m

Lad nu Y betegne kvindeandelen i 984, og Y kvindeandelen i 996. Det antages at Y bin0, q og at Y og Y er uafhængige. Da Y = X + X + X har vi da X i binn i, p ifgl. den i a godkendte hypotese at Y bin486, q med q = p, jf. MS..6. 8 er således en observation af Y og 40 en observation af Y, og vores statistiske model er således som i IH5.. med k = : {0,,..., 0} {0,,..., 486}, P q,q q,q [0,] 0 486 70 P q Y = y = p y y p 0 y p y y p 486 y p y y p 70 y Vi ønsker at undersøge om forholdet mellem mænd og kvinder er det samme de to år. Vi vil altså teste for om andelen af kvinder kan antages at være den samme i de to grupper: H : q = q = q [0, ] IH5.. giver kvotientteststørrelsen, og vi beregner 60 0 59 0 log Qy = 8 log + 75 log 8 789 75 789 60 486 59 486 + 40 log + 84 log 40 789 84 789 = 6,6 min{m y, y } min{m, m, m } 59 0 = = 6 5 m 789 kan vi ifgl. bem. 5.. approksimere testsandsynligheden: ɛy F χ 6,6 =,% Vi forkaster altså hypotesen. For 984 estimeres kvindeandelen til ˆq = 8 0 = 75,%, og for 996 til ˆq = ˆp = 8,7%. Kvindeandelen er således vokset. Estimatorernes fordelinger er desuden givet ved 0ˆq bin0, q og ˆq bin486, q. Eksamen S00 opg. a Arbejdsstilling ifht. tilbagetrækningsform På en gang Delvis Fleksibel arbejdstid Andet/uoplyst I alt Selvstændige 6 = x 7 = x = x 8 = x 4 74 = n Lønmodtagere 9 = x 5 = x 4 = x = x 4 90 = n I alt 9 = x 69 = x 57 = x 9 = x 4 64 = n Lad X rs betegne antallet af folk med arbejdsstilling r der planlægger tilbagetrækningsform s. r = svarer til selvstændige, r = lønmodtagere. s = svarer til På en gang, s = til Delvis, s = til Fleksibel arbejdstid, og s = 4 til Andet/uoplyst. Sæt X = X, X, X, X 4 og X = X, X, X, X 4. 6, 7,, 8 er da en observation af X, og 9, 5, 4, en observation af X. Det antages at X poly74, p og X poly90, p med p = p, p, p, p 4, p = p, p, p, p 4 4, samt at X og X er uafhængige. Vores statistiske model er da som i IH6.. med k = og m = 4:

D 4 74 D 4 90, P p,p p,p 4 74 4 90 4 P p,p X = x = p xs s x, x, x, x 4 x, x, x, x 4 Da vi skal undersøge om de to grupper har samme ønsker om tilbagetrækningsform, tester vi for H : p = p = p 4 IH6.. giver kvotientteststørrelsen, og vi beregner log Qx = 8, udfra de i skemaet angivne værdier for x rs erne og n og n. s= min{n, n } min{x, x, x, x 4 } 74 9 = n 64 =,86 < 5 så bem. 6.. giver os egentlig ikke lov til at approksimere testsandsynligheden med χ -fordelingen, men siden F χ 4 8, =, 0 6 kan vi stadig være sikre på at testsandsynligheden ɛx er klart mindre end 5% eftersom testsandsynligheden ikke afviger så kraftigt fra χ -fordelingen, så at sige. Så hypotesen forkastes altså. Vi kan antage at de to grupper har forskellige ønsker om tilbagetrækningsform. Fordelingen på de enkelte tilbagetrækningstyper = 5%, %, %, % og for lønmodtagerne til ˆp = 9 90, 5 90, 4 90, 90 = 67%, 8%, %, 4%, og disse estimaters fordelinger er givet ved 74ˆp poly74, p og 90ˆp poly90, p, jf. IH6... estimeres for de selvstændige til ˆp = 6 74, 7 74, 74, 8 74 b Estimat for andelen der ønsker at trække sig tilbage på en gang Der er i alt 6 selvstændige og 46 4 lønmodtagere. Et skøn for hvor mange der ønsker at trække sig tilbage på en gang, må således være 6ˆp + 464ˆp = 6 6 74 = 8548 + 464 9 90 Bemærk: jeg angiver estimatet i hele tal da andet ikke ville give mening. c Undersøgelsens ifht. arbejdsstyrkens fordeling i de to grupper Lønmodtagere Selvstændige I alt Undersøgelsen 90 = m y 74 = y 64 = m Arbejdsstyrken 464 = m y 6 = y 07456 = m I alt 466 = m y 687 = y 0780 = m Lad nu Y betegne antal selvstændige i undersøgelsen, og Y antal selvstændige i arbejdsstyrken. Det antages at Y bin64, q, at Y bin07456, q, og at Y og Y er uafhængige. 74 er således en observation af Y og 6 en observation af Y. Vores statistiske model er således som i IH5.. med k = : {0,,..., 64} {0,,..., 07456}, P q,q q,q [0,] 64 07456 70 P q Y = y = p y p 64 y p y y p 07456 y p y y p 70 y y s= p xs s

Vi ønsker at undersøge om forholdet mellem selvstændige og lønmodtagere er det samme i de to grupper: H : q = q = q [0, ] IH5.. giver kvotientteststørrelsen, og vi beregner 687 64 466 64 log Qy = 74 log + 90 log 74 0780 90 0780 687 07456 466 07456 + 6 log + 464 log 6 0780 464 0780 = 0,0465 min{m y, y } min{m, m, m } 687 64 = = 7 5 m 0780 kan vi ifgl. bem. 5.. approksimere testsandsynligheden: ɛy F χ 0,0465 = 8,9% Så hypotesen godkendes. Det kan antages at undersøgelsens andel af selvstændige svarer til arbejdsstyrkens. Andelen af selvstændige estimeres desuden til ˆq = 687 0780 = 9,9%, og dette estimats fordeling er givet ved 0780ˆq bin0780, q, jf. IH5... Eksamen V0/04 opg. Lad X bin, p hvor p [0, ]. Definer Y = {} X. I.e. en ny stokastisk variabel Y defineres til når X er lig, og 0 ellers. a Sandsynlighedsfunktionen p for Y Y er koncentreret på {0, } så p : {0, } [0, ] med p = P Y = = P X = = p p = p p b EZ = p + p p p 0 = p = p p Definer Z = X + Y. MS.7.7 giver EX + Y = EX + EY. Da X bin, p giver MS s. 9 at EX = p, og EY = 0 p p + p p = p p. Dermed: EZ = p + p p = p p p. c CovX, Y = p p p, samt hvornår X, Y er ukorrelerede eller uafhængige Vi bemærker først at XY = Y. Herefter bruges MS s. 96: CovX, Y = EXY EXEY = EY EXEY = EXEY = pp p 4

Vi bemærker nu at CovX, Y = 0 hviss corrx, Y = 0, jf. MS def..8.6. Så når vi skal finde de p for hvilke X og Y er ukorrelerede, skal vi blot finde rødderne i pp p. Og disse er 0, og. Formuleringen er Er der værdier af p for hvilke X og Y er uafhængige? så det er nok at angive blot een værdi af p for hvilke det gælder. Da X og Y er ukorrelerede hvis de er uafhængige jf. MS s. 00 vil et evt. brugbart p være 0, eller. Selvom det er nok at angive een værdi, går jeg dem alle tre igennem: p = I dette tilfælde er X, Y koncentreret på {0, 0,, 0,,,, }. Da denne mængde ikke er en produktmængde, er X og Y ikke uafhængige, jf. MS s. 84. p = 0 I dette tilfælde er X, Y koncentreret på {0, 0} og P X, Y = 0, 0 = = = P X = 0 P Y = 0 trivielt, så X og Y uafhængige. p = I dette tilfælde er X, Y koncentreret på {, 0} og P X, Y =, 0 = = = P X = P Y = 0 trivielt, så X og Y uafhængige. så X og Y er uafhængige netop når p {0, }. d Variansen af Z MS s. 97 giver en måde at beregne variansen af en sum udfra kovariansen: VarZ = VarX + VarY + CovX, Y = p p + p p p p + p p p da X bin, p og Y bin, p p, og variansen for binomialfordelingen er angivet MS s. 0. e Simultane sandsynlighedsfunktion p for X, Y X, Y er koncentreret på {0, 0,, 0,,,, 0}, så p : {0, 0,, 0,,,, 0} [0, ]. For x, y {0, 0,, 0,,,, 0} har vi p x, y = P X, Y = x, y = P X = x = p x p x x f Sandsynlighedsfunktionen p for Z Z er koncentreret på {0,, } så p : {0,, } [0, ]. Eksamen S0 opg. p 0 = P X = 0 = p p = P X = = p p p = P X = + P X = = p p + p a Matematisk linje: kønsfordeling uafh. af afgangsklassetrin? Piger Drenge I alt 9. klasse 7 = n x = x 48 = n 0. klasse 8 = n x 8 = x 6 = n I alt 5 = n x 9 = x 64 = n 5

Lad nu X betegne antal drenge fra 9. klasse, og X antal drenge fra 0. klasse. Det antages at X bin48, p, at X bin6, p, og at X og X er uafhængige. er således en observation af X og 8 en observation af X. Vores statistiske model er således som i IH5.. med k = : {0,,..., 48} {0,,..., 6}, P p,p p,p [0,] 48 6 70 P p X = x = p x p 48 x p x x p 6 x p x x p 70 x x Vi ønsker at undersøge om forholdet mellem selvstændige og lønmodtagere er det samme i de to grupper: H : p = p = p [0, ] IH5.. giver kvotientteststørrelsen, og vi beregner 9 48 5 48 log Qx = log + 7 log 64 7 64 9 6 5 6 + 8 log + 8 log 8 64 8 64 = 0,89 min{n x, x } min{n, n, n } 9 6 = = 7,5 5 n 64 kan vi ifgl. bem. 5.. approksimere testsandsynligheden: ɛx F χ 0,89 = 66,4% Så hypotesen godkendes. Det kan antages at kønsfordelingen er den samme for de to afgangsklassetrin. Drengeandelen estimeres desuden til ˆp = 9 64 = 45,%, og dette estimats fordeling er givet ved 64ˆp bin64, p, jf. IH5... b Sammenhæng mellem afgangsklassetrin og valg af gymnasial uddannelse? Matematisk Sproglig HHX HTX I alt 9. klasse 48 = x = x = x 0 = x 4 4 = n 0. klasse 6 = x 4 = x = x 5 = x 4 56 = n I alt 64 = x 7 = x 4 = x 5 = x 4 70 = n Lad X rs betegne antallet af elever med fra afgangsklassetrin r der har valgt gymnasial uddannelse s. r = svarer til 9. klasse, r = 0. klasse. s = svarer til matematisk linje, s = til sproglig linje, s = til HHX, og s = 4 til HTX. Sæt X = X, X, X, X 4 og X = X, X, X, X 4. 48,,, 0 er da en observation af X, og 6, 4,, 5 en observation af X. Det antages at X poly4, p og X poly56, p med p = p, p, p, p 4, p = p, p, p, p 4 4, samt at X og X er uafhængige. Vores statistiske model er da som i IH6.. med k = og m = 4: D 4 4 D 4 56, P p,p p,p 4 P p,p X = x = 4 x, x, x, x 4 4 6 s= p xs s 56 x, x, x, x 4 4 s= p xs s

Da vi skal undersøge om de to grupper har samme ønsker om tilbagetrækningsform, tester vi for H : p = p = p 4 IH6.. giver kvotientteststørrelsen, og vi beregner log Qx = 0,5 udfra de i skemaet angivne værdier for x rs erne og n og n. min{n, n } min{x, x, x, x 4 } 56 4 = n 70 =, 5 så ifgl. bem. 6.. kan vi approksimere testsandsynligheden: ɛx F χ 4 0,5 =,4 0 4 Så hypotesen forkastes. Valg af gymnasial uddannelse afhænger af afgangsklassetrin. Fordelingen på de enkelte uddannelser estimeres for 9. klasse til ˆp = 48 4, 4, 4, 0 4 = 4%, 0%, %, 6% og for 0. klasse til ˆp = 6 56, 4 56, 56, 5 56 = 9%, 5%, 8%, 9%, og disse estimaters fordelinger er givet ved 4ˆp poly4, p og 56ˆp poly56, p, jf. IH6... c Pigeandel i Høje Taastrup ifht. på landsplan Lad nu X betegne antallet af piger på der startede på gymnasiale uddannelser i Høje Taastrup 00. Da er 7+6+7+5+8++8+5+ = 0 en observation af X. Det antages at X bin90, p hvor p [0, ] er pigeandelen på de gymnasiale uddannelser i Høje Taastrup. Den statistiske model er således som i IH4..: {0,,..., 90}, Pp p [0,] 90 P p X = x = p x p 90 x x IH4.. giver således et estimat af pigeandelen: ˆp = 0 90 = 57,9%, og dette estimat har fordelingen 90ˆp bin90, p. I eksamenssættet angives pigeandelen på landsplan til xx. IH4.. bruges nu med xx som sætningens p 0, testet udføres og der konkluderes. Sara Arklint.0.05 7