Mat2SS Vejledende besvarelse uge 11



Relaterede dokumenter
Susanne Ditlevsen Institut for Matematiske Fag susanne

Statistik og Sandsynlighedsregning 1. IH kapitel 6

Susanne Ditlevsen Institut for Matematiske Fag susanne

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Statistik i basketball

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Elementær sandsynlighedsregning

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Projektopgave til Mat2SS. Espen Højsgaard (CPR xxxx) Rune Højsgaard (CPR xxxx)

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Kønsproportion og familiemønstre.

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Statistik og Sandsynlighedsregning 2

Løsning eksamen d. 15. december 2008

Estimation og konfidensintervaller

Stastistik og Databehandling på en TI-83

Betingede sandsynligheder Aase D. Madsen

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Repetition Stokastisk variabel

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

Tidlige eksempler. Susanne Ditlevsen Institut for Matematiske Fag susanne

Sandsynlighedsregning Oversigt over begreber og fordelinger

Statistik og Sandsynlighedsregning 2

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Nanostatistik: Opgavebesvarelser

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Sandsynlighedsregning Stokastisk variabel

Tema. Dagens tema: Indfør centrale statistiske begreber.

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Simpel Lineær Regression

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kvantitative Metoder 1 - Forår Dagens program

Elementær sandsynlighedsregning

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Nanostatistik: Opgaver

Kvantitative Metoder 1 - Efterår Dagens program

Oversigt over nyttige fordelinger

INSTITUT FOR MATEMATISKE FAG c

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Opgaver i sandsynlighedsregning

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Løsning til eksaminen d. 29. maj 2009

Note om Monte Carlo metoden

02402 Løsning til testquiz02402f (Test VI)

Kvantitative Metoder 1 - Efterår Dagens program

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : (navn) (underskrift) (bord nr)

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Produkt og marked - matematiske og statistiske metoder

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

Vejledende løsninger til opgaver i kapitel 6

Statistik for ankomstprocesser

Definition. Definitioner

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

Kvantitative Metoder 1 - Forår 2007

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

StatDataN: Middelværdi og varians

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

En Introduktion til SAS. Kapitel 5.

Kvantitative Metoder 1 - Forår Dagens program

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 17. december 2015 Kursus nr : (navn) (underskrift) (bord nr)

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Løsning til eksamen 16/

Statistiske modeller

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

Nanostatistik: Konfidensinterval

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2010 Kursus nr : (navn) (underskrift) (bord nr)

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Module 4: Ensidig variansanalyse

Normalfordelingen og Stikprøvefordelinger

Eksamen i Statistik for biokemikere. Blok

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr)

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

STATISTIKNOTER Simple binomialfordelingsmodeller

Note til styrkefunktionen

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Kvantitative Metoder 1 - Forår 2007

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Løsning til eksaminen d. 14. december 2009

Transkript:

MatSS Vejledende besvarelse uge Eksamen V99/00 opg. a Kønsfordelingen 996 den samme for de tre skoler Mænd Kvinder I alt København 5 = n x 56 = x 8 = n Odense 9 = n x 06 = x 5 = n Århus 0 = n x 40 = x 70 = n I alt 84 = n x 40 = x 486 = n Lad X, X og X betegne antallet af kvinder optaget på sociale højskoler i hhv. København, Odense og Århus i 996. Da er 56 en observation af X, 06 en observation af X og 40 en observation af X. Vi antager at de tre stokastiske variable X, X og X er indbyrdes uafhængige. Vi antager også at hver X i binn i, p i. Vi har altså en statistisk model som i IH5.. med k = : {0,,..., 8} {0,,..., 5} {0,,..., 70}, P p,p,p p,p,p [0,] 8 5 70 P p X = x = p x x p 8 x p x x p 5 x p x x p 70 x Vi ønsker at undersøge om forholdet mellem mænd og kvinder er det samme i de tre grupper. Vi vil altså teste for om andelen af kvinder kan antages at være den samme i de tre grupper: H : p = p = p = p [0, ] IH5.. giver kvotientteststørrelsen, og vi beregner 40 8 84 8 40 5 log Qx = 56 log + 5 log + 06 log 56 486 5 486 06 486 84 5 40 70 84 70 + 9 log + 40 log + 0 log 9 486 40 486 0 486 =,0 min{n x, x } min{n, n, n } 84 5 = =, 5 n 486 kan vi ifgl. bem. 5.. approksimere testsandsynligheden: ɛx F χ,0 = 0,8% Vi godkender altså hypotesen og kan således antage at kønsfordelingen er den samme på de tre skoler. Kvindeandelen på skolerne estimeres til ˆp = 40 486 = 8,7%, og estimatorens fordeling er givet ved 486ˆp bin486, p, jf. IH5... b Kønsfordelingen ændret sig fra 984 til 996 Mænd Kvinder I alt 984 75 = m y 8 = y 0 = m 996 84 = m y 40 = y 486 = m I alt 59 = m y 60 = y 789 = m

Lad nu Y betegne kvindeandelen i 984, og Y kvindeandelen i 996. Det antages at Y bin0, q og at Y og Y er uafhængige. Da Y = X + X + X har vi da X i binn i, p ifgl. den i a godkendte hypotese at Y bin486, q med q = p, jf. MS..6. 8 er således en observation af Y og 40 en observation af Y, og vores statistiske model er således som i IH5.. med k = : {0,,..., 0} {0,,..., 486}, P q,q q,q [0,] 0 486 70 P q Y = y = p y y p 0 y p y y p 486 y p y y p 70 y Vi ønsker at undersøge om forholdet mellem mænd og kvinder er det samme de to år. Vi vil altså teste for om andelen af kvinder kan antages at være den samme i de to grupper: H : q = q = q [0, ] IH5.. giver kvotientteststørrelsen, og vi beregner 60 0 59 0 log Qy = 8 log + 75 log 8 789 75 789 60 486 59 486 + 40 log + 84 log 40 789 84 789 = 6,6 min{m y, y } min{m, m, m } 59 0 = = 6 5 m 789 kan vi ifgl. bem. 5.. approksimere testsandsynligheden: ɛy F χ 6,6 =,% Vi forkaster altså hypotesen. For 984 estimeres kvindeandelen til ˆq = 8 0 = 75,%, og for 996 til ˆq = ˆp = 8,7%. Kvindeandelen er således vokset. Estimatorernes fordelinger er desuden givet ved 0ˆq bin0, q og ˆq bin486, q. Eksamen S00 opg. a Arbejdsstilling ifht. tilbagetrækningsform På en gang Delvis Fleksibel arbejdstid Andet/uoplyst I alt Selvstændige 6 = x 7 = x = x 8 = x 4 74 = n Lønmodtagere 9 = x 5 = x 4 = x = x 4 90 = n I alt 9 = x 69 = x 57 = x 9 = x 4 64 = n Lad X rs betegne antallet af folk med arbejdsstilling r der planlægger tilbagetrækningsform s. r = svarer til selvstændige, r = lønmodtagere. s = svarer til På en gang, s = til Delvis, s = til Fleksibel arbejdstid, og s = 4 til Andet/uoplyst. Sæt X = X, X, X, X 4 og X = X, X, X, X 4. 6, 7,, 8 er da en observation af X, og 9, 5, 4, en observation af X. Det antages at X poly74, p og X poly90, p med p = p, p, p, p 4, p = p, p, p, p 4 4, samt at X og X er uafhængige. Vores statistiske model er da som i IH6.. med k = og m = 4:

D 4 74 D 4 90, P p,p p,p 4 74 4 90 4 P p,p X = x = p xs s x, x, x, x 4 x, x, x, x 4 Da vi skal undersøge om de to grupper har samme ønsker om tilbagetrækningsform, tester vi for H : p = p = p 4 IH6.. giver kvotientteststørrelsen, og vi beregner log Qx = 8, udfra de i skemaet angivne værdier for x rs erne og n og n. s= min{n, n } min{x, x, x, x 4 } 74 9 = n 64 =,86 < 5 så bem. 6.. giver os egentlig ikke lov til at approksimere testsandsynligheden med χ -fordelingen, men siden F χ 4 8, =, 0 6 kan vi stadig være sikre på at testsandsynligheden ɛx er klart mindre end 5% eftersom testsandsynligheden ikke afviger så kraftigt fra χ -fordelingen, så at sige. Så hypotesen forkastes altså. Vi kan antage at de to grupper har forskellige ønsker om tilbagetrækningsform. Fordelingen på de enkelte tilbagetrækningstyper = 5%, %, %, % og for lønmodtagerne til ˆp = 9 90, 5 90, 4 90, 90 = 67%, 8%, %, 4%, og disse estimaters fordelinger er givet ved 74ˆp poly74, p og 90ˆp poly90, p, jf. IH6... estimeres for de selvstændige til ˆp = 6 74, 7 74, 74, 8 74 b Estimat for andelen der ønsker at trække sig tilbage på en gang Der er i alt 6 selvstændige og 46 4 lønmodtagere. Et skøn for hvor mange der ønsker at trække sig tilbage på en gang, må således være 6ˆp + 464ˆp = 6 6 74 = 8548 + 464 9 90 Bemærk: jeg angiver estimatet i hele tal da andet ikke ville give mening. c Undersøgelsens ifht. arbejdsstyrkens fordeling i de to grupper Lønmodtagere Selvstændige I alt Undersøgelsen 90 = m y 74 = y 64 = m Arbejdsstyrken 464 = m y 6 = y 07456 = m I alt 466 = m y 687 = y 0780 = m Lad nu Y betegne antal selvstændige i undersøgelsen, og Y antal selvstændige i arbejdsstyrken. Det antages at Y bin64, q, at Y bin07456, q, og at Y og Y er uafhængige. 74 er således en observation af Y og 6 en observation af Y. Vores statistiske model er således som i IH5.. med k = : {0,,..., 64} {0,,..., 07456}, P q,q q,q [0,] 64 07456 70 P q Y = y = p y p 64 y p y y p 07456 y p y y p 70 y y s= p xs s

Vi ønsker at undersøge om forholdet mellem selvstændige og lønmodtagere er det samme i de to grupper: H : q = q = q [0, ] IH5.. giver kvotientteststørrelsen, og vi beregner 687 64 466 64 log Qy = 74 log + 90 log 74 0780 90 0780 687 07456 466 07456 + 6 log + 464 log 6 0780 464 0780 = 0,0465 min{m y, y } min{m, m, m } 687 64 = = 7 5 m 0780 kan vi ifgl. bem. 5.. approksimere testsandsynligheden: ɛy F χ 0,0465 = 8,9% Så hypotesen godkendes. Det kan antages at undersøgelsens andel af selvstændige svarer til arbejdsstyrkens. Andelen af selvstændige estimeres desuden til ˆq = 687 0780 = 9,9%, og dette estimats fordeling er givet ved 0780ˆq bin0780, q, jf. IH5... Eksamen V0/04 opg. Lad X bin, p hvor p [0, ]. Definer Y = {} X. I.e. en ny stokastisk variabel Y defineres til når X er lig, og 0 ellers. a Sandsynlighedsfunktionen p for Y Y er koncentreret på {0, } så p : {0, } [0, ] med p = P Y = = P X = = p p = p p b EZ = p + p p p 0 = p = p p Definer Z = X + Y. MS.7.7 giver EX + Y = EX + EY. Da X bin, p giver MS s. 9 at EX = p, og EY = 0 p p + p p = p p. Dermed: EZ = p + p p = p p p. c CovX, Y = p p p, samt hvornår X, Y er ukorrelerede eller uafhængige Vi bemærker først at XY = Y. Herefter bruges MS s. 96: CovX, Y = EXY EXEY = EY EXEY = EXEY = pp p 4

Vi bemærker nu at CovX, Y = 0 hviss corrx, Y = 0, jf. MS def..8.6. Så når vi skal finde de p for hvilke X og Y er ukorrelerede, skal vi blot finde rødderne i pp p. Og disse er 0, og. Formuleringen er Er der værdier af p for hvilke X og Y er uafhængige? så det er nok at angive blot een værdi af p for hvilke det gælder. Da X og Y er ukorrelerede hvis de er uafhængige jf. MS s. 00 vil et evt. brugbart p være 0, eller. Selvom det er nok at angive een værdi, går jeg dem alle tre igennem: p = I dette tilfælde er X, Y koncentreret på {0, 0,, 0,,,, }. Da denne mængde ikke er en produktmængde, er X og Y ikke uafhængige, jf. MS s. 84. p = 0 I dette tilfælde er X, Y koncentreret på {0, 0} og P X, Y = 0, 0 = = = P X = 0 P Y = 0 trivielt, så X og Y uafhængige. p = I dette tilfælde er X, Y koncentreret på {, 0} og P X, Y =, 0 = = = P X = P Y = 0 trivielt, så X og Y uafhængige. så X og Y er uafhængige netop når p {0, }. d Variansen af Z MS s. 97 giver en måde at beregne variansen af en sum udfra kovariansen: VarZ = VarX + VarY + CovX, Y = p p + p p p p + p p p da X bin, p og Y bin, p p, og variansen for binomialfordelingen er angivet MS s. 0. e Simultane sandsynlighedsfunktion p for X, Y X, Y er koncentreret på {0, 0,, 0,,,, 0}, så p : {0, 0,, 0,,,, 0} [0, ]. For x, y {0, 0,, 0,,,, 0} har vi p x, y = P X, Y = x, y = P X = x = p x p x x f Sandsynlighedsfunktionen p for Z Z er koncentreret på {0,, } så p : {0,, } [0, ]. Eksamen S0 opg. p 0 = P X = 0 = p p = P X = = p p p = P X = + P X = = p p + p a Matematisk linje: kønsfordeling uafh. af afgangsklassetrin? Piger Drenge I alt 9. klasse 7 = n x = x 48 = n 0. klasse 8 = n x 8 = x 6 = n I alt 5 = n x 9 = x 64 = n 5

Lad nu X betegne antal drenge fra 9. klasse, og X antal drenge fra 0. klasse. Det antages at X bin48, p, at X bin6, p, og at X og X er uafhængige. er således en observation af X og 8 en observation af X. Vores statistiske model er således som i IH5.. med k = : {0,,..., 48} {0,,..., 6}, P p,p p,p [0,] 48 6 70 P p X = x = p x p 48 x p x x p 6 x p x x p 70 x x Vi ønsker at undersøge om forholdet mellem selvstændige og lønmodtagere er det samme i de to grupper: H : p = p = p [0, ] IH5.. giver kvotientteststørrelsen, og vi beregner 9 48 5 48 log Qx = log + 7 log 64 7 64 9 6 5 6 + 8 log + 8 log 8 64 8 64 = 0,89 min{n x, x } min{n, n, n } 9 6 = = 7,5 5 n 64 kan vi ifgl. bem. 5.. approksimere testsandsynligheden: ɛx F χ 0,89 = 66,4% Så hypotesen godkendes. Det kan antages at kønsfordelingen er den samme for de to afgangsklassetrin. Drengeandelen estimeres desuden til ˆp = 9 64 = 45,%, og dette estimats fordeling er givet ved 64ˆp bin64, p, jf. IH5... b Sammenhæng mellem afgangsklassetrin og valg af gymnasial uddannelse? Matematisk Sproglig HHX HTX I alt 9. klasse 48 = x = x = x 0 = x 4 4 = n 0. klasse 6 = x 4 = x = x 5 = x 4 56 = n I alt 64 = x 7 = x 4 = x 5 = x 4 70 = n Lad X rs betegne antallet af elever med fra afgangsklassetrin r der har valgt gymnasial uddannelse s. r = svarer til 9. klasse, r = 0. klasse. s = svarer til matematisk linje, s = til sproglig linje, s = til HHX, og s = 4 til HTX. Sæt X = X, X, X, X 4 og X = X, X, X, X 4. 48,,, 0 er da en observation af X, og 6, 4,, 5 en observation af X. Det antages at X poly4, p og X poly56, p med p = p, p, p, p 4, p = p, p, p, p 4 4, samt at X og X er uafhængige. Vores statistiske model er da som i IH6.. med k = og m = 4: D 4 4 D 4 56, P p,p p,p 4 P p,p X = x = 4 x, x, x, x 4 4 6 s= p xs s 56 x, x, x, x 4 4 s= p xs s

Da vi skal undersøge om de to grupper har samme ønsker om tilbagetrækningsform, tester vi for H : p = p = p 4 IH6.. giver kvotientteststørrelsen, og vi beregner log Qx = 0,5 udfra de i skemaet angivne værdier for x rs erne og n og n. min{n, n } min{x, x, x, x 4 } 56 4 = n 70 =, 5 så ifgl. bem. 6.. kan vi approksimere testsandsynligheden: ɛx F χ 4 0,5 =,4 0 4 Så hypotesen forkastes. Valg af gymnasial uddannelse afhænger af afgangsklassetrin. Fordelingen på de enkelte uddannelser estimeres for 9. klasse til ˆp = 48 4, 4, 4, 0 4 = 4%, 0%, %, 6% og for 0. klasse til ˆp = 6 56, 4 56, 56, 5 56 = 9%, 5%, 8%, 9%, og disse estimaters fordelinger er givet ved 4ˆp poly4, p og 56ˆp poly56, p, jf. IH6... c Pigeandel i Høje Taastrup ifht. på landsplan Lad nu X betegne antallet af piger på der startede på gymnasiale uddannelser i Høje Taastrup 00. Da er 7+6+7+5+8++8+5+ = 0 en observation af X. Det antages at X bin90, p hvor p [0, ] er pigeandelen på de gymnasiale uddannelser i Høje Taastrup. Den statistiske model er således som i IH4..: {0,,..., 90}, Pp p [0,] 90 P p X = x = p x p 90 x x IH4.. giver således et estimat af pigeandelen: ˆp = 0 90 = 57,9%, og dette estimat har fordelingen 90ˆp bin90, p. I eksamenssættet angives pigeandelen på landsplan til xx. IH4.. bruges nu med xx som sætningens p 0, testet udføres og der konkluderes. Sara Arklint.0.05 7