Nanostatistik: Opgaver Jens Ledet Jensen, 19/01/05 Opgaver 1 Opgaver fra Indblik i Statistik 5 Eksamensopgaver fra tidligere år 11 i
ii NANOSTATISTIK: OPGAVER
Opgaver Opgave 1 God opgaveskik: Når I regner en statistikopgave bør I starte med at angive den model I vil bruge til at beskrive data med, og dermed den model I vil bruge til at besvare spørgsmålene med. Som et eksempel kan vi bruge opgave 7.3 hvor vi vil regne under modellen: X 1,..., X 20 er uafhængige og X i N(µ, σ 2 ). Antal betydende cifre: Når I skal angive et spredningsskøn s bør I have mindst 2 betydende cifre. Dette medfører at I bør have mindst 4 betydende cifre i variansskønnet s 2 (2 gange antallet af betydende cifre i s). Når I skal beregne s 2 er det nemmeste hvis I undgår afrundinger indtil I kommer frem til facit. Hvis I laver afrundinger (pas på fordi der indgår en differens) skal I altså sørge for at facit bliver rigtig på de 4 første betydende cifre. (I kan checke om I får det samme s 2 hvis I medtager et ciffer mere.) Når I har fundet spredningsskønnet s, lad os sige at s = x.y 10 k, skal I angive gennemsnittet x med k + 1 betydende cifre (forklaring følger når vi kommer til konfidensintervaller). Eksempel: hvis s = 0.13 skal I angive x med 2 decimaler: x = 6.57. Eksempel: hvis s = 120 skal I angive x med -1 decimal : x = 8340. Opgave 2 Et experiment består i at tage alle navnene på de kvindelige studerende på Aarhus Universitet og skrive disse på hver sin lap papir. Disse kommes i en stor hat, denne rystes og vi trækker en tilfældig lap op. a) Beskriv udfaldsrummet Ω. b) Beskriv sandsynlighedsmålet P. c) Hvad er sandsynligheden for at trække en person med efternavnet Jensen? Opgave 3 Et experiment består i at kaste en terning én gang. a) Beskriv udfaldsrummet Ω. b) Beskriv sandsynlighedsmålet P. c) Angiv elementerne i hændelsen et lige antal øjne mindre end 6. 1
2 NANOSTATISTIK: OPGAVER Opgave 4 I øvelsestimen skal I alle kaste en mønt 10 gange (dette kan I godt gøre samtidigt) og registrere hvor mange gange I får krone ud af de 10 kast. a) Lav på tavlen en akse med tallene 0, 1,..., 10, og afsæt jeres observationer som kryds over det relevante tal. Instruktoren noterer samtidig jeres resultater ned for at jeg kan få dem. b) Diskuter med hinanden om I alle er lige gode til at kaste en mønt. c) Find gennemsnittet af jeres observationer. Har I fået en værdi tæt på 5? Opgave 5 Et experiment består i at kaste en terning 3 gange. a) Forklar at udfaldsrummet har 216 elementer. b) Angiv sandsynligheden for at få en 6-er i alle 3 kast. c) Hvor mange udfald er der, hvor der ingen 6-er er i de 3 kast? d) Angiv sandsynligheden for ingen 6-er at få i de 3 kast. e) Angiv sandsynligheden for at få mindst én 6-er i de 3 kast. Opgave 6 Et experiment består i at kaste en terning 2 gange. a) Find sandsynligheden for at summen af de to par øjne er et lige tal. Opgave 7 Antag at P(A) = 2 5, P(B) = 2 5, og at P(A B) = 1 2. a) Hvad er P(A B)? Opgave 8 Lad Ω være området {(x, y) 0 x 1, 0 y 1}, også kaldet enhedskvadratet. Lad sandsynlighedsmålet P være givet ved at P(C) er arealet af området C Ω. Lad A være hændelse A = {(x, y) Ω x y} og lad B være hændelse B = {(x, y) Ω y 1 2 }. a) Udregn P(A B). b) Udregn P(A B). Opgave 9 En kasse indeholder 10 kugler med numrene 1, 2,..., 10. Et experiment består i først at trække én kugle, og dernæst trække én kugle mere fra de 9 tilbageblevne.
NANOSTATISTIK: OPGAVER 3 a) Angiv udfaldsrummet Ω. b) Angiv sandsynligheden for at tallene på de to udtrukne kugler afviger med 2 eller mere. (Svar: 2 8+8 7 10 9.) Opgave 10 Lad a og b være konstanter. Vis at Cov(aX, by ) = ab Cov(X, Y ). Opgave 11 Lad udfaldsrummet Ω = [0, 1], og lad den kontinuerte stokastiske variabel X have tæthed f X (x) = a + 2(1 a)x for 0 x 1, hvor a er en konstant med 0 < a < 2. Find E(X) og V (X). Opgave 12 R: Prøv at følge vejledningen nedenfor: Tænd computeren Start R (klikke på ikon) Start en editor (notepad eller lignende) Skriv R-ordrer i editor Kopier R-ordrer fra editor (marker, ctrl-c) Indsæt R-ordrer i R-vindue (ctrl-v) Afslut R-sessionen Prøv følgende sekvens af rordrer efter at I har startet R: indhold=c(24.82,25.23,24.89,25.12,25.11,24.96,25.15,25.38, 25.03,25.09,25.19,25.10,24.98,24.87,25.03,25.03,25.04,24.94) n=length(indhold) sum(indhold) sum(indhold)/n mean(indhold) va=(sum(indholdˆ2)-sum(indhold)ˆ2/n)/(n-1) var(indhold)-va c(mean(indhold),var(indhold),sqrt(var(indhold))) qqnorm(indhold) qnorm((c(1:n)-0.5)/n) Den sidste ordre gav jer de værdier I skal bruge hvis I vil lave et qqplot af data i opgave 9.2 i hånden. Opgave 13 Vi kaster en nål 16 gange og registrerer antallet X af gange nålen skærer en linie. Sandsynligheden p for at skære en linie er ukendt. Situationen er altså at X binomial(16, p). a) Hvis p = 1 2 hvad er da variansen σ2 på skønnet ˆp af p? b) Antag at vi har observeret X = 12. Hvad er ˆp?
4 NANOSTATISTIK: OPGAVER c) Udtryk forskellen ˆp 1 (ˆp fra spørgsmål b) som et antal gange standardafvigelsen σ fra spørgsmål 2 a. Opgave 14 Ved første øvelsesgang kastede 12 af jer en mønt 10 gange. Antallet af krone for de 12 personer var: 3,4,4,4,5,5,5,6,6,6,6,8. (OBS: se efter om der er en opdatering af denne opgave på ugesedlen.) a) Udregn for hver af de 12 personer skønnet ˆp for sandsynligheden for at få krone. b) Lav et pindediagram for antallet af krone baseret på de 12 observationer. c) Indsæt i pindediagrammet sandsynlighederne fra en binomialfordeling med antalsparameter 10 og sandsynlighedsparameter 1 2. Denne opgave kan med fordel laves i R: kast=c(3,4,4,4,5,5,5,6,6,6,6,8) x=c(0:10) taet=dbinom(x,10,0.5) phat=kast/10 phat antal=c(0,0,0,1,3,3,4,0,1,0,0) plot(x,antal/12,type= h ) points(x+0.1,taet,type= h,col=2) Opgave 15 Lad X og Y være uafhængige med X binomial(n, p) og Y binomial(n, p 2 ). Find maksimum likelihood estimatet for p. (I skulle gerne komme frem til en andengradsligning.) Opgave 16 En laborant er blevet bedt om at bestemme koncentrationen i 30 prøver. Imidlertid er der kun 15 forskellige prøver idet laboranten har fået den samme prøve 2 gange (i tilfældig rækkefølge). De 15 værdier nedenfor er differens mellem de to målinger der hører til samme prøve. 0.10,-0.32,-0.05,-0.22,0.22,0.23,-0.05,0.72-0.15,-0.35, -0.25,0.20,0.35,0.04,-0.23 a) Opstil en statistisk model til at beskrive de 15 differenser. b) Lav et skøn over middelværdien µ i fordelingen af differensen. c) Lav et skøn over variansen σ 2 i fordelingen af differensen. d) Lav et test for om middelværdien er nul.
Opgaver fra Indblik i Statistik Opgave 2.2 Opgave 2.3 Spørgsmål a) omformuleres til: Hvad er udfaldsrummet og sandsynlighedsmålet? Opgave 3.2 Opgave 3.3 Opgave 3.4 Opgave 3.5 Opgave 3.6 Opgave 3.7 Opgave 3.8 I spørgsmål c) skal I beregne P(X = 1 Y = 1); til dette skal I bruge formlen P(Y = j) = i P(Y = j, X = i) = i P(Y = j X = i)p(x = i). Opgave 3.9 Opgave 4.2 5
6 NANOSTATISTIK: OPGAVER Opgave 4.3 Opgave 4.4 Opgave 4.5 Opgave 4.6 Da jeg ikke har indført medianen skal spørgsmål a) omformuleres til: find 0.5- fraktilen for henholdsvis X og Y. Opgave 4.7 Da jeg ikke har indført medianen skal spørgsmål a) omformuleres til: find 0.5- fraktilen for Y. Opgave 4.8 Opgave 4.9 Erstat spørgsmål a) til h) med: a) Find f X og f Y og indse at X og Y ikke er uafhængige; b) Find E(X), E(Y ), V (X), V (Y ), E(XY ), og Cov(X, Y ); c) Lad Z = 2X + 3Y. Find E(Z), V (Z). Opgave 4.10 Opgave 5.2 Udelad spørgsmål f). Opgave 5.3 Udelad spørgsmål e). Opgave 5.4 Udelad spørgsmål c).
NANOSTATISTIK: OPGAVER 7 Opgave 5.5 Omformuler spørgsmål a) og b) til: Argumenter for at P(Y = 3) = 5 4 8 P(Y = 0) = 3 2. Find dernæst P(Y = 2) og P(Y = 1). 8 1 7 6 3 7 6 og at Opgave 5.6 Lidt svær. Erstat spørgsmål a), b), og c) med: Argumenter for at P(X = 0) = 48 47 46 45 44 4 48 47 46 45 og at P(X = 0) = 5. 52 51 50 49 48 52 51 50 49 48 Opgave 5.7 Omformuler spørgsmål a) og b) til: Forklar at det er rimeligt at beskrive antallet af taxaer i et tidsrum af længde T minutter som en poisonfordelt variabel med middelværdi T/10. Spørgsmål e) udelades. Opgave 5.8 Omformuler spørgsmål a) og c) til: Forklar at det er rimeligt at beskrive X som en poisonfordelt variabel med middelværdi 90/60. Opgave 5.9 Opgave 5.10 Udelad spørgsmål h). Opgave 5.11 Opgave 5.12 Opgave 7.2 Lad i hele opgaven p = 0.3. Erstat spørgsmål a) til d) med følgende spørgsmål: a) Udregn P(X = k) for k = 0, 1, 2, 3, 4, 5, hvor X er antallet af de 5 udvalgte der er under 18 år. b) Udregn middelværdi og varians af stikprøvegennemsnittet X/5. Opgave 7.3 I skal sige at 20 børn er tilfældigt udvalgt istedet for 200. Hvis X 1,...,X 20 er de 20 højder vil vi bruge en model der siger at X 1,..., X 20 er uafhængige og X i N(µ, σ 2 ). Spørgsmål a) skal I springe over. I spørgsmål d) kan I slette ordet approksimative.
8 NANOSTATISTIK: OPGAVER Spørgsmål g) kan være lidt svært at forstå. Det kan formuleres som: find n så at P( X 140 < 1) = 0.9, hvor X = 1 n ni=1 X i, hvor vi altså har n målinger istedet for 20. Opgave 8.2 Opgave 8.3 Opgave 9.2 Erstat alle spørgsmålene med: a) Lav et qqplot af data. b) Beregn stikprøvegennemsnittet. c) Beregn x 2 i, x i, og dernæst s 2. d) Find en værdi x så at 9 observationer er mindre end x og 9 observationer er større end x, og sammenlign denne værdi med stikprøvegennemsnittet. e) Hvis den sande middelværdi er µ = 25 og den sande varians er σ 2 = 0.01, hvad er da sandsynligheden for at få en værdi af X der afviger mere end 0.03 fra 25 (brug tabel 1 i bogen). Hvad er sandsynligheden for at få en værdi af s 2 større end 0.0177647 (brug tabel 4 i bogen). Opgave 9.3 Opgave 10.2 Opgave 10.3 Opgave 10.4 Opgave 10.5 Opgave 11.2
NANOSTATISTIK: OPGAVER 9 Opgave 11.3 Opgave 11.4 Opgave 11.5 Opgave 11.6 Opgave 12.2 Opgave 12.3 Opgave 12.4 Opgave 12.5 Opgave 13.2 Opgave 13.3 Opgave 13.4 Opgave 13.5 Opgave 13.6 Opgave 13.7
10 NANOSTATISTIK: OPGAVER Opgave 13.8 Opgave 14.2 Opgave 14.3 Opgave 14.4 Opgave 14.5 Opgave 14.6
Eksamensopgaver fra tidligere år Naturvidenskabelig bacheloruddannelse. Forår 2004. Opgave 1 Lad X og Y være to uafhængige stokastiske variable. Middelværdi og varians er givet ved E(X) = 1, V (X) = 0.2, E(Y ) = 2, V (Y ) = 0.3. Lad endvidere den stokastiske variable Z være på formen Z = 2 X Y. a) Beregn middelværdi og varians af Z. b) Vis, at E(X 2 ) = 1.2 og beregn dernæst E(X Z). Opgave 2 For at undersøge effekten af et sovemiddel har man for 10 personer registreret forskellen mellem sovetiden ved brug af sovemidlet og sovetiden uden brug af sovemidlet (vi kalder dette for tilvæksten i sovetid). De 10 værdier målt i timer er 1.9 0.8 1.1 0.1 0.1 4.4 5.5 1.6 4.6 3.4 Summen af disse 10 tal er 23.3 og summen af tallene kvadreret er 90.37. a) Undersøg om disse data kan betragtes som stammende fra en normalfordeling. b) Lav et skøn over middelværdien af tilvæksten i sovetid. Lav også et skøn over variansen på tilvæksten i sovetid. c) Lav et 95% konfidensinterval for middelværdien af tilvæksten i sovetid. d) Har sovemidlet en virkning? 11
12 NANOSTATISTIK: OPGAVER Opgave 3 Et stereogram består af en masse prikker, hvor man ikke umiddelbart kan se noget. Hvis man kigger tilstrækkeligt længe, vil man dog tilsidst kunne se det billede, der er lagt ned i stereogrammet. For at undersøge effekten af forhåndsinformation ved opdagelsen af en figur i et stereogram udførte man et eksperiment med to grupper af personer. I gruppe 1 fik man ingen forhåndsinformation, hvorimod i gruppe 2 blev personerne vist en almindelig tegning af den figur man skulle opdage. For hver person registrerede man logaritmen til den tid der gik inden personen opdagede figuren. For hver gruppe kan man antage at logaritmen til tidsforbruget er normalfordelt. I tabellen nedenfor er antallet af personer n, gennemsnittet x, og variansskønnet s 2 for hver gruppe angivet. Gennemsnittet og variansskønnet er for logaritmen til den tid der bruges til opgaven. n x s 2 Gruppe 1 43 1.820 0.6621 Gruppe 2 35 1.389 0.6688 a) Vis, at det kan antages at variansen, af logaritmen til den tid der bruges, er den samme i de to grupper. b) Lav et test for om middelværdien af logaritmen til den tid der bruges til opgaven er den samme i de to grupper.
NANOSTATISTIK: OPGAVER 13 Naturvidenskabelig bacheloruddannelse. August 2004. Opgave 1 Lad X og Y være to uafhængige stokastiske variable. Middelværdi og varians er givet ved E(X) = 1, V (X) = 1, E(Y ) = 0, V (Y ) = 5. Lad endvidere de stokastiske variable U og V være givet ved U = X 2Y og V = 3X + Y. a) Beregn middelværdi og varians af U. Vis endvidere at E(X 2 ) = 2. b) Beregn E(U V ). Opgave 2 Peter og Paul hævder begge at være bedre til at spille ludo end modparten. For at undersøge dette spiller de 100 spil mod hinanden. Af disse 100 spil vinder Peter 41 spil og Paul vinder 59 spil. a) Baseret på resultatet af de 100 spil, er det da rimeligt at sige, at Peter og Paul er lige gode til at spille ludo? b) Lav et 95% konfidensinterval for sandsynligheden p for at Peter vinder, når Peter og Paul spiller ludo. Opgave 3 For at undersøge højden på 10-årige piger blev 100 piger tilfældigt udvalgt. Højden (i centimeter) på de 100 piger blev målt og betegnes i det følgende x 1, x 2,...,x 100. Summen af x i -erne og summen af de kvadrerede værdier er 100 i=1 x i = 13937.1 og 100 i=1 x 2 i = 1947160.9. a) I figur 1 er et qqplot af data. Den mindste værdi af x i -erne er 123.7. Angiv koordinaterne for punktet længst til venstre i figur 1. b) Find et skøn over middelværdien af højden af en 10-års pige, og find et skøn over variansen på højden af en 10-års pige. c) Lav et 95% konfidensinterval for middelværdien af højden på en 10-års pige. d) Hvis det antages at højden på en tilvældig udvalgt 10-års pige er normalfordelt med middelværdi 139.4 og varians 47.8, hvad er da sandsynligheden for at en tilfældig udvalgt 10-års pige har en højde der er mindre end 130 centimeter?
14 NANOSTATISTIK: OPGAVER qq plot 2 1 0 1 2 125 130 135 140 145 150 155 observationer Figure 1: QQplot for de 100 pigehøjder.