Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: kkb@math.aau.dk Hjemmeside: www.math.aau.dk/ kkb Statistik - lektion 1 p.1/22
Hvorfor statistik? Population Stikprøve At udtale sig om hele populationen på baggrund af en stikprøve. Herunder: Hvilke sammen hænge er der i populationen fx. mellem højde og vægt Hvor sikre er vores konklusioner? Statistik - lektion 1 p.2/22
Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Uoverskueligt! Hvordan opsummerer vi? Statistik - lektion 1 p.3/22
Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Histogram: Antal observationer i givne intervaller. Histogram of x Frequency 0.0 1.5 3.0 15 20 25 30 x Statistik - lektion 1 p.3/22
Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Medianen er det tal, der ligger halvejs inde i (ordnet) data. Ordnet data: 18 19 19 20 20 20 21 21 21 22 22 23 24 24 26 29 Median er i dette tilfælde 21 (mellem 21 og 21) P % fraktilen er et tal som P procent af data er mindre end. Medianen er således 50% fraktilen. Statistik - lektion 1 p.3/22
Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Middelværdi: x = 1 n (x 1 + x 2 +... + x n ) = 1 n n i=1 x i, hvor x i er den i te observation og n er antal observationer. Eksemplet: x = 1 (18 + 19 +... 26 + 29) = 21.8125 16 Statistik - lektion 1 p.3/22
Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Mål for variationen i data: Variansen: s 2 = 1 n 1 n i=1 (x i x) 2 Standardafvigelsen: s = s 2 Eksemplet: s 2 = 1 16 1( (18 21.8125) 2 +(19 21.8125) 2 +...+(29 21.8125) 2) = 8.1625 Short cut: s 2 = n n i=1 x2 i ( n i=1 x i) 2 n(n 1) Statistik - lektion 1 p.3/22
Venn-diagram Udfaldsrum (mængde) S Hændelse (delmængde) A Udfald (element) x Udfaldsrummet er mængden af mulige udfald (resultat) af et eksperiment. En hændelse er en delmængde af udfaldrummet. Eksempel: Eksperiment: vælg en tilfældig studerende på holdet Udfaldsrummet: mængden af alle studerende på holdet Udfald: hver studerende svarer til et udfald Hændelse: den studerende er over 170cm høj Statistik - lektion 1 p.4/22
Sandsynligheder En sandsynlighed er et tal mellem 0 og 1 Sandsynligheden for en hændelse A betegnes P (A) (Probability). For alle hændelser A S gælder 0 P (A) 1 Hvis P (A) = 1 så indtræffef hændelsen A altid! Hvis P (A) = 0 så indtræffef hændelsen A aldrig! Sandsynligheden for at eksperimentet har et udfald i udfaldsrummet S er 1: P (S) = 1 Den tomme hændelse/mængde betegnes. P ( ) = 0 Statistik - lektion 1 p.5/22
Antag at alle udfald er lige sandsynlige: For alle x S, P (x) = 1 antal elementer i S Eksempel (forts.): Antag 34 studerende og antag Peter S, da er sandynligheden for at vi vælger Peter: P (Peter) = 1 34 0.029 Statistik - lektion 1 p.6/22
Sandsynligheden for en hændelse A Antag at alle udfald er lige sandsynlige: For alle A S, P (A) = = antal elementer i A antal elementer i S antal gunstige antal mulige Eksempel (forts.): Antag A = Studerende er højere end 170cm og antag at der er 21 studerende i A: P (A) = 21 34 0.62 Statistik - lektion 1 p.7/22
Mere mængdelære C A B = A A B A B = A C = A Foreningsmængde: A B Fællesmængde: A B P (A B) = P (A) + P (B) P (A B) (foreningen af elementer i A ogb) (alle elementer fælles for A ogb) Hændelserne A og C overlapper ikke, dvs. A C =. P (A C) = P ( ) = 0 P (A C) = P (A) + P (C) P (A C) = P (A) + P (C) Statistik - lektion 1 p.8/22
Mænd Kvinder > 170cm 170cm Eksempel (forts.): To hændelser A = Højde over 170cm B = Mand P (A) = P (B) = P (A B) = P (A B) = Statistik - lektion 1 p.9/22
Mere mængdelære Ā A Ā er A s kompliment. Dvs. Ā indeholder alle elementer fra S som ikke er indeholdt i A. A Ā = S og A Ā = P (A Ā) = P (A) + P (Ā) og P (A Ā) = P (S) = 1 P (A) + P (Ā) = 1 P (Ā) = 1 P (A) Statistik - lektion 1 p.10/22
Mere mængdelære A Ā B B = B B Mængden B kan deles i to delmængder B A og B Ā: B = (B A) (B Ā) og (B A) (B Ā) = P (B) = P ((B A) (B Ā)) = P (B A) + P (B Ā) Statistik - lektion 1 p.11/22
Betinget sandsynlighed Mænd Kvinder > 170cm A = Højde over 170cm B = Mand 170cm Antag at vi ved at den valgte studerende er mand (hændelsen B er indtruffet). Hvad er da sandsynligheden for at den valgte studerende er højere end 170cm (hændelsen A er indtruffet)? Statistik - lektion 1 p.12/22
Betinget sandsynlighed Sandsynligheden for hændelsen A givet at hændelsen B er indtruffet er den betingede sandsynlighed P (A B) = P (A B) P (B) Kan omskrives til P (A B) = P (A B)P (B) Sandsynligheden for B givet A er P (B A) = P (A B) P (A) Kan omskrives til: P (A B) = P (B A)P (A) Kombineret får vi: P (B A)P (A) = P (A B)P (B) Statistik - lektion 1 p.13/22
Opgave To hændelser: A: Har lungesygdom B: Ryger Undersøgelse viser at blandt folk over 60: P (A) = 0.07, P (B A) = 0.90 og P (B Ā) = 0.253 Opgave: Givet en person over 60 er ryger, hvad er sandsynligheden for at han/hun har en lungesygdom? Statistik - lektion 1 p.14/22
Uafhængighed To hændelser A og B er uafhængige hvis P (A B) = P (A) P (B A) = P (B) eller P (A B) = P (A)P (B) Eksempel: A = Har set TV-avisen og B = Har set Nyhederne. Antag at A og B er uafhængige (er det en rimlig antagelse?) og P (A) = 0.3 og P (B) = 0.4. Hvad er sandsynligheden for at have set begge programmer? Hvad er sandsynligheden for at have set mindst et af programmerne? Statistik - lektion 1 p.15/22
Stokastisk variabel S 0 X En stokastisk variabel (SV) X knytter et tal til hvert udfald i udfaldsrummet S. Notation: (store) X er et tilfældigt tal, mens (lille) x er en observation af X (og dermed ikke tilfældig)! Fx: Antal øjne på terning, eksamenskarakter, højden i cm, temperatur i saune, køn, nationalitet. Eksempel: X er højden i cm. P ( Højde over 170 cm ) = P (X > 170) Statistik - lektion 1 p.16/22
Sandsynlighedsfunktion: P er en sandsynlighedsfunktion hvis 0 P (x) 1 for alle x S og allex P (x) = 1 Fordelingsfunktion: F (x) = P (X x) = alle i x P (i) Statistik - lektion 1 p.17/22
Antag at X er antal finner i en tilfældigt udvalgt sauna! Antag desuden at X er beskrevet ved følgende sandsynlighedsfunktion. P (x) 4/16 6/16 4/16 1 F (x) 1/16 1/16 0 1 2 3 4 0 1 2 3 4 P (X = 1) = F (1) = P (X 3) = F (3) = P (X > 3) = P (1 < X 3) = Statistik - lektion 1 p.18/22
Middelværdi Antag X SV med sandsynlighedsfuntion P Middelværdi: µ = E(X) = alle x xp (x) Regneregler: Hvis h(x) er en funktion, så gælder E(h(X)) = alle x h(x)p (x) Hvis a og b er konstanter E(a + bx) = a + be(x) = a + bµ Eksempel: X er SV med sandsynlighedsfunktion P (0) = 1 16, P (1) = 4 16, P (2) = 6 16, P (3) = 4 16 og P (4) = 1 16 E(X) = E(1 + 2X) = Antag h(x) = x 2 E(h(X)) = Statistik - lektion 1 p.19/22
Bemærk forskellen på den teoretiske middelværdi µ = E(X) = alle x xp (x) og den observerede middelværdi x = 1 n (x 1 + x 2 +... + x n ) = 1 n n i=1 x i Eksempel: Antag at X er antallet af finner i en tilfældigt valgt suana og sandsynlighedsfunktionen er passer med virkeligheden! Undersøg antallet af personer i ti (n = 10) saunaer og find middelværdien. Gentag dette 1000 gange! Histogram over de 1000 middelværdier: Histogram of m Frequency 0 100 250 1.0 1.5 2.0 2.5 3.0 Statistik - lektion 1 p.20/22
Varians Antag X SV med sandsynlighedsfuntion P Varians: σ 2 = Var(X) = E(X µ) 2 vskip3mm Formel: Var(X) = alle x (x µ)p (x) Regneregler: Hvis a og b er konstanter Var(a + bx) = b 2 Var(X) Short cut: Var(X) = E(X 2 ) ( E(X) ) 2 Eksempel: X er SV med sandsynlighedsfunktion P (0) = 1 16, P (1) = 4 16, P (2) = 6 16, P (3) = 4 16 og P (4) = 1 16 Var(X) = Var(1 + 2X) = Statistik - lektion 1 p.21/22
Bemærk forskellen på den teoretiske varians σ 2 = Var(X) = E(X µ) 2 og den observerede varians s 2 = 1 n 1 n i=1 (x i x) 2 Eksempel: Undersøg antallet af personer i ti (n = 10) saunaer og find variansen. Gentag dette 1000 gange! Histogram over de 1000 varianser: Histogram of v Frequency 0 100 200 0.0 0.5 1.0 1.5 2.0 2.5 v Statistik - lektion 1 p.22/22