Idag 1. Introduktion til statistik: Eksempel 1.1 og 1.2 fra WMMY samt andre eksempler. 2. Sandsynlighedsregning: udfaldsrum, hændelser, regning med sandsynligheder. 1/17
Eksempel 1.1: kvalitetskontrol En ingeniør udtager 100 komponenter fra en produktionslinie. Ud af disse er 10 defekte. Kvalitetskrav: sandsynlighed for defekt højst 0.05 (5%). Estimeret sandsynlighed: 10/100=0.10. Spørgsmål: er data i modstrid med kvalitetskrav. Sandsynlighedsregning: antag sandsynlighed for defekt komponent er 0.05, sandsynlighed for at observere 10 eller flere ud af 100 = 0.03 2/17
Eksempel 1.2: virkning af nitrogen-behandling på vækst af egetræer Vægt af stammer: Ingen Nitrogen: 0.32, 0.53, 0.28, 0.37, 0.47, 0.43, 0.36, 0.42, 0.38, 0.43 Nitrogen: 0.26, 0.43, 0.47, 0.49, 0.52, 0.75, 0.79, 0.86, 0.62, 0.46 Spørgsmål: har nitrogenbehandling effekt på vækst af træer? 3/17
Deskriptiv statistik Ingen N Med N Frequency 0.0 1.0 2.0 3.0 Frequency 0 1 2 3 4 0.25 0.35 0.45 0.55 nonitro 0.2 0.4 0.6 0.8 nitro x = 0.399 s 2 = 0.005 x = 0.565 s 2 = 0.035 Deskriptive variable (empirisk middelværdi og varians): x = (x 1 + x 2 + + x n )/n = 1 n n i=1 x i s 2 = 1 n 1 n (x i x) 2 i=1 4/17
Ilts afhængighed af lys og temperatur i Lindenborg Å ilt/temp/lys 9.5 10.0 10.5 11.0 ilt temp lys ilt 9.5 10.0 10.5 11.0 0.0 0.1 0.2 0.3 0 20 40 60 80 100 120 tid lys 5/17
10 12 14 16 ilt 9.5 10.0 10.5 11.0 ilt 9.5 10.0 10.5 11.0 lys 0.0 0.1 0.2 0.3 temp 10 12 14 16 temp forskudt med 5 tidsenheder 10 12 14 16 temp forskudt med 5 tidsenheder Iltindholds afhængighed af lys og temperatur? Interaktion mellem lys og temperatur? (multipel regression) 6/17
Farvevariation i pulp til fremstilling af æggebakker Refleksionsmålinger målt 4 gange 4 steder på 5 papstykker: Reflektans 0.4 0.5 0.6 0.7 0.8 1 2 3 4 5 Pap.nr. Variation mellem papstykker, variation indenfor papstykker, målevariation? (variansanalyse) 7/17
En overordnet synsvinkel på statistik Population Stikproeve Defekt/ikke defekt status for alle komponenter Dataindsamling/eksperiment N,N,D,N,...,N Stammevaegte for alle traeer. 0.32.0.53,...,0.46 Deskriptiv statistik Deskriptive variable Populations parametre p=ssh for defekt Forv. stammevaegt med/uden nitrogen Inferentiel/teoretisk/analytisk statistik Obs. sands.: 10% Emp. middelvaerdier 0.399 og 0.565 8/17
Sandsynlighedsregning Udfaldsrum S: mængden af alle udfald et eksperiment kan give. Ex check af komponent: S = {N, D} Ex check af to komponenter: S = {NN, ND, DN, DD} Ex vejning af stamme: S = alle positive reelle tal Ex kast med terning: S = {1, 2, 3, 4, 5, 6} Hændelse: en delmængde af S Ex kast med terning: A = {1, 2}, A = {6} Ex vejning af træ: A =]0.32; 0.40[ (hændelsen at vægt mellem 0.32 og 0.40). 9/17
Komplementære hændelse: A =S fraregnet A. Ex: (kast med terning) A = {1, 2} A = {3, 4, 5, 6} Ex: (vejning af træ) A =]0; 0.32[ A = [0.32; [. Snit af hændelser: A B (både A og B) Ex: (kast med terning) A = {1, 2} B = {2, 4} A B = {2} Forening af hændelser: A B (A eller B) Ex: (vejning af træ) A =]0; 0.32[ B =]0.20; 0.40[ A B =]0, 0.40[ 10/17
Venn diagram S A A og B B 11/17
Sandsynlighed for hændelser (endeligt tilstandsrum) Lad S = {e 1, e 2,...,e m } være et endeligt udfaldsrum. Til hvert e j tilordnes en positive vægt p j 0 således at p 1 + p 2 +... + p m = 1. Sandsynligheden P(A) for en hændelse A: summen af vægtene for elementerne i A. Dvs. P( ) = 0, P(S) = P({e 1, e 2,...,e m }) = p 1 + p 2 +... + p m = 1 og for enhver hændelse A: 0 P(A) 1. Ex (ærlig terning) p 1 = p 2 = = p 6 = 1/6. P({1, 3}) = 2/6. (Vi ser senere på sandsynligheder for uendelige udfaldsrum) 12/17
Fortolkning af sandsynligheder Frekventiel: antag et eksperiment gentages n gange og vi registrerer antal gange m hvor A indtræffer. P(A) m n Subjektiv: sandsynlighed angiver personlig vurdering af sandsynligheden for at en hændelse indtræffer. Ex: P(DK vinder VM i fodbold næste gang) = 0.003 NB: giver ikke mening at give denne sandsynlighed en frekventistisk fortolkning. 13/17
Additive regler for regning med sandsynligheder P(A B) = P(A) + P(B) P(A B) P(A) = 1 P(A ) Ex 2.29 sandsynlighed for at sum af to terningekast er 7 eller 11 er 2/9. Ex sandsynlighed for at sum af to terningekast mindre end 12 = 35/36. Ex sandsynlighed for mindst en sekser i 2 kast =11/36. 14/17
Betinget sandsynlighed Ex A: udfald af terningkast 4 B: udfald=1 eller 6. P(A) = 1/2 og P(B) = 2/6 Antag, at vi ved A indtræffer: dermed reduceret udfaldsrum S red = {4, 5, 6} og betinget sandsynlighed for B givet A er P(B A) = 1/3 = 1/6 P(A B) = 3/6 P(A) Definition (betinget sandsynlighed): P(B A) = P(A B) P(A) 15/17
Betinget sandsynlighed, eksempler Ex køn vs. arbejdsløshed (WMMY s. 59) I arbejde arbejdsløs total Mand 460 40 500 Kvinde 140 260 400 Total 600 300 900 En person udvælges tilfældigt blandt de 900 personer. M: personen er en mand E: personen er i arbejde. Hvad er sandsynligheden for at personen er en mand givet at personen er i arbejde? Ex 2.33 P(D)=ssh for planmæssig afgang=0.83, P(A)=ssh for planmæssig ankomst=0.82, P(A D)=0.78. P(A D) og P(A D )? 16/17
Uafhængighed Evt. forskel mellem P(B) og P(B A) skyldes den information som A indeholder om B. Definition (uafhængighed) A og B er uafhængige hvis P(B A) = P(B) NB: P(B A) = P(B) P(A B) = P(A)P(B) Ex 2.33 D og A afhængige. Ex sandsynlighed for at slå mindst en sekser i 10 uafhængige terningekast=1 (5/6) 10 = 0.84. 17/17