Grundlæggende statistik Lektion 2
Indhold Diskrete fordelinger Binomial fordelingen Poisson fordelingen Hypergeometrisk fordeling
Data typer el. typer af tilfældige variable Diskrete variable > Kategoriseres > Listes > Tælles Eksempler > Farve, by, ok/ikke ok > 1,2,3,4,. fejl p å et em ne Kontinuerte > Måles (kan underinddeles) Eksempler > Tryk, temperatur, dimension, væ gt
Kategoriser følgende Variabel Diskret Kontinuert Længde af en aksel x Vare nummer x Procestid i en hærdeovn x Styrke af en svejsesamling x Postnummer x Antal lakfejl på en plade x Farve af et emne x Kvalitetskontrol, QC x Diameter af et hul x Antal arbejdsulykker pr. måned x
Diskrete fordelinger Sandsynligheden er altid større end nul, og Summen af sandsynligheden af alle udfald er 1 p x 0 p x 1 All x
Middelværdi og varians Middelværdi x x p x All x Varians 2 2 x x p x x All x
Eksempel Har set på det ugentlige antal arbejdsulykker gennem et år Antal arbejdsulykker pr. uge (x) Hyppighed 0 32 1 12 2 4 3 2 4 0 5 0 I alt: Beregn Sandsynlighed for alle udfald Middelværdi Standardafvigelse 95%(2 sigma) konfidensinterval
Resultat Har set på det ugentlige antal arbejdsulykker gennem et år x Frekvens Sandsynlighed P(x) Gennemsnit x*p(x) Varians (x-µ_x)^2*p(x) 0 32 0,64 0 0,173056 1 12 0,24 0,24 0,055296 2 4 0,08 0,16 0,175232 3 2 0,04 0,12 0,246016 0,52 : µ_x 0,6496 Varians σ Beregn Sandsynlighed for alle udfald Middelværdi Standardafvigelse 95%(2 sigma) konfidensinterval 0,805977667 Standard afvigelse
Binomialfordelingen Anvendelses-eksempler > Stikprøver med tilbagelæ gning > Stikprøver fra løbende produktion Forudsætninger > n elementer udvæ lges (n identiske forsøg) > Hvert forsøg har 2 mulige udfald (succes eller fiasko) > Konstant sandsynlighed for succes > Uafhæ ngighed (udfaldet af et forsøg afhæ nger ikke af det foregående).
Binomialfordelingen n! x n x p x p q x! n x! x np 2 x npq Hvor: x : Binomial variabel n : antal forsøg p : sandsynlighed for succes q: 1-P σ 2 :Varians σ Sandard afvigelse μ: Gennemsnit!: Fakultet, fx 4! = 4*3*2*1
rare events approach Hvis sandsynligheden for hændelse er lille under givne antagelser, så har vi stærke indicier for at antagelsen er falsk F.eks. > Vi observerer 40%sandsynlighed for en hæ ndelse > Den beregnede sandsynlighed for samme hæ ndelse er 0,3%. > Den store forskel og lille sandsynlighed for at se hæ ndelsen gør at vi mener der er noget galt med forudsæ tningen f.eks. sandsynligheden for succes.
Probability Distribution Plot Binomial; n=10; p=0,2 Eksempel 0,3 0 0,2 5 0,2 0 0,1 5 Der udtages 10 på hinanden følgende emner fra en produktionsproces. Fejlraten på linjen er 20%. 0,1 0 0,0 5 0,0 0 0 1 2 3 X 4 5 6 7 Hvad er sandsynligheden for at man finder 4 defekte emner? p x = 4 = 10! 4! 10 4! 0,204 0,8 10 4 = 0,088 I exel: =BINOMIAL.FORDELING(4;10;0,2;) 0,08808 Hvad er sandsynligheden for at man finder mindst 3 defekte emner? p x 3 = 1 p x 2 = 0,32 Hvad er sandsynligheden for at man finder mere end 6 defekte emner? p x > 6 = p( 7) Iinspektionen fandt man 4 defekte emner. Er dette udtryk for at processen er ude af kontrol (at der er sket noget i processen)?
Poisson fordelingen Anvendelses-eksempler > Antal fejl pr. læ ngdeenhed > Antal biluheld pr. tidsenhed Forudsætninger > Sandsynligheden er proportional med intervallæ ngden > Sandsynligheden for et antal hæ ndelser i et interval er uafhæ ngigt af hvor intervallet begynder. > Konstant sandsynlighed for succes > Uafhæ ngighed mellem intervallerne
Poisson fordelingen p x e x x x x! Hvor: x : Poisson variabel μ : gennemsnitligt antal hændeler e : den naturlige logaritme 2 x
Probability Distribution Plot Poisson; Mean=0,8 0,5 Eksempel 0,4 0,3 0,2 En virksomhed har i gennemsnit 0,8 fejl pr. faktura. 0,1 0,0 X 0 1 2 3 4 5 Ien given uge fandt de 12 fejl på 6 fakturaer. Beregn sandsynligheden for a t finde 0,1,2,3,4,5,6, fejl pr. faktura. Er fejlniveauet for den pågældende uge udtryk for at antallet af fejl pr. faktura er unormalt højt? x sandsynlighed p(x) 0 0,449329 1 0,359463 2 0,143785 3 0,038343 4 0,007669 5 0,001227 6 0,000164 7 1,87E-05 8 1,87E-06 9 1,66E-07 10 1,33E-08 11 9,67E-10 12 6,45E-11
Hypergeometrisk fordeling Anvendelses-eksempler > Stikprøver uden tilbagelæ gning Forudsætninger > n elementer udtages tilfæ ldigt > Hvert forsøg har 2 udfald (succes eller fiasko) > Sandsynligheden varierer for hver udvæ lgelse > Der er afhængighed mellem forsøgene
Hypergeometrisk fordeling r N r p x x n x N n r x n N 2 x r n 1 N r N n N N 1 Hvor: x : Hypergeometrisk variabel N : Populationsstørrelse r: antal successer i populationen n : antal der skal udvælges x : x ud af de n udvalgte er successer N N! n n! N n!
Eksempel En virksomhed udtager en stikprøve på 15 stk. af en produktionsbatch på 500 stk. Antag at af de 500 er 50 defekte. Beregn den eksakte sandsynlighed for at der er mindst 12 emner uden defekt i stikprøven (mindst 12 gode emner i stikprøven)