Relaterede dokumenter
Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Vejledende løsninger til opgaver i kapitel 6

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Sandsynlighedsregning

Produkt og marked - matematiske og statistiske metoder

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Kvantitative Metoder 1 - Forår Dagens program

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kvantitative Metoder 1 - Efterår Dagens program

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik noter - Efterår 2009 Keller - Statistics for management and economics

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Løsning til eksaminen d. 29. maj 2009

Løsning eksamen d. 15. december 2008

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Diskrete fordelinger. Fire vigtige diskrete fordelinger: 1. Uniform fordeling (diskret) 2. Binomial fordeling. 3. Hyper-geometrisk fordeling

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kvantitative Metoder 1 - Forår 2007

Kapitel 4 Sandsynlighed og statistiske modeller

INSTITUT FOR MATEMATISKE FAG c

Produkt og marked - matematiske og statistiske metoder

Løsning til eksaminen d. 14. december 2009

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Konfidensintervaller og Hypotesetest

Undervisningsbeskrivelse

Kvantitative Metoder 1 - Forår 2007

Statistiske modeller

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Normalfordelingen og Stikprøvefordelinger

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Kapitel 4 Sandsynlighed og statistiske modeller

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Undervisningsbeskrivelse

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

02402 Vejledende løsninger til hjemmeopgaver og øvelser i kapitel 4

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Note til styrkefunktionen

Undervisningsbeskrivelse

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Undervisningsbeskrivelse

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Fagplan for statistik, efteråret 2015

Teoretisk Statistik, 13 april, 2005

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Temaopgave i statistik for

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

4 Sandsynlighedsfordelinger og approksimationer

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen

Hvad skal vi lave i dag?

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Transkript:

Grundlæggende statistik Lektion 2

Indhold Diskrete fordelinger Binomial fordelingen Poisson fordelingen Hypergeometrisk fordeling

Data typer el. typer af tilfældige variable Diskrete variable > Kategoriseres > Listes > Tælles Eksempler > Farve, by, ok/ikke ok > 1,2,3,4,. fejl p å et em ne Kontinuerte > Måles (kan underinddeles) Eksempler > Tryk, temperatur, dimension, væ gt

Kategoriser følgende Variabel Diskret Kontinuert Længde af en aksel x Vare nummer x Procestid i en hærdeovn x Styrke af en svejsesamling x Postnummer x Antal lakfejl på en plade x Farve af et emne x Kvalitetskontrol, QC x Diameter af et hul x Antal arbejdsulykker pr. måned x

Diskrete fordelinger Sandsynligheden er altid større end nul, og Summen af sandsynligheden af alle udfald er 1 p x 0 p x 1 All x

Middelværdi og varians Middelværdi x x p x All x Varians 2 2 x x p x x All x

Eksempel Har set på det ugentlige antal arbejdsulykker gennem et år Antal arbejdsulykker pr. uge (x) Hyppighed 0 32 1 12 2 4 3 2 4 0 5 0 I alt: Beregn Sandsynlighed for alle udfald Middelværdi Standardafvigelse 95%(2 sigma) konfidensinterval

Resultat Har set på det ugentlige antal arbejdsulykker gennem et år x Frekvens Sandsynlighed P(x) Gennemsnit x*p(x) Varians (x-µ_x)^2*p(x) 0 32 0,64 0 0,173056 1 12 0,24 0,24 0,055296 2 4 0,08 0,16 0,175232 3 2 0,04 0,12 0,246016 0,52 : µ_x 0,6496 Varians σ Beregn Sandsynlighed for alle udfald Middelværdi Standardafvigelse 95%(2 sigma) konfidensinterval 0,805977667 Standard afvigelse

Binomialfordelingen Anvendelses-eksempler > Stikprøver med tilbagelæ gning > Stikprøver fra løbende produktion Forudsætninger > n elementer udvæ lges (n identiske forsøg) > Hvert forsøg har 2 mulige udfald (succes eller fiasko) > Konstant sandsynlighed for succes > Uafhæ ngighed (udfaldet af et forsøg afhæ nger ikke af det foregående).

Binomialfordelingen n! x n x p x p q x! n x! x np 2 x npq Hvor: x : Binomial variabel n : antal forsøg p : sandsynlighed for succes q: 1-P σ 2 :Varians σ Sandard afvigelse μ: Gennemsnit!: Fakultet, fx 4! = 4*3*2*1

rare events approach Hvis sandsynligheden for hændelse er lille under givne antagelser, så har vi stærke indicier for at antagelsen er falsk F.eks. > Vi observerer 40%sandsynlighed for en hæ ndelse > Den beregnede sandsynlighed for samme hæ ndelse er 0,3%. > Den store forskel og lille sandsynlighed for at se hæ ndelsen gør at vi mener der er noget galt med forudsæ tningen f.eks. sandsynligheden for succes.

Probability Distribution Plot Binomial; n=10; p=0,2 Eksempel 0,3 0 0,2 5 0,2 0 0,1 5 Der udtages 10 på hinanden følgende emner fra en produktionsproces. Fejlraten på linjen er 20%. 0,1 0 0,0 5 0,0 0 0 1 2 3 X 4 5 6 7 Hvad er sandsynligheden for at man finder 4 defekte emner? p x = 4 = 10! 4! 10 4! 0,204 0,8 10 4 = 0,088 I exel: =BINOMIAL.FORDELING(4;10;0,2;) 0,08808 Hvad er sandsynligheden for at man finder mindst 3 defekte emner? p x 3 = 1 p x 2 = 0,32 Hvad er sandsynligheden for at man finder mere end 6 defekte emner? p x > 6 = p( 7) Iinspektionen fandt man 4 defekte emner. Er dette udtryk for at processen er ude af kontrol (at der er sket noget i processen)?

Poisson fordelingen Anvendelses-eksempler > Antal fejl pr. læ ngdeenhed > Antal biluheld pr. tidsenhed Forudsætninger > Sandsynligheden er proportional med intervallæ ngden > Sandsynligheden for et antal hæ ndelser i et interval er uafhæ ngigt af hvor intervallet begynder. > Konstant sandsynlighed for succes > Uafhæ ngighed mellem intervallerne

Poisson fordelingen p x e x x x x! Hvor: x : Poisson variabel μ : gennemsnitligt antal hændeler e : den naturlige logaritme 2 x

Probability Distribution Plot Poisson; Mean=0,8 0,5 Eksempel 0,4 0,3 0,2 En virksomhed har i gennemsnit 0,8 fejl pr. faktura. 0,1 0,0 X 0 1 2 3 4 5 Ien given uge fandt de 12 fejl på 6 fakturaer. Beregn sandsynligheden for a t finde 0,1,2,3,4,5,6, fejl pr. faktura. Er fejlniveauet for den pågældende uge udtryk for at antallet af fejl pr. faktura er unormalt højt? x sandsynlighed p(x) 0 0,449329 1 0,359463 2 0,143785 3 0,038343 4 0,007669 5 0,001227 6 0,000164 7 1,87E-05 8 1,87E-06 9 1,66E-07 10 1,33E-08 11 9,67E-10 12 6,45E-11

Hypergeometrisk fordeling Anvendelses-eksempler > Stikprøver uden tilbagelæ gning Forudsætninger > n elementer udtages tilfæ ldigt > Hvert forsøg har 2 udfald (succes eller fiasko) > Sandsynligheden varierer for hver udvæ lgelse > Der er afhængighed mellem forsøgene

Hypergeometrisk fordeling r N r p x x n x N n r x n N 2 x r n 1 N r N n N N 1 Hvor: x : Hypergeometrisk variabel N : Populationsstørrelse r: antal successer i populationen n : antal der skal udvælges x : x ud af de n udvalgte er successer N N! n n! N n!

Eksempel En virksomhed udtager en stikprøve på 15 stk. af en produktionsbatch på 500 stk. Antag at af de 500 er 50 defekte. Beregn den eksakte sandsynlighed for at der er mindst 12 emner uden defekt i stikprøven (mindst 12 gode emner i stikprøven)