Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Relaterede dokumenter
Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Elementær sandsynlighedsregning

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Elementær sandsynlighedsregning

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Note om Monte Carlo metoden

INSTITUT FOR MATEMATISKE FAG c

Produkt og marked - matematiske og statistiske metoder

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Teoretisk Statistik, 16. februar Generel teori,repetition

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Løsning eksamen d. 15. december 2008

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Sandsynlighedsregning og statistik

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Kvantitative Metoder 1 - Forår 2007

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Landmålingens fejlteori - Sandsynlighedsregning - Lektion 1

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Lad os som eksempel se på samtidigt kast med en terning og en mønt:

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Normalfordelingen og Stikprøvefordelinger

Statistiske modeller

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

Tema. Dagens tema: Indfør centrale statistiske begreber.

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Indblik i statistik - for samfundsvidenskab

Dagens program. Afsnit Eksperimenter med usikkerhed Sandsynlighedsmodel - Udfaldsrum - Hændelser - Sandsynligheder Eksempler

Susanne Ditlevsen Institut for Matematiske Fag susanne

Sandsynlighedsregning

Løsning til eksaminen d. 29. maj 2009

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Sandsynlighedsregning Oversigt over begreber og fordelinger

Personlig stemmeafgivning

Sandsynligheder. Mængder Hændelser Sandsynligheder Regler for sandsynligheder

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

Forelæsning 1: Intro og beskrivende statistik

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

Kapitel 4 Sandsynlighed og statistiske modeller

Diskrete fordelinger. Fire vigtige diskrete fordelinger: 1. Uniform fordeling (diskret) 2. Binomial fordeling. 3. Hyper-geometrisk fordeling

Transkript:

Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: kkb@math.aau.dk Hjemmeside: www.math.aau.dk/ kkb Statistik - lektion 1 p.1/22

Hvorfor statistik? Population Stikprøve At udtale sig om hele populationen på baggrund af en stikprøve. Herunder: Hvilke sammen hænge er der i populationen fx. mellem højde og vægt Hvor sikre er vores konklusioner? Statistik - lektion 1 p.2/22

Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Uoverskueligt! Hvordan opsummerer vi? Statistik - lektion 1 p.3/22

Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Histogram: Antal observationer i givne intervaller. Histogram of x Frequency 0.0 1.5 3.0 15 20 25 30 x Statistik - lektion 1 p.3/22

Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Medianen er det tal, der ligger halvejs inde i (ordnet) data. Ordnet data: 18 19 19 20 20 20 21 21 21 22 22 23 24 24 26 29 Median er i dette tilfælde 21 (mellem 21 og 21) P % fraktilen er et tal som P procent af data er mindre end. Medianen er således 50% fraktilen. Statistik - lektion 1 p.3/22

Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Middelværdi: x = 1 n (x 1 + x 2 +... + x n ) = 1 n n i=1 x i, hvor x i er den i te observation og n er antal observationer. Eksemplet: x = 1 (18 + 19 +... 26 + 29) = 21.8125 16 Statistik - lektion 1 p.3/22

Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Mål for variationen i data: Variansen: s 2 = 1 n 1 n i=1 (x i x) 2 Standardafvigelsen: s = s 2 Eksemplet: s 2 = 1 16 1( (18 21.8125) 2 +(19 21.8125) 2 +...+(29 21.8125) 2) = 8.1625 Short cut: s 2 = n n i=1 x2 i ( n i=1 x i) 2 n(n 1) Statistik - lektion 1 p.3/22

Venn-diagram Udfaldsrum (mængde) S Hændelse (delmængde) A Udfald (element) x Udfaldsrummet er mængden af mulige udfald (resultat) af et eksperiment. En hændelse er en delmængde af udfaldrummet. Eksempel: Eksperiment: vælg en tilfældig studerende på holdet Udfaldsrummet: mængden af alle studerende på holdet Udfald: hver studerende svarer til et udfald Hændelse: den studerende er over 170cm høj Statistik - lektion 1 p.4/22

Sandsynligheder En sandsynlighed er et tal mellem 0 og 1 Sandsynligheden for en hændelse A betegnes P (A) (Probability). For alle hændelser A S gælder 0 P (A) 1 Hvis P (A) = 1 så indtræffef hændelsen A altid! Hvis P (A) = 0 så indtræffef hændelsen A aldrig! Sandsynligheden for at eksperimentet har et udfald i udfaldsrummet S er 1: P (S) = 1 Den tomme hændelse/mængde betegnes. P ( ) = 0 Statistik - lektion 1 p.5/22

Antag at alle udfald er lige sandsynlige: For alle x S, P (x) = 1 antal elementer i S Eksempel (forts.): Antag 34 studerende og antag Peter S, da er sandynligheden for at vi vælger Peter: P (Peter) = 1 34 0.029 Statistik - lektion 1 p.6/22

Sandsynligheden for en hændelse A Antag at alle udfald er lige sandsynlige: For alle A S, P (A) = = antal elementer i A antal elementer i S antal gunstige antal mulige Eksempel (forts.): Antag A = Studerende er højere end 170cm og antag at der er 21 studerende i A: P (A) = 21 34 0.62 Statistik - lektion 1 p.7/22

Mere mængdelære C A B = A A B A B = A C = A Foreningsmængde: A B Fællesmængde: A B P (A B) = P (A) + P (B) P (A B) (foreningen af elementer i A ogb) (alle elementer fælles for A ogb) Hændelserne A og C overlapper ikke, dvs. A C =. P (A C) = P ( ) = 0 P (A C) = P (A) + P (C) P (A C) = P (A) + P (C) Statistik - lektion 1 p.8/22

Mænd Kvinder > 170cm 170cm Eksempel (forts.): To hændelser A = Højde over 170cm B = Mand P (A) = P (B) = P (A B) = P (A B) = Statistik - lektion 1 p.9/22

Mere mængdelære Ā A Ā er A s kompliment. Dvs. Ā indeholder alle elementer fra S som ikke er indeholdt i A. A Ā = S og A Ā = P (A Ā) = P (A) + P (Ā) og P (A Ā) = P (S) = 1 P (A) + P (Ā) = 1 P (Ā) = 1 P (A) Statistik - lektion 1 p.10/22

Mere mængdelære A Ā B B = B B Mængden B kan deles i to delmængder B A og B Ā: B = (B A) (B Ā) og (B A) (B Ā) = P (B) = P ((B A) (B Ā)) = P (B A) + P (B Ā) Statistik - lektion 1 p.11/22

Betinget sandsynlighed Mænd Kvinder > 170cm A = Højde over 170cm B = Mand 170cm Antag at vi ved at den valgte studerende er mand (hændelsen B er indtruffet). Hvad er da sandsynligheden for at den valgte studerende er højere end 170cm (hændelsen A er indtruffet)? Statistik - lektion 1 p.12/22

Betinget sandsynlighed Sandsynligheden for hændelsen A givet at hændelsen B er indtruffet er den betingede sandsynlighed P (A B) = P (A B) P (B) Kan omskrives til P (A B) = P (A B)P (B) Sandsynligheden for B givet A er P (B A) = P (A B) P (A) Kan omskrives til: P (A B) = P (B A)P (A) Kombineret får vi: P (B A)P (A) = P (A B)P (B) Statistik - lektion 1 p.13/22

Opgave To hændelser: A: Har lungesygdom B: Ryger Undersøgelse viser at blandt folk over 60: P (A) = 0.07, P (B A) = 0.90 og P (B Ā) = 0.253 Opgave: Givet en person over 60 er ryger, hvad er sandsynligheden for at han/hun har en lungesygdom? Statistik - lektion 1 p.14/22

Uafhængighed To hændelser A og B er uafhængige hvis P (A B) = P (A) P (B A) = P (B) eller P (A B) = P (A)P (B) Eksempel: A = Har set TV-avisen og B = Har set Nyhederne. Antag at A og B er uafhængige (er det en rimlig antagelse?) og P (A) = 0.3 og P (B) = 0.4. Hvad er sandsynligheden for at have set begge programmer? Hvad er sandsynligheden for at have set mindst et af programmerne? Statistik - lektion 1 p.15/22

Stokastisk variabel S 0 X En stokastisk variabel (SV) X knytter et tal til hvert udfald i udfaldsrummet S. Notation: (store) X er et tilfældigt tal, mens (lille) x er en observation af X (og dermed ikke tilfældig)! Fx: Antal øjne på terning, eksamenskarakter, højden i cm, temperatur i saune, køn, nationalitet. Eksempel: X er højden i cm. P ( Højde over 170 cm ) = P (X > 170) Statistik - lektion 1 p.16/22

Sandsynlighedsfunktion: P er en sandsynlighedsfunktion hvis 0 P (x) 1 for alle x S og allex P (x) = 1 Fordelingsfunktion: F (x) = P (X x) = alle i x P (i) Statistik - lektion 1 p.17/22

Antag at X er antal finner i en tilfældigt udvalgt sauna! Antag desuden at X er beskrevet ved følgende sandsynlighedsfunktion. P (x) 4/16 6/16 4/16 1 F (x) 1/16 1/16 0 1 2 3 4 0 1 2 3 4 P (X = 1) = F (1) = P (X 3) = F (3) = P (X > 3) = P (1 < X 3) = Statistik - lektion 1 p.18/22

Middelværdi Antag X SV med sandsynlighedsfuntion P Middelværdi: µ = E(X) = alle x xp (x) Regneregler: Hvis h(x) er en funktion, så gælder E(h(X)) = alle x h(x)p (x) Hvis a og b er konstanter E(a + bx) = a + be(x) = a + bµ Eksempel: X er SV med sandsynlighedsfunktion P (0) = 1 16, P (1) = 4 16, P (2) = 6 16, P (3) = 4 16 og P (4) = 1 16 E(X) = E(1 + 2X) = Antag h(x) = x 2 E(h(X)) = Statistik - lektion 1 p.19/22

Bemærk forskellen på den teoretiske middelværdi µ = E(X) = alle x xp (x) og den observerede middelværdi x = 1 n (x 1 + x 2 +... + x n ) = 1 n n i=1 x i Eksempel: Antag at X er antallet af finner i en tilfældigt valgt suana og sandsynlighedsfunktionen er passer med virkeligheden! Undersøg antallet af personer i ti (n = 10) saunaer og find middelværdien. Gentag dette 1000 gange! Histogram over de 1000 middelværdier: Histogram of m Frequency 0 100 250 1.0 1.5 2.0 2.5 3.0 Statistik - lektion 1 p.20/22

Varians Antag X SV med sandsynlighedsfuntion P Varians: σ 2 = Var(X) = E(X µ) 2 vskip3mm Formel: Var(X) = alle x (x µ)p (x) Regneregler: Hvis a og b er konstanter Var(a + bx) = b 2 Var(X) Short cut: Var(X) = E(X 2 ) ( E(X) ) 2 Eksempel: X er SV med sandsynlighedsfunktion P (0) = 1 16, P (1) = 4 16, P (2) = 6 16, P (3) = 4 16 og P (4) = 1 16 Var(X) = Var(1 + 2X) = Statistik - lektion 1 p.21/22

Bemærk forskellen på den teoretiske varians σ 2 = Var(X) = E(X µ) 2 og den observerede varians s 2 = 1 n 1 n i=1 (x i x) 2 Eksempel: Undersøg antallet af personer i ti (n = 10) saunaer og find variansen. Gentag dette 1000 gange! Histogram over de 1000 varianser: Histogram of v Frequency 0 100 200 0.0 0.5 1.0 1.5 2.0 2.5 v Statistik - lektion 1 p.22/22