Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Relaterede dokumenter
Definition. Definitioner

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

4 Oversigt over kapitel 4

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Kvantitative Metoder 1 - Forår Dagens program

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Kvantitative Metoder 1 - Forår Dagens program

StatDataN: Middelværdi og varians

Elementær sandsynlighedsregning

Kvantitative Metoder 1 - Efterår Dagens program

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

MM501 forelæsningsslides

Kvantitative Metoder 1 - Forår 2007

Elementær sandsynlighedsregning

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Note om Monte Carlo metoden

INSTITUT FOR MATEMATISKE FAG c

Produkt og marked - matematiske og statistiske metoder

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

MM501/MM503 forelæsningsslides

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Teoretisk Statistik, 16. februar Generel teori,repetition

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Løsning eksamen d. 15. december 2008

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Sandsynlighedsregning og statistik

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Kvantitative Metoder 1 - Forår 2007

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Landmålingens fejlteori - Sandsynlighedsregning - Lektion 1

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Lad os som eksempel se på samtidigt kast med en terning og en mønt:

Højde af kvinder 2 / 18

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kvantitative Metoder 1 - Forår Dagens program

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen


Normalfordelingen og Stikprøvefordelinger

Statistiske modeller

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Oversigt over nyttige fordelinger

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

Tema. Dagens tema: Indfør centrale statistiske begreber.

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Indblik i statistik - for samfundsvidenskab

Dagens program. Afsnit Eksperimenter med usikkerhed Sandsynlighedsmodel - Udfaldsrum - Hændelser - Sandsynligheder Eksempler

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Dagens program. Afsnit Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder

Susanne Ditlevsen Institut for Matematiske Fag susanne

Sandsynlighedsregning

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Løsning til eksaminen d. 29. maj 2009

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Sandsynlighedsregning Oversigt over begreber og fordelinger

Personlig stemmeafgivning

Sandsynligheder. Mængder Hændelser Sandsynligheder Regler for sandsynligheder

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

Forelæsning 1: Intro og beskrivende statistik

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Nanostatistik: Stokastisk variabel

Aarhus Universitet 5. februar Meddelelse 2

Nanostatistik: Stokastisk variabel

Kapitel 4 Sandsynlighed og statistiske modeller

Diskrete fordelinger. Fire vigtige diskrete fordelinger: 1. Uniform fordeling (diskret) 2. Binomial fordeling. 3. Hyper-geometrisk fordeling

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Transkript:

Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: kkb@math.aau.dk Hjemmeside: www.math.aau.dk/ kkb Statistik - lektion 1 p.1/22

Hvorfor statistik? Population Stikprøve At udtale sig om hele populationen på baggrund af en stikprøve. Herunder: Hvilke sammen hænge er der i populationen fx. mellem højde og vægt Hvor sikre er vores konklusioner? Statistik - lektion 1 p.2/22

Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Uoverskueligt! Hvordan opsummerer vi? Statistik - lektion 1 p.3/22

Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Histogram: Antal observationer i givne intervaller. Histogram of x Frequency 0.0 1.5 3.0 15 20 25 30 x Statistik - lektion 1 p.3/22

Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Medianen er det tal, der ligger halvejs inde i (ordnet) data. Ordnet data: 18 19 19 20 20 20 21 21 21 22 22 23 24 24 26 29 Median er i dette tilfælde 21 (mellem 21 og 21) P % fraktilen er et tal som P procent af data er mindre end. Medianen er således 50% fraktilen. Statistik - lektion 1 p.3/22

Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Middelværdi: x = 1 n (x 1 + x 2 +... + x n ) = 1 n n i=1 x i, hvor x i er den i te observation og n er antal observationer. Eksemplet: x = 1 (18 + 19 +... 26 + 29) = 21.8125 16 Statistik - lektion 1 p.3/22

Statistik Vi har observeret følgende værdier: 22 19 26 21 20 24 21 29 19 24 18 21 20 20 23 22 Mål for variationen i data: Variansen: s 2 = 1 n 1 n i=1 (x i x) 2 Standardafvigelsen: s = s 2 Eksemplet: s 2 = 1 16 1( (18 21.8125) 2 +(19 21.8125) 2 +...+(29 21.8125) 2) = 8.1625 Short cut: s 2 = n n i=1 x2 i ( n i=1 x i) 2 n(n 1) Statistik - lektion 1 p.3/22

Venn-diagram Udfaldsrum (mængde) S Hændelse (delmængde) A Udfald (element) x Udfaldsrummet er mængden af mulige udfald (resultat) af et eksperiment. En hændelse er en delmængde af udfaldrummet. Eksempel: Eksperiment: vælg en tilfældig studerende på holdet Udfaldsrummet: mængden af alle studerende på holdet Udfald: hver studerende svarer til et udfald Hændelse: den studerende er over 170cm høj Statistik - lektion 1 p.4/22

Sandsynligheder En sandsynlighed er et tal mellem 0 og 1 Sandsynligheden for en hændelse A betegnes P (A) (Probability). For alle hændelser A S gælder 0 P (A) 1 Hvis P (A) = 1 så indtræffef hændelsen A altid! Hvis P (A) = 0 så indtræffef hændelsen A aldrig! Sandsynligheden for at eksperimentet har et udfald i udfaldsrummet S er 1: P (S) = 1 Den tomme hændelse/mængde betegnes. P ( ) = 0 Statistik - lektion 1 p.5/22

Antag at alle udfald er lige sandsynlige: For alle x S, P (x) = 1 antal elementer i S Eksempel (forts.): Antag 34 studerende og antag Peter S, da er sandynligheden for at vi vælger Peter: P (Peter) = 1 34 0.029 Statistik - lektion 1 p.6/22

Sandsynligheden for en hændelse A Antag at alle udfald er lige sandsynlige: For alle A S, P (A) = = antal elementer i A antal elementer i S antal gunstige antal mulige Eksempel (forts.): Antag A = Studerende er højere end 170cm og antag at der er 21 studerende i A: P (A) = 21 34 0.62 Statistik - lektion 1 p.7/22

Mere mængdelære C A B = A A B A B = A C = A Foreningsmængde: A B Fællesmængde: A B P (A B) = P (A) + P (B) P (A B) (foreningen af elementer i A ogb) (alle elementer fælles for A ogb) Hændelserne A og C overlapper ikke, dvs. A C =. P (A C) = P ( ) = 0 P (A C) = P (A) + P (C) P (A C) = P (A) + P (C) Statistik - lektion 1 p.8/22

Mænd Kvinder > 170cm 170cm Eksempel (forts.): To hændelser A = Højde over 170cm B = Mand P (A) = P (B) = P (A B) = P (A B) = Statistik - lektion 1 p.9/22

Mere mængdelære Ā A Ā er A s kompliment. Dvs. Ā indeholder alle elementer fra S som ikke er indeholdt i A. A Ā = S og A Ā = P (A Ā) = P (A) + P (Ā) og P (A Ā) = P (S) = 1 P (A) + P (Ā) = 1 P (Ā) = 1 P (A) Statistik - lektion 1 p.10/22

Mere mængdelære A Ā B B = B B Mængden B kan deles i to delmængder B A og B Ā: B = (B A) (B Ā) og (B A) (B Ā) = P (B) = P ((B A) (B Ā)) = P (B A) + P (B Ā) Statistik - lektion 1 p.11/22

Betinget sandsynlighed Mænd Kvinder > 170cm A = Højde over 170cm B = Mand 170cm Antag at vi ved at den valgte studerende er mand (hændelsen B er indtruffet). Hvad er da sandsynligheden for at den valgte studerende er højere end 170cm (hændelsen A er indtruffet)? Statistik - lektion 1 p.12/22

Betinget sandsynlighed Sandsynligheden for hændelsen A givet at hændelsen B er indtruffet er den betingede sandsynlighed P (A B) = P (A B) P (B) Kan omskrives til P (A B) = P (A B)P (B) Sandsynligheden for B givet A er P (B A) = P (A B) P (A) Kan omskrives til: P (A B) = P (B A)P (A) Kombineret får vi: P (B A)P (A) = P (A B)P (B) Statistik - lektion 1 p.13/22

Opgave To hændelser: A: Har lungesygdom B: Ryger Undersøgelse viser at blandt folk over 60: P (A) = 0.07, P (B A) = 0.90 og P (B Ā) = 0.253 Opgave: Givet en person over 60 er ryger, hvad er sandsynligheden for at han/hun har en lungesygdom? Statistik - lektion 1 p.14/22

Uafhængighed To hændelser A og B er uafhængige hvis P (A B) = P (A) P (B A) = P (B) eller P (A B) = P (A)P (B) Eksempel: A = Har set TV-avisen og B = Har set Nyhederne. Antag at A og B er uafhængige (er det en rimlig antagelse?) og P (A) = 0.3 og P (B) = 0.4. Hvad er sandsynligheden for at have set begge programmer? Hvad er sandsynligheden for at have set mindst et af programmerne? Statistik - lektion 1 p.15/22

Stokastisk variabel S 0 X En stokastisk variabel (SV) X knytter et tal til hvert udfald i udfaldsrummet S. Notation: (store) X er et tilfældigt tal, mens (lille) x er en observation af X (og dermed ikke tilfældig)! Fx: Antal øjne på terning, eksamenskarakter, højden i cm, temperatur i saune, køn, nationalitet. Eksempel: X er højden i cm. P ( Højde over 170 cm ) = P (X > 170) Statistik - lektion 1 p.16/22

Sandsynlighedsfunktion: P er en sandsynlighedsfunktion hvis 0 P (x) 1 for alle x S og allex P (x) = 1 Fordelingsfunktion: F (x) = P (X x) = alle i x P (i) Statistik - lektion 1 p.17/22

Antag at X er antal finner i en tilfældigt udvalgt sauna! Antag desuden at X er beskrevet ved følgende sandsynlighedsfunktion. P (x) 4/16 6/16 4/16 1 F (x) 1/16 1/16 0 1 2 3 4 0 1 2 3 4 P (X = 1) = F (1) = P (X 3) = F (3) = P (X > 3) = P (1 < X 3) = Statistik - lektion 1 p.18/22

Middelværdi Antag X SV med sandsynlighedsfuntion P Middelværdi: µ = E(X) = alle x xp (x) Regneregler: Hvis h(x) er en funktion, så gælder E(h(X)) = alle x h(x)p (x) Hvis a og b er konstanter E(a + bx) = a + be(x) = a + bµ Eksempel: X er SV med sandsynlighedsfunktion P (0) = 1 16, P (1) = 4 16, P (2) = 6 16, P (3) = 4 16 og P (4) = 1 16 E(X) = E(1 + 2X) = Antag h(x) = x 2 E(h(X)) = Statistik - lektion 1 p.19/22

Bemærk forskellen på den teoretiske middelværdi µ = E(X) = alle x xp (x) og den observerede middelværdi x = 1 n (x 1 + x 2 +... + x n ) = 1 n n i=1 x i Eksempel: Antag at X er antallet af finner i en tilfældigt valgt suana og sandsynlighedsfunktionen er passer med virkeligheden! Undersøg antallet af personer i ti (n = 10) saunaer og find middelværdien. Gentag dette 1000 gange! Histogram over de 1000 middelværdier: Histogram of m Frequency 0 100 250 1.0 1.5 2.0 2.5 3.0 Statistik - lektion 1 p.20/22

Varians Antag X SV med sandsynlighedsfuntion P Varians: σ 2 = Var(X) = E(X µ) 2 vskip3mm Formel: Var(X) = alle x (x µ)p (x) Regneregler: Hvis a og b er konstanter Var(a + bx) = b 2 Var(X) Short cut: Var(X) = E(X 2 ) ( E(X) ) 2 Eksempel: X er SV med sandsynlighedsfunktion P (0) = 1 16, P (1) = 4 16, P (2) = 6 16, P (3) = 4 16 og P (4) = 1 16 Var(X) = Var(1 + 2X) = Statistik - lektion 1 p.21/22

Bemærk forskellen på den teoretiske varians σ 2 = Var(X) = E(X µ) 2 og den observerede varians s 2 = 1 n 1 n i=1 (x i x) 2 Eksempel: Undersøg antallet af personer i ti (n = 10) saunaer og find variansen. Gentag dette 1000 gange! Histogram over de 1000 varianser: Histogram of v Frequency 0 100 200 0.0 0.5 1.0 1.5 2.0 2.5 v Statistik - lektion 1 p.22/22