Kapitel 4 Sandsynlighed og statistiske modeller



Relaterede dokumenter
Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 2 Frekvensfordelinger

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Sandsynlighedsregning Stokastisk variabel

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Produkt og marked - matematiske og statistiske metoder

Kapitel 7 Forskelle mellem centraltendenser

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Uge 10 Teoretisk Statistik 1. marts 2004

Kapitel 3 Centraltendens og spredning

m = 0,15 22,5 + 0, , , , ,05 90 = 61,9år år år år år 26,67% 40% 26,67% 6,67%

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Opgaver til kapitel 3

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Definition. Definitioner

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

Kvantitative Metoder 1 - Forår 2007

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Temaopgave i statistik for

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Elementær sandsynlighedsregning

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Undervisningsbeskrivelse

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Kvantitative Metoder 1 - Efterår Dagens program

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Produkt og marked - matematiske og statistiske metoder

Fagplan for statistik, efteråret 2015

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Sandsynlighedsregning

Kvantitative Metoder 1 - Forår 2007

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Kapitel 1 Statistiske grundbegreber

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Normalfordelingen og Stikprøvefordelinger

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Kapitel 12 Variansanalyse

Matematik A, vejledende opgave 2, ny ordning. Vejledende løsninger, Peter B. Delprøven uden hjælpemidler. Opgave 1. a) A= 6x 2 +12xdx = 2x 3 + 6x 2 2

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Vejledende løsninger til opgaver i kapitel 6

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Kapitel 12 Variansanalyse

Statistiske modeller

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Note om Monte Carlo metoden

Lidt om fordelinger, afledt af normalfordelingen

Kvantitative Metoder 1 - Forår 2007

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Tema. Dagens tema: Indfør centrale statistiske begreber.

Schweynoch, Se eventuelt

Kapitel 3 Centraltendens og spredning

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Højde af kvinder 2 / 18

Løsning til eksaminen d. 29. maj 2009

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Elementær sandsynlighedsregning

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Løsning til eksaminen d. 14. december 2009

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Estimation og konfidensintervaller

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Kvantitative Metoder 1 - Forår Dagens program


Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

Teoretisk Statistik, 16. februar Generel teori,repetition

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Susanne Ditlevsen Institut for Matematiske Fag susanne

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Transkript:

Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011

1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol med normalfordelingen 5 Normalfordeling med Excel 6 Opsamling

1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol med normalfordelingen 5 Normalfordeling med Excel 6 Opsamling

Generalisering fra stikprøve til population Idé: Opstil en model for populationen og estimér modellens parametre på baggrund af stikprøven Kontrollér at stikprøven ikke er i modstrid med modellen Eksempel: 95% konfidensinterval for middelværdien i en normalfordeling

Generalisering fra stikprøve til population Idé: Opstil en model for populationen og estimér modellens parametre på baggrund af stikprøven Kontrollér at stikprøven ikke er i modstrid med modellen Eksempel: 95% konfidensinterval for middelværdien i en normalfordeling

1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol med normalfordelingen 5 Normalfordeling med Excel 6 Opsamling

Binomialfordelingen - uformelt Lyttetest: En person har i tre ud af tre sætninger korrekt hørt forskel på bas og pas - kan det være tilfældigt? Vi gentager et eksperiment tre gange, hvor der hver gang er 50% sandsynlighed for at få succes ved en tilfældighed (fx. få krone) Hvad er sandsynligheden for at få krone tre gange i træk? Og hvorfor er det interessant?

Uformelt... fortsat Der er otte mulige udfald ved tre kast: KKK, KKP, KPK, PKK, KPP, PKP, PPK, PPP Alle otte udfald er lige sandsynlige og netop ét udfald svarer til tre gange krone Laplaces lov: Sandsynlighed er antal gunstige divideret med antal mulige Sandsynligheden for netop tre gange krone er således 1/8 = 0,125 = 12,5%

Uformelt... fortsat Tilbage til lyttetest: Der er altså en sandsynlighed (risiko) på 12,5% for, at personen ikke kan høre forskel på bas og pas selvom der blev svaret rigtigt i 3 ud af 3 tilfælde. Er dette acceptabelt og hvis ikke: Hvordan kan man så lave eksperimentet bedre?

Binomialfordelingen formelt n Bernoulli-forsøg med sandsynligheden p for sandt (og følgeligt sandsynligheden 1 p for falsk) Punktsandsynligheder er givet ved ( ) n f (x) = p n (1 p) n 1, x = 0, 1,..., n x hvor K(n,x) er binomialkoefficienten ( ) n n (n 1)... (n x + 1) = x x (x 1)... 1 = n! x!(n x)!

Binomialfordelingen formelt og grafisk X ~ Bin(3,0.5) f(x) = P(X=x) 0.0 0.1 0.2 0.3 0.4 0 1 2 3 x

Opgave 3

1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol med normalfordelingen 5 Normalfordeling med Excel 6 Opsamling

Normalfordelingen Normalfordelingen er en kontinuert fordeling mens binomialfordelingen er en diskret fordeling Tæthedsfunktion ϕ(x) 0.0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 x Histogrammet for en binomialfordeling med p = 0, 5 og meget højt n ligner tæthedsfunktionen for en normalfordeling

Normalfordelingen Normalfordelingen er en kontinuert fordeling mens binomialfordelingen er en diskret fordeling Tæthedsfunktion ϕ(x) 0.0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 x Histogrammet for en binomialfordeling med p = 0, 5 og meget højt n ligner tæthedsfunktionen for en normalfordeling

Normalfordelingen som grænsefordeling for binomialfordelingen med p = 0, 5 n=5 n=10 P(x) 0.05 0.15 0.25 P(x) 0.00 0.10 0.20 0 1 2 3 4 5 x 0 2 4 6 8 10 x n=20 n=50 P(x) 0.00 0.05 0.10 0.15 P(x) 0.00 0.04 0.08 0 5 10 15 20 x 0 10 20 30 40 50 x

Normalfordelingen Der findes uendeligt mange normalfordelinger, der hver især er karakteriseret ved deres middelværdi µ og deres spredning σ Middelværdi µ og spredning σ er parametre i normalfordelingen, og vi skriver N(µ, σ 2 ) Tæthedsfunktionen er en klokkeformet kurve: f (x; µ, σ) = 1 ) ( σ 2π exp (x µ)2 2σ 2 (vi bruger heldigvis næsten altid tabeller) Kurven har toppunkt for x = µ Større spredning giver fladere tæthedsfunktion

Tæthedsfunktion for 3 forskellige normalfordelinger f(x) 0.00 0.05 0.10 0.15 0.20 N(10, 2 2 ) N(10, 4 2 ) N(20, 2 2 ) 10 0 10 20 30 x

Fordelingsfunktion og standardnormalfordeling Ved bestemt integration af tæthedsfunktionen kommer vi frem til fordelingsfunktionen, der er en slags kummuleret frekvensfordeling Fraktiler i en normalfordeling er nyttige ifm udsagn af typen: 50% af eleverne kan forventes at score mellem 22 og 87 i den forelagte prøve 5% af eleverne forventes at score mindre end 12 Fordelingsfunktionen går gennem (µ, 0.5) Lavere spredning giver stejlere fordelingsfunktion

Fordelingsfunktion for 3 forskellige normalfordelinger F(x) 0.0 0.2 0.4 0.6 0.8 1.0 N(10, 2 2 ) N(10, 4 2 ) N(20, 2 2 ) 10 0 10 20 30 x

Standardnormalfordelingen Der findes uendeligt mange normalfordelinger, men vi kan i praksis klare os med én, nemlig standardnormalfordelingen N(0, 1) Fordelingsfunktionen Φ(x) fremkommer ved integration af tæthedsfunktionen ϕ(x) Tæthedsfunktion Fordelingsfunktion ϕ(x) 0.0 0.1 0.2 0.3 0.4 Φ(x) 0.0 0.2 0.4 0.6 0.8 1.0 3 2 1 0 1 2 3 x 3 2 1 0 1 2 3 x

Eksempel på brug af Φ Antag at vi har lavet en undersøgelse, hvor gennemsnittet af scorene er 17 og standardafvigelsen er 3. Vi antager desuden, at scorene følger en normalfordeling. Vi vil nu gerne kende sandsynligheden for, at en tilfældig score er mindre end 14. Vi normaliserer ved at beregne den såkaldte z-værdi: z = x X s = 14 17 3 = 1 Ved opslag i Tabel A kan vi nu se at p = P(x 14) = Φ( 1) = 0, 159 Sandsynligheden for at en tilfældig score er mindre en 14 er altså cirka 16%

Eksempel på brug af Φ Antag at vi har lavet en undersøgelse, hvor gennemsnittet af scorene er 17 og standardafvigelsen er 3. Vi antager desuden, at scorene følger en normalfordeling. Vi vil nu gerne kende sandsynligheden for, at en tilfældig score er mindre end 14. Vi normaliserer ved at beregne den såkaldte z-værdi: z = x X s = 14 17 3 = 1 Ved opslag i Tabel A kan vi nu se at p = P(x 14) = Φ( 1) = 0, 159 Sandsynligheden for at en tilfældig score er mindre en 14 er altså cirka 16%

Eksempel på brug af Φ Antag at vi har lavet en undersøgelse, hvor gennemsnittet af scorene er 17 og standardafvigelsen er 3. Vi antager desuden, at scorene følger en normalfordeling. Vi vil nu gerne kende sandsynligheden for, at en tilfældig score er mindre end 14. Vi normaliserer ved at beregne den såkaldte z-værdi: z = x X s = 14 17 3 = 1 Ved opslag i Tabel A kan vi nu se at p = P(x 14) = Φ( 1) = 0, 159 Sandsynligheden for at en tilfældig score er mindre en 14 er altså cirka 16%

Eksempel på brug af Φ Antag at vi har lavet en undersøgelse, hvor gennemsnittet af scorene er 17 og standardafvigelsen er 3. Vi antager desuden, at scorene følger en normalfordeling. Vi vil nu gerne kende sandsynligheden for, at en tilfældig score er mindre end 14. Vi normaliserer ved at beregne den såkaldte z-værdi: z = x X s = 14 17 3 = 1 Ved opslag i Tabel A kan vi nu se at p = P(x 14) = Φ( 1) = 0, 159 Sandsynligheden for at en tilfældig score er mindre en 14 er altså cirka 16%

Eksempel på brug af Φ Antag at vi har lavet en undersøgelse, hvor gennemsnittet af scorene er 17 og standardafvigelsen er 3. Vi antager desuden, at scorene følger en normalfordeling. Vi vil nu gerne kende sandsynligheden for, at en tilfældig score er mindre end 14. Vi normaliserer ved at beregne den såkaldte z-værdi: z = x X s = 14 17 3 = 1 Ved opslag i Tabel A kan vi nu se at p = P(x 14) = Φ( 1) = 0, 159 Sandsynligheden for at en tilfældig score er mindre en 14 er altså cirka 16%

1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol med normalfordelingen 5 Normalfordeling med Excel 6 Opsamling

Modelkontrol Vi er ofte interesserede i at se, hvor godt vores stikprøve egentlig stemmer overens med normalfordelingsantagelsen For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventede antal observationer i et bestemt interval under antagelsen om normalitet og sammenligner med det observerede Vi beregner x = 208, 9 og s = 9, 79 For klassen afgrænset ved (204, 5; 209, 5] beregnes to z-værdier til -0,45 og 0,06 Via Tabel A findes tilhørende sandsynligheder p som 0,326 og 0,524 Sandsynligheden for at være i intervallet er derfor 0,524-0,326 = 0,198 Da stikprøven omfatter 40 enheder forventer vi at finde 40 0, 198 = 7, 92 enheder i intervallet Der var faktisk 9...

Modelkontrol Vi er ofte interesserede i at se, hvor godt vores stikprøve egentlig stemmer overens med normalfordelingsantagelsen For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventede antal observationer i et bestemt interval under antagelsen om normalitet og sammenligner med det observerede Vi beregner x = 208, 9 og s = 9, 79 For klassen afgrænset ved (204, 5; 209, 5] beregnes to z-værdier til -0,45 og 0,06 Via Tabel A findes tilhørende sandsynligheder p som 0,326 og 0,524 Sandsynligheden for at være i intervallet er derfor 0,524-0,326 = 0,198 Da stikprøven omfatter 40 enheder forventer vi at finde 40 0, 198 = 7, 92 enheder i intervallet Der var faktisk 9...

Modelkontrol Vi er ofte interesserede i at se, hvor godt vores stikprøve egentlig stemmer overens med normalfordelingsantagelsen For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventede antal observationer i et bestemt interval under antagelsen om normalitet og sammenligner med det observerede Vi beregner x = 208, 9 og s = 9, 79 For klassen afgrænset ved (204, 5; 209, 5] beregnes to z-værdier til -0,45 og 0,06 Via Tabel A findes tilhørende sandsynligheder p som 0,326 og 0,524 Sandsynligheden for at være i intervallet er derfor 0,524-0,326 = 0,198 Da stikprøven omfatter 40 enheder forventer vi at finde 40 0, 198 = 7, 92 enheder i intervallet Der var faktisk 9...

Modelkontrol Vi er ofte interesserede i at se, hvor godt vores stikprøve egentlig stemmer overens med normalfordelingsantagelsen For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventede antal observationer i et bestemt interval under antagelsen om normalitet og sammenligner med det observerede Vi beregner x = 208, 9 og s = 9, 79 For klassen afgrænset ved (204, 5; 209, 5] beregnes to z-værdier til -0,45 og 0,06 Via Tabel A findes tilhørende sandsynligheder p som 0,326 og 0,524 Sandsynligheden for at være i intervallet er derfor 0,524-0,326 = 0,198 Da stikprøven omfatter 40 enheder forventer vi at finde 40 0, 198 = 7, 92 enheder i intervallet Der var faktisk 9...

Modelkontrol Vi er ofte interesserede i at se, hvor godt vores stikprøve egentlig stemmer overens med normalfordelingsantagelsen For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventede antal observationer i et bestemt interval under antagelsen om normalitet og sammenligner med det observerede Vi beregner x = 208, 9 og s = 9, 79 For klassen afgrænset ved (204, 5; 209, 5] beregnes to z-værdier til -0,45 og 0,06 Via Tabel A findes tilhørende sandsynligheder p som 0,326 og 0,524 Sandsynligheden for at være i intervallet er derfor 0,524-0,326 = 0,198 Da stikprøven omfatter 40 enheder forventer vi at finde 40 0, 198 = 7, 92 enheder i intervallet Der var faktisk 9...

Modelkontrol Vi er ofte interesserede i at se, hvor godt vores stikprøve egentlig stemmer overens med normalfordelingsantagelsen For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventede antal observationer i et bestemt interval under antagelsen om normalitet og sammenligner med det observerede Vi beregner x = 208, 9 og s = 9, 79 For klassen afgrænset ved (204, 5; 209, 5] beregnes to z-værdier til -0,45 og 0,06 Via Tabel A findes tilhørende sandsynligheder p som 0,326 og 0,524 Sandsynligheden for at være i intervallet er derfor 0,524-0,326 = 0,198 Da stikprøven omfatter 40 enheder forventer vi at finde 40 0, 198 = 7, 92 enheder i intervallet Der var faktisk 9...

Modelkontrol Vi er ofte interesserede i at se, hvor godt vores stikprøve egentlig stemmer overens med normalfordelingsantagelsen For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventede antal observationer i et bestemt interval under antagelsen om normalitet og sammenligner med det observerede Vi beregner x = 208, 9 og s = 9, 79 For klassen afgrænset ved (204, 5; 209, 5] beregnes to z-værdier til -0,45 og 0,06 Via Tabel A findes tilhørende sandsynligheder p som 0,326 og 0,524 Sandsynligheden for at være i intervallet er derfor 0,524-0,326 = 0,198 Da stikprøven omfatter 40 enheder forventer vi at finde 40 0, 198 = 7, 92 enheder i intervallet Der var faktisk 9...

Modelkontrol Vi er ofte interesserede i at se, hvor godt vores stikprøve egentlig stemmer overens med normalfordelingsantagelsen For Tabel 2.5 (vokalvarighed i ms) beregner vi det forventede antal observationer i et bestemt interval under antagelsen om normalitet og sammenligner med det observerede Vi beregner x = 208, 9 og s = 9, 79 For klassen afgrænset ved (204, 5; 209, 5] beregnes to z-værdier til -0,45 og 0,06 Via Tabel A findes tilhørende sandsynligheder p som 0,326 og 0,524 Sandsynligheden for at være i intervallet er derfor 0,524-0,326 = 0,198 Da stikprøven omfatter 40 enheder forventer vi at finde 40 0, 198 = 7, 92 enheder i intervallet Der var faktisk 9...

Grafisk modelkontrol Vokalvarighed [ms] Antal 0 2 4 6 8 10 (184.5; 189.5] (189.5; 194.5] (194.5; 199.5] (199.5; 204.5] (204.5; 209.5] (209.5; 214.5] (214.5; 219.5] (219.5; 224.5] (224.5; 229.5] Observeret Forventet (229.5; 234.5] Vokalvarighed [ms]

Grafisk modelkontrol Vokalvarighed [ms] Antal 0 2 4 6 8 10 (184.5; 189.5] (189.5; 194.5] (194.5; 199.5] (199.5; 204.5] (204.5; 209.5] (209.5; 214.5] (214.5; 219.5] (219.5; 224.5] (224.5; 229.5] (229.5; 234.5] Observeret Forventet

1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol med normalfordelingen 5 Normalfordeling med Excel 6 Opsamling

Normalfordeling i Excel Der kan beregnes værdier for både f (x) og F (x) for vilkårlige normalfordelinger med funktionen normfordeling(...), der tager fire argumenter: værdi af x middelværdi µ spredning σ kumulativ: 0 betyder nej (der regnes med f ) og 1 betyder ja (der regnes med F ) Der kan findes fraktiler for vilkårlige normalfordelinger med funktionen norminv(...), der tager tre argumenter: sandsynlighed p middelværdi µ spredning σ Dette svarer til at finde x p i ligningen F (x p ) = p x p = F 1 (p)

Normalfordeling i Excel Der kan beregnes værdier for både f (x) og F (x) for vilkårlige normalfordelinger med funktionen normfordeling(...), der tager fire argumenter: værdi af x middelværdi µ spredning σ kumulativ: 0 betyder nej (der regnes med f ) og 1 betyder ja (der regnes med F ) Der kan findes fraktiler for vilkårlige normalfordelinger med funktionen norminv(...), der tager tre argumenter: sandsynlighed p middelværdi µ spredning σ Dette svarer til at finde x p i ligningen F (x p ) = p x p = F 1 (p)

Normalfordeling i Excel Ønsker man at finde værdier i standardnormalfordelingen kan man benytte funtionerne standardnormfordeling(...) og standardnorminv(...), der tager ét argument hver... men det er nok lige så nemt at angive µ = 0 og σ = 1 i de generelle funktioner I praksis bruger vi stort set kun tæthedsfunktionen når vi skal tegne pæne klokkeformede kurver det er næsten altid fordelingsfunktionen, der er den interessante

Normalfordeling i Excel Ønsker man at finde værdier i standardnormalfordelingen kan man benytte funtionerne standardnormfordeling(...) og standardnorminv(...), der tager ét argument hver... men det er nok lige så nemt at angive µ = 0 og σ = 1 i de generelle funktioner I praksis bruger vi stort set kun tæthedsfunktionen når vi skal tegne pæne klokkeformede kurver det er næsten altid fordelingsfunktionen, der er den interessante

Normalfordeling i Excel Ønsker man at finde værdier i standardnormalfordelingen kan man benytte funtionerne standardnormfordeling(...) og standardnorminv(...), der tager ét argument hver... men det er nok lige så nemt at angive µ = 0 og σ = 1 i de generelle funktioner I praksis bruger vi stort set kun tæthedsfunktionen når vi skal tegne pæne klokkeformede kurver det er næsten altid fordelingsfunktionen, der er den interessante

1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol med normalfordelingen 5 Normalfordeling med Excel 6 Opsamling

Opsamling Normalfordelingen er en ofte benyttet model for delvist observerede populationer, idet fordelingens parametre kan estimeres fra en stikprøve Normalfordelingen har to parametre, middelværdi µ og spredning σ, og vi skriver N(µ, σ 2 ) Standardnormalfordelingen N(0, 1) kan benyttes til beregninger i andre normalfordelinger via en z-værdi z = x µ σ Således beregnes sandsynligheden P(X < x), hvor X N(µ 0, σ0 2) ved ( ) x µ0 p = Φ hvor Φ er fordelingsfunktionen for standardnormalfordelingen. σ 0

Opsamling Normalfordelingen er en ofte benyttet model for delvist observerede populationer, idet fordelingens parametre kan estimeres fra en stikprøve Normalfordelingen har to parametre, middelværdi µ og spredning σ, og vi skriver N(µ, σ 2 ) Standardnormalfordelingen N(0, 1) kan benyttes til beregninger i andre normalfordelinger via en z-værdi z = x µ σ Således beregnes sandsynligheden P(X < x), hvor X N(µ 0, σ0 2) ved ( ) x µ0 p = Φ hvor Φ er fordelingsfunktionen for standardnormalfordelingen. σ 0

Opsamling Normalfordelingen er en ofte benyttet model for delvist observerede populationer, idet fordelingens parametre kan estimeres fra en stikprøve Normalfordelingen har to parametre, middelværdi µ og spredning σ, og vi skriver N(µ, σ 2 ) Standardnormalfordelingen N(0, 1) kan benyttes til beregninger i andre normalfordelinger via en z-værdi z = x µ σ Således beregnes sandsynligheden P(X < x), hvor X N(µ 0, σ0 2) ved ( ) x µ0 p = Φ hvor Φ er fordelingsfunktionen for standardnormalfordelingen. σ 0

Opsamling Normalfordelingen er en ofte benyttet model for delvist observerede populationer, idet fordelingens parametre kan estimeres fra en stikprøve Normalfordelingen har to parametre, middelværdi µ og spredning σ, og vi skriver N(µ, σ 2 ) Standardnormalfordelingen N(0, 1) kan benyttes til beregninger i andre normalfordelinger via en z-værdi z = x µ σ Således beregnes sandsynligheden P(X < x), hvor X N(µ 0, σ0 2) ved ( ) x µ0 p = Φ hvor Φ er fordelingsfunktionen for standardnormalfordelingen. σ 0