Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Størrelse: px
Starte visningen fra side:

Download "Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala"

Transkript

1 3 5% 5% 5% Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter på session: Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala Influerende faktorer: Gener Miljø under opvækst: Energi Proteiner vitaminer Sygdomme Stress P(X) M6, slide M6, slide 4 (normalfordelingen) Gængse matematiske sandsynlighedsfordelinger: M6, slide Diskrete data: Den positive binomialfordeling Poisson-fordelingen Den negative binomialfordeling Kontinuerte data: Normalfordelingen/-fordelingen t-fordelingerne χ -fordelingerne, F-fordelingerne p( Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Kropsvægte af duehøge-hunner: Influerende faktorer: Gener Miljø: Energi Proteiner vitaminer Sygdomme Stress I realiteten er biologiske fordelinger kun tilnærmelsesvist normalfordelte, da nogle faktorer er vigtigere end andre. M6, slide 5 (normalfordelingen) Normalfordelingen Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. P(X) -Derfor tilnærmes binomialfordelingen og Poisson-fordelingen sig også normalfordelingen, når >9. Kontinuert sandsynlighedsfordeling Opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. P( M6, slide 3 (normalfordelingen) M6, slide 6 (normalfordelingen)

2 Normalfordelingens parametre: P( e π µ Enhver normalfordeling kan beskrives ud fra parametrene µ og µ: Fordelingens middelværdi : Fordelingens standardafvigelse M6, slide 7 (normalfordelingen) P(X) Tabel af de kumulerede værdier af den standardiserede normalfordeling, -fordelingen Σ P() -3,0 0,003 -,5 0,006 -,0 0,08 -,9 0,088 -,8 0,0360 -,7 0,0447 -,6 0,0549 -,5 0,0669 -,4 0,0809 -,3 0,0970 -, 0,5 -, 0,358 -,0 0,588-0,9 0,84-0,8 0,0-0,7 0,4-0,6 0,744-0,5 0,3087-0,4 0,3447-0,3 0,38-0, 0,408-0, 0,460 0,0 0,5000 M6, slide 0 (-fordelingen) Σ P() 0, 0,5398 0, 0,579 0,3 0,678 0,4 0,6553 0,5 0,693 0,6 0,756 0,7 0,7578 0,8 0,7879 0,9 0,857 0,84, 0,864, 0,8847,3 0,9030,4 0,990,5 0,9330,6 0,9450,7 0,9553,8 0,9639,9 0,97 0,977,5 0, ,9986 Kummuleret P() (-µ)/ P( ( - µ)/ P( ( - µ)/ Kummuleret P() Gælder altid for normalfordelinger: 68.6% af arealet ligger i intervallet µ± 95.44% af arealet ligger i intervallet µ± 99.74% af arealet ligger i intervallet µ± af arealet ligger i intervallet µ±.96 M6, slide 8 (normalfordelingen) (-µ)/ Fra ΣP() kan man estimere sandsynligheden for at et stokastisk udfald afviger fra en normalfordeling med en kendt middelværdi og standardafvigelse: -tailed: hvad er sandsynligheden for at et udfald vil antage en værdi afvigende fra µ i én bestemt retning? -tailed : Hvad er sandsynligheden for at et udfald vil antage en værdi afvigende fra µ i den ene eller anden retning? M6, slide (-fordelingen) Kummuleret P() (-µ)/ P( ( - µ)/ Den standardiserede normalfordeling, -fordelingen Eksempel: µ P() ( - µ)/ P( e π µ Da sandsynlighedsfunktionen af en enhver normalfordeling er den samme for ( - µ)/, re-skaleres normalfordelte data til denne størrelse,. Længden af -årige sild følger en normalfordeling med parametrene: µ.5 cm,.3 cm Hvor sandsynligt vil det være at én - årig sild vil være mindst 5. cm lang? (5..5)/.3.0 M6, slide 9 (-fordelingen) M6, slide (-fordelingen)

3 Z (5..5)/.3.0 Kummuleret P() M6, slide 3 (-fordelingen) (-µ)/ P(.0) Σ P(......,8 0,964,9 0,97 0,977, 0,98, 0,986,3 0,989,4 0, µ Sikkerhedsinterval for enkeltobservationer af normalfordelte data: Nu isolerer vi i ligningen: µ ± α µ ± α µ α < < µ + α P ( < < µ + ) α µ α α α signifikansniveauet α angiver sandsynligheden for at (værdien af en ny observation) afviger fra populationens middelværdi med mere end gange populationens standardafvigelse M6, slide 6 (-fordelingen) Z (5..5)/.3.0 Kummuleret P() (-µ)/ ( - µ)/ P(.0) der er.3% chance for at en -årig sild vil være 5. cm lang eller længere M6, slide 4 (-fordelingen) P(. µ Sikkerhedsinterval for enkeltobservationer af normalfordelte data: P( < < µ + ) α µ α α Sikkerhedsintervallet omkring µ angiver det interval, hvori værdien af den stokastiske variabel kan forventes at befinde sig med en given sandsynlighed: P( ( - µ)/ 95% sikkerhedsintervallet angiver det interval, som indeholder 95% af alle enkelt-observationer. 95% sikkerhedsintervallet angiver det interval, som en ny observation med 95% sikkerhed vil befinde sig inden for. M6, slide 7 (-fordelingen) Z (5..5)/.3.0 Kummuleret P() (-µ)/ P( P( ) ( 0.977) der er 4.6% chance for at en -årig sild afviger.6 cm eller mere fra populationens M6, slide 5 (-fordelingen) middelværd (two-tailed) µ ( - µ)/ Eksempel : µ.5cm,.3cm Hvilke maksimum- og minimumværdier for kropslængde vil 95% og 99% af populationen befinder sig inden for? P(.960) 95%; P(ll.576) 99% 0 95%-grænser: ± (.5cm)/.3 cm ± ±.96.3 cm.5 ±.55 cm {9.95 cm; 5.05 cm} 95% af observationerne vil være længere end 9.95 cm, men kortere end 5.05 cm 99%-grænser: ± (.5)/.3 ± ±.59.3 cm.5 ± 3.35 cm {9.5 cm; 5.85 cm} 99% af observationerne vil være længere end 9.5 cm, men kortere end 5.85 cm M6, slide 8 (-fordelingen) P( ( - µ)/ µ ± c µ ±

4 Hvordan kan vi vide om en fordeling er normalfordelt? Se på data: Ser fordelingen nogenlunde normalfordelt ud? Ligger ca. 7 af observationerne inden for ±s? Div. grafiske metoder (qq-plot, nf-papir) Goodness-of-fit test: Uanvendelig ved små stikprøvestørrelser straffer meget store stikprøvestørrelser. M6, slide 9 Vi skal om lidt se at det sjældent er så vigtigt at en fordeling af observationer er normalfordelt, blot gennemsnittet er normalfordelt mere herom senere.. t-fordelingen Der eksisterer en t-fordeling for hver værdi af ν. (ν df. {,,3... }) -fordelingen er et særtilfælde af t- fordelingen, hvor ν I praksis er der minimal forskel på de to fordelinger når ν > 00. Signifikansniveauer af t ν er tabellagt i Appendi i F, C& J M6, slide (t-fordelingen) t-fordelingen Hvis vores middelværdi og standardafvigelse er estimeret fra en stikprøve, erstattes -fordelingen med t-fordelingen: µ t ν µ s Sikkerhedsgrænser omkring en middelværdi t for n (i praksis for n > 00) M6, slide 0 (t-fordelingen) M6, slide 3 (sikkerhedsgrænser omkring en middelværdi) t-fordelingerne er fladere end -fordelingen. Et gennemsnit af en stikprøve er også en stokastisk variabel Udfaldsrummet vil være det samme som for populationen som helhed Men hvad med spredningen på gennemsnittet (usikkerheden på estimatet af µ)? M6, slide (t-fordelingen) M6, slide 4 (sikkerhedsgrænser omkring en middelværdi)

5 Eksempel: Kropsvægte af 37 duehøgehunner dræbt i kollisioner: Fordeling af enkeltobservationer: Eksempel: 00 tilfældige tal 0-00: Fordeling af enkeltobservationer: M6, slide 5 (sikkerhedsgrænser omkring en middelværdi) M6, slide 8 (sikkerhedsgrænser omkring en middelværdi) Eksempel: Kropsvægt af 37 duehøgehunner dræbt i kolisioner: Fordeling af 00 gennemsnitsværdier, baseret på hver 5 enkeltobservationer: Eksempel: tilfældige tal 0-00: Fordeling af gennemsnitsværdier (n5) M6, slide 6 (sikkerhedsgrænser omkring en middelværdi) M6, slide 9 (sikkerhedsgrænser omkring en middelværdi) Gennemsnittene er normalfordelte! Eksempel: tilfældige tal 0-00: Fordeling af gennemsnitsværdier (n0) Fordeling af enkeltobservationer: Fordeling af 00 gennemsnit, hver baseret på 5 enkeltobservationer: M6, slide 7 (sikkerhedsgrænser omkring en middelværdi) M6, slide 30 (sikkerhedsgrænser omkring en middelværdi)

6 Eksempel: tilfældige tal 0-00: Fordeling af gennemsnitsværdier (n30) Spredningen på et gennemsnit: s ( s ( n s ( s( s( n n s ( variansen af enkeltobservationer s ( variansen af gennemsnittene n antal observationer, som indgår i beregning af M6, slide 3 (sikkerhedsgrænser omkring en middelværdi) M6, slide 34 (sikkerhedsgrænser omkring en middelværdi) Eksempel: tilfældige tal 0-00: Fordeling af gennemsnitsværdier (n30) Spredningen af enkeltobservationer omkring middelværdien (µ) standard deviation of the observations,standard deviation s( SD( SD s ( n M6, slide 3 (sikkerhedsgrænser omkring en middelværdi) Udsnit af -akse forstørret Spredningen af gennemsnittene omkring middelværdien (µ) Standard deviation of the means, standard error of the mean s( SD s ( SD( SE( SE n n M6, slide 35 (sikkerhedsgrænser omkring en middelværdi) Den centrale grænseværdisætning! Gennemsnittene af et stort antal stikprøver vil være normalfordelt med den samme µ som den oprindelige population. Dette gælder uanset hvilken type fordeling enkeltobservationerne følger! Spredningen på gennemsnittet bliver mindre, når antallet af observationer øger! Duehøges vægt Tal 0-00 n s( s( s( s( n M6, slide 33 (sikkerhedsgrænser omkring en middelværdi) M6, slide 36 (sikkerhedsgrænser omkring en middelværdi)

7 Konventionelle forkortelser SD ( standard deviation ) standardafvigelsen af enkeltobservationer SE ( standard error ) standardafvigelsen af et parameterestimat (her: gennemsnittet) M6, slide 37 (sikkerhedsgrænser omkring en middelværdi) Eksempel: Kropsvægte af 37 duehøge-hunner. 087g SD 93g n 37 Hvad er 95%-sikkerhedsintervallet omkring den sande middelværdi (µ) af duehøge-hunners vægt? M6, slide 40 (sikkerhedsgrænser omkring en middelværdi) Sikkerhedsgrænser for den sande middelværdi: Spredning af enkeltobservationer: µ tν s Spredning af gennemsnitsværdierne: M6, slide 38 (sikkerhedsgrænser omkring en middelværdi) t ν µ µ s SE( n 087g, SD 93g, n 37 95%-sikkerhedsintervallet omkring den sande middelværdi (µ): P t SE( < < + t SE( )) α ( µ SE( SD/(n) ½ 93/(37) ½ 5.0g t (37-)0.05 α P( g< µ< g) 0.95 Den sande middelværdi for kropsvægten af duehøgehunner P(038 ligger g< med µ<36 95% sandsynlighed g) 0.95 mellem 038 og 36 g! M6, slide 4 (sikkerhedsgrænser omkring en middelværdi) Sikkerhedsgrænser for den sande middelværdi: t ν µ µ s SE( n ( µ P tν < < tν α ) α SE(, P t SE( < < + t SE( )) α ( µ M6, slide 39 (sikkerhedsgrænser omkring en middelværdi) 087g, SD 93g, n 37, SE( 5.0g 99% og 99.9%-sikkerhedsintervallet omkring den sande middelværdi (µ)? P t SE( < < + t SE( )) α ( µ t (37-) 0.0 α t (37-) 0.00 α M6, slide 4 (sikkerhedsgrænser omkring en middelværdi) P( < µ< ) 0.99 P(03<µ<5) 0.99

8 Sikkerhedsgrænser omkring den sande middelværdi for vægten af duehøge-hunner: -α α P(038 g< µ<36 g) P(03 g <µ<5g ) P(005 g<µ<69 g) P(990 g<µ<84 g) Sikkerhedsgrænser for en difference mellem to middelværdier: Eksempel: Skinnebenslængde målt i to græshoppe-populationer: 7.43 mm, s 0.055, n 7.64 mm, s 0.005, n 8 Hvor meget afviger de to populationers middelværdi: Kan de betragtes som forskellige? Difference: mm 0. mm Hvad er usikkerheden på dette estimat? M6, slide 43 (sikkerhedsgrænser omkring en middelværdi) M6, slide 46 (sikkerhedsgrænser for en difference mellem to middelværdier) Hvordan får vi sikkerhedsgrænserne om µ så smalle som muligt? P( t SE( < µ < + t SE( ) α s s P tν < µ < + tν α n n Sænke konfidensniveauet (-α) Sikkerhedsgrænser for en difference mellem to middelværdier: Hvis, er sikkerhedsgrænserne omkring den sande difference givet ved: P([ ] tν SE[ ] < µ µ < [ ] + tν SE[ ]) α Mindske spredningen på enkeltobservationerne (s, SD) -Hvor: S. E.( ) ( n ) s + ( n ) s n + n n + n nn Øge stikprøvestørrelsen (n) M6, slide 44 (sikkerhedsgrænser omkring en middelværdi) M6, slide 47 (sikkerhedsgrænser for en difference mellem to middelværdier) Sikkerhedsgrænser for en difference mellem to middelværdier: S.E. for differencen ml. middelværdier: S. E.( ) s hvor : s + n n s ( n ) s + ( n ) s n + n n + n n n S. E.( ) ( n ) s + ( n ) s n + n n + n nn M6, slide 45 (sikkerhedsgrænser for en difference mellem to middelværdier) M6, slide 48 (sikkerhedsgrænser for en difference mellem to middelværdier)

9 Græshopper: 95% sikkerhedsgrænser omkring forskel i middelværdi µ µ : 7.43 mm, s 0.055, n 7.64 mm, s 0.005, n 8 ( - 0.) ( n ) s + ( n ) s S. E.( n + n n + n nn S.E. ( Sikkerhedsgrænser omkring en hyppighed P([ ] tν SE[ ] < µ µ < [ ] + tν SE[ ]) α df. +8-8, t P( < µ -µ < )0.95 P(0.0mm< µ -µ < 0.35) 0.95 M6, slide 49 (sikkerhedsgrænser for en difference mellem to middelværdier) M6, slide 5 (sikkerhedsgrænser for en hyppighed) Test for varianshomogenitet F-test Det er en forudsætning for pålidelig beregning af forskel i µ, at de forskellige stikprøver har ens varians H 0 : De to stikprøver har ens varians ( ). H : De to stikprøver har forskellig varians ( ). S F ma νν Smin ν antal frihedsgrader for S ma og ν antal frihedsgrader for S min. (Appendi 8 i F,C & J 998) (NB! Der er flere forskellige slags F-tests. Mere herom senere. M6, slide 50 (sikkerhedsgrænser for en difference mellem to middelværdier) Sikkerhedsgrænser omkring en hyppighed Standard error for usikkerhed omkring estimatet af en hyppighed: pˆ qˆ pˆ ( pˆ) S. E.( pˆ) n n -hvor ^p, er et estimat af den sande hyppighed, p. Sikkerhedsgrænser omkring en hyppighed: P pˆ t SE[ pˆ] < p < pˆ + t SE[ ˆ]) α ( p -hvor ν df. n - (NB! Kun pålidelig hvis s [ n ^p ^q] > 9) M6, slide 53 (sikkerhedsgrænser for en hyppighed) Græshopper: Tjek for varianshomogenitet 7.43 mm, s 0.055, n 7.64 mm, s 0.005, n 8 H 0 : De to stikprøver har ens varians ( ). H : De to stikprøver har forskellig varians ( ). S F ma νν Smin F, / Appendi 8: p > 0.05 (kritisk værdi.87) H 0 : accepteres: og kan betragtes som ens: Vi kan stole på de beregnede sikkerhedsgrænser omkring differencen i middelværdier Eksempel: Byttedyr i 38 maveprøver af Europæisk los (Lyn lyn: f( P(Hyppighed Rådyr: 57.9% Småvildt: 6 4.% I alt: n38 0 Hvad er 95%-sikkerhedsgrænserne omkring den sande hyppighed af rådyr i diæten? ^p 0.579, n k 38 M6, slide 5 (sikkerhedsgrænser for en difference mellem to middelværdier) M6, slide 54 (sikkerhedsgrænser for en hyppighed)

10 95%-sikkerhedsgrænserne omkring den sande hyppighed af rådyr i diæten:^p0.579, nk38 P pˆ t SE( pˆ) < p < pˆ + t SE( ˆ)) α ( p S n ^p ^q OK! S.E.(^p) ( /[38-]) ½ 0.08 t 37, P( <p< ) 0.95 P(0.45<p<0.743)0.95 Konklusion: Rådyr udgør med 95% sikkerhed mellem 4% og 74% af de nedlagte byttedyr M6, slide 55 (sikkerhedsgrænser for en hyppighed) Rådyr udgør med 95% sikkerhed mellem 4% og 74% af de nedlagte byttedyr Diætandel rådyr småvildt Småvildt udgør med 95% sikkerhed mellem 6% (-0.743) og 59% (-0.45) af de nedlagte byttedyr. M6, slide 56 (sikkerhedsgrænser for en hyppighed) Tjekliste, Modul 6 (uge 49): * normalfordeling, µ, * -, t-fordeling * Tjek for normalfordeling af data * SD, SE * Den centrale grænseværdisætning * Sikkerhedsinterval omkring middelværdi * Sikkerhedsinterval omkring difference ml. middelværdier *F-fordeling, Varianshomogenitets-test * Sikkerhedsinterval omkring hyppighed (Læs også gerne på transformation af data) M6, slide 57 (tjekliste)

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala Statistik for biologer 005-6, modul 5: Sadsylighedsfordeliger for kotiuerte data på iterval/ratioskala M6, slide Gægse matematiske sadsylighedsfordeliger: Diskrete data: De positive biomialfordelig Poisso-fordelige

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Løsninger til kapitel 9

Løsninger til kapitel 9 Opgave 9.1 a) test for spredning, ensidet b) test for middelværdi, ensidet c) test for andel, ensidet d) test for to andele, ensidet e) test for spredning, tosidet f) test for middelværdi, ensidet g) test

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel: Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3 Landmålingens fejlteori Repetition - Kontinuerte stokastiske variable Lektion 4 - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf10 Institut for Matematiske Fag Aalborg Universitet 29. april

Læs mere

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Løsninger til kapitel 6

Løsninger til kapitel 6 Opgave 6.1 a) 180 200 P ( X < 180) = Φ = Φ( = 0, 1587 b) 220 200 P ( X > 220) = Φ = Φ(1) = 0, 8413 c) 200 200 P ( X > 200) = 1 X < 200) = 1 Φ = ) = 1 0,5 = 0, 5 d) P ( X = 230) = 0 e) 180 200 P ( X 180)

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Estimation og usikkerhed

Estimation og usikkerhed Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Matematik/Statistik. statistik. Forelæser og ansvarlig for kursets statistikdel: Peter Sunde Afd. f. Populationsbiologi

Matematik/Statistik. statistik. Forelæser og ansvarlig for kursets statistikdel: Peter Sunde Afd. f. Populationsbiologi Matematik/Statistik statistik Forelæser og ansvarlig for kursets statistikdel: Peter Sunde Afd. f. Populationsbiologi PSunde@bi.ku.dk M1, slide 1 Dagens prædiken: Introduktion til kurset Praktiske oplysninger

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

M1, slide 4 (Introduktion til kurset: praktiske oplysninger) M1, slide 5 (Introduktion til kurset: praktiske oplysninger)

M1, slide 4 (Introduktion til kurset: praktiske oplysninger) M1, slide 5 (Introduktion til kurset: praktiske oplysninger) Matematik/Statistik statistik Forelæser og ansvarlig for kursets statistikdel: Peter Sunde Afd. f. Populationsbiologi PSunde@bi.ku.dk Statistik - 9 dobbeltforelæsninger (uge -) ugentlige øvelsestimer (sammen

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Uge 10 Teoretisk Statistik 1. marts 2004

Uge 10 Teoretisk Statistik 1. marts 2004 1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Statistisk Model Indhold Binomialfordeling Sandsynlighedsfunktion Middelværdi og spredning 1 Aalen: Innføring i statistik med medisinske eksempler

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Besvarelser til øvelsesopgaver i uge 6

Besvarelser til øvelsesopgaver i uge 6 Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret.

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Lidt om fordelinger, afledt af normalfordelingen

Lidt om fordelinger, afledt af normalfordelingen IMM, 2002-10-10 Poul Thyregod Lidt om fordelinger, afledt af normalfordelingen 1 Introduktion I forbindelse med inferens i normalfordelinger optræder forskellige fordelinger, der er afledt af normalfordelingen,

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Forelæsning 2: Kapitel 4, Diskrete fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Hvorfor er det lige at vi skal lære det her?

Hvorfor er det lige at vi skal lære det her? Lektion 8 Stokastiske variable En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Vejledende løsninger kapitel 8 opgaver

Vejledende løsninger kapitel 8 opgaver KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 3. februar 005 Morten Frydenberg, Afdeling for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (ud

Læs mere

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Binomialfordelingen. X ~ bin(n,p): X = antal succeser i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes. Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Sandsynlighedsregning

Sandsynlighedsregning Mogens Bladt www2.imm.dtu.dk/courses/02405 21. September, 2007 Lidt om binomialkoefficienter n størrelsen af en mængde/population. Vi ønsker at udtage en sub population af størrelse r. To sub populationer

Læs mere

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 8. november 2011 Videnskabelig hypotese Planlægning af et studie Endpoints Forsøgsplanlægning Stikprøvestørrelse 1 51 Instrumentelle/eksponerings variable Variationskilder

Læs mere