Tidlige eksempler. Susanne Ditlevsen Institut for Matematiske Fag susanne

Størrelse: px
Starte visningen fra side:

Download "Tidlige eksempler. Susanne Ditlevsen Institut for Matematiske Fag susanne"

Transkript

1 Statistik og Sandsynlighedsregning Repetition Statistik Susanne Ditlevsen Institut for Matematiske Fag susanne New England Journal of Medicine gav i 2000 et bud på de most important medical developments of the past millenium. En af dem var Application of statistics to medicine Det stod nævnt side om side med f.eks Elucidation of human anatomy and physiology Editors, 2000) 9. undervisningsuge 2 Tidlige eksempler 747: James Lind randomiserede 2 skørbugspatienter til 6 forskellige behandlinger cider, vitriol eliksir, eddike, havvand, citrusfrugter og en eliksir bestående af bl.a. muskatnød, hvidløg, sennep og myrra) om bord på skibet Salisbury. 3 4

2 Tidlige eksempler 747: James Lind randomiserede 2 skørbugspatienter til 6 forskellige behandlinger cider, vitriol eliksir, eddike, havvand, citrusfrugter og en eliksir bestående af bl.a. muskatnød, hvidløg, sennep og myrra) om bord på skibet Salisbury. 847: Ignaz Semmelweis opdagede sammenhæng mellem forurening fra lig og barselsfeber. Ved at kræve at hospitalspersonalet skulle vaske hænder efter at have skåret i lig inden de gik ind på fødestuen, nedsattes barselsfeberdødeligheden fra 2% til 2%. 5 6 Tidlige eksempler 747: James Lind randomiserede 2 skørbugspatienter til 6 forskellige behandlinger cider, vitriol eliksir, eddike, havvand, citrusfrugter og en eliksir bestående af bl.a. muskatnød, hvidløg, sennep og myrra) om bord på skibet Salisbury. 847: Ignaz Semmelweis opdagede sammenhæng mellem forurening fra lig og barselsfeber. Ved at kræve at hospitalspersonalet skulle vaske hænder efter at have skåret i lig inden de gik ind på fødestuen, nedsattes barselsfeberdødeligheden fra 2% til 2%. 854: John Snow viste at kolera smitter igennem forurenet vand. Endnu en stor epidemi hærgede i Soho i London, og han opdagede at alle døde havde drukket fra den samme gadebrønd. Brønden blev lukket og epidemien blev standset

3 Repetition Observation En vektor af tal x x,..., x n ) E. x repræsenterer udfaldet af et eller flere) eksperimenter, og antages at være værdien af en stokastisk variabel X X,..., X n ). Udfaldsrum E IR n. E er mængden af alle mulige udfald. Mulige sandsynlighedsfordelinger På E har vi mængden af mulige sandsynlighedsfordelinger for X. 9 0 Hvad er en statistisk model? Afgrænsningen af de mulige sandsynlighedsfordelinger formaliserer vor forhåndsviden eller vore forhåndsantagelser om problemet. De enkelte fordelinger formaliserer den usikkerhed der er forbundet med observationerne. Mængden af mulige sandsynlighedsfordelinger formaliserer den uvidenhed vi har om de mekanismer, der har frembragt observationerne. Formålet med den statistiske analyse er at fjerne noget af uvidenheden om de bagvedliggende mekanismer, der har frembragt observationen. Statistisk model Mængden af sandsynligheder skal kunne indiceres ved en parameter θ Θ IR d. Statistisk model. E, P θ ) θ Θ ), hvor P θ ) θ Θ er en familie af sandsynligheder på E. Parameterområde. Parameterområdet Θ IR d er en indeksmængde for familien af sandsynligheder i modellen. θ Θ er parameteren. 2

4 Estimatorer At vælge en fordeling på grundlag af observationen x kaldes at estimere eller på dansk at skønne). Formålet er at vælge den sandsynlighedsfordeling i modellen, der i en eller anden forstand passer bedst med vores observation. Fordelingen P θ identificeres ofte med parameteren θ, så man estimerer parameteren θ. En estimator bliver så en afbildning fra E ind i Θ, altså en afledt) stokastisk variabel med en fordeling. En god estimator skal være central: E ˆθ θ. Den skal have lille varians. Hypotese Formålet med en statistisk analyse er ofte at undersøge en eller flere på forhånd opstillede hypoteser. Hypotesen skal kunne identificeres med nogle bestemte fordelinger i modellen, og svarer således til en mindre familie af sandsynlighedsfordelinger på udfaldsrummet E P θ ) θ Θ0 Hypotesen betegnes ofte med H og skrives hvor P θ ) θ Θ0 P θ ) θ Θ H : θ Θ Test for simpel hypotese Teststørrelse Et test er en metode til at afgøre, om observationen x kan antages at svare til et P θ i hypotesen. Vi har Den fulde model: M : θ Θ Hypotesen: H : θ θ 0 Alle mulige udfald observationer) ordnes efter, hvor godt de stemmer overens med hypotesen. En sådan ordning kan opfattes som en afbildning T fra E ind i IR, hvor bestemte værdier af T repræsenterer god henholdsvis dårlig tilpasning. T kaldes en teststørrelse. Testsandsynlighed Antag at T x ) T x) betyder at x passer mindst lige så dårligt med hypotesen som x. Vi bruger teststørrelsen til at måle, hvor god tilpasningen er ved hjælp af testsandsynligheden ɛx) P θ0 {x E : T x ) T x)} P θ0 T X) T x)) Testsandsynligheden udtrykker sandsynligheden for at få en observation der passer dårligere end det vi har observeret under antagelsen om, at hypotesen er opfyldt, altså at observationerne stammer fra P θ0. Hypotesen accepteres hvis observationen viser tilstrækkelig god overensstemmelse. Hypotesen forkastes hvis overensstemmelsen er for dårlig. 5 6

5 Signifikansniveau og kritisk område Man forkaster hypotesen H : θ θ 0 på niveau α, eller siger at testet udviser signifikans på niveau α hvis ɛx) α Lad α ]0, [ være signifikansniveau ved test af hypotesen H. Da er det kritiske område givet ved K α KH, α) {x E : ɛx) α} Fejl af type I og II Funktion af observationen x H accepteres H forkastes H er sand OK Type I fejl ukendt) α H er falsk Type II fejl OK ukendt) β 7 8 Likelihoodmetoden Metode til konstruktion af estimatorer og teststørrelser. P θ er diskret med sandsynlighedsfunktion p θ θ Θ. Likelihoodfunktion : L : E Θ [0, ] Lx, θ) p θ x) Lx, θ) er sandsynligheden for at få observationen x, når X s fordeling er P θ. Maximum likelihood estimator Definition) Maximum likelihood estimatoren fås ved at vælge den sandsynlighedsfordeling i modellen, der passer bedst med vores observation i følgende forstand: ˆθ ˆθx) Θ er maximum likelihood estimatoren for θ, hvis Lx, ˆθ) Lx, θ) θ Θ 9 20

6 Beregning af Maximum likelihood estimator Maximum likelihood estimatoren findes ved at maksimalisere L som funktion af θ for fastholdt x, altså en funktionsundersøgelse af L. Dette gøres oftest ved at maksimalisere log-likelihood funktionen: lθ) log Lθ) Udover at angive et punktestimat er det vigtigt at angive hvor nøjagtigt estimatet er. Usikkerheden kan angives med et konfidensinterval. Et α) konfidensinterval, hvor α [0, ], er et interval af formen Y, Y 2 ) hvor Y i g i X,..., X n ), i, 2, er stokastiske variable, således at P θ Y < θ < Y 2 ) α Maximum findes ofte) ved at løse likelihood ligningen d dθ lθ) 0 ˆθ ˆθX) er en afledt) stokastisk variabel med en fordeling Når n er stor kan vi konstruere følgende konfidensinterval ˆθ z α/2 sˆθ ; ˆθ + z α/2 sˆθ) hvor z α/2 er α/2) fraktilen i normalfordelingen. afhænger af fordelingen af X) Vi har Kvotienttest Lx, ˆθ) Lx, θ) θ Θ Lx, ˆθ 0 ) Lx, θ) θ Θ 0 Metode til konstruktion af teststørrelse: Da P θ ) θ Θ0 også er en statistisk model, kan vi definere likelihoodfunktionen under hypotesen L : E Θ 0 [0, ] Lx, θ) p θ x) og beregne maximum likelihood estimatoren ˆθ 0 under hypotesen. og da Θ 0 Θ fås Lx, ˆθ) Lx, ˆθ 0 ) Kvotientteststørrelsen for observationen x defineres ved Qx) Lx, ˆθ 0 x)) Lx, ˆθx)) pˆθ x) 0x) pˆθx) x) Vi har 0 Qx). En observation passer bedre med hypotesen jo større dens Q værdi er

7 Testsandsynlighed Vi ser på mængden {x E : Qx ) Qx)} {QX) Qx)}. Sandsynligheden for at få noget, der er værre end det observerede, hvis den rigtige fordeling er P θ, θ Θ 0, er P θ {QX) Qx)}), θ Θ 0 Testsandsynligheden ɛ for observationen x er givet ved ɛx) sup θ Θ 0 P θ {QX) Qx)}) Hvis testsandsynligheden er stor eksisterer der en fordeling i hypotesen, der giver vores observerede værdi relativ) høj sandsynlighed. Dvs. observationen bekræfter hypotesen. Approximativ fordeling af kvotienttestsstørrelsen Statistisk model E, P θ ) θ Θ ) med hypotese H: θ Θ 0, hvor Θ og Θ 0 har dimension d og d 0, henholdsvis. Når observationsantallet går mod uendelig under passende betingelser, gælder at 2 log QX) er approximativt χ 2 fordelt med d d 0 frihedsgrader: hvor F χ 2 f P θ QX) Qx)) F χ 2 d d0 2 log Qx)), F χ 2 f x) x 0 2 f/2 Γf/2) y f 2 e y 2 dy. er fordelingsfunktionen for χ 2 fordelingen med f frihedsgrader Pearsontest eller χ 2 test Observation X X,..., X k, hvor X i erne er antal. Ud fra maximum likelihood estimatoren beregnes for hvert X i et skøn, ÊX i, for EX) under hypotesen, og man bruger som teststørrelse. X 2 k x i ÊX i) 2 i ÊX i Hvis man kan bruge det approksimative test i kvotienttestet, så vil 2 log Qx) og X 2 med stor sandsynlighed ligge nær hinanden. Testsandsynligheden ɛx) i Pearson testet kan under de samme betingelser som i kvotienttestet approksimeres ved følgende udtryk ɛx) F χ 2 d d0 X 2 ) Eksempel Kønsproportion og familiemønstre.) Register Kvinnefilen), der for alle norske kvinder født efter 935 indeholder oplysninger om køn og fødselsdato for hvert barn. Fordeling af køn for de to første børn. Norge Andet barn Pige Dreng Ialt Første barn Pige Dreng Ialt Er der sammenhæng mellem første og andet barns køn? 27 28

8 Alle børnepar i tabellen har forskellige mødre tvillingefødsler er ikke medtaget). Det er således rimeligt at beskrive andet barns køn ved to uafhængige binomialfordelinger: X Bn, p ): antal piger ved anden fødsel for kvinder hvis første barn er en pige X 2 Bn 2, p 2 ): antal piger ved anden fødsel for kvinder hvis første barn er en dreng Forskningsspørgsmål: Er der sammenhæng mellem de to første børns køn? Hypotesen om uafhængighed ingen sammenhæng) kan identificeres med hvor n og n og H : p p 2 p : sandsynlighed for at andet barn er pige når første barn er pige p 2 : sandsynlighed for at andet barn er pige når første barn er dreng Statistisk model Maximum likelihood estimatorer hvor E, Pp,p 2)) p,p 2) [0,] 2 ) E {0,..., } {0,..., } Maximum likelihood estimator under den fulde model ˆp, ˆp 2 ) x, x ) n n , ) , ) P p,p 2)X x) ) p x x p ) x ) p x2 2 p 2) x2 x 2 Maximum likelihood estimator under H ˆp x + x 2 n + n

9 Kvotientteststørrelse 2 ) xi ) nr x ˆp ˆp i Qx) ˆp i i ˆp i ) x ) n x ˆp ˆp ) x2 ˆp ˆp ˆp ˆp ˆp 2 ˆp ) n2 x 2 Vi har estimeret sandsynligheden for at få en pige ved anden fødsel til ˆp Pigehyppighed blandt førstefødslerne er n n + n således at 2 log Qx) 2 log Q0.327) Kan denne meningsfyldt sammenlignes med pigehyppighed blandt andenfødslerne? Approksimation til testsandsynlighed ɛx) F χ ) 0.35 Fortolkning? - Hypotesen accepteres Vi har estimeret sandsynligheden for at få en pige ved anden fødsel til ˆp Pigehyppighed blandt førstefødslerne er n n + n Kan denne meningsfyldt sammenlignes med pigehyppighed blandt andenfødslerne? NEJ! Tabellen indeholder kun information om andengangsfødende. Hvad nu hvis tilbøjelighed til at få endnu et barn afhænger af første barns køn? Antal Børnenes Antal % % kvinder med børn køn kvinder endnu et barn pige dreng Ialt piger pige, dreng drenge Ialt piger piger, dreng pige, 2 drenge drenge Ialt

10 Etbarnsmødre Forskningsspørgsmål: Afhænger tilbøjeligheden til at få endnu et barn af tidligere børns køn? Etbarnsmødre Tobørnsmødre Trebørnsmødre Antal Børnenes Antal % % kvinder med børn køn kvinder endnu et barn pige dreng Ialt Pigehyppighed blandt etbarnsmødre estimeres til kan sammenlignes med pigehyppigheden ved anden fødsel estimeret til ) Da hyppigheder for at få endnu et barn er stort set ens 74.7% og 74.8%) antages disse ikke at afhænge af første barns køn Tobørnsmødre Antal Børnenes Antal % % kvinder med børn køn kvinder endnu et barn 2 piger pige, dreng drenge Ialt Lader til at hyppighed for et tredie barn afhænger af kønnene på de børn, man allerede har. Hypotese: forældre ønsker børn af begge køn. Statistisk model n pp, n pd, n dd og x pp, x pd, x dd angiver hhv. antallet af familier med en given børnekombination for de to første børn som vi opfatter som givet) og antallet af familier med den givne børnekombination, der har fået endnu et barn vores observationer). hvor og E, Ppdd,p pd,p dd)) ppp,p pd,p dd) [0,] 3 ) E {0,..., n pp } {0,..., n pd } {0,..., n dd }) P ppp,p pd,p dd )X pp x pp, X pd x pd, X dd x dd ) nj ) x jpp,pd,dd x j p j j p j) nj xj) 38 39

11 Hypoteserne bliver H : p pp p dd p [0, ], p pd [0, ] H 2 : p pp p dd p pd p [0, ] Under modellen varierer de tre sandsynlighedsparametre frit og likelihoodfunktionen bliver L : {0,..., n pp } {0,..., n pd } {0,..., n dd } [0, ] 3 [0, ] ) nj Lx, p pp, p pd, p dd )) p xj j p j) nj xj) jpp,pd,dd Maximum likelihood estimatorerne bliver xpp ˆp pp, ˆp pd, ˆp dd ), x pd, x ) dd 0.446, 0.396, 0.450) n pp n pd n dd x j Under H bliver likelihoodfunktionen L : {0,..., n pp } {0,..., n pd } {0,..., n dd } [0, ] 2 [0, ] ) ) nr Lx, p, p pd )) p xr p) nr xr) npd p x pd pd p pd) n pd x pd ) x r rpp,dd ) npp ndd x pp npd x pd x dd x pd ) p xpp+x dd p) npp+n dd x pp+x dd )) ) p x pd pd p pd) n pd x pd ) og maximum likelihood estimatorerne bliver xpp + x dd ˆp, ˆp pd ), x ) pd 0.448, 0.396) n pp + n dd n pd 40 4 Kvotientteststørrelsen Q x) for test af H mod den fulde model bliver Q x) Lx, ˆp, ˆp pd ) Lx, ˆp pp, ˆp pd, ˆp dd ) ˆpx pd pd ˆp pd) n pd x pd ) jpp,dd ˆpxj ˆp) nj xj) ˆp j) nj xj) jpp,pd,dd ˆpxj j ˆpxpp+x dd ˆp) npp+n dd x pp+x dd )) jpp,dd ˆpxj ˆp j) nj xj) Vi får ved indsættelse 2 log Qx) Den approksimative testsandsynlighed er j ɛ x) F χ ) Vi kan således lige netop godkende hypotesen på 5%-niveau. Vi kan derefter undersøge, om alle familier har samme tilbøjelighed til at få et barn til, altså undersøge H 2 med H som udgangsmodel. Under H 2 har vi p x pp + x dd + x pd n pp + n dd + n pd Kvotientteststørrelsen Q 2 x) for test af H 2 mod H bliver Q 2 x) Lx, p) Lx, ˆp, ˆp pd ) nj x jpp,pd,dd x j ) p j p) nj xj) nj jpp,dd x j )ˆp x j ˆp) n j x j) n pd x x pd )ˆp pd pd ˆp pd) n pd x pd ) p xpp+x dd+x pd p) npp+n dd+n pd x pp+x dd +x pd )) ˆp xpp+x dd ˆp) n pp+n dd x pp+x dd )) ˆp x pd pd ˆp pd) n pd x pd ) 42 43

12 Hvad nu hvis vi havde testet H 2 overfor den fulde model i stedet for overfor H : Vi får ved indsættelse 2 log Q 2 x) 285 og ɛ 2 x) F χ 2 285) < Stærkt signifikant. Qx) Lx, p) Lx, ˆp pp, ˆp dd, ˆp pd ) nj x jpp,pd,dd x j ) p j p) nj xj) nj x jpp,dd,pd x j )ˆp j j ˆp j) nj xj) ɛx) F χ ) < Stærkt signifikant Kønsfordeling i tobørnsfamilier Hvordan fordeler børn sig faktisk på køn? Hvad skal man mene om følgende notits fra Information? Forestil dig, at du skal købe to gaver med hjem fra ferien for at glæde din kollegas to børn. Mens du leder i legetøjsbutikken kommer du i tanker om, at du ikke kan huske om de begge er drenge.... Hvad er apriori sandsynligheden for at et ægtepar med to børn har to drenge? Svar /4. Information, ) Lad X X 0, X, X 2 ) være antal familier med henholdsvis 0, og 2 drenge. X antages polynomialfordelt med udfaldsrum D 3 n) og parameterrum 3. Her er n Hypotese: Drengehyppighed afhænger ikke af første barns køn. Kan identificeres med følgende hypotese: Antallet af drenge i tobørnsfamilier er binomialfordelt med sandsynlighedsparameter q [0, ]

13 Sandsynlighed for at en tobørnsfamilie har netop y drenge, y {0,, 2} bliver ) 2 P q Y y) q y q) 2 y y Under hypotesen bliver familier med 0, eller 2 drenge således polynomialfordelt med sandsynlighedsvektor: p 0, p, p 2 ) q) 2, 2q q), q 2) Under den fulde model estimerer vi som sædvanlig ved de observerede hyppigheder: ˆp 0, ˆp, ˆp 2 ) x0 n, x n, x ) 2 n 0.237, 0.499, 0.264) og antalsparameter n, hvor q [0, ] Likelihoodfunktion under hypotesen: Kvotientteststørrelsen bliver: L : D 3 n) [0, ] [0, ] ) n Lx, q) q) 2 ) x 0 x 2q q)) q 2 ) x 2 x 0, x, x 2 ) n 2 x q x+2x2 q) 2x0+x x 0, x, x 2 ˆq x + 2x 2 2n Bemærk: ˆq er netop hyppigheden af drenge blandt alle børn. Qx) ˆq) 2 ) x 0 2ˆq ˆq)) x ˆq 2 ) x 2 2 s0 ˆpxs s ) x+2x x + 2x 2 2 x + 2x 2 2 x 2n 2n 2 xs ) xs s0 n 0.33 ɛx) F χ 2 2 log Qx)) 0.36 Fortolkning? )) 2x0+x 50 5

14 Tobørnsmødre Hvad har vi testet? Hvordan de to første børn fordeler sig på drenge og piger. Men hvordan er fordelingen hos familier med netop to børn? Antal Børnenes Antal % % kvinder med børn køn kvinder endnu et barn 2 piger pige, dreng drenge Ialt Tobørnsmødre med netop to børn Antal Børnenes Antal % børn køn kvinder 2 piger pige, dreng drenge Ialt Under den fulde model estimeres: ˆp 0, ˆp, ˆp 2 ) 0.228, 0.52, 0.25) Under hypotesen estimeres: ˆq 0.52 Kvotientteststørrelse: Qx) 0 ɛx) F χ 2 2 log Qx)) 0 Fortolkning? 54

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ. Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag susanne

Susanne Ditlevsen Institut for Matematiske Fag    susanne Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller

Læs mere

Estimation og konfidensintervaller

Estimation og konfidensintervaller Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,

Læs mere

Projektopgave til Mat2SS. Espen Højsgaard (CPR xxxx) Rune Højsgaard (CPR xxxx)

Projektopgave til Mat2SS. Espen Højsgaard (CPR xxxx) Rune Højsgaard (CPR xxxx) Projektopgave til MatSS Espen Højsgaard (CPR 04038-xxxx) Rune Højsgaard (CPR 090678-xxxx) 1 1 Samme sandsynlighed for drengefødsel Vi har som udgangspunkt for løsning af opgaven brugt følgende tabeller,

Læs mere

Statistik og Sandsynlighedsregning 1. IH kapitel 6

Statistik og Sandsynlighedsregning 1. IH kapitel 6 Statistik og Sandsynlighedsregning 1 IH kapitel 6 Overheads til forelæsninger. Uge 41/2005 1 Test i Polynomialfordelingen Forsøg: n uafhængige gentagelse af forsøg med m udfald. Vi observerer x = x 1,...,

Læs mere

Mat2SS Vejledende besvarelse uge 11

Mat2SS Vejledende besvarelse uge 11 MatSS Vejledende besvarelse uge Eksamen V99/00 opg. a Kønsfordelingen 996 den samme for de tre skoler Mænd Kvinder I alt København 5 = n x 56 = x 8 = n Odense 9 = n x 06 = x 5 = n Århus 0 = n x 40 = x

Læs mere

Kønsproportion og familiemønstre.

Kønsproportion og familiemønstre. Københavns Universitet Afdeling for Anvendt Matematik og Statistik Projektopgave forår 2005 Kønsproportion og familiemønstre. Matematik 2SS Inge Henningsen februar 2005 Indledning I denne opgave undersøges,

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen Statistik og Sandsynlighedsregning 1 MS kapitel 3 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Definition 3.2.1 Lad X 1, X 2,..., X n være uafhængige

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Dagens program. Praktisk information:

Dagens program. Praktisk information: Dagens program Praktisk information: Husk hjemmeopgaven i statistik Hypoteseprøvning kap. 11.2,11.3 og 11.8 Eksempel på test Styrkefunktionen kap. 11.2 Stikprøvens størrelse kap. 11.3 Likelihood ratio

Læs mere

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model). Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: 2019-03-17) 1 / 40 Statistisk test Et statistisk test er en konfrontation

Læs mere

Hypotesetests, fejltyper og p-værdier

Hypotesetests, fejltyper og p-værdier Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet

Læs mere

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Om hypoteseprøvning (1)

Om hypoteseprøvning (1) E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Statistiske principper

Statistiske principper Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis

Læs mere

StatDataN: Test af hypotese

StatDataN: Test af hypotese StatDataN: Test af hypotese JLJ StatDataN: Test af hypotese p. 1/69 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Nanostatistik: Test af hypotese

Nanostatistik: Test af hypotese Nanostatistik: Test af hypotese JLJ Nanostatistik: Test af hypotese p. 1/50 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Nanostatistik: Konfidensinterval

Nanostatistik: Konfidensinterval Nanostatistik: Konfidensinterval JLJ Nanostatistik: Konfidensinterval p. 1/37 Fraktilpåmindelse u p : Φ(u p ) = p, Φ( z ) = 1 Φ( z ) t p [f] : F t[f] (t p [f]) = p, F t[f] ( t ) = 1 F t[f] ( t ) F-fordeling:

Læs mere

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

2 X 2 = Antal mygstik på enpersoniløbetaf1minut Opgave I I mange statistiske undersøgelser bygger man analysen på anvendelse af normalfordelingen til (eventuelt tilnærmelsesvist) at beskrive den tilfældige variation. Spørgsmål I.1 (1): Forén af følgende

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1 Tag-hjem prøve 1. juli 2010 24 timer Alle hjælpemidler er tilladt. Det er tilladt at skrive med blyant og benytte viskelæder,

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30 Områdeestimator X (Ω, F) (X, E) x 01 01 P θ ν θ θ Θ 0000 1111 000000 111111 0000 1111 0000 1111 C(x) En områdeestimator er en afbildning C : X P(Θ).. p.1/30 Konfidensområde En områdestimator C : X P(Θ)

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro Uge 48 II Teoretisk Statistik 7. november 003 Numerisk modelkontrol af diskrete fordelinger: intro Eksempel: kvalitetskontrol Goodness-of-fit test: generel teori Endeligt udfaldsrum Udfaldsrum uden øvre

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative

Læs mere

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Statistisk Model Indhold Binomialfordeling Sandsynlighedsfunktion Middelværdi og spredning 1 Aalen: Innføring i statistik med medisinske eksempler

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2005 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 11, 2016 1/22 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver

Læs mere

Den lineære normale model

Den lineære normale model Den lineære normale model Ingredienser: V : N-dimensionalt vektorrum. X : Ω V : stokastisk variabel. L : ægte underrum af V, dimension k., : fundamentalt indre produkt på V. Vi laver en hel familie af

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 9, 2015 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Sandsynlighedsregning Stokastisk variabel

Sandsynlighedsregning Stokastisk variabel Sandsynlighedsregning Stokastisk variabel I eksperimenter knyttes ofte en talværdi til hvert udfald. S s X(s) R Definition: En stokastisk variabel X er en funktion defineret på S, der antager værdier på

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere