Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ."

Transkript

1 Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter. x antages at være en værdi af en stokastisk variabel X (X,..., X n ). Udfaldsrummet E R n er mængden af alle mulige udfald. Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ. 2 Hvad er en statistisk model? Afgrænsningen af de mulige sandsynlighedsfordelinger formaliserer vor forhåndsviden eller vore forhåndsantagelser om problemet. De enkelte fordelinger formaliserer den usikkerhed der er forbundet med observationerne. Mængden af mulige sandsynlighedsfordelinger formaliserer den uvidenhed vi har om de mekanismer, der har frembragt observationerne. Formålet med den statistiske analyse er at fjerne noget af uvidenheden om de bagvedliggende mekanismer, der har frembragt observationen. Statistisk model Mængden af sandsynlighedsfordelinger skal kunne indiceres ved en parameter θ Θ R d. Den statistiske model er givet ved (E, (P θ ) θ Θ ), hvor (P θ ) θ Θ er en familie af sandsynlighedsfordelinger på E. Parameterområdet Θ R d er en indeksmængde for familien af sandsynlighedsfordelinger i modellen, og θ Θ er parameteren. 3 4

2 Likelihoodfunktionen x 2 p(x,, x n ) P(A) A Antag at P θ er kontinuert med sandsynlighedstæthed p θ θ Θ. Fortolkning af sandsynlighedstætheden: For et (lille) δ > 0 gælder at sandsynlighedstætheden for en mængde af formen A [x, x + δ] [x n, x n + δ] hvor A E, er approksimativt givet ved x 2 + δ x 2 A p(x,..., x n ) P (A)/ A x x + δ x 5 6 Maximum likelihood estimator Tætheden kan opfattes som forholdet mellem sandsynlighedsmasse og volumen (for et lille område). Likelihoodfunktion: L : E Θ [0, ) L(x, θ) p θ (x) L(x, θ) er for fastholdt x et mål for hvor sandsynligt det er at få observationen x, når X s fordeling er P θ. Vi ønsker at vælge den sandsynlighedsfordeling i modellen, der passer bedst muligt med det observerede x. At vælge en fordeling på grundlag af observationen x kaldes at estimere (eller på dansk at skønne). Fordelingen P θ identificeres ofte med parameteren θ, så man estimerer parameteren θ. Maximum likelihood estimatoren fås ved at vælge den sandsynlighedsfordeling i modellen, der passer bedst med vores observation i følgende forstand: ˆθ ˆθ(x) Θ er maximum likelihood estimatoren for θ, hvis L(x, ˆθ) L(x, θ) θ Θ 7 8

3 Beregning af maximum likelihood estimatoren Antag at vi observerer x fra en Normalfordeling N(θ, ). Likelihoodfunktion: L(x, θ) 2π 0.6 exp (0.347 θ) } Maximum likelihood estimatoren findes ved at maksimalisere L som funktion af θ for fastholdt x, altså ved en funktionsundersøgelse af L. Det er ofte besværligt at arbejde direkte med L, og i stedet findes maximum af log-likelihooden l log L. De to funktioner L og l har samme maximum (overvej hvorfor!), og det er derfor ligegyldigt om man ser på den ene eller den anden. likelihood and log likelihood L θ 9 0 Log-likelihoodfunktion: l(x, θ) log(l(x, θ)) log( 2π 0.6) (x θ) Maximum er det samme for de to funktioner, likelihood og log-likelihood. likelihood and log likelihood L l log(l) likelihood and log likelihood L l log(l) θ θ 2

4 Et andet eksempel, her eksponentialfordelingen. likelihood and log likelihood L*00 l log(l) θ Maximum af log-likelihood funktionen kan findes ved at differentiere med hensyn til θ (θ,..., θ d ). Score-funktionerne er således defineret som d dθ j l(θ), j,..., d Maximum likelihood estimatoren findes da som løsning til likelihoodligningerne d dθ j l(θ) 0, j,..., d ˆθ er en (afledt) stokastisk variabel med en fordeling. En god estimator, ˆθ, for en parameter θ skal være central, dvs. at Eˆθ θ, og skal have lille varians. 3 4 Hypotese Formålet med en statistisk analyse er ofte at undersøge en eller flere på forhånd opstillede hypoteser. Hypotesen skal kunne identificeres med nogle bestemte fordelinger i modellen. En hypotese svarer til en ny, mindre familie af sandsynlighedsfordelinger på udfaldsrummet E (P θ ) θ Θ0 Hypotesen betegnes ofte med H og skrives hvor (P θ ) θ Θ0 (P θ ) θ Θ H : θ Θ 0 Test Et test er en metode til at afgøre, om observationen x kan antages at svare til et P θ i hypotesen. Vi skriver M : θ Θ (den fulde model) H : θ Θ 0 (hypotesen) Alle mulige udfald (observationer) ordnes efter, hvor godt de stemmer overens med hypotesen. Hypotesen accepteres hvis observationen viser tilstrækkelig god overensstemmelse. Hypotesen forkastes hvis overensstemmelsen er for dårlig. 5 6

5 Kvotienttest Da (P θ ) θ Θ0 også er en statistisk model, kan vi definere likelihoodfunktionen under hypotesen L : E Θ 0 [0, ) L(x, θ) p θ (x) og beregne maximum likelihood estimatoren ˆθ 0 under hypotesen. Vi har L(x, ˆθ) L(x, θ) θ Θ Estimation i den fulde model og under hypotesen. θ^ Θ θ^0 Θ 0 L(x, ˆθ 0 ) L(x, θ) θ Θ 0 Desuden er L(x, ˆθ) L(x, ˆθ 0 ) (Hvorfor?) 7 8 Kvotientteststørrelsen for observationen x defineres ved Q(x) L(x, ˆθ 0 (x)) L(x, ˆθ(x)) pˆθ (x) 0(x) pˆθ(x) (x) En observation passer bedre med hypotesen jo større dens Q værdi er. Der gælder altid at Testsandsynlighed Vi ser på mængden x E : Q(x ) Q(x)} Q(X) Q(x)} Sandsynligheden for at få noget, der er mindre eller lige så sandsynligt som det observerede, hvis den rigtige fordeling er P θ, θ Θ 0, er P θ (Q(X) Q(x)}) Testsandsynligheden ɛ for observationen x er givet ved (Hvorfor?) 0 Q(x) ɛ(x) sup θ Θ 0 P θ (Q(X) Q(x)}) 9 20

6 Approximativ fordeling af kvotienttestsstørrelsen Bemærk at ɛ er bestemt af sandsynlighedsfordelingerne i hypotesen. Hvis testsandsynligheden er stor betyder det, at der eksistserer en fordeling i hypotesen, der giver vores observerede værdi (relativ) høj sandsynlighed. (Relativt til hvad?). Vi siger da at observationen bekræfter hypotesen. Betragt en statistisk model (E, (P θ ) θ Θ ) med en hypotese H: θ Θ 0, hvor Θ og Θ 0 er pæne mængder med fuld dimension, henholdsvis d og d 0. Når observationsantallet går mod uendelig under passende betingelser, gælder for θ i det indre af Θ 0, at 2 log Q(X) er approximativt χ 2 fordelt med d d 0 frihedsgrader, således at der gælder P θ (Q(X) Q(x)) F χ 2 d d0 ( 2 log Q(x)) hvor F χ 2 f er fordelingsfunktionen for χ 2 fordelingen med f frihedsgrader. Dette får vi stort set ikke brug for i det følgende Test for følge af hypoteser M H 0, H, H 2,..., H k, svarer til en følge af statistiske modeller (E, (P θ ) θ Θ0 ), (E, (P θ ) θ Θ ),..., (E, (P θ ) θ Θk ) hvor (P θ ) θ Θr } (P θ ) θ Θr } H r testes overfor H r ved at se på Q r (x) L(x, ˆθ r (x)) L(x, ˆθ, r, 2,..., k, r (x)) hvor Q r er kvotientteststørrelsen for test af H r under H r. Hvis Q 0k er kvotientteststørrelsen for test af hypotesen H k mod (E, (P θ ) θ Θ0 ), så gælder 2 log Q 0k (x) k r 2 log Q r(x). Det kan ses udfra log Q 0k log L(x, ˆQ k (x)) L(x, ˆQ 0 (x)) log L(x, ˆQ (x)) L(x, ˆQ 2 (x)) L(x, ˆQ 0 (x)) L(x, ˆQ (x)) L(x, ˆQ k (x)) L(x, ˆQ k (x)) log L(x, ˆQ (x)) L(x, ˆQ 0 (x)) + log L(x, ˆQ 2 (x)) L(x, ˆQ (x)) + + log k log Q r (x) r L(x, ˆQ k (x)) L(x, ˆQ k (x)) 23 24

7 Eksempel: eksponentialfordelingen Antag x 0 er en observation fra en eksponentialfordeling med ukendt skalaparameter λ. Udfaldsrum: E [0, [ Parameterrum: Θ ]0, [ Statistisk model: ([0, [, (P λ ) λ ]0, [ ), hvor P λ har tæthed Likelihoodfunktion: p λ (x) λ e x/λ, x 0 L : [0, [ ]0, [ [0, [ L(x, λ) λ e x/λ Estimation af λ i eksponentialfordelingen Log-likelihooden bliver log p λ (x) log λ x λ Score-funktionen (her er kun en score-funktion - hvorfor?) bliver d log p λ (x) dλ λ + x λ 2 λ og likelihood-ligningen giver estimatoren Hvad nu hvis x 0? ( x ) λ λ + x λ 2 0 ˆλ x hvis x > likelihood for eksponentialfordelingen x0 x0. x0.5 x Hvis x 0 er L(0, λ) λ, dvs der er ingen værdier af λ i parameterområdet for hvilke L(0, λ) antager sin maximumværdi. Maximum likelihood estimatoren er således ikke defineret for x 0. MEN, heldigvis er P λ (X 0) 0 når λ > 0. Maximum likelihood estimatoren er derfor defineret med sandsynlighed. Vi antager fremover at x > λ Maximum likelihood estimatoren ˆλ(X) er en afledt stokastisk variabel, eksponentialfordelt med skalaparameter λ, da ˆλ X

8 Test i eksponentialfordelingen Funktionsundersøgelse af Q(x) Hypotese: Kvotientteststørrelse: Q(x) L(x, ˆλ 0 ) L(x, ˆλ) Testsandsynlighed: H : λ λ 0 L(x, λ 0) L(x, x) λ 0 e x/λ0 x e x/x x λ 0 e x/λ 0 ɛ(x) P λ0 (Q(X) Q(x)) P λ0 ( X λ 0 e X/λ0 x λ 0 e x/λ0 ) P λ0 (x 0 : x e x /λ 0 x ) e x/λ0 λ 0 λ 0 Q(x) x λ 0 e x/λ0 dq(x) dx λ 0 e x/λ0 }} >0 ( xλ0 ) Q(x) er voksende for x < λ 0 og aftagende for x > λ 0. Derudover er Q(0) 0 og lim x Q(x) 0. Definer q Q(x), da har ligningen Q(x ) q højst to løsninger, x og x 2, hvor x λ 0 x 2. Hvis x λ 0 da er x x. Hvis x λ 0 da er x 2 x Heraf følger x 0 : Q(x ) q} 0 x x } x 2 x } Lad os tegne det i R (se program med kommentarer på hjemmesiden): x <- seq(0,0,0.) Qtest <- function(x,lambda0) (x/lambda0)*exp(-x/lambda0) } lambda0 <- 3 plot(x,qtest(x,lambda0lambda0),type"l",ylab"q(x)") abline(vlambda0,lty2) xobs <- qtest <- Qtest(xobs,lambda0) lines(rep(xobs,2),c(-,qtest),lty2) axis(,atc(xobs,lambda0),labelsc("xobs",expression(lambda)), cex.axi.5) abline(hqtest,lty2) axis(2,atqtest,labels"q(xobs)",cex.axi.5) Vi har x x. Lad os finde x 2 : findx2 <- function(x) abs(qtest(x,lambda0lambda0)-qtest) } x2 <- optimize(findx2,lowerlambda0,upper0)$minimum lines(rep(x2,2),c(-,qtest),lty2) axis(,atx2,labels"x2",cex.axi.5) 3 32

9 Testsandsynligheden bliver: Q(x) Q(xobs) ɛ(x) P λ0 (x : Q(x ) q) P λ0 0 x x } + P λ0 x 2 x } x e x /λ 0 dx + e x /λ 0 dx 0 λ 0 x 2 λ 0 ] x [ ] [ e x /λ 0 + e x /λ 0 0 x 2 e x/λ0 + e x2/λ0 Hvis for eksempel λ 0 3 og x fås x x og x (udregnet i R), og xobs λ x x2 Fortolkning? ɛ(x) e /λ0 + e 6.7/λ Sammenligning af eksponentialfordelinger Statistisk model: ([0, [ 2, (P λ,λ 2 ) (λ,λ 2) ]0, [ 2) Lad være en observation af x (x, x 2 ) hvor P λ,λ 2 (x, x 2 ) λ e x λ Likelihoodfunktion under den fulde model: λ 2 e x 2 λ 2 X (X, X 2 ) der er ekponentialfordelte med skalaparametre λ og λ 2. Vi ønsker at teste hypotesen H : λ λ 2 L : [0, [ 2 ]0, [ 2 [0, [ L(x, x 2, λ, λ 2 ) λ e x λ Maximum likelihood estimator: λ 2 e x 2 λ 2 (ˆλ, ˆλ 2 ) (x, x 2 ) hvis x > 0 og x 2 >

10 Hypotese: λ λ 2 λ ]0, [ Kvotientteststørrelse: Likelihoodfunktion under hypotesen: Log-likelihood: L : [0, [ 2 ]0, [ [0, [ L(x, x 2, λ) x λ 2 e +x 2 λ l log L(x, x 2, λ) 2 log λ x + x 2 λ Score-funktion: dl dλ 2 λ + x + x 2 λ 2 Maximum likelihood estimator: ˆλ x + x 2 2 x hvis x + x 2 > 0 Q(x, x 2 ) L(x, x 2, ˆλ) L(x, x 2, ˆλ, ˆλ 2 ) L(x, x 2, (x + x 2 )/2)) L(x, x 2, x, x 2 ) ((x +x 2)/2) 2 e (x+x2)/((x+x2)/2) 4x x 2 (x + x 2 ) 2 x e x/x x 2 e x2/x Resultater om normalfordeling X N(µ, σ 2 ). N har tæthed ϕ µ,σ 2(x) exp } (x µ)2 2πσ 2 2σ2 EX µ, Var(X) σ 2 X µ N(0, ) σ Hvis X og X 2 er uafhængige, X r N(µ r, σr), 2 da er X + X 2 N(µ + µ 2, σ 2 + σ2) 2 Hvis X,..., X n er uafhængige og X r N(µ, σ 2 ), da er X n (X X n ) N(µ, σ2 n ) Test i normalfordelingen Observation af x (x,..., x n ) R n X (X,..., X n ) X r N(µ, σ 2 ) er uafhængige, identisk normalfordelte variable med µ R og σ 2 > 0. X har tæthed ϕ µ,σ 2(x) n exp } 2πσ 2 2σ 2 (x s µ) 2 ( 2πσ 2 ) n exp 2σ 2 } (x s µ)

11 Statistisk model og maximum likelihood estimatoren Vi antager µ ukendt og σ 2 σ 2 0 kendt. Den statistiske model bliver (R n, (N µ ) µ R ) hvor N µ har tæthed } ϕ µ (x) ( exp 2πσ0 2 )n 2σ0 2 (x s µ) 2 Likelihoodfunktionen for µ bliver derfor L : R n R [0, ) L(x, µ) ϕ µ (x) Estimation af µ i normalfordeling med kendt varians Log-likelihooden bliver log ϕ µ (x) n log ( ) 2πσ0 2 2σ0 2 (x s µ) 2 Score-funktionen (her er kun en score-funktion - hvorfor?) bliver d log ϕ µ (x) dµ σ 2 0 (x s µ) og likelihood-ligningen giver estimatoren (er det et maximum?) σ0 2 (x s ˆµ) 0 ˆµ n x s x 4 42 Estimation af µ i normalfordeling med kendt varians Vi får således at maximum likelihood estimatoren er gennemsnittet af målingerne. Vi så tidligere at hvis X,..., X n er uafhængige og X r N(µ, σ 2 ), da er X n (X X n ) N(µ, σ2 n ) Vi får derfor direkte fordelingen af maximum likelihood estimatoren ˆµ N(µ, σ2 0 n ) Vi kunne også direkte have maximeret likelihooden. Der gælder (x s µ) 2 ((x s x) + ( x µ)) 2 (x s x) 2 + ( x µ) (x s x)( x µ) (x s x) 2 + n( x µ) 2 + 2( x µ) (x s x) (x s x) 2 + n( x µ) 2 (x s x)

12 Test af hypotesen H : µ µ 0. Kvotientteststørrelse: Q(x) L(x, ˆµ 0) L(x, ˆµ) exp } n ( 2πσ0 2)n 2σ0 2 (x s µ 0 ) 2 exp } n ( 2πσ0 2)n 2σ0 2 (x s x) 2 } exp 2σ0 2 ((x s µ 0 ) 2 (x s x) 2 ) exp } 2σ0 2 n( x µ 0 ) 2 Da hypotesen er simpel, har vi at ɛ(x) P µ0 (Q(X) Q(x)) P µ0 ( 2 log Q(X) 2 log Q(x)) ( P µ0 σ0 2 n( X µ 0 ) 2 ) σ0 2 n( x µ 0 ) 2 ( X µ0 P µ0 σ 0 / n x µ ) 0 σ 0 / n ( X µ0 2P µ0 σ 0 / n x µ ) 0 σ 0 / n ( ( )) x µ0 2 Φ σ 0 / n da X µ 0 σ 0 / n er standard normalfordelt

Tidlige eksempler. Susanne Ditlevsen Institut for Matematiske Fag susanne

Tidlige eksempler. Susanne Ditlevsen Institut for Matematiske Fag    susanne Statistik og Sandsynlighedsregning Repetition Statistik Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne New England Journal of Medicine gav i 2000 et

Læs mere

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag susanne

Susanne Ditlevsen Institut for Matematiske Fag    susanne Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Estimation og konfidensintervaller

Estimation og konfidensintervaller Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Statistik og Sandsynlighedsregning 1. IH kapitel 6

Statistik og Sandsynlighedsregning 1. IH kapitel 6 Statistik og Sandsynlighedsregning 1 IH kapitel 6 Overheads til forelæsninger. Uge 41/2005 1 Test i Polynomialfordelingen Forsøg: n uafhængige gentagelse af forsøg med m udfald. Vi observerer x = x 1,...,

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Sandsynlighedsregning Oversigt over begreber og fordelinger

Sandsynlighedsregning Oversigt over begreber og fordelinger Tue Tjur Marts 2007 Sandsynlighedsregning Oversigt over begreber og fordelinger Stat. MØK 2. år Kapitel : Sandsynlighedsfordelinger og stokastiske variable En sandsynlighedsfunktion på en mængde E (udfaldsrummet)

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Uge 10 Teoretisk Statistik 1. marts 2004

Uge 10 Teoretisk Statistik 1. marts 2004 1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en

Læs mere

Nanostatistik: Test af hypotese

Nanostatistik: Test af hypotese Nanostatistik: Test af hypotese JLJ Nanostatistik: Test af hypotese p. 1/50 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling

Læs mere

StatDataN: Test af hypotese

StatDataN: Test af hypotese StatDataN: Test af hypotese JLJ StatDataN: Test af hypotese p. 1/69 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling

Læs mere

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål Program Statistik og Sandsynlighedsregning Sandsynlighedstætheder og kontinuerte fordelinger på R Varians og middelværdi Normalfordelingen Susanne Ditlevsen Uge 48, tirsdag Tætheder og fordelingsfunktioner

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål Program Statistik og Sandsynlighedsregning 2 Middelværdi og varians Helle Sørensen Uge 6, onsdag I formiddag: Tætheder og fordelingsfunktioner kort resume fra i mandags og et par eksempler mere om sammenhængen

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer

Læs mere

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3 Landmålingens fejlteori Repetition - Kontinuerte stokastiske variable Lektion 4 - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf10 Institut for Matematiske Fag Aalborg Universitet 29. april

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler

Læs mere

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k Dagens program: Likelihoodfunktion, begreber : Mandag den 4. februar Den generelle lineære model score-funktion: første afledede af log-likelihood har middelværdien nul observeret information: anden afledede

Læs mere

MM501 forelæsningsslides

MM501 forelæsningsslides MM501 forelæsningsslides uge 40, 2010 Produceret af Hans J. Munkholm bearbejdet af JC 1 Separabel 1. ordens differentialligning En generel 1. ordens differentialligning har formen s.445-8 dx Eksempler

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Mat2SS Vejledende besvarelse uge 11

Mat2SS Vejledende besvarelse uge 11 MatSS Vejledende besvarelse uge Eksamen V99/00 opg. a Kønsfordelingen 996 den samme for de tre skoler Mænd Kvinder I alt København 5 = n x 56 = x 8 = n Odense 9 = n x 06 = x 5 = n Århus 0 = n x 40 = x

Læs mere

Sandsynlighed og Statistik

Sandsynlighed og Statistik 36 Sandsynlighed og Statistik 6.1 Indledning Denne note beskriver de statistiske begreber og formler som man med rimelig sandsynlighed kan komme ud for i eksperimentelle øvelser. Alt er yderst korfattet,

Læs mere

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m. 1 Uge 11 Teoretisk Statistik 8. marts 2004 Kapitel 3: Fordeling af en stokastisk variabel, X Kapitel 4: Fordeling af flere stokastiske variable, X 1,,X m (på en gang). NB: X 1,,X m kan være gentagne observationer

Læs mere

Den lineære normale model

Den lineære normale model Den lineære normale model Ingredienser: V : N-dimensionalt vektorrum. X : Ω V : stokastisk variabel. L : ægte underrum af V, dimension k., : fundamentalt indre produkt på V. Vi laver en hel familie af

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Normalfordelingen og transformation af kontinuerte fordelinger Helle Sørensen Uge 7, mandag SaSt2 (Uge 7, mandag) Normalford. og transformation 1 / 16 Program Paretofordelingen,

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Lineære transformationer, middelværdi og varians Helle Sørensen Uge 8, onsdag SaSt2 (Uge 8, onsdag) Lineære transf. og middelværdi 1 / 15 Program I formiddag: Fordeling

Læs mere

STATISTIKNOTER. Mindre matematisk-statistisk opslagsværk, indeholdende bl.a. ordforklaringer, resuméer og tabeller. Jørgen Larsen

STATISTIKNOTER. Mindre matematisk-statistisk opslagsværk, indeholdende bl.a. ordforklaringer, resuméer og tabeller. Jørgen Larsen STATISTIKNOTER Mindre matematisk-statistisk opslagsværk, indeholdende bla ordforklaringer, resuméer og tabeller Jørgen Larsen IMFUFA Roskilde Universitetscenter Februar 1999 IMFUFA, Roskilde Universitetscenter,

Læs mere

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro Uge 48 II Teoretisk Statistik 7. november 003 Numerisk modelkontrol af diskrete fordelinger: intro Eksempel: kvalitetskontrol Goodness-of-fit test: generel teori Endeligt udfaldsrum Udfaldsrum uden øvre

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Uafhængighed og reelle transformationer Helle Sørensen Uge 8, mandag SaSt2 (Uge 8, mandag) Uafh. og relle transf. 1 / 16 Program I dag: Uafhængighed af kontinuerte

Læs mere

Statistik for ankomstprocesser

Statistik for ankomstprocesser Statistik for ankomstprocesser Anders Gorst-Rasmussen 20. september 2006 Resumé Denne note er en kortfattet gennemgang af grundlæggende statistiske værktøjer, man kunne tænke sig brugt til at vurdere rimeligheden

Læs mere

Preben Blæsild og Jens Ledet Jensen

Preben Blæsild og Jens Ledet Jensen χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R Helle Sørensen Uge 6, mandag SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 1 / 19 Program Velkommen I dag:

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Statistiske principper

Statistiske principper Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr) DANMARKS TEKNISKE UNIVERSITET Side af 7 sider Skriftlig prøve, den: 0. maj 206 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1 Tag-hjem prøve 1. juli 2010 24 timer Alle hjælpemidler er tilladt. Det er tilladt at skrive med blyant og benytte viskelæder,

Læs mere

Statistisk model. Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål

Statistisk model. Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål Statistisk model Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål på (X, E). Modellen er parametriseret hvis der findes en parametermængde Θ og

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen

Læs mere

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen STATISTIK Skriftlig evaluering, 3. semester, mandag den 6. januar 004 kl. 9.00-13.00. Alle hjælpemidler er tilladt. Opgaveløsningen forsynes med navn og CPR-nr. OPGAVE 1 Et firma tuner biler. Antallet

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Rune Haubo B Christensen (based on slides by Per Bruun Brockhoff) DTU Compute, Statistik og Dataanalyse Bygning

Læs mere

Lidt om fordelinger, afledt af normalfordelingen

Lidt om fordelinger, afledt af normalfordelingen IMM, 2002-10-10 Poul Thyregod Lidt om fordelinger, afledt af normalfordelingen 1 Introduktion I forbindelse med inferens i normalfordelinger optræder forskellige fordelinger, der er afledt af normalfordelingen,

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Sandsynlighedsregning

Sandsynlighedsregning Mogens Bladt www2.imm.dtu.dk/courses/02405 21. September, 2007 Lidt om binomialkoefficienter n størrelsen af en mængde/population. Vi ønsker at udtage en sub population af størrelse r. To sub populationer

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

MM501/MM503 forelæsningsslides

MM501/MM503 forelæsningsslides MM501/MM503 forelæsningsslides uge 50, 2009 Produceret af Hans J. Munkholm 1 Separabel 1. ordens differentialligning En generel 1. ordens differentialligning har formen dx Eksempler = et udtryk, der indeholder

Læs mere

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Sandsynlighedsregning: endeligt udfaldsrum (repetition) Program: 1. Repetition: sandsynlighedsregning 2. Sandsynlighedsregning fortsat: stokastisk variabel, sandsynlighedsfunktion/tæthed, fordelingsfunktion. 1/16 Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Læs mere

hvor a og b er konstanter. Ved middelværdidannelse fås videre

hvor a og b er konstanter. Ved middelværdidannelse fås videre Uge 3 Teoretisk Statistik. marts 004. Korrelation og uafhængighed, repetition. Eksempel fra sidste gang (uge ) 3. Middelværdivektor, kovarians- og korrelationsmatrix 4. Summer af stokastiske variable 5.Den

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

INSTITUT FOR MATEMATISKE FAG c

INSTITUT FOR MATEMATISKE FAG c INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: bjh@math.aau.dk Dataanalyse Sandsynlighed og stokastiske

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 28 Kgs. Lyngby Danmark Email: bfn@dtu.dk Dagens emner afsnit 4.5 og 4.6 (Kumulerede) fordelingsfunktion

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 Vejledende løsning 5.46 P (0.010 < error < 0.015) = (0.015 0.010)/0.050 = 0.1 > punif(0.015,-0.025,0.025)-punif(0.01,-0.025,0.025) [1] 0.1

Læs mere

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel: Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2011 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2011 Kursus nr : (navn) (underskrift) (bord nr) CIVILINGENIØREKSAMEN Side af 6 sider Skriftlig prøve, den: 27. maj 20 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: (navn) (underskrift) (bord

Læs mere

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse

Læs mere

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Binomialfordelingen. X ~ bin(n,p): X = antal succeser i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes. Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Stokastiske processer og køteori

Stokastiske processer og køteori Stokastiske processer og køteori 3. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 SIDSTE GANG Ankomstproces T 1, T 2,... (ankomsttid per kunde) til køsystem. Modellér

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2010 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2010 Kursus nr : (navn) (underskrift) (bord nr) CIVILINGENIØREKSAMEN Side af 6 sider Skriftlig prøve, den: 8. maj 00 Kursus nr : 005 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: navn underskrift bord nr Der

Læs mere

Projektopgave til Mat2SS. Espen Højsgaard (CPR xxxx) Rune Højsgaard (CPR xxxx)

Projektopgave til Mat2SS. Espen Højsgaard (CPR xxxx) Rune Højsgaard (CPR xxxx) Projektopgave til MatSS Espen Højsgaard (CPR 04038-xxxx) Rune Højsgaard (CPR 090678-xxxx) 1 1 Samme sandsynlighed for drengefødsel Vi har som udgangspunkt for løsning af opgaven brugt følgende tabeller,

Læs mere

DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider. Skriftlig prøve, den: 18. december 2014 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider. Skriftlig prøve, den: 18. december 2014 Kursus nr : (navn) (underskrift) (bord nr) DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider Skriftlig prøve, den: 8. december 04 Kursus nr : 040 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere