Note om Monte Carlo metoden

Størrelse: px
Starte visningen fra side:

Download "Note om Monte Carlo metoden"

Transkript

1 Note om Monte Carlo metoden Kasper K. Berthelsen Version marts Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at opnå tilnærmede løsninger vha. (computer) simulation af en eller flere stokastiske variable. Denne note omhandler såkaldt simpel Monte Carlo. Eksempel: Terningkast Hvad er det forventede antal øjne ved et kast med en fair terning? Vi starter med en matematisk beskrivelse af en terning. Antag X er en stokastisk variabel, der angiver antallet af øjne ved et kast med en fair terning. Dvs. X kan tage værdierne 1 til 6 med lige stor sandsynlighed. Dvs. P (X = 1) = P (X = 2) =... = P (X = 6) = 1 6. Lad p(x) være den tilsvarende sandsynlighedsfunktion, dvs. p(x) = P (X = x). Den forventede værdi af X er da E[X] = 6 x=1 xp(x) = 6 x=1 x 1 6 = 1 6 ( ) = 3.5. Det forventede antal øjne ved et kast med en fair terning er altså 3.5. At det forventede antal øjne ved et kast med en fair terning er 3.5 kan fortolkes som det gennemsnitlige antal øjne ved gentagne kast i det lange løb. En alternativ og tilnærmet metode er at kaste med en terning et stort antal gange og finde det gennemsnitlige antal øjne i de mange kast. Vi anvender en computer til at udføre de mange terningkast. Man kan nemt få R til at kaste en fair terning 1000 gange: x = sample(size = 1000, x = 1:6, prob = c(1, 1, 1, 1, 1, 1)/6, replace = TRUE) Figur 1 viser fordelingen af antal øjne i de 1000 kast. Vi kan udregne gennemsnittet af de 1000 kast: mean(x) ## [1]

2 Figur 1: Fordeling af antal øjne i 1000 kast med en terning. Den vandrette linje svarer til det forventede antal kast med hhv. 1,2,...,6 øjne i de 1000 kast, Konkret er det forventede antal Vi ser at det gennemsnitlige antal øjne i de 1000 kast er 3.478, hvilket hermed er vores estimat af det forventede antal øjne. Estimatet er tæt på det korrekte svar 3.5. Vi vil senere se på, hvordan vi sikre os, at estimatet er tilstrækkeligt præcist. Gentager vi eksperimentet får vi et andet resultat: x = sample(size = 1000, x = 1:6, prob = c(1, 1, 1, 1, 1, 1)/6, replace = TRUE) mean(x) ## [1] Det gennemsnitlige antal øjne i dette eksperiment er 3.552, hvilket ikke er det samme som i første eksperiment. Dette skyldes at der er anvendt 1000 nye (og uafhængige) terningkast. Pga. det stokastiske (dvs. tilfældige) element i metoden (de mange tilfældige terningkast) får man i praksis aldrig samme svar. Lad os et øjeblik undersøge variation i svarene ovenfor nærmere. Vi bemærker først at ovenstående R kode kan skrives mere kompakt, så eksperimentet kan opnås i et hug : mean(sample(size = 1000, x = 1:6, replace = TRUE)) ## [1] Bemærk endnu engang af vi får en ny middelværdi. Vha. kommandoen replicate kan vi gentage eksperimentet mange gange, fx gange: middel = replicate(2500, mean(sample(size = 1000, x = 1:6, replace = TRUE))) Vektoren middel har længde 2500 og indeholder gennemsnittene fra de 2500 eksperimenter, hvor hver gennemsnit er baseret på 1000 terningkast. Hvert gennemsnit er et estimat af E[X]. Figur 2 viser et histogram over de 2500 estimater. 2

3 300 Antal Figur 2: Histogram over det gennemsnitlige antal øjne i 1000 kast i de 2500 esperimenter. Det ses at de fleste estimater ligger mellem 3.35 og 3.65 med den sande værdi 3.5 lige i midten. Med andre ord, så ligger langt de fleste estimater ikke længere end 0.15 fra fra den sande forventede værdi. Ovenstående er et simpelt eksempel på anvendelse af Monte Carlo metoden, og derfor ofte refereret til som simpel Monte Carlo. I det følgende går vi mere i detaljer med simpel Monte Carlo som en teknik til at estimerer forventede værdier. Ovenstående eksempel er mest af akademisk interesse, da det er muligt at udregne den sande forventede værdi. I de følgende afsnit vil vi se på eksempler, hvor der er mere vanskeligt eller helt umuligt at finde en simpel formel til udregning af den forventede værdi. Vi vil også se, at Monte Carlo metoden, måske lidt overraskende, også kan anvendes til at estimere sandsynligheder. 2 Monte Carlo estimation af middelværdi Motivationen for Monte Carlo metoden er ganske simpel: Vi har en stokastisk variabel X og ønsker at bestemme den forventede værdi E[X] af X. I andre tilfælde er vi interesseret i at finde den forventede værdi af en funktion af X, fx. hvad er den forventede værdi af X 2? I nogle tilfælde er det muligt at udregne den forventede værdi af interesse. I afsnit 1 ønskede vi at bestemme det forventede antal øjne i et kast med en fair terning. I tilfældet med antal øjne i et kast med en fair terning så vi, at det er (simpelt) at udregne den forventede værdi og det er dermed ikke nødvendigt at anvende Monte Carlo metoden. I andre tilfælde er det mere kompliceret eller helt umuligt at udregne den forventede værdi. I disse tilfælde kan Monte Carlo metoden anvendes til at estimere den forventede værdi. Som vi så afsnit 1 er ideen bag Monte Carlo metoden ganske simpel: Vi simulerer et antal realisationer x 1,..., x n af den stokastiske variabel X og udregner gennemsnittet af disse. Resultatet er et estimat af den forventede værdi E[X]. I afsnit 1 svarer en simulation af en realisation af X til et enkelt terningkast. I det følgende antager vi, at X er en kontinuert stokastisk variabel, men alle resultater gælder også for diskrete stokastiske variable. Mere specifikt, antag at X er en kontinuert stokastisk variabel med tæthedsfunktion f(x). Dvs. at 3

4 sandsynligheden for at X falder mellem a og b (a b) er P (a X b) = b I dette tilfælde udregnes den forventede værdi af h(x) som E[h(X)] = a f(x)dx. (1) h(x)f(x)dx. (2) Vi er interesserede i eksempler, hvor det er umuligt eller bare meget svært at udregne integralet i (2). For senere at kunne anvende Monte Carlo metoden er det også nødvenigt at antag, at det er muligt at simulere X. Eksempel: log-normalfordelt stokastisk variabel Antag X er standard normalfordelt, dvs. X N (0, 1). Vi er interesserede i at finde middelværdien af exp(x), hvor exp betegner eksponentialfunktionen, som også skrives e x. I dette tilfælde er middelværdien E[exp(X)] givet ved 1 E[exp(X)] = exp(x) exp ( 12 ) 2π x2 dx. Dette integrale kan faktisk udregnes og det er dermed muligt at bestemme den (sande) forventede værdi. Vi vælger dog en Monte Carlo tilgang. Egenskaber ved simpel Monte Carlo Lad µ betegne den ukendte middelværdi E[h(X)], og lad σ 2 betegne variansen Var[h(X)], hvor vi antager at σ 2 <, dvs. at variansen er af h(x) er endelig. Antag at X 1,..., X n er uafhængige stokastiske variable med samme fordeling som X, dvs. E[h(X i )] = µ og Var[h(X)] = σ 2 for i = 1,..., n. Definer gennemsnittet ˆµ = 1 n n h(x i ) = 1 n (h(x 1) + h(x 2 ) + h(x n )). i=1 Af regneregler for linearkombinationer af stokastiske variable følger, at E[ˆµ] = µ og Var[ˆµ] = σ2 n. Med andre ord er ˆµ en unbiased estimator for µ. Hvis hvert x i er en konkret simulation af X i, så er ˆµ = 1 n h(x i ) n et unbiased Monte Carlo estimat af µ. i=1 4

5 Antal Antal Figur 3: Histogram for hhv. x (til venstre) og exp(x) (til højre). Eksempel: log-normal fortsat Vha. R er det enkelt at simulere fx værdier x 1,..., x 1000, fra en standard normalfordeling: x = rnorm(1000) Figur 3 viser et histogram for hhv. x og exp(x). Herefter er et Monte Carlo estimatet af E[exp(X)] givet ved gennemsnittet ˆµ = 1 n n exp(x i ). i=1 I R giver en udregning af gennemsnittet: mean(exp(x)) ## [1] Dvs. ˆµ = er et estimat af E[exp(X)]. Spørgsmålet er hvor præcist et estimat ˆµ er. Konfidensinterval for Monte Carlo estimat For et tilstrækkelig stort n gælder der ifølge central grænseværdi sætning tilnærmelsesvist at ˆµ µ σ/ N (0, 1). n Heraf følger, at et tilnærmet (1 α)100% konfidensinterval for µ er givet ved ˆµ ± z α/2 s n, (3) hvor stikprøvestandardafvigelsen s er givet ved den sædvanlige formel: s = 1 n (h(x i ) ˆµ) n 1 2. i=1 5

6 Eksempel: log-normal fortsat Vi starter med at finde standardafvigelsen s: sd(exp(x)) ## [1] Vi kan nu udregne et 95% ved at indsætte i formel (3): mean(exp(x)) + c(-1, 1) * qnorm(0.975) * sd(exp(x))/sqrt(1000) ## [1] Vi er hermed 95% sikre på at den forventede værdi af exp(x) ligger mellem og Dette er umiddelbart dette et relativt bredt konfidensinterval. Bestemmelse af stikprøvestørrelse Når man anvender Monte Carlo metoden til at estimere den forventede værdi, så er det afgørende, at det tilhørende konfidensinterval ikke er for langt. Er konfidensintervallet for langt, indikere det, at den valgte stikprøvestørrelse, n, ikke er stor nok. For at afgøre, hvordan vi opnår et konfidensinterval af en passende længde bemærker vi først, at formlen for konfidensinterval (3) kan skrives som ˆµ ± ME, s hvor ME = z α/2 n er fejlmarginen (Margin of Error). Hvis vi isolerer n i udtrykket for fejlmarginen får vi n = (z α/2) 2 s 2 (ME) 2. (4) Formel (4) giver en anslået værdi for n, der vil sikre en fejlmargin af størrelse ME. Grunden til at det kun er anslået er, at vi anvender den estimerede standardafvieglse s og ikke σ. Bemærk, at estimatet s er fundet på baggrund af et eksisterende simulationseksperiment. Eksempel: log-normal fortsat Antag nu at vi ønsker en fejlmargin på ME = 0, 01. Vi finder n i R: n = (qnorm(0.975) * sd(exp(x))/0.01)^2 n ## [1] Vi gentager ovenstående simulationer og udregner, men nu med n = : 6

7 x = rnorm(n) mean(exp(x)) ## [1] sd(exp(x)) ## [1] mean(exp(x)) + c(-1, 1) * qnorm(0.975) * sd(exp(x))/sqrt(n) ## [1] Vi er hermed 95% sikre på, at den sande middelværdi µ ligger i intervallet fra til Vi har konkret opnået at fejlmarginen er , hvilket skal sammenlignes med et ønske om en fejlmargin på Flere eksempler på anvendelse af Monte Carlo Eksempel: Kontrol af udregning Antag X N (µ, σ 2 ), dvs. X er en normalfordelt stokastisk variabel med middelværdi µ og varians σ 2. For stokastiske variable gælder generelt Var[X] = E[X 2 ] E[X] 2. Isoleres E[X 2 ] opnås E[X 2 ] = σ 2 + µ 2. Antag µ = 3 og σ 2 = 14. Der gælder derfor E[X 2 ] = = 23. Et Monte Carlo eksperiment giver en indikation på om udregningen er korrekt: x = rnorm(10000, 3, sqrt(14)) mean(x^2) ## [1] Dvs. et Monte Carlo estimat af E[X] er , hvilket indikere at den uregnede værdi 23 ikke kan være helt forkert (der er korrekt). Vi kan supplere med et tilnærmet 95% konfidensinterval: mean(x^2) + c(-1, 1) * qnorm(0.975) * sd(x^2)/sqrt(n) ## [1] Eksempel: Maksimum af to stokastiske variable Antag X 1 og X 2 er to uafhængige og standard normalfordelte stokastiske variable. Vi er interesseret i stokastisk variabel X der til enhver tid er maksimum af X 1 og X 2. Dette kan formelt skrives som X = max(x 1, X 2 ). Det er ikke enkelt at udregne den forventede værdi af X eller andre af dens egenskaber. For at finde et estimat af E[X] anvender vi en Monte Carlo tilgang. Først simulerer vi n realisationer af X 1 som vi betegner x 11, x 12,..., x 1n. Tilsvarende simulerer vi n realisationer af X 2 som vi betegner x 21, x 22,..., x 2n. For hvert par x 1i og x 2i beregner vi maksimum x i = max(x 1i, x 2i ). Estimatet af E[X] er da gennemsnittet af x 1, x 2,..., x n. I tilfældet med n = udføres dette Monte Carlo i R som følger: 7

8 Density Figur 4: Histogram for x samt tæthedsfunktionen for en standard normalfordelt stokastisk variabel. x1 = rnorm(10000) x2 = rnorm(10000) x = pmax(x1, x2) mean(x) ## [1] ## pmax(...) tager parvise maksima Monte Carlo estimatet af X er derfor , hvilket som forventet er højere end middelværdien for X 1 og X 2, der for begges tilfælde er nul. Figur 4 viser et histogram for x samt tæthedsfunktionen for en standard normalfordelt stokastisk variabel. Som forventet er histogrammet forskudt til højre i forhold til tæthedsfunktionen. 3 Monte Carlo estimation af sandsynlighed I dette afsnit skal vi se, hvordan man kan bruge Monte Carlo metoden i afsnit 2 til at estimere sandsynligheder. Eksempel: Halesandsynlighed i en standard normalfordeling Antag at X er standard normalfordelt. Vi ønsker at bestemme sandsynligheden for, at X er mindre end eller lig I det følgende betegner vi denne sandsynlighed π. Sandsynligheden π er illustreret på Figur 5. I praksis kan vi nemt finde π vha. R: pnorm(-1.5) ## [1] Antag nu, at vi ikke har adgang til en kommando som pnorm, men at vi vha. en computer kan simulere værdier fra en normalfordeling. Vha. R kan vi nemt simulere 1000 værdier fra en standard normalfordeling: 8

9 Figur 5: Tæthedsfunktionen for en standardnormalfordelt stokastisk variabel. Det farvede område svarer sandsynligheden for at X er mindre end eller lig Figur 6: Histogram for de 1000 simulerede værdier. Det farvede område svarer til værdier mindre end eller lig Den prikkede linje er tæthedsfunktionen for en standardnormalfordeling. x = rnorm(1000) Figur 6 viser et histogram over de 1000 simulerede værdier. I histogrammet er andelen af x i er der er mindre end eller lig -1.5 på 7.1%. Dette er et estimat af π. Vi kan tænke på π som sandsynligheden for succes, hvor en succes er at X er mindre end eller lig 1.5. Fortolkning af en sandsynlighed π er andelen af succeser i det lange løb. Dvs. estimation af en sandsynlighed er det samme som at estimere en andel og vi kan dermed genbruge den sædvanlige teori for estimation af andele. Antag vi har n uafhængige stokastiske variable X 1,..., X n, hvor X i N (0, 1). For hver X i indfør en ny stokastisk variabel Y i der kan tage værdierne 0 og 1. Hver Y i er en funktion af X i på følgende måde: { 1 hvis X i 1.5 Y i = 0 hvis X i > 1.5 Da P (X 1.5) = π gælder der at P (Y i = 1) = π, dvs. Y 1,..., Y n er uafhængige bernoulli variable med sandsynlighedsparameter π. Heraf følger det, at E[Y i ] = π og Var[Y i ] = π(1 π). 9

10 Lad ˆπ betegne gennemsnittet af Y 1,..., Y n, da gælder E[ˆπ] = π og Var[ˆπ] = π(1 π). n Vi har således at ˆπ er en unbiased estimator for sandsynligheden π. I R udregnes y i erne nemt: y = 1 * (x <= -1.5) Som eksempel oplister vi de først fem x i er: x[1:5] ## [1] Bemærk at x 1 er større end -1.5 og x 2 er mindre end En oplistning af det først fem y i er viser, hvordan x i erne er blevet konverteret til 0 er og 1 er. Bemærk at y 1 = 0 og y 2 = 1. y[1:5] ## [1] Herefter er det enkelt at finde gennemsnittet af y i erne og Monte Carlo estimatet ˆπ: mean(y) ## [1] Vi har hermed at ˆπ = er et unbiased Monte Carlo estimat af sandsynligheden π. I praksis er det ikke nødvendigt at introducere y. Udregningerne kan udføres direkte på x: mean(x <= -1.5) ## [1] Bemærk at spørgsmålet om at estimere en sandsynlighed blev konverteret til et spørgsmål om at estimere en middelværdi. Hermed er estimation af en sandsynlighed principielt ikke forskellig fra at estimere en middelværdi. Det følger af central grænseværdi sætning, at for tilstrækkelige store værdier af n gælder der ˆπ π ca. N (0, 1). π(1 π)/n 10

11 Hvis vi erstatter variansen π(1 π)/n under kvadratroden med estimatet ˆπ(1 ˆπ)/n, så giver en omskrivning, at et tilnærmet (1 α)100% konfidensinterval for π er givet ved ˆπ(1 ˆπ) ˆπ ± z α/2. (5) n Et 95% konfidensintervallet for π udregnes vha. formel (5) i R som: mean(y) + c(-1, 1) * qnorm(0.975) * sqrt(mean(y) * (1 - mean(y))/1000) ## [1] Dvs. vi er 95% sikre på, at den sande sandsynlighed π ligger mellem og Hvis konfidensintervallet er for bredt, kan vi anslå et passende n ved udregninger som i forrige afsnit. Hvis vi ønsker en fejlmargin ME, så er en anslået værdi for n givet ved n = ˆπ(1 ˆπ)(z α/2 /ME) 2. 4 Monte Carlo p-værdi Vi har ovenfor set, hvordan Monte Carlo metoden kan anvendes til at estimere en sandsynlighed. I forbindelse med hypotesetest er p-værdien sandsynligheden for, under H 0, at observere en mere kritisk teststørrelsen end den der er observeret for data. Lad data være repræsenteret ved en vektor bestående af n observationer: x = (x 1, x 2,..., x n ). Antag desuden, at vi har en teststørrelse H(x). Eksempel: Kast med en fair mønt Vi har kastet med en mønt 100 gange og observeret krone 39 gange. I dette tilfælde er x = 39. Vi ønsker at undersøge om mønten er fair, dvs. om det er lige sandsynligt at få plat og krone: H 0 : Mønten er fair vs H 1 : Mønten er ikke fair Under H 0 forventer vi, at observere 50 krone. Som teststørrelse vælger vi forskellen mellem det observerede antal og 50. Med andre ord H(x) = x 50. I det konkrete tilfælde har vi H(39) = = 11 = 11. I R anvendes funktionen abs til at finde den absolutte værdi: abs(39-50) ## [1] 11 11

12 Antal Figur 7: Histogram over antal krone i 100 kast. Den lodrette linje angiver det observerede antal krone, x = 39. Spørgsmålet er hvor kritisk 39 krone i 100 kast er for hypotesen om en fair mønt. p-værdien er sandsynligheden for at observere en mindst lige så kritisk test størrelse næste gang under antagelse af, at H 0 er sand. Vi kan tænke på processen at kaste en fair mønt 100 gange og tælle antal krone som et (H 0 ) eksperiment. I dette tilfælde er p-værdien sandsynligheden for at et H 0 eksperiment fører til et antal krone der afviger fra 50 med mindst 11 kast. I praksis er denne sandsynlighed er ikke svær at udregne, men vi forsøger os alligevel med Monte Carlo metoden. Ideen er at udføre H 0 eksperimentet mange gange og derefter bestemme andelen af H 0 eksperimenter der førte til en teststørrelse der var mindst lige så kritisk som H(x). Denne andel er et estimat af p-værdien. I det følgende betegner vi resultatet af et H 0 eksperiment som x. p-værdien er med andre ord sandsynligheden for at et H 0 eksperiment fører til en teststørrelse H(x ) der er mindst lige så kritisk som H(x). Ovenstående ideer kan opsummeres i følgende algoritme til estimation af p-værdi Udregn H(x) For i = 1,..., n udfør trin 1 til 3 1. Find x ved at udføre H 0 eksperiment. 2. Udregn H(x ). 3. Hvis H(x ) er mindst lige så kritisk for H 0 som H(x), så sæt y i = 1 ellers sæt y i = 0. Et estimat af p-værdien er ȳ = n 1 n i=1 y i. Bemærk, at selvom ȳ er et gennemsnit, så er det præcis det samme som andelen af de n H 0 eksperimenter der fører til en teststørrelse H(x ) der er mindst lige så kritisk som den observerede teststørrelse H(x). Eksempel: Kast med en fair mønt fortsat Under H 0 er antallet af krone i 100 kast med en fair mønt binomial fordelt med sandsynlighedsparameter 0, 5 og antalsparameter 100. Med R kan man derfor udføre et H 0 eksperiment som 12

13 rbinom(1, size = 100, prob = 0.5) ## [1] 48 Vi kan udføre eksperimenter ved x.star = rbinom(10000, size = 100, prob = 0.5) Figur 7 viser fordelingen i de x i er. Allerede ved at kigge på histogrammet i Figur 7 kan vi se, at det er sjældent man opnår 39 eller krone i 100 kast med en fair mønt. Vi kan nu udregne teststørrelsen for hvert x i og de tilhørende y i værdier: H = abs(x.star - 50) ## Udregn teststørrelser y = H >= 11 ## Udregn y mean(y) ## [1] Dvs. den estimerede p-værdi er i dette tilfælde Et tilnærmet 95% konfidensinterval for p-værdien kan udregnes vha. formel (5): mean(y) + c(-1, 1) * qnorm(0.975) * sqrt(mean(y) * (1 - mean(y))/10000) ## [1] Som nævnt er det ikke svært at udregne det korrekte p-værdi i dette tilfælde. Da x er binomialfordelt kan p-værdien findes som 2 * pbinom(39, size = 100, prob = 0.5) ## [1] Som sagt er Monte Carlo p-værdien kun et estimat, og hver gang R-koden anvendes opnås et nyt resultat fordi nye H 0 eksperimenter udføres. For at illustrere denne tilfældige variation i estimatet kan vi udføre Monte Carlo estimationen mange gange. Først bemærker vi, at ovenstående procedure kan komprimeres til en linje: mean(abs(rbinom(10000, size = 100, prob = 0.5) - 50) >= 11) ## [1] Denne udregning kan nemt gentages, fx gange, vha. kommandoen replicate: p = replicate(2500, mean(abs(rbinom(10000, size = 100, prob = 0.5) - 50) >= 11)) Figur 8 viser et histogram over de 2500 Monte Carlo p-værdier. Som det ses er der en hvis variation i Monte Carlo p-værdierne. Denne variation kan mindskes ved at øge antallet af H 0 eksperimenter fra til fx

14 Figur 8: Histogram over Monte Carlo p-værdier. Den lodrette streg angiver den sande p-værdi. 14

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 11, 2016 1/22 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering Landmålingens fejlteori Lektion 3 Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition: Middelværdi og

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en

Læs mere

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen Statistik Lektion etinget sandsynlighed ayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV inomialfordelingen Repetition Udfaldsrum S Hændelse S Simpel hændelse O i 1, 3 4,

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 9, 2015 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800

Læs mere

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål Program Statistik og Sandsynlighedsregning Sandsynlighedstætheder og kontinuerte fordelinger på R Varians og middelværdi Normalfordelingen Susanne Ditlevsen Uge 48, tirsdag Tætheder og fordelingsfunktioner

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel: Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Estimation: Kapitel 9.1-9.3 Estimation Estimationsfejlen Bias Eksempler Bestemmelse af stikprøvens størrelse Konsistens De nitioner påkonsistens Eksempler på konsistente og middelrette estimatorer

Læs mere

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/36 Estimation af varians/spredning Antag X 1,...,X n stokastiske

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 Vejledende løsning 5.46 P (0.010 < error < 0.015) = (0.015 0.010)/0.050 = 0.1 > punif(0.015,-0.025,0.025)-punif(0.01,-0.025,0.025) [1] 0.1

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2 Københavns Universitet Susanne Ditlevsen og Helle Sørensen R opgaver Det er en god ide at vænne sig til at skrive kommandoerne i en editor

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1 Økonometri 1 Inferens i den lineære regressionsmodel 25. september 2006 Økonometri 1: F6 1 Oversigt: De næste forelæsninger Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Course 02402/02323 Introducerende Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

INSTITUT FOR MATEMATISKE FAG c

INSTITUT FOR MATEMATISKE FAG c INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: bjh@math.aau.dk Dataanalyse Sandsynlighed og stokastiske

Læs mere

Sandsynlighedsregning Oversigt over begreber og fordelinger

Sandsynlighedsregning Oversigt over begreber og fordelinger Tue Tjur Marts 2007 Sandsynlighedsregning Oversigt over begreber og fordelinger Stat. MØK 2. år Kapitel : Sandsynlighedsfordelinger og stokastiske variable En sandsynlighedsfunktion på en mængde E (udfaldsrummet)

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

Oversigt over nyttige fordelinger

Oversigt over nyttige fordelinger Oversigt over nyttige fordelinger Helene Regitze Lund Wandsøe November 14, 2011 1 Bernoulli-fordelingen 1 Når et eksperiment har to mulige udfald: succes eller fiasko. X er en stokastisk variabel med følgende

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Statistik. Hjemmeside:  kkb. Statistik - lektion 1 p.1/22 Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: kkb@math.aau.dk

Læs mere

Nanostatistik: Opgaver

Nanostatistik: Opgaver Nanostatistik: Opgaver Jens Ledet Jensen, 19/01/05 Opgaver 1 Opgaver fra Indblik i Statistik 5 Eksamensopgaver fra tidligere år 11 i ii NANOSTATISTIK: OPGAVER Opgaver Opgave 1 God opgaveskik: Når I regner

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Statistisk Model Indhold Binomialfordeling Sandsynlighedsfunktion Middelværdi og spredning 1 Aalen: Innføring i statistik med medisinske eksempler

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Normalfordelingen og transformation af kontinuerte fordelinger Helle Sørensen Uge 7, mandag SaSt2 (Uge 7, mandag) Normalford. og transformation 1 / 16 Program Paretofordelingen,

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Sandsynlighedsregning

Sandsynlighedsregning Mogens Bladt www2.imm.dtu.dk/courses/02405 21. September, 2007 Lidt om binomialkoefficienter n størrelsen af en mængde/population. Vi ønsker at udtage en sub population af størrelse r. To sub populationer

Læs mere

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006 Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Approksimation af binomialsandsynligheder, Afsnit 4.5 Multinomial fordeling, Afsnit 4.8 Negativ binomialfordeling, Afsnit 4.4 Poisson fordeling og Poisson process, Afsnit 4.6 Kontinuerte

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable 2.1 Sandsynlighedsbegrebet............................... 1 2.1.1

Læs mere

MM501 forelæsningsslides

MM501 forelæsningsslides MM501 forelæsningsslides uge 40, 2010 Produceret af Hans J. Munkholm bearbejdet af JC 1 Separabel 1. ordens differentialligning En generel 1. ordens differentialligning har formen s.445-8 dx Eksempler

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Note om Monte Carlo eksperimenter

Note om Monte Carlo eksperimenter Note om Monte Carlo eksperimenter Mette Ejrnæs og Hans Christian Kongsted Økonomisk Institut, Københavns Universitet 9. september 003 Denne note er skrevet til kurset Økonometri på. årsprøve af polit-studiet.

Læs mere

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål Program Statistik og Sandsynlighedsregning 2 Middelværdi og varians Helle Sørensen Uge 6, onsdag I formiddag: Tætheder og fordelingsfunktioner kort resume fra i mandags og et par eksempler mere om sammenhængen

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Rune Haubo B Christensen (based on slides by Per Bruun Brockhoff) DTU Compute, Statistik og Dataanalyse Bygning

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff. Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling

Læs mere

Besvarelser til øvelsesopgaver i uge 6

Besvarelser til øvelsesopgaver i uge 6 Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret.

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg.

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg. Noter til Biomat, 005. Kombinatorik. - eller kunsten at tælle. Alle tal i kombinatorik-afsnittet er hele og ikke-negative. Additionsprincippet enten - eller : Antag vi enten skal lave et valg med m muligheder

Læs mere

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen STATISTIK Skriftlig evaluering, 3. semester, mandag den 6. januar 004 kl. 9.00-13.00. Alle hjælpemidler er tilladt. Opgaveløsningen forsynes med navn og CPR-nr. OPGAVE 1 Et firma tuner biler. Antallet

Læs mere

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Version 1.1

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Version 1.1 Noter i fejlteori Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen Version 1.1 April 2013 2 Indhold 1 Motivation 3 2 Det matematiske fundament 5 2.1 Lidt sandsynlighedsregning......................

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Lineære transformationer, middelværdi og varians Helle Sørensen Uge 8, onsdag SaSt2 (Uge 8, onsdag) Lineære transf. og middelværdi 1 / 15 Program I formiddag: Fordeling

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen Vægte motiverende eksempel Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@mathaaudk Institut for Matematiske Fag Aalborg Universitet Højdeforskellen mellem punkterne P

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere