Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Størrelse: px
Starte visningen fra side:

Download "Forelæsning 4: Konfidensinterval for middelværdi (og spredning)"

Transkript

1 Introduktion til Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark Efterår 2017 DTU Compute Introduktion til Statistik Efterår / 56

2 Kapitel 3: Konfidensintervaller for én gruppe/stikprøve Grundlæggende koncepter Population og tilfældig stikprøve Estimation (f.eks. ˆµ er estimat af µ) Signifikansniveau α Konfidensintervaller (fanger rigtige prm. 1 α af gangene) Stikprøvefordelinger (stikprøvegennemsnit (t) og empirisk varians (χ 2 )) Centrale grænseværdisætning Specifikke metoder, én gruppe/stikprøve Konfidensinterval for middelværdi (t-fordeling) Konfidensinterval for varians (χ 2 -fordeling) DTU Compute Introduktion til Statistik Efterår / 56

3 Chapter 3: One sample confidence intervals General concepts Population and a random sample Estimation (e.g. ˆµ is estimate of µ) Significance level α Confidence intervals (Catches true value 1 α times) Sampling distributions (sample mean (t) and sample vaiance (χ 2 )) Central Limit Theorem Specific methods, one sample Confidence interval for the mean (t-distribution) Confidence interval for the variance (χ 2 -distribution) DTU Compute Introduktion til Statistik Efterår / 56

4 Oversigt 1 Fordelingen for gennemsnittet t-fordelingen 2 Konfidensintervallet for µ Eksempel 3 Den statistiske sprogbrug og formelle ramme 4 Ikke-normale data, Central Grænseværdisætning (CLT) 5 Konfidensinterval for varians og spredning DTU Compute Introduktion til Statistik Efterår / 56

5 Eksempel: Population og fordeling (Uendelig) Population Stikprøve {x 1,x 2,...,x n } Tilfældigt udvalgt Middelværdi µ Statistisk inferens Vi går nu på jagt efter µ! Stikprøvegennemsnit x DTU Compute Introduktion til Statistik Efterår / 56

6 Fordelingen for gennemsnittet Theorem 3.2: Fordeling for gennemsnit af normalfordelinger (Stikprøve-) fordelingen for X Assume that X 1,...,X n are independent and identically normally distributed random variables, X i N(µ,σ 2 ) and i = 1,...,n, then: X = 1 n n i=1 X i X N (µ, σ 2 ) n DTU Compute Introduktion til Statistik Efterår / 56

7 Fordelingen for gennemsnittet Middelværdi og varians følger af regneregler Theorem 2.40: Lineær funktion af normal distribuerede variable er også normalfordelt Theorem 2.53: Middelværdien af X ( ) n 1 E( X) = E n X i = 1 n i=1 n i ) = i=1e(x 1 n n i=1 µ = 1 n nµ = µ Theorem 2.53: Variansen for X Var( X) = 1 n n 2 Var(X i ) = 1 n i=1 n 2 σ 2 = 1 i=1 n 2 nσ 2 = σ 2 n DTU Compute Introduktion til Statistik Efterår / 56

8 Fordelingen for gennemsnittet Spørgsmål om stikprøvegennemsnittet (socrative.com, room: PBAC) Two normal distributions Den ene pdf hører til X i og den anden til X. Hvad kan konkluderes (for n > 1)? A: Den sorte hører til X i og den blå til X B: Den sorte hører til X og den blå til X i C: Det kan ikke afgøres D: Ved ikke µ Svar A: X i N(µ,σ 2 ) og X N(µ, σ 2 n ) altså σ X < σ X i DTU Compute Introduktion til Statistik Efterår / 56

9 Fordelingen for gennemsnittet Eksempel: Simuler middelværdi og spredning af stikprøvegennemsnit ## Middelværdien mu <- -5 ## Standard afvigelsen sigma <- 2 ## Stikprøvestørrelsen n <- 50 ## Simuler normalfordelte X_i x <- rnorm(n=n, mean=mu, sd=sigma) ## Se realiseringerne x ## Empirisk tæthed hist(x, prob=true, col='blue') ## Beregn gennemsnittet (stikprøve middelværdien, i.e. sample mean) mean(x) ## Beregn stikprøvevariansen (sample variance) var(x) ## Gentag den simulerede stikprøvetagning mange gange mat <- replicate(100, rnorm(n=n, mean=mu, sd=sigma)) ## Beregn gennemsnittet for hver af dem xbar <- apply(mat, 2, mean) ## Nu har vi mange realiseringer af stikprøvegennemsnittet xbar ## Se deres fordeling hist(xbar, prob=true, col='blue') ## Deres gennemsnit mean(xbar) DTU Compute Introduktion til Statistik Efterår / 56

10 Fordelingen for gennemsnittet Standardiseret fejl vi begår, Corollary 3.3: Når vi bruger X som estimat for µ: Så begår vi fejlen X µ Fordelingen for den standardiserede fejl vi begår: Assume that X 1,...,X n are independent and identically normally distributed random variables, X i N ( µ,σ 2) where i = 1,...,n, then: Z = X µ = X µ σ ( X µ) σ/ n N(0,12 ) That is, the standardized sample mean Z follows a standard normal distribution. DTU Compute Introduktion til Statistik Efterår / 56

11 Fordelingen for gennemsnittet Transformation til standard normalfordeling: Pdf for gennemsnittet X når X i N(µ,σ 2 ) X N(µ, σ 2 n ) σ X = σ n µ DTU Compute Introduktion til Statistik Efterår / 56

12 Fordelingen for gennemsnittet Transformation til standard normalfordeling: Pdf for fejlen vi begår X µ når X i N(µ,σ 2 ) X µ N(0, σ 2 n ) σ ( X µ) = σ n 0 µ DTU Compute Introduktion til Statistik Efterår / 56

13 Fordelingen for gennemsnittet Transformation til standard normalfordeling: X µ Pdf for den standardiserede fejl σ/ n når X i N(µ,σ 2 ) X µ σ/ n N(0,12 ) σ ( ) X µ = 1 σ/ n 0 µ Standardiseret til standard normalfordeling (noteres Z = X µ σ/ n N(0,12 )) DTU Compute Introduktion til Statistik Efterår / 56

14 Fordelingen for gennemsnittet Nu kan et 95% konfidensinterval udledes 95% konfidensinterval for µ: P(z < Z < z ) = 0.95 ( P z < X µ ) σ/ n < z σ σ ) P (z n < X µ < z n ( σ σ ) P X + z n < µ < X + z n = 0.95 = 0.95 = 0.95 DTU Compute Introduktion til Statistik Efterår / 56

15 Fordelingen for gennemsnittet 1. simulering: Beregning af 95% konfidensinterval Konfidensintervallet er omkring x og fanger her µ pdf for X i Pdf for X µ x + z σ n x x x + z σ n DTU Compute Introduktion til Statistik Efterår / 56

16 Fordelingen for gennemsnittet 2. simulering: Beregning af 95% konfidensinterval Konfidensintervallet er omkring x og fanger her µ pdf for X i Pdf for X µ x + z σ n x x + z σ n DTU Compute Introduktion til Statistik Efterår / 56

17 Fordelingen for gennemsnittet 2. simulering: Beregning af 99% konfidensinterval 99% konfidensintervallet er breddere end 95% konfidensintervallet (det skal fange µ oftere) pdf for X i Pdf for X µ x + z σ n x x + z σ n DTU Compute Introduktion til Statistik Efterår / 56

18 Fordelingen for gennemsnittet 20 simuleringer: Beregning at 95% konfidensinterval MISS µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ DTU Compute Introduktion til Statistik Efterår / 56

19 Fordelingen for gennemsnittet 100 simuleringer: Beregning at 95% konfidensinterval µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ MISS µ µ µ µ µ µ µ µ µ µ MISS MISS µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ MISS µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ µ DTU Compute Introduktion til Statistik Efterår / 56

20 Fordelingen for gennemsnittet Spørgsmål om konfidensinterval (socrative.com, room: PBAC) Hvis vi planlægger at beregne et 98% konfidensinterval for middelværdien, hvad er da sandsynligheden for at middelværdien ikke ligger inde i intervallet? A: 1% B: 2% C: 4% D: Den kender vi ikke E: Ved ikke Svar B: Der er 2% for at vi ikke fanger den rigtige middelværdi i 98% konfidensintervallet DTU Compute Introduktion til Statistik Efterår / 56

21 Fordelingen for gennemsnittet Spørgsmål om konfidensinterval (socrative.com, room: PBAC) Når vi så har udført eksperimentet og har stikprøven, ved vi da om middelværdien er indeholdt i det konfidensinterval vi har beregnet? A: Ja B: Nej C: Ved ikke Svar B: Nej, vi ved ikke om vi har fanget den rigtige middelværdi, vi kender kun sandsynligheden for at fange den DTU Compute Introduktion til Statistik Efterår / 56

22 Fordelingen for gennemsnittet Praktisk problem!! Populationsspredningen σ indgår i formlen og den kender vi ikke!! Oplagt løsning: Anvend stikprøvespredningen S som estimatet af σ i stedet for! MEN MEN: Så bryder den givne teori faktisk sammen!! HELDIGVIS: Der findes en heldigvis udvidet teori, der kan klare det!! DTU Compute Introduktion til Statistik Efterår / 56

23 Fordelingen for gennemsnittet t-fordelingen Theorem 3.4: More applicable extension of the same stuff: (kopi af Theorem 2.49) t-fordelingen tager højde for usikkerheden i at bruge s: Assume that X 1,...,X n are independent and identically normally distributed random variables, where X i N ( µ,σ 2) and i = 1,...,n, then T = X µ S/ n t where t is the t-distribution with n 1 degrees of freedom. DTU Compute Introduktion til Statistik Efterår / 56

24 Fordelingen for gennemsnittet t-fordelingen t-fordelingen med 9 frihedsgrader (n = 10) og standardnormalfordelingen Red: t Black: standard normal z = 1.96 z = 1.96 t = 2.26 t = DTU Compute Introduktion til Statistik Efterår / 56

25 Fordelingen for gennemsnittet t-fordelingen t-fordelingen med 29 frihedsgrader (n = 30) og standardnormalfordelingen Red: t Black: standard normal z = 1.96 z = 1.96 t = 2.05 t = DTU Compute Introduktion til Statistik Efterår / 56

26 Konfidensintervallet for µ Metodeboks 3.8: One-sample konfidensinterval for µ Brug den rigtige t-fordeling til at lave konfidensintervallet: For a sample x 1,...,x n the 100(1 α)% confidence interval is given by: x ± t 1 α/2 s n where t 1 α/2 is the 100(1 α)% quantile from the t-distribution with n 1 degrees of freedom. Mest almindeligt med α = 0.05: The most commonly used is the 95%-confidence interval: x ± t s n DTU Compute Introduktion til Statistik Efterår / 56

27 Konfidensintervallet for µ Eksempel Eksempel - Højde af 10 studerende Stikprøve, n = 10: Sample mean og standard deviation: x = 178 s = Estimer population mean og standard deviation: ˆµ = 178 ˆσ = DTU Compute Introduktion til Statistik Efterår / 56

28 Konfidensintervallet for µ Eksempel Højde-eksempel, 95% konfidensinterval (CI) ## 97.5% fraktilen af t-fordelingen for n=10: qt(p=0.975, df=9) ## [1] 2.26 Indsat i formlen giver det 178 ± ± 8.74 = [169.3; 186.7] DTU Compute Introduktion til Statistik Efterår / 56

29 Konfidensintervallet for µ Eksempel Højde-eksempel, 99% Konfidensinterval (CI) ## 99.5% fraktilen af t-fordelingen for n=10: qt(p=0.995, df=9) ## [1] 3.25 Indsat i formlen giver det 178 ± ± = [165.4; 190.6] DTU Compute Introduktion til Statistik Efterår / 56

30 Konfidensintervallet for µ Eksempel Der findes en R-funktion, der kan gøre det hele (med mere): ## Angiv data x <- c(168,161,167,179,184,166,198,187,191,179) ## Beregn 99% konfidensinterval t.test(x, conf.level=0.99) ## ## One Sample t-test ## ## data: x ## t = 50, df = 9, p-value = 5e-12 ## alternative hypothesis: true mean is not equal to 0 ## 99 percent confidence interval: ## ## sample estimates: ## mean of x ## 178 DTU Compute Introduktion til Statistik Efterår / 56

31 Konfidensintervallet for µ Eksempel Svar via socrative.com eller Socrative app. Room: PBAC Gennemsnit x = 14.4, stikprøvespredningen s = 6, antal obs. er n = 9 Formlen for konfidensintervallet er x ± t s n t-fordelingen med 8 frihedsgrader t = 2.31 t = x Hvilket af intervallerne er det rigtige 95% konfidensinterval? A: Turkise B: Sorte C: Grønne D: Blå E: Røde s Svar D: Blå. Fordi t n = så nedre grænse omkring DTU Compute Introduktion til Statistik Efterår / 56

32 Den statistiske sprogbrug og formelle ramme Den formelle ramme for statistisk inferens Fra bogen, kapitel 1: An observational unit is the single entity/level about which information is sought (e.g. a person) (Observationsenhed) The statistical population consists of all possible measurements on each observational unit (Population) The sample from a statistical population is the actual set of data collected. (Stikprøve) Sprogbrug og koncepter: µ og σ er parametre, som beskriver populationen x er estimatet for µ (konkret udfald) X er estimatoren for µ (nu set som stokastisk variabel) Begrebet statistic(s) er en fællesbetegnelse for begge DTU Compute Introduktion til Statistik Efterår / 56

33 Den statistiske sprogbrug og formelle ramme Den formelle ramme for statistisk inferens - Eksempel Fra bogen, kapitel 1, højdeeksempel Vi måler højden for 10 tilfældige personer i Danmark Stikprøven/The sample: De 10 konkrete talværdier: x 1,...,x 10 Populationen: Højderne for alle mennesker i Danmark. Observationsenheden: En person DTU Compute Introduktion til Statistik Efterår / 56

34 Den statistiske sprogbrug og formelle ramme Statistisk inferens = Learning from data Learning from data is learning about parameters of distributions that describe populations Vigtigt i den forbindelse: Stikprøven skal på meningsfuld vis være repræsentativ for en eller anden veldefineret population Hvordan sikrer man det Ved at sikre at stikprøven er fuldstændig tilfældig udtaget DTU Compute Introduktion til Statistik Efterår / 56

35 Den statistiske sprogbrug og formelle ramme Tilfældig stikprøveudtagning Definition 3.11: A random sample from an (infinite) population: A set of observations X 1,X 2,...,X n constitutes a random sample of size n from the infinite population f (x) if: 1 Each X i is a random variable whose distribution is given by f (x) 2 These n random variables are independent Hvad betyder det???? 1 Alle observationer skal komme fra den samme population 2 De må IKKE dele information med hinanden (f.eks. hvis man havde udtaget hele familier i stedet for enkeltindivider) DTU Compute Introduktion til Statistik Efterår / 56

36 Ikke-normale data, Central Grænseværdisætning (CLT) Theorem 3.13: The Central Limit Theorem Gennemsnittet af en tilfældig stikprøve følger altid en normalfordeling hvis n er stor nok: Let X be the mean of a random sample of size n taken from a population with mean µ and variance σ 2, then Z = X µ σ/ n is a random variable whose distribution function approaches that of the standard normal distribution, N(0,1 2 ), as n Dvs., hvis n er stor nok, kan vi (tilnærmelsesvist) antage: X µ σ/ n N(0,12 ) og X µ S/ t ved t-fordelingen med n 1 frihedsgrader n DTU Compute Introduktion til Statistik Efterår / 56

37 Ikke-normale data, Central Grænseværdisætning (CLT) CLT in action - gennemsnit af Uniform fordelte observationer ## Stikprøvestørrelse n=1 ## Antal gentagelser k=1000 ## Simuler u=matrix(runif(k*n),ncol=n) ## Se empirisk tæthed hist(apply(u,1,mean), col='blue', main='n=1', xlab='means', nclass=15, prob=true, xl Density n= Means DTU Compute Introduktion til Statistik Efterår / 56

38 Ikke-normale data, Central Grænseværdisætning (CLT) CLT in action - gennemsnit af Uniform fordelte observationer ## Stikprøvestørrelse n=2 ## Antal gentagelser k=1000 ## Simuler u=matrix(runif(k*n),ncol=n) ## Se empirisk tæthed hist(apply(u,1,mean), col='blue', main='n=2', xlab='means', nclass=15, prob=true, xl Density n= Means DTU Compute Introduktion til Statistik Efterår / 56

39 Ikke-normale data, Central Grænseværdisætning (CLT) CLT in action - gennemsnit af Uniform fordelte observationer ## Stikprøvestørrelse n=6 ## Antal gentagelser k=1000 ## Simuler u=matrix(runif(k*n),ncol=n) ## Se empirisk tæthed hist(apply(u,1,mean), col='blue', main='n=6', xlab='means', nclass=15, prob=true, xl n=6 Density Means DTU Compute Introduktion til Statistik Efterår / 56

40 Ikke-normale data, Central Grænseværdisætning (CLT) CLT in action - gennemsnit af Uniform fordelte observationer ## Stikprøvestørrelse n=30 ## Antal gentagelser k=1000 ## Simuler u=matrix(runif(k*n),ncol=n) ## Se empirisk tæthed hist(apply(u,1,mean), col='blue', main='n=30', xlab='means', nclass=15, prob=true, x Density n= Means DTU Compute Introduktion til Statistik Efterår / 56

41 Ikke-normale data, Central Grænseværdisætning (CLT) Konsekvens af CLT: Vores CI-metode virker OGSÅ for ikke-normale data: Vi kan bruge konfidens-interval baseret på t-fordelingen i stort set alle situationer, blot n er stor nok Hvad er stor nok? Faktisk svært at svare præcist på, MEN: Tommelfingerregel: n 30 Selv for mindre n kan formlen være (næsten) gyldig for ikke-normale data. DTU Compute Introduktion til Statistik Efterår / 56

42 Ikke-normale data, Central Grænseværdisætning (CLT) Svar via socrative.com eller Socrative app. Room: PBAC Er lydniveauet behageligt? A: Fino B: Nope, skru op C: Nope, skru ned D: Nope, der er dårlig og ubehagelig lyd herinde med det lydanlægget DTU Compute Introduktion til Statistik Efterår / 56

43 Ikke-normale data, Central Grænseværdisætning (CLT) Svar via socrative.com eller Socrative app. Room: PBAC Bør Peder klæde sig mere nydeligt? A: Ja, for den da! Det er grimt det tøj B: Nej, han ser faktisk rigtig checket ud C: Nej, det kan være lige meget med tøjet, han skal barbere sig og rede sit hår først D: Ved ikke, jeg har simpelthen været for optaget af statistikken til at lægge mærke til hans påklædning DTU Compute Introduktion til Statistik Efterår / 56

44 Konfidensinterval for varians og spredning Stikprøvefordelingen for varians-estimatet (Theorem 2.56) Variansestimater opfører sig som en χ 2 -fordeling: Let then: S 2 = 1 n 1 χ 2 = n i=1 (X i X) 2 (n 1)S2 σ 2 is a random variable following the χ 2 -distribution with v = n 1 degrees of freedom. DTU Compute Introduktion til Statistik Efterår / 56

45 Konfidensinterval for varians og spredning χ 2 -fordelingen med ν = 9 frihedsgrader ## Plot chi^2 tæthedsfunktion med 9 frihedsgrader ## En sekvens af x værdier x <- seq(0, 30, by = 0.1) ## Plot chi^2 tæthedsfunktion plot(x, dchisq(x, df = 9), type = 'l', ylab="f(x)") f(x) x DTU Compute Introduktion til Statistik Efterår / 56

46 Konfidensinterval for varians og spredning Metode 3.18: Konfidensinterval for stikprøvevarians og stikprøvespredning Variansen: A 100(1 α)% confidence interval for the variance σ 2 is: [ ] (n 1)s 2 (n 1)s 2 χ1 α/2 2 ; χα/2 2 where the quantiles come from a χ 2 -distribution with ν = n 1 degrees of freedom. Spredningen: A 100(1 α)% confidence interval for the sample standard deviation ˆσ is: [ ] (n 1)s 2 (n 1)s 2 ; χ 2 1 α/2 χ 2 α/2 DTU Compute Introduktion til Statistik Efterår / 56

47 Konfidensinterval for varians og spredning Eksempel Produktion af tabletter Vi producerer pulverblanding og tabletter deraf, så koncentrationen af det aktive stof i tabletterne skal være 1 mg/g med den mindst mulige spredning. En tilfældig stikprøve udtages, hvor vi måler mængden af aktivt stof. Data: En tilfældig stikprøve med n = 20 tabletter er udtaget og fra denne får man: ˆµ = x = 1.01, ˆσ 2 = s 2 = %-konfidensinterval for variansen - vi skal bruge χ 2 -fraktilerne: χ = , χ = ## 2.5% og 97.5% fraktilerne i chi^2 fordelingen for n=20 qchisq(c(0.025, 0.975), df = 19) DTU Compute Introduktion til Statistik Efterår / 56

48 Konfidensinterval for varians og spredning Eksempel Så konfidensintervallet for variansen σ 2 bliver: [ ; ] = [ ; ] Og konfidensintervallet for spredningen σ bliver: [ ; ] = [0.053; 0.102] DTU Compute Introduktion til Statistik Efterår / 56

49 Konfidensinterval for varians og spredning Højdeeksempel Vi skal bruge χ 2 -fraktilerne med ν = 9 frihedsgrader: χ = , χ = ## 2.5% og 97.5% fraktilerne i chi^2 fordelingen for n=10 qchisq(c(0.025, 0.975), df = 9) ## [1] Så konfidensintervallet for højdespredningen σ bliver: [ ] ; 2 = [8.4; 22.3] DTU Compute Introduktion til Statistik Efterår / 56

50 Konfidensinterval for varians og spredning Eksempel - Højde af 10 studerende - recap: Stikprøve, n = 10: Sample mean og standard deviation: x = 178 s = Estimer population mean og standard deviation: ˆµ = 178 ˆσ = NYT:Konfidensinterval, µ: 178 ± [169.3; 186.7] NYT:Konfidensinterval, σ: [8.4; 22.3] DTU Compute Introduktion til Statistik Efterår / 56

51 Konfidensinterval for varians og spredning Svar via socrative.com eller Socrative app. Room: PBAC Hvilket af følgende udsagn er korrekt? Svar D A: Statistik er virkelig skod, jeg tror ikke det kan bruges til noget B: Statistik er altså øv, man skal bare sidde og sætte en masse tal ind i nogle dumme formler C: Jeg burde ligge under min dyne og blive frisk til at feste igennem i aften D: Statistik er virkelig fedt, det er fascinerende, at man ikke bare kan regne et estimat ud, men man kan også regne ud hvor præcist det er DTU Compute Introduktion til Statistik Efterår / 56

Oversigt. 1 Eksempel. 2 Fordelingen for gennemsnittet t-fordelingen. 3 Konfidensintervallet for µ Eksempel

Oversigt. 1 Eksempel. 2 Fordelingen for gennemsnittet t-fordelingen. 3 Konfidensintervallet for µ Eksempel Kursus 02402/02323 Introducerende Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme Itroduktio til Statistik Forelæsig 4: Kofidesiterval for middelværdi (og spredig) Peder Bacher DTU Compute, Dyamiske Systemer Bygig 303B, Rum 009 Damarks Tekiske Uiversitet 2800 Lygby Damark e-mail: pbac@dtu.dk

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Kursus 02402/02323 Introducerende Statistik

Kursus 02402/02323 Introducerende Statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Course 02402/02323 Introducerende Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares) Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus

Læs mere

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 10: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 12: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Introduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher

Introduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher Introduktion til Statistik Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Building 324, Room 220 Danish Technical University

Læs mere

Kursus 02402/02323 Introducerende Statistik. Forelæsning 6: Sammenligning af to grupper

Kursus 02402/02323 Introducerende Statistik. Forelæsning 6: Sammenligning af to grupper Kursus 02402/02323 Introducerende Statistik Forelæsning 6: Sammenligning af to grupper Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Hvorfor er normalfordelingen så normal?

Hvorfor er normalfordelingen så normal? Hvorfor er normalfordelingen så normal? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 24, 2018 normalfordelingen så normal? October 24, 2018 1 / 13 Højde af kvinder Histogram

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling

Læs mere

Estimation og usikkerhed

Estimation og usikkerhed Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode

Læs mere

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed... Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................

Læs mere

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 8: Inferens for varianser (kap 9) Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Forelæsning 2: Kapitel 4, Diskrete fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer

Læs mere

Forelæsning 10: Statistik ved hjælp af simulering

Forelæsning 10: Statistik ved hjælp af simulering Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Højde af kvinder 2 / 18

Højde af kvinder 2 / 18 Hvorfor er normalfordelingen så normal? og er den nu også det? Søren Højsgaard (updated: 2019-03-17) 1 / 18 Højde af kvinder 2 / 18 Inddeler man i mindre grupper kan man forestille sig at histogrammet

Læs mere

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering Landmålingens fejlteori Lektion 3 Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition: Middelværdi og

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Peder Bacher DTU Compute, Dynamiske Systemer Building 303B, Room 017 Danish Technical University 2800 Lyngby

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel: Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Forelæsning 11: Tovejs variansanalyse, ANOVA

Forelæsning 11: Tovejs variansanalyse, ANOVA Introduktion til Statistik Forelæsning 11: Tovejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation

Læs mere

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3 Landmålingens fejlteori Repetition - Kontinuerte stokastiske variable Lektion 4 - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf10 Institut for Matematiske Fag Aalborg Universitet 29. april

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Matematisk Modellering 1 Cheat Sheet

Matematisk Modellering 1 Cheat Sheet By a team of brave computer scientists: Mads P. Buch, Tobias Brixen, Troels Thorsen, Peder Detlefsen, Mark Gottenborg, Peter Krogshede - 1 Contents 1 Basalt 3 1.1 Varianser...............................

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Kapitel 4: Statistik ved simulering. Kursus 02323: Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik.

Kapitel 4: Statistik ved simulering. Kursus 02323: Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik. Kursus 02323: Introducerende Statistik Forelæsning 7: Simuleringsbaseret statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

MM501 forelæsningsslides

MM501 forelæsningsslides MM501 forelæsningsslides uge 40, 2010 Produceret af Hans J. Munkholm bearbejdet af JC 1 Separabel 1. ordens differentialligning En generel 1. ordens differentialligning har formen s.445-8 dx Eksempler

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Lidt om fordelinger, afledt af normalfordelingen

Lidt om fordelinger, afledt af normalfordelingen IMM, 2002-10-10 Poul Thyregod Lidt om fordelinger, afledt af normalfordelingen 1 Introduktion I forbindelse med inferens i normalfordelinger optræder forskellige fordelinger, der er afledt af normalfordelingen,

Læs mere

Kursus 02402/02323 Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik

Kursus 02402/02323 Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 7: Simuleringsbaseret statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren

Læs mere