StatDataN: Test af hypotese

Størrelse: px
Starte visningen fra side:

Download "StatDataN: Test af hypotese"

Transkript

1 StatDataN: Test af hypotese JLJ StatDataN: Test af hypotese p. 1/69

2 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling af stokastiske variabel Skøn over parameter: unbiased, lille varians Binomial: ˆp = X Normal: ˆµ = X, variansestimat = s 2 = 1 n 1 n i=1 (x i x) 2 Maximum likelihood estimation: find θ som maximerer ss for det observerede som funktion af θ StatDataN: Test af hypotese p. 2/69

3 Spørgsmål Er Peter større end Søren? Er danske mænd federe end danske kvinder? Er en mønt fair? Virker to medicinpræparater lige godt? StatDataN: Test af hypotese p. 3/69

4 Hypotese Ex: Skal vi acceptere et fifty-fifty væddemål baseret på kast med mønt? Hypotese: p = 2 1, p = P(krone) Ex: Medicinalfirma hævder at nyt præparat er bedre end det hidtil anvendte Forbrugeren: teste dette udsagn Forbruger er konservativ: vil ikke opgive det velprøvede præparat medmindre nye er klart bedre Hypotese: Nye præparat har samme effekt som gamle Alternativ: Nye præparat er bedre Ex: Tyngdeaccelerationen er målt i København til 9.81m/s 2. Vi vil undersøge om undergrunden under Ribe er anderledes end i Kbh Hypotese: tyngdeaccelerationen i Ribe er 9.81m/s 2 StatDataN: Test af hypotese p. 4/69

5 Hypotese Hypotese: Et udsagn om værdien af en parameter i modellen (Ex: θ = θ 0 ) Alternativ: alternative værdier af parameteren (Ex1: θ θ 0, Ex2: θ > θ 0 ) Parameter θ P θ data vurdere udsagn om θ Vi ved ikke om en hypotese er sand eller falsk Indsamlede data skal bruges til at træffe en kvalificeret afgørelse StatDataN: Test af hypotese p. 5/69

6 Lysmålinger Omkring 1880 målte Simon Newcomb lyset hastighed over en afstand på 7400m. Nedenstående målinger skal lægges til og er tiden i nanosekunder. Den sande værdi med moderne måleteknikker er Spørgsmål: Målte Newcomb rigtigt? Model: X 1,...,X 64 N(µ,5 2 ). Hypotese: Er µ = 33.02? Vis plot: spreder punkterne sig omkring 33.02? Varians = 5 2 = måleusikkerhed StatDataN: Test af hypotese p. 6/69

7 Lysmålinger Spreder punkterne sig omkring 33.02? Er x = tæt på 33.02? Hvis µ = er X N(33.02, 5 2 ) Er et typisk udfald fra en N(33.02, 5 2 /64) fordeling? Acceptområde: intervallet [ , ] Forkastelsesområde: alt andet: [, ] [ , ] StatDataN: Test af hypotese p. 7/69

8 Lysmålinger Mulige fejl: Newcomb målte rigtigt, men vi siger at han målte forkert Newcomb målte forkert, men vi siger at han målte rigtigt Hvis Newcomb målte rigtigt, hvad er da sandsynligheden for at vi forkaster µ = 33.02? P( X > 28 5 ) = Φ( 2) + (1 Φ(2)) = Hvis Newcomb målte forkert, lad os sige µ = 28, hvad er da sandsynligheden for at vi forkaster µ = 33.02? P( N(28, (5/8) 2 ) > ) = 1 StatDataN: Test af hypotese p. 8/69

9 Lysmålinger Hvis Newcomb målte rigtigt, hvad er da sandsynligheden for at få en værdi af X der ligger længere væk fra end gør? P( X > ( ) = 2Φ( 5.27/(5/8)) = StatDataN: Test af hypotese p. 9/69

10 Test af en hypotese Baseret på observation af X 1,X 2,...,X n ønsker vi at sige enten: vi accepterer hypotesen eller: vi forkaster hypotesen Test: deler udfaldsrummet op i en del hvor vi accepterer og en del hvor vi forkaster hypotese resultat af test sand falsk accepterer fint fejl af type II forkaster fejl af type I fint StatDataN: Test af hypotese p. 10/69

11 Test af en hypotese sandsynlighed hypotese sand hypotese falsk forkastelsesområde α = 5% β =? Ex:55% acceptområde 1 α = 95% 1 β =? Ex:45% α vælges af os β afhænger af n og alternativet α = fejl af type I = niveau af test Sprogbrug: Test på niveau 5% β kaldes styrken StatDataN: Test af hypotese p. 11/69

12 p-værdi Intuitivt kan vi altid rangordne udfald og tale om at ét udfald er værre end et andet udfald for hypotesen Hvis x 1 og x 2 er to udfald og der findes et niveau α så at x 1 ligger i forkastelsesområdet og x 2 ligger i acceptområdet så er x 1 værre end x 2 p-værdi for en observation x er sandsynligheden, beregnet under hypotesen, for at få en værdi af X der er lige så slem eller værre end den faktisk observerede x StatDataN: Test af hypotese p. 12/69

13 p-værdi p-værdien for observationen x = p(x) = P H (værdi af X der er lige så slem eller værre end x) Vis R-plot StatDataN: Test af hypotese p. 13/69

14 Cartoon StatDataN: Test af hypotese p. 14/69

15 Normalfordeling: test for µ = 0, σ 2 kendt Ex: Diffusion med drift µ (ukendt) og diffusionskoefficient σ 2 (kendt). Observerer position til tid 1. X 1,...,X n uafhængige N(µ,σ 2 )-fordelte Estimat for µ: ˆµ = X = 1 n n i=1 X i Hypotese: ingen kræfter påvirker partiklen, dvs µ = 0 Alternativ: µ 0 Intuitivt: Hvis X er tæt på nul tror vi på µ = 0, hvis X er langt fra nul tror vi ikke på at µ = 0 Acceptområde: c < X < c Forkastelsesområde: X c StatDataN: Test af hypotese p. 15/69

16 Teste µ = 0 Test på niveau 5% - hvad skal c være? Når µ = 0 er X N(0, n 1σ2 ) n n X σ N(0, n 1σ2 ( σ )2 ) = N(0, 1) Niveau = P( X c) = P( n σ X = 2[1 Φ( n σ c)] u p : Φ(u p ) = p eller 1 Φ(u p ) = 1 p n σ c) n σ 0.05 Niveau 5%: 1 Φ( c) = 2 = = n σ c = u c = σ n u 0.975, u = 1.96 StatDataN: Test af hypotese p. 16/69

17 Acceptområde Acceptområde: X < σ n u eller n σ X < u Forkastelsesområde: n σ X u p-værdi: observeret værdi = x ss for noget der er værre end x = P H ( X x ) = 2[1 Φ( n σ x )] StatDataN: Test af hypotese p. 17/69

18 Styrke SS (=styrke) for at forkaste under alternativ: µ 0 X N(µ, σ2 n ) P( X c) = P( X c) + P( X c) ( ) ( n n n = P σ ( X µ) ( c µ) + P σ σ ( X µ) ( ) ( ) n n = Φ ( c µ) + 1 Φ (c µ) σ σ n σ ) (c µ) Med c = σ n u fås ( Φ u n σ µ ) + 1 Φ ( u n σ µ ) Vis plot: µ fast / n fast StatDataN: Test af hypotese p. 18/69

19 Resume Model: X 1,...X n uafhængige N(µ,σ 2 )-fordelte, σ 2 kendt Hypotese: µ = 0 Alternativ: µ 0 n Beregn Z = X, σ observerede værdi = z Accept: z < u Forkast: z u p-værdi: 2[1 Φ( z )] StatDataN: Test af hypotese p. 19/69

20 Data-eksempel I en produktion af kobbertråd tages med passende mellemrum 9 stykker ud af ens længde og stykkerne vejes. Man ved af erfaring at måleusikkerheden er σ 2 = Man tilstræber en produkstandard svarende til en vægt på g. Her er 9 målinger fratrukket (vis qqplot): Beregninger: n = 9, x i = 0.062, x = z = = 2.40 u = 1.96 Konklusion: da 2.40 > 1.96 forkaster vi hypotesen om at middelværdien er 0 StatDataN: Test af hypotese p. 20/69

21 Teste µ = µ 0, σ 2 kendt I diffusionseksemplet kan vi være interesseret i at teste at der kun er én kendt kraft som påvirker partiklen, svarende til en bestemt drift µ 0 Model: X 1,...,X n uafhængige, X i N(µ,σ 2 ) Hypotese: µ = µ 0 Alternativ: µ µ 0 Lad X i = X i µ 0 N( µ,σ 2 ), µ = µ µ 0 Bemærk at X = X µ0 Så skal vi teste µ = 0 mod µ 0 Beregn Z = n σ ( X µ 0 ) observerede værdi z accept: z < u 0.975, forkast: z u p-værdi: 2[1 Φ( z )] StatDataN: Test af hypotese p. 21/69

22 Tyngdeacceleration i Ribe En bestemt experimentel opstilling til måling af tyngdeaccelerationen giver anledning til en måleusikkerhed på σ = 0.1m/s 2. Hvis den sande tyngdeacceleration er µ vil en måling X være normalfordelt med middelværdi µ og varians σ 2 For at teste om tyngdeaccelerationen i Ribe er den samme som i København, nemlig 9.81m/s 2, foretages 10 målinger. Data er Se qq-plot n = 10, x = 10 1 x i = 98.47, x = 9.847, µ 0 = 9.81, u = 1.96 z = = 1.17 Da 1.17 < 1.96 accepterer vi hypotesen at tyngdeaccelerationen i Ribe er 9.81m/s 2 StatDataN: Test af hypotese p. 22/69

23 Ensidet test for µ = 0, σ 2 kendt I diffusionseksemplet vil vi teste at ingen kræfter påvirker partiklen (µ = 0) mod alternativet at der er en kraft fra den ene side svarende til µ > 0 Intuitivt: Hvis X er tæt på nul eller er negativ tror vi på at µ = 0. Hvis X er stor og positiv tror vi ikke længere på at µ = 0 når alternativet er µ > 0 Acceptområde: X < c Forkastelsesområde: X c Hvad skal c være for at få test på niveau 5%? X c Z = n X σ n σ c, Z N(0, 1) P H (Z u 0.95 ) = 0.95, vælg n σ c = u 0.95 Accept: Z < u 0.95, Forkast: Z u 0.95 StatDataN: Test af hypotese p. 23/69

24 Ensidet test for µ = µ 0, σ 2 kendt Model: X 1,...,X n uafhængige, X i N(µ,σ 2 ) Hypotese: µ = µ 0 Alternativ: µ > µ 0 Beregn Z = n σ ( X µ 0 ) Accept: Z < u 0.95 Forkast: Z u 0.95 p-værdi: et observeret gennemsnit y er værre for hypotesen end et observeret gennemsnit x hvis y > x og y > 0 p-værdi = 1 Φ ( n ) σ ( x µ 0) hvis x > µ 0 1 hvis x µ 0 StatDataN: Test af hypotese p. 24/69

25 Cartoon StatDataN: Test af hypotese p. 25/69

26 Kast med en mønt: teste p = 1 2 Model: X 1,...,X n uafhængige, P(X i = 1) = p, P(X i = 0) = 1 p Hypotese: p = 1 2 Alternativ: p 1 2 Estimat for p: ˆp = 1 n n i=1 X i = X = observeret frekvens Intuitivt: hvis ˆp er tæt på 1 2 så tror vi på at p = 1 2 ellers ikke StatDataN: Test af hypotese p. 26/69

27 Teste p = 1 2 Ex: n = 6 Forkastelsesområde Niveau F 1 = { 0 6, 6 6 } ( 6 0) ( 1 2 )6 + ( ) 6 6 ( 1 2 )6 = F 2 = F 1 { 1 6, 5 6 } ( ) 6 1 ( 1 2 )6 + ( ) 6 5 ( 1 2 )6 = F 3 = F 2 { 2 6, 4 6 } ( ) 6 2 ( 1 2 )6 + ( ) 6 4 ( 1 2 )6 = Ex: n = 8 Forkastelsesområde Niveau F 1 = { 0 8, 8 8 } ( 8 0) ( 1 2 )8 + ( ) 8 8 ( 1 F 2 = F 1 { 1 8, 7 8 } ( ) 8 1 ( 1 2 )8 + ( ) 8 7 ( 1 F 3 = F 2 { 2 8, 6 8 } ( ) 8 2 ( 1 2 )8 + ( ) 8 6 ( 1 2 )8 = 1 2 )8 = 9 2 )8 = StatDataN: Test af hypotese p. 27/69

28 Teste p = 1 2 Ex: n = 10 Forkastelsesområde Niveau F 1 = { 0 10, } = F 2 = F 1 { 1 10, 9 10 } = F 3 = F 2 { 2 10, 8 10 } = Vis illustrationer i R Vi har et begrænset antal mulige niveauer for testet StatDataN: Test af hypotese p. 28/69

29 Teste p = 1 2 X = n i=1 X i Forkaster hvis X k eller X n k Niveau = α(k) = 2F binom(n, 1 2 )(k) (F er fordelingsfunktionen, dvs F(x) = P(X x)) p-værdi = ss for at få noget der ligger længere væk fra 1 2 end observationen x = { 2Fbinom(n, 1 2 )(x ) hvis x < n 2 2(1 F binom(n, 1 2 )(x 1)) hvis x > n 2 StatDataN: Test af hypotese p. 29/69

30 Teste p = 1 2 Normalfordelingsapproximation: X N( 1 2, 1 4n ) (centrale grænseværdisætning) X = n i=1 X i N( n 2, n 4 ) Beregn z = x 1 2 n 2 n/4 hvis x > n 2 x n 2 n/4 hvis x < n 2 Forkaster hypotesen p = 2 1 z u på niveau 5% hvis p-værdi = 2[1 Φ( z )] StatDataN: Test af hypotese p. 30/69

31 Fødsler i London I perioden fødtes der n = børn i London Fordelt efter køn: Drenge: , piger: Vi vil teste at drenge- og pigefødsler er lige hyppige. Vi kan betragte antallet af drenge som binomialfordelt, og vil teste at p = 1 2 Teststørrelse: z = = /4 Vi har således en klar forkastelse af hypotesen: 31.3 >> 1.96 p-værdi: 2[1 Φ(31.3)] = StatDataN: Test af hypotese p. 31/69

32 Ny forelæsning StatDataN: Test af hypotese p. 32/69

33 Ærteforsøg I 1865 lavede Mendel et forsøg med selvbefrugtning af 10 ærteplanter. Kimbladenes farve bestemmes af to allelle gener A og B. AA og AB: gule kimblade, BB: grønne kimblade Ifølge Mendel skal forholdet mellem gule og grønne kimblade være 3:1. Data: n = 478 planter, x = 355 gule Model: X binomial(478,p). Hypotese: p = 3 4 Alternativ: p 3 4. StatDataN: Test af hypotese p. 33/69

34 Metode Test: deler de mulige udfald op i et acceptområde og i et forkastelsesområde Intuitivt: accepterer hvis x er tæt på np 0, forkaster hvis x er langt fra np 0 Størrelsen af forkastelsområdet bestemmes af det valgte niveau for testet: α = P p=p0 (X forkastelsesområdet) = sandsynligheden for fejl af type I StatDataN: Test af hypotese p. 34/69

35 Metode p-værdi: sandsynligheden under p = p 0 for at få en værdi af X der ligger længere væk fra np 0 end den faktiske observation { x 2F = binom(n,p0 )(x ) hvis x < np 0 2(1 F binom(n,p0 )(x 1)) hvis x > np 0 n = 478, p 0 = 3 4, np 0 = x = 355 < F binom(478, 3 )(355) = StatDataN: Test af hypotese p. 35/69

36 Teste p = p 0 Model: X 1,...,X n uafhængige, P(X i = 1) = p, P(X i = 0) = 1 p Hypotese: p = p 0 Alternativ: p p 0 Exact { p-værdi: 2F = binom(n,p0 )(x ) hvis x < np 0 2(1 F binom(n,p0 )(x 1)) hvis x > np 0 StatDataN: Test af hypotese p. 36/69

37 Teste p = p 0 Normalfordelingsapproximation: X = n i=1 X i N(np 0,np 0 (1 p 0 )) Beregn x 1 np 2 0 hvis x > np 0 np0 (1 p z = 0 ) hvis x < np 0 x np 0 np0 (1 p 0 ) Forkaster hypotesen p = p 0 på niveau 5% hvis z u p-værdi = 2[1 Φ( z )] Vis approximation i R Regel: np 0 > 5 og n(1 p 0 ) > 5 StatDataN: Test af hypotese p. 37/69

38 Ærteforsøg I 1865 lavede Mendel et forsøg med selvbefrugtning af 10 ærteplanter. Kimbladenes farve bestemmes af to allelle gener A og B. AA og AB: gule kimblade, BB: grønne kimblade Ifølge Mendel skal forholdet mellem gule og grønne kimblade være 3:1. Data: n = 478 planter, x = 355 gule Vi kan betragte antallet af gule som binomialfordelte og vil teste at p = 3 4 Teststørrelse = = (1 34 ) Da 0.32 < 1.96 accepterer vi Mendels hypotese om forholdet 3:1 StatDataN: Test af hypotese p. 38/69

39 Cartoon StatDataN: Test af hypotese p. 39/69

40 Opgave x 1,...,x 100 er uafhængige målinger fra en N(µ, 1) fordeling x = Vil teste µ = 10 mod alternativet µ 10 Vil I acceptere hypotesen? StatDataN: Test af hypotese p. 40/69

41 σ 2 ukendt Experiment: En kugle slippes 1m over bordplade og tidspunkt hvor den rammer bordplade registreres: stopur startes og stoppes Teori: 1m = m s t 2 2 t = s = 0.45s Måleusikkerheder: højdemåling, start og stop af ur Usikkerheder beskrives ofte ved normalfordelingen, X N(µ,σ 2 ) σ beskriver størrelsen af usikkerhederne Lille σ: godt" experiment Teste µ = 0.45s Næsten ethvert experiment vil involvere en måleusikkerhed og typisk er σ 2 ikke kendt StatDataN: Test af hypotese p. 41/69

42 Teste µ = µ 0, σ 2 ukendt Hvordan tester vi µ = µ 0 med σ 2 ukendt? σ 2 kendt: Test på niveau 5%. Alternativ: µ µ 0 Beregn: Z = n X µ 0 σ, X = 1 n n 1 X i Accept: Z < u 0.975, Forkast: Z u σ 2 ukendt?: Naturligt at erstatte σ 2 med et skøn T = n X µ s 0 2 hvor s 2 = n 1 1 n i=1 (X i X) 2 er vores skøn over variansen σ 2 StatDataN: Test af hypotese p. 42/69

43 Typiske værdier af T Kan vi sige hvornår T har en normal værdi og hvornår den har en usædvanlig stor værdi? Ja, hvis n = 10 sætter vi grænsen ved Når µ = µ 0 vil vi i 5% af tilfældene få en T -værdi med T 2.26 n = 20: 2.09 n = 50: 2.01 n = 100: 1.98 Husk: P( Z 1.96) = 0.05, Z N(0, 1) Intuitivt: T er skalainvariant fordeling afhænger ikke af σ, men kun af n T = ( X µ 0 )/σ s2 /σ 2 StatDataN: Test af hypotese p. 43/69

44 t-fordelingen Definition: Hvis Z N(0, 1), W χ 2 [f]/f, uafhængige, så siges Z W at have en t-fordeling med f frihedsgrader Z W t[f] Vi har Z = X µ 0 σ N(0, 1) og σ s2 χ 2 [n 1]/(n 1) og derfor 2 T = ( X µ 0 )/σ t[n 1] s2 /σ 2 Vis tæthed i R F t[f] ( ): fordelingsfunktionen for en t[f]-fordeling ss for at ligge til venstre for x er F t[f] (x) t [f]: 97.5% fraktilen i en t[f]-fordeling ss for at ligge til højre for t [f] er 2.5% StatDataN: Test af hypotese p. 44/69

45 Opsummering Model: X 1,...,X n uafhængige, X i N(µ,σ 2 ) Hypotese: µ = µ 0 Alternativ: µ µ 0 Beregn T = n X µ s 0 2 observerede værdi t accept: t < t [n 1] forkast: t t [n 1] p-værdi: 2[1 F t[n 1] ( z )] t [9] = Dataeksempel! StatDataN: Test af hypotese p. 45/69

46 Simon Newcomb: lysets hastighed Omkring 1880 målte Simon Newcomb lyset hastighed over en afstand på 7400m. Nedenstående målinger skal lægges til og er tiden i nanosekunder. Den sande værdi med moderne måleteknikker er n = 64, x = 64 1 x i = 1776, x = = 27.75, s 2 = (x i x) 2 = t = n x s = = 8.29, t [63] = 2.00 Da 8.29 < 2.00 accepterer vi ikke at Newcomb har målt rigtigt. p-værdi = 2[1 F t[63] (8.29)] = StatDataN: Test af hypotese p. 46/69

47 Teste to middelværdier ens Experiment: I Kbh foretages n uafhængige målinger til bestemmelse af tyngdeaccelerationen. I Ribe foretages m uafhængige målinger med samme forsøgsopstilling. Teste at tyngdeaccelerationen er den samme de to steder X 1,...,X n uafhængige, X i N(µ 1,σ 2 ) Y 1,...,Y m uafhængige, Y i N(µ 2,σ 2 ) Hypotese: µ 1 = µ 2 Alternativ: µ 1 µ 2 StatDataN: Test af hypotese p. 47/69

48 Teste µ 1 = µ 2 X = n 1 n i=1 X i, Ȳ = m 1 m i=1 Y i s 2 x = n 1 1 n i=1 (X i X) 2, s 2 y = m 1 1 m i=1 (Y i Ȳ )2 Intuitivt: X tæt på Ȳ : så tror vi på at µ 1 = µ 2, ellers ikke Hvad er tæt på? Under hypotesen er E( X Ȳ ) = µ 1 µ 2 = 0 V ( X Ȳ ) = σ2 n + σ2 m X Ȳ N(0,σ2 ( n 1 + m 1 X )) eller Ȳ N(0, 1) σ2 ( ) n m Baserer acceptområdet på X Ȳ σ2 ( 1 n + 1 m ) StatDataN: Test af hypotese p. 48/69

49 Teste µ 1 = µ 2 σ 2 X Ȳ kendt: Beregn Z = σ2 ( ) n m Accept: z < u 0.975, Φ(u ) = Forkast: z u p-værdi = 2[1 Φ( z )] σ 2 ukendt: fælles variansestimat: s 2 X Ȳ Beregn T = t[n + m 2] s2 ( ) n m Accept: t < t [n + m 2], F t[f] (t [f]) = Forkast: t t [n + m 2] p-værdi = 2[1 F t[n+m 2] ( t )] StatDataN: Test af hypotese p. 49/69

50 Fælles variansskøn s 2 x = n 1 1 n i=1 (X i X) 2 n 1 1 χ2 [n 1] s 2 y = m 1 1 m i=1 (Y i Ȳ )2 m 1 1 χ2 [m 1] s 2 1 { = n n+m 2 i=1 (X i X) 2 + m i=1 (Y i Ȳ )2} = (n 1)s 2 x+(m 1)s 2 y n+m 2 n+m 2 1 χ2 [n + m 2] Derfor t[n + m 2] fordeling Dataeksempel StatDataN: Test af hypotese p. 50/69

51 Michelsons lysmålinger Michelson målte lyshastigheden 100 gange i 1879 og 23 gange i Data er (fratrukket km/s, sande lyshastighed er på denne skala) 1879: : Vis qq-plot Teste at Michelson måler det samme i de to år n = 100, x = , s 2 x = m = 23, ȳ = , s 2 y = OBS! s 2 = = , t = = ( ) Da 3.68 >> t [121] = 1.98 forkaster vi hypotesen om at de to experimenter er sammenlignelige (p-værdi=2[1 F t[121] (3.68) = ) StatDataN: Test af hypotese p. 51/69

52 Michelsons lysmålinger Opgave: Lad os nu for hver af de to experimenter teste at data er i overensstemmelse med den korrekte værdi for lyshastigheden StatDataN: Test af hypotese p. 52/69

53 Michelsons lysmålinger 1879: t = = = 14.92, t [99] = 1.98, p-værdi 1882: t = = 2.05, t [22] = 2.07, p-værdi = StatDataN: Test af hypotese p. 53/69

54 Cartoon StatDataN: Test af hypotese p. 54/69

55 Teste µ 1 = µ 2, σ 2 x σ 2 y Model: X 1,...,X n uafhængige, X i N(µ 1,σ 2 x) Y 1,...,Y m uafhængige, Y i N(µ 2,σ 2 y) To forskellige målemetoder, så σ 2 x σ 2 y Hypotese: µ 1 = µ 2 Alternativ: µ 1 µ 2 Under hypotesen er E( X Ȳ ) = µ 1 µ 2 = 0 V ( X Ȳ ) = σ2 x n + σ2 y m X Ȳ N(0, σ2 x n + σ2 y m ) eller X Ȳ σ 2 x n + σ2 y m N(0, 1) StatDataN: Test af hypotese p. 55/69

56 Teste µ 1 = µ 2, σ 2 x σ 2 y Vi estimerer de to varianser ved s 2 x = n 1 1 n i=1 (X i X) 2, s 2 y = m 1 1 n i=1 (Y i Ȳ )2 Teststørelse: T = X Ȳ s 2 x n + s2 y m Denne er ikke exact t-fordelt, men vi kan bruge en t-fordeling som approximation T t[f], f = ( ) s 2 2 xn + s2 y m (s 2 x )2 n 2 (n 1) + (s2 y )2 m 2 (m 1) Accept: t < t [f], Forkast: t t [f] StatDataN: Test af hypotese p. 56/69

57 Michelsons lysmålinger n = 100, x = , s 2 x = m = 23, ȳ = , s 2 y = s 2 x og s 2 y ser noget forskellige ud s2 y s 2 x p-værdi på 4%) = 1.84 (Test giver Teststørrelse: t = frihedsgrader: f = ( ) 2 (6242.7) ( ) t [f]: 2.05 (før: 1.98) p-værdi: (før: ) = 3.05 (før: t = 3.68) = (før: f = 121) Konklusion: Det rigtige her er nok at sige σ 2 x σ 2 y, men vi får stadig en kraftig forskel mellem de to experimenter StatDataN: Test af hypotese p. 57/69

58 To normalfordelinger: teste σ 2 x = σ 2 y Model: X 1,...,X n uafhængige, X i N(µ 1,σ 2 x) Y 1,...,Y m uafhængige, Y i N(µ 2,σ 2 y) Hypotese: Alternativ: σ 2 x = σ 2 y σ 2 x σ 2 y Under hypotesen er s 2 x s σ2 xχ 2 [n 1]/(n 1) 2 y σyχ 2 2 [m 1]/(m 1) = χ2 [n 1]/(n 1) χ 2 [m 1]/(m 1) per definition af en F -fordeling: = F[n 1,m 1] StatDataN: Test af hypotese p. 58/69

59 F fordeling Hvis V 1 χ 2 [f 1 ] og V 2 χ 2 [f 2 ], V 1 og V 2 uafhængige, så siges V 1/f 1 V 2 /f 2 at have en F -fordeling med f 1 frihedsgrader i tælleren og f 2 frihedsgrader i nævneren. Dette skrives V 1 /f 1 V 2 /f 2 F[f 1,f 2 ] ss for at ligge til venstre for x er F F[f1,f 2 ](x) Der er 97.5% sandsynlighed for at ligge til venstre for F [f 1,f 2 ] vigtigt: F [f 1,f 2 ] = 1 F [f 2,f 1 ] StatDataN: Test af hypotese p. 59/69

60 To normalfordelinger: teste σ 2 x = σ 2 y Teststørrelse: W = s2 x s 2 y F[n 1,m 1] Accept: F α/2 [n 1,m 1] < w < F 1 α/2 [n 1,m 1] Forkast: w F α/2 [n 1,m 1] eller w F 1 α/2 [n 1,m 1] { 2F p-værdi: [n 1,m 1] (w) w < 1 2(1 F [n 1,m 1] (w)) w > 1 Ex: Michelsons lysmålinger: n = 100, s 2 x = , m = 23, s 2 y = w = = 0.54 p-værdi = 2F [99,22] (0.54) = StatDataN: Test af hypotese p. 60/69

61 Teste µ 1 µ 2 = δ 0 Model: X 1,...,X n uafhængige, X i N(µ + δ,σ 2 ) Y 1,...,Y m uafhængige, Y i N(µ,σ 2 ) Hypotese: δ = δ 0 Alternativ: δ δ 0 Hvis vi lader X i = X i δ skal vi som før teste µ 1 = µ 2 Under hypotesen er E( X Ȳ δ 0) = µ + δ 0 µ δ 0 = 0 V ( X Ȳ δ 0) = σ2 n + σ2 m X Ȳ δ 0 N(0,σ 2 ( n 1 + m 1 )) eller X Ȳ δ 0 N(0, 1) ) σ2 ( 1 n + 1 m StatDataN: Test af hypotese p. 61/69

62 Teste µ 1 µ 2 = δ 0 Variansestimat: s 2 1 { = n n+m 2 i=1 (X i X) 2 + m i=1 (Y i Ȳ )2} Beregn T = X Ȳ δ 0 t[n + m 2] s2 ( ) n m Accept: t < t [n + m 2], F t[f] (t [f]) = Forkast: t t [n + m 2] p-værdi = 2[1 F t[n+m 2] ( t )] StatDataN: Test af hypotese p. 62/69

63 Fedme Ex: Overvægt ved sessionsmåling (BMI>30) 1. halvdel 2003: n 1 = 11527, x 1 = halvdel 2003: n 2 = 13000, x 2 = 871 Kurven er knækket, færre fede unge; Fedmen har kulmineret" (Søndagsavisen, 18/1/2003) Er der en forskel mellem de to halvår? ˆp 1 = = 0.069, ˆp 2 = = Er ˆp 1 tæt på ˆp 2? Model: X 1 binomial(n 1,p 1 ), X 2 binomial(n 2,p 2 ), uafhængige Hypotese: p 1 = p 2 (fælles værdi p) Alternativ: p 1 p 2 StatDataN: Test af hypotese p. 63/69

64 To binomialfordelinger. Teste p 1 = p 2 Under hypotesen har vi E(ˆp 1 ˆp 2 ) = n 1p 1 n 1 n 2p 2 n 2 = p 1 p 2 = p p = 0 V (ˆp 1 ˆp 2 ) = n 1p 1 (1 p 1 ) = ( n n 1 2 )p(1 p) Lad Z = n 2 1 ˆp 1 ˆp 2 p(1 p)( 1 n n 2 ) E( Z) = 0, V ( Z) = 1 + n 2p 2 (1 p 2 ) n 2 2 Normalfordelingsapproximation: Z N(0, 1) StatDataN: Test af hypotese p. 64/69

65 To binomialfordelinger. Teste p 1 = p 2 p er ukendt: Estimat for p under hypotesen: (X 1 + X 2 ) binomial(n 1 + n 2,p), ˆp = X 1+X 2 n 1 +n 2 Beregn: Z = ˆp 1 ˆp 2 ˆp(1 ˆp)( 1 n n 2 ) Accept: z < u Forkast: z u p-værdi: 2[1 Φ( z )] Sessionsfedme: ˆp 1 = , ˆp 2 = , ˆp = , z = 0.61 Konklusion: ingen grund til at tro der er sket en ændring StatDataN: Test af hypotese p. 65/69

66 Approksimation Regel: n 1ˆp > 5, n 2ˆp > 5, n 1 (1 ˆp) > 5, n 2 (1 ˆp) > 5 B > 30 B < 30 F E B > 30 B < 30 F E StatDataN: Test af hypotese p. 66/69

67 ABO-blodtype For at undersøge om frekvensen af fænotype A indenfor ABO-blodtypen havde ændret sig over tid undersøgte man 651 tilfældig valgte børn under 16 år og 1151 tilfældig valgte ældre over 65 år. A ikke A total under 16 år over 65 år Vi vil betragte dette som to uafhængige binomialfordelte målinger og teste p 1 = p 2 StatDataN: Test af hypotese p. 67/69

68 ABO-blodtype n 1 = 651, ˆp 1 = = n 2 = 1151, ˆp 2 = = ˆp = = Testtørrelse: z = = ( )( ) u : 1.96 p-værdi: 2[1 Φ(1.946)] = Konklusion: Ikke noget klart svar på accept eller forkastelse StatDataN: Test af hypotese p. 68/69

69 Approksimation Regel: n 1ˆp > 5, n 2ˆp > 5, n 1 (1 ˆp) > 5, n 2 (1 ˆp) > 5 A ikke A < > A ikke A < > StatDataN: Test af hypotese p. 69/69

Nanostatistik: Test af hypotese

Nanostatistik: Test af hypotese Nanostatistik: Test af hypotese JLJ Nanostatistik: Test af hypotese p. 1/50 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling

Læs mere

Nanostatistik: Konfidensinterval

Nanostatistik: Konfidensinterval Nanostatistik: Konfidensinterval JLJ Nanostatistik: Konfidensinterval p. 1/37 Fraktilpåmindelse u p : Φ(u p ) = p, Φ( z ) = 1 Φ( z ) t p [f] : F t[f] (t p [f]) = p, F t[f] ( t ) = 1 F t[f] ( t ) F-fordeling:

Læs mere

StatDataN: Plot af data

StatDataN: Plot af data StatDataN: Plot af data JLJ StatDataN: Plot af data p. 1/39 Repetition binomial(n,p): P(X = k) = ( n) k p k (1 p) n k n uafhængige kast med en mønt, X= antal krone X binomial(n, p), Y binomial(m, p), uafhængige

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Nanostatistik: Opgaver

Nanostatistik: Opgaver Nanostatistik: Opgaver Jens Ledet Jensen, 19/01/05 Opgaver 1 Opgaver fra Indblik i Statistik 5 Eksamensopgaver fra tidligere år 11 i ii NANOSTATISTIK: OPGAVER Opgaver Opgave 1 God opgaveskik: Når I regner

Læs mere

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ. Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte Helle Sørensen Uge 9, onsdag SaSt2 (Uge 9, onsdag) Normalfordelingens venner 1 / 20 Program Resultaterne fra denne uge skal bruges

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model). Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: 2019-03-17) 1 / 40 Statistisk test Et statistisk test er en konfrontation

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Uge 10 Teoretisk Statistik 1. marts 2004

Uge 10 Teoretisk Statistik 1. marts 2004 1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Sandsynlighedsregning

Sandsynlighedsregning Mogens Bladt www2.imm.dtu.dk/courses/02405 21. September, 2007 Lidt om binomialkoefficienter n størrelsen af en mængde/population. Vi ønsker at udtage en sub population af størrelse r. To sub populationer

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag susanne

Susanne Ditlevsen Institut for Matematiske Fag    susanne Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller

Læs mere

Estimation og konfidensintervaller

Estimation og konfidensintervaller Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Hypotesetests, fejltyper og p-værdier

Hypotesetests, fejltyper og p-værdier Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag

Læs mere

Preben Blæsild og Jens Ledet Jensen

Preben Blæsild og Jens Ledet Jensen χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren

Læs mere

Statistiske principper

Statistiske principper Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Hvorfor er normalfordelingen så normal?

Hvorfor er normalfordelingen så normal? Hvorfor er normalfordelingen så normal? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 24, 2018 normalfordelingen så normal? October 24, 2018 1 / 13 Højde af kvinder Histogram

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Basal statistik. 6. februar 2007

Basal statistik. 6. februar 2007 Basal statistik 6. februar 2007 Statistisk inferens Sandsynligheder Fordelinger Modeller Statistisk analyse Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3 Landmålingens fejlteori Repetition - Kontinuerte stokastiske variable Lektion 4 - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf10 Institut for Matematiske Fag Aalborg Universitet 29. april

Læs mere

Basal statistik. 11.september 2007

Basal statistik. 11.september 2007 Basal statistik 11.september 2007 Statistisk inferens Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab,

Læs mere

Basal statistik. 6. februar 2007

Basal statistik. 6. februar 2007 Basal statistik 6. februar 2007 Statistisk inferens Sandsynligheder Fordelinger Modeller Statistisk analyse Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel: Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m. 1 Uge 11 Teoretisk Statistik 8. marts 2004 Kapitel 3: Fordeling af en stokastisk variabel, X Kapitel 4: Fordeling af flere stokastiske variable, X 1,,X m (på en gang). NB: X 1,,X m kan være gentagne observationer

Læs mere

Højde af kvinder 2 / 18

Højde af kvinder 2 / 18 Hvorfor er normalfordelingen så normal? og er den nu også det? Søren Højsgaard (updated: 2019-03-17) 1 / 18 Højde af kvinder 2 / 18 Inddeler man i mindre grupper kan man forestille sig at histogrammet

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Basal statistik. 11.september Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke

Basal statistik. 11.september Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke Basal statistik 11.september 2007 Statistisk inferens Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab,

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler

Læs mere

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Binomialfordelingen. X ~ bin(n,p): X = antal succeser i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes. Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):

Læs mere

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Statistik og Sandsynlighedsregning 1. IH kapitel 6

Statistik og Sandsynlighedsregning 1. IH kapitel 6 Statistik og Sandsynlighedsregning 1 IH kapitel 6 Overheads til forelæsninger. Uge 41/2005 1 Test i Polynomialfordelingen Forsøg: n uafhængige gentagelse af forsøg med m udfald. Vi observerer x = x 1,...,

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

StatDataN: Middelværdi og varians

StatDataN: Middelværdi og varians StatDataN: Middelværdi og varians JLJ StatDataN: Middelværdi og varians p. 1/33 Repetition Stokastisk variabel: funktion fra udfaldsrum over i de hele tal eller over i de reelle tal Ex: Ω = alle egetræer,

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Om hypoteseprøvning (1)

Om hypoteseprøvning (1) E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8 Landmålingens fejlteori Repetition - Fordeling af slutfejl Lektion 8 - tvede@math.aau.dk http://www.math.aau.dk/ tvede/teaching/l4 Institut for Matematiske Fag Aalborg Universitet 15. maj 2008 1/13 Fordeling

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

statistik statistik viden fra data statistik viden fra data Jens Ledet Jensen Aarhus Universitetsforlag Aarhus Universitetsforlag

statistik statistik viden fra data statistik viden fra data Jens Ledet Jensen Aarhus Universitetsforlag Aarhus Universitetsforlag Jens Ledet Jensen på data, og statistik er derfor et nødvendigt værktøj i disse sammenhænge. Gennem konkrete datasæt og problemstillinger giver Statistik viden fra data en grundig indføring i de basale

Læs mere

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere