Nanostatistik: Test af hypotese
|
|
- Christina Thomsen
- 6 år siden
- Visninger:
Transkript
1 Nanostatistik: Test af hypotese JLJ Nanostatistik: Test af hypotese p. 1/50
2 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling af stokastiske variabel Skøn over parameter: unbiased, lille varians Binomial: ˆp = X Normal: ˆµ = X, variansestimat = s 2 Maximum likelihood estimation: find θ som maximerer ss for det observerede som funktion af θ Nanostatistik: Test af hypotese p. 2/50
3 Hypotese Ex: Skal vi acceptere et fifty-fifty væddemål baseret på kast med mønt? Hypotese: p = 2 1, p = P(krone) Ex: Medicinalfirma hævder at nyt præparat er bedre end det hidtil anvendte Forbrugeren: teste dette udsagn Forbruger er konservativ: vil ikke opgive det velprøvede præparat medmindre nye er klart bedre Hypotese: Nye præparat har samme effekt som gamle Alternativ: Nye præparat er bedre Ex: Tyngdeaccelerationen er målt i København til 9.81m/s 2. Vi vil undersøge om undergrunden under Ribe er anderledes end i Kbh Hypotese: tyngdeaccelerationen i Ribe er 9.81m/s 2 Nanostatistik: Test af hypotese p. 3/50
4 Hypotese Hypotese: Et udsagn om værdien af en parameter i modellen (Ex: θ = θ 0 ) Alternativ: alternative værdier af parameteren (Ex1: θ θ 0, Ex2: θ > θ 0 ) Parameteren bestemmer hvilken ss-mekanisme der frembringer data Vi ved ikke om en hypotese er sand eller falsk Indsamlede data skal bruges til at træffe en kvalificeret afgørelse Nanostatistik: Test af hypotese p. 4/50
5 Test af en hypotese Baseret på observation af X 1,X 2,...,X n ønsker vi at sige enten: vi accepterer hypotesen eller: vi forkaster hypotesen Test: deler udfaldsrummet op i en del hvor vi accepterer og en del hvor vi forkaster hypotese resultat af test sand falsk accepterer fint felj af type II forkaster fejl af type I fint Nanostatistik: Test af hypotese p. 5/50
6 Test af en hypotese sandsynlighed hypotese sand hypotese falsk forkastelsesområde α = 5% β =? Ex:55% acceptområde 1 α = 95% 1 β =? Ex:45% α vælges af os β afhænger af n og alternativet α = fejl af type I = niveau af test Sprogbrug: Test på niveau 5% Nanostatistik: Test af hypotese p. 6/50
7 p-værdi Lad F α være forkastelsesområdet for et test på niveau α, dvs P H (X F α ) = α H i P H betyder at ss udregnes under hypotesen Ex: F α = (,c α ] [c α, ) Jo større værdi af x jo værre er x for hypotesen c α bestemt ved P H ( X c α ) = α p-værdi for observation x = P H ( X x) Generelt: α 2 > α 1 F α2 er større end F α1 (F α1 F α2 ) Hvis x F α1, y F α2,y / F α1 siges x at være værre for hypotesen end y Nanostatistik: Test af hypotese p. 7/50
8 p-værdi Lad p = p(x) være valgt så at x ligger på randen af F p. Så siges x at være significant på niveau p (x F p men x / F α for α < p) p = p(x) kaldes p-værdien for observationen x p-værdien for observationen x = P H (værdi af X der er lige så slem eller værre end x) Vis R-plot Nanostatistik: Test af hypotese p. 8/50
9 Normalfordeling: test for µ = 0, σ 2 kendt Ex: Diffusion med drift µ (ukendt) og diffusionskoefficient σ 2 (kendt). Observerer position til tid 1. X 1,...,X n uafhængige N(µ,σ 2 )-fordelte Estimat for µ: ˆµ = X = 1 n n i=1 X i Hypotese: ingen kræfter påvirker partiklen, dvs µ = 0 Alternativ: µ 0 Intuitivt: Hvis X er tæt på nul tror vi på µ = 0, hvis X er langt fra nul tror vi ikke på at µ = 0 Acceptområde: c < X < c Forkastelsesområde: X c Nanostatistik: Test af hypotese p. 9/50
10 Teste µ = 0 Test på niveau 5% - hvad skal c være? Når µ = 0 er X N(0, n 1σ2 ) n n X σ N(0, n 1σ2 ( σ )2 ) = N(0, 1) Niveau = P( X c) = P( n σ X = 2[1 Φ( n σ c)] u p : Φ(u p ) = p eller 1 Φ(u p ) = 1 p n σ c) n σ 0.05 Niveau 5%: 1 Φ( c) = 2 = = n σ c = u c = σ n u 0.975, u = 1.96 Nanostatistik: Test af hypotese p. 10/50
11 Acceptområde Acceptområde: X < σ n u eller n σ X < u Forkastelsesområde: n σ X u p-værdi: observeret værdi = x ss for noget der er værre end x = P H ( X x ) = 2[1 Φ( n σ x )] Nanostatistik: Test af hypotese p. 11/50
12 Styrke SS (=styrke) for at forkaste under alternativ: µ 0 X N(µ, σ2 n ) P( X c) = P( X c) + P( X c) ( ) ( n n n = P σ ( X µ) ( c µ) + P σ σ ( X µ) ( ) ( ) n n = Φ ( c µ) + 1 Φ (c µ) σ σ n σ ) (c µ) Med c = σ n u fås ( Φ u n σ µ ) + 1 Φ ( u n σ µ ) Vis plot: µ fast / n fast Nanostatistik: Test af hypotese p. 12/50
13 Resume Model: X 1,...X n uafhængige N(µ,σ 2 )-fordelte, σ 2 kendt Hypotese: µ = 0 Alternativ: µ 0 n Beregn Z = X, σ observerede værdi = z Accept: z < u Forkast: z u p-værdi: 2[1 Φ( z )] Nanostatistik: Test af hypotese p. 13/50
14 Data-eksempel I en produktion af kobbertråd tages med passende mellemrum 9 stykker ud af ens længde og stykkerne vejes. Man ved af erfaring at måleusikkerheden er σ 2 = Man tilstræber en produkstandard svarende til en vægt på g. Her er 9 målinger fratrukket (vis qqplot): Beregninger: n = 9, x i = 0.062, x = z = = 2.40 u = 1.96 Konklusion: da 2.40 > 1.96 forkaster vi hypotesen om at middelværdien er 0 Nanostatistik: Test af hypotese p. 14/50
15 Teste µ = µ 0, σ 2 kendt I diffusionseksemplet kan vi være interesseret i at teste at der kun er én kendt kraft som påvirker partiklen, svarende til en bestemt drift µ 0 Model: X 1,...,X n uafhængige, X i N(µ,σ 2 ) Hypotese: µ = µ 0 Alternativ: µ µ 0 Lad X i = X i µ 0 N( µ,σ 2 ), µ = µ µ 0 Bemærk at X = X µ0 Så skal vi teste µ = 0 mod µ 0 Beregn Z = n σ ( X µ 0 ) observerede værdi z accept: z < u 0.975, forkast: z u p-værdi: 2[1 Φ( z )] Nanostatistik: Test af hypotese p. 15/50
16 Tyngdeacceleration i Ribe En bestemt experimentel opstilling til måling af tyngdeaccelerationen giver anledning til en måleusikkerhed på σ = 0.1m/s 2. Hvis den sande tyngdeacceleration er µ vil en måling X være normalfordelt med middelværdi µ og varians σ 2 For at teste om tyngdeaccelerationen i Ribe er den samme som i København, nemlig 9.81m/s 2, foretages 10 målinger. Data er Se qq-plot n = 10, x = 10 1 x i = 98.47, x = 9.847, µ 0 = 9.81, u = 1.96 z = = 1.17 Da 1.17 < 1.96 accepterer vi hypotesen at tyngdeaccelerationen i Ribe er 9.81m/s 2 Nanostatistik: Test af hypotese p. 16/50
17 Ensidet test for µ = 0, σ 2 kendt I diffusionseksemplet vil vi teste at ingen kræfter påvirker partiklen (µ = 0) mod alternativet at der er en kraft fra den ene side svarende til µ > 0 Intuitivt: Hvis X er tæt på nul eller er negativ tror vi på at µ = 0. Hvis X er stor og positiv tror vi ikke længere på at µ = 0 når alternativet er µ > 0 Acceptområde: X < c Forkastelsesområde: X c Hvad skal c være for at få test på niveau 5%? X c Z = n X σ n σ c, Z N(0, 1) P H (Z u 0.95 ) = 0.95, vælg n σ c = u 0.95 Accept: Z < u 0.95, Forkast: Z u 0.95 Nanostatistik: Test af hypotese p. 17/50
18 Ensidet test for µ = µ 0, σ 2 kendt Model: X 1,...,X n uafhængige, X i N(µ,σ 2 ) Hypotese: µ = µ 0 Alternativ: µ > µ 0 Beregn Z = n σ ( X µ 0 ) Accept: Z < u 0.95 Forkast: Z u 0.95 p-værdi: et observeret gennemsnit y er værre for hypotesen end et observeret gennemsnit x hvis y > x og y > 0 p-værdi = 1 Φ ( n ) σ ( x µ 0) hvis x > µ 0 1 hvis x µ 0 Nanostatistik: Test af hypotese p. 18/50
19 Kast med en mønt: teste p = 1 2 Model: X 1,...,X n uafhængige, P(X i = 1) = p, P(X i = 0) = 1 p Hypotese: p = 1 2 Alternativ: p 1 2 Estimat for p: ˆp = 1 n n i=1 X i = X = observeret frekvens Intuitivt: hvis ˆp er tæt på 1 2 så tror vi på at p = 1 2 ellers ikke Nanostatistik: Test af hypotese p. 19/50
20 Teste p = 1 2 Ex: n = 6 Forkastelsesområde Niveau F 1 = { 0 6, 6 6 } ( 6 0) ( 1 2 )6 + ( ) 6 6 ( 1 2 )6 = F 2 = F 1 { 1 6, 5 6 } ( ) 6 1 ( 1 2 )6 + ( ) 6 5 ( 1 2 )6 = F 3 = F 2 { 2 6, 4 6 } ( ) 6 2 ( 1 2 )6 + ( ) 6 4 ( 1 2 )6 = Ex: n = 8 Forkastelsesområde Niveau F 1 = { 0 8, 8 8 } ( 8 0) ( 1 2 )8 + ( ) 8 8 ( 1 F 2 = F 1 { 1 8, 7 8 } ( ) 8 1 ( 1 2 )8 + ( ) 8 7 ( 1 F 3 = F 2 { 2 8, 6 8 } ( ) 8 2 ( 1 2 )8 + ( ) 8 6 ( 1 2 )8 = 1 2 )8 = 9 2 )8 = Nanostatistik: Test af hypotese p. 20/50
21 Teste p = 1 2 Ex: n = 10 Forkastelsesområde Niveau F 1 = { 0 10, } = F 2 = F 1 { 1 10, 9 10 } = F 3 = F 2 { 2 10, 8 10 } = Vis illustrtioner i R Vi har et begrænset antal mulige niveauer for testet Nanostatistik: Test af hypotese p. 21/50
22 Teste p = 1 2 X = n i=1 X i Forkaster hvis X k eller X n k Niveau = α(k) = 2F binom(n, 1 2 )(k) (F er fordelingsfunktionen, dvs F(x) = P(X x)) p-værdi = ss for at få noget der ligger længere væk fra 1 2 end observationen x = { 2Fbinom(n, 1 2 )(x ) hvis x < n 2 2(1 F binom(n, 1 2 )(x 1)) hvis x > n 2 Nanostatistik: Test af hypotese p. 22/50
23 Teste p = 1 2 Normalfordelingsapproximation: X N( 1 2, 1 4n ) (Galton apparat) X = n i=1 X i N( n 2, n 4 ) Beregn z = x 1 2 n 2 n/4 hvis x > n 2 x n 2 n/4 hvis x < n 2 Forkaster hypotesen p = 2 1 z u på niveau 5% hvis p-værdi = 2[1 Φ( z )] Nanostatistik: Test af hypotese p. 23/50
24 Fødsler i London I perioden fødtes der n = børn i London Fordelt efter køn: Drenge: , piger: Vi vil teste at drenge- og pigefødsler er lige hyppige. Vi kan betragte antallet af drenge som binomialfordelt, og vil teste at p = 1 2 Teststørrelse: z = = /4 Vi har således en klar forkastelse af hypotesen: 31.3 >> 1.96 p-værdi: 2[1 Φ(31.3)] = Nanostatistik: Test af hypotese p. 24/50
25 Teste p = p 0 Model: X 1,...,X n uafhængige, P(X i = 1) = p, P(X i = 0) = 1 p Hypotese: p = p 0 Alternativ: p p 0 Exact { p-værdi: 2F = binom(n,p0 )(x ) hvis x < np 0 2(1 F binom(n,p0 )(x 1)) hvis x > np 0 Nanostatistik: Test af hypotese p. 25/50
26 Teste p = p 0 Normalfordelingsapproximation: X = n i=1 X i N(np 0,np 0 (1 p 0 )) Beregn x 1 np 2 0 hvis x > np 0 np0 (1 p z = 0 ) hvis x < np 0 x np 0 np0 (1 p 0 ) Forkaster hypotesen p = p 0 på niveau 5% hvis z u p-værdi = 2[1 Φ( z )] Vis approximation i R Regel: np 0 > 5 og n(1 p 0 ) > 5 Nanostatistik: Test af hypotese p. 26/50
27 Ærteforsøg I 1865 lavede Mendel et forsøg med selvbefrugtning af 10 ærteplanter. Kimbladenes farve bestemmes af to allelle gener A og B. AA og AB: gule kimblade, BB: grønne kimblade Ifølge Mendel skal forholdet mellem gule og grønne kimblade være 3:1. Data: n = 478 planter, x = 355 gule Vi kan betragte antallet af gule som binomialfordelte og vil teste at p = 3 4 Teststørrelse = = (1 34 ) Da 0.42 < 1.96 accepterer vi Mendels hypotese om forholdet 3:1 Nanostatistik: Test af hypotese p. 27/50
28 σ 2 ukendt Experiment: En kugle slippes 1m over bordplade og tidspunkt hvor den rammer bordplade registreres: stopur startes og stoppes Teori: 1m = m s t 2 2 t = s = 0.45s Måleusikkerheder: højdemåling, start og stop af ur Usikkerheder beskrives ofte ved normalfordelingen, X N(µ,σ 2 ) σ beskriver størrelsen af usikkerhederne Lille σ: godt" experiment Teste µ = 0.45s Næsten ethvert experiment vil involvere en måleusikkerhed og typisk er σ 2 ikke kendt Nanostatistik: Test af hypotese p. 28/50
29 Teste µ = µ 0, σ 2 ukendt Hvordan tester vi µ = µ 0 med σ 2 ukendt? σ 2 kendt: Test på niveau 5%. Alternativ: µ µ 0 Beregn: Z = n X µ 0 σ, X = 1 n n 1 X i Accept: Z < u 0.975, Forkast: Z u σ 2 ukendt?: Naturligt at erstatte σ 2 med et skøn T = n X µ s 0 2 hvor s 2 = n 1 1 n i=1 (X i X) 2 er vores skøn over variansen σ 2 Nanostatistik: Test af hypotese p. 29/50
30 Typiske værdier af T Kan vi sige hvornår T har en normal værdi og hvornår den har en usædvanlig stor værdi? Ja, hvis n = 10 sætter vi grænsen ved Når µ = µ 0 vil vi i 5% af tilfældene få en T -værdi med T 2.26 n = 20: 2.09 n = 50: 2.01 n = 100: 1.98 Husk: P( Z 1.96) = 0.05, Z N(0, 1) Intuitivt: T er skalainvariant fordeling afhænger ikke af σ, men kun af n T = ( X µ 0 )/σ s2 /σ 2 Nanostatistik: Test af hypotese p. 30/50
31 t-fordelingen Definition: Hvis Z N(0, 1), W χ 2 [f]/f, uafhængige, så siges Z W at have en t-fordeling med f frihedsgrader Z W t[f] Vi har Z = X µ 0 σ N(0, 1) og σ s2 χ 2 [n 1]/(n 1) og derfor 2 T = ( X µ 0 )/σ t[n 1] s2 /σ 2 Vis tæthed i R Nanostatistik: Test af hypotese p. 31/50
32 Opsummering Model: X 1,...,X n uafhængige, X i N(µ,σ 2 ) Hypotese: µ = µ 0 Alternativ: µ µ 0 Beregn T = n X µ s 0 2 observerede værdi t accept: t < t [n 1] forkast: t t [n 1] p-værdi: 2[1 F t[n 1] ( z )] Hvor F t[f] er fordelingsfunktionen for en t[f]-fordeling t [f] er 97.5% fraktilen i en t[f]-fordeling, dvs der er 97.5% ss for at ligge under t [f] og 2.5% for at ligge over: F t[f] (t [f]) = Dataeksempel! Nanostatistik: Test af hypotese p. 32/50
33 Simon Newcomb: lysets hastighed Omkring 1880 målte Simon Newcomb lyset hastighed over en afstand på 7400m. Nedenstående målinger skal lægges til og er tiden i nanosekunder. Den sande værdi med moderne måleteknikker er n = 64, x = 64 1 x i = 1776, x = = 27.75, s 2 = (x i x) 2 = t = n x s = = 8.29, t [63] = 2.00 Da 8.29 < 2.00 accepterer vi ikke at Newcomb har målt rigtigt. p-værdi = 2[1 F t[63] (8.29)] = Nanostatistik: Test af hypotese p. 33/50
34 Teste to middelværdier ens Experiment: I Kbh foretages n uafhængige målinger til bestemmelse af tyngdeaccelerationen. I Ribe foretages m uafhængige målinger med samme forsøgsopstilling. Teste at tyngdeaccelerationen er den samme de to steder X 1,...,X n uafhængige, X i N(µ 1,σ 2 ) Y 1,...,Y m uafhængige, Y i N(µ 2,σ 2 ) Hypotese: µ 1 = µ 2 Alternativ: µ 1 µ 2 Nanostatistik: Test af hypotese p. 34/50
35 Teste µ 1 = µ 2 X = 1 n n i=1 X i, 1 m Ȳ = m s 2 x = 1 n 1 i=1 Y i n i=1 (X i X) 2, s 2 y = 1 m 1 m i=1 (Y i Ȳ )2 Intuitivt: X tæt på Ȳ : så tror vi på at µ 1 = µ 2, ellers ikke Hvad er tæt på? Under hypotesen er E( X Ȳ ) = µ 1 µ 2 = 0 V ( X Ȳ ) = σ2 n + σ2 m X Ȳ N(0,σ2 ( n 1 + m 1 X )) eller Ȳ N(0, 1) σ2 ( ) n m Nanostatistik: Test af hypotese p. 35/50
36 Teste µ 1 = µ 2 σ 2 X Ȳ kendt: Beregn Z = σ2 ( ) n m Accept: z < u 0.975, Φ(u ) = Forkast: z u p-værdi = 2[1 Φ( z )] σ 2 ukendt: variansestimat: s 2 = { n i=1 (X i X) 2 + m 1 n+m 2 Beregn T = X Ȳ t[n + m 2] s2 ( ) n m i=1 (Y i Ȳ )2} = (n 1)s2 x+(m 1)s 2 y n+m 2 Accept: t < t [n + m 2], F t[f] (t [f]) = Forkast: t t [n + m 2] p-værdi = 2[1 F t[n+m 2] ( t )] Dataeksempel Nanostatistik: Test af hypotese p. 36/50
37 Michelsons lysmålinger Michelson målte lyshastigheden 100 gange i 1879 og 23 gange i Data er (fratrukket km/s, sande lyshastighed er på denne skala) 1879: : Vis qq-plot Teste at Michelson måler det samme i de to år n = 100, x = , s 2 x = m = 23, ȳ = , s 2 y = OBS! s 2 = = , t = = ( ) Da 3.68 >> t [121] = 1.98 forkaster vi hypotesen om at de to experimenter er sammenlignelige (p-værdi=2[1 F t[121] (4.90) = ) Nanostatistik: Test af hypotese p. 37/50
38 Michelsons lysmålinger Lad os nu for hver af de to experimenter teste at data er i overensstemmelse med den korrekte værdi for lyshastigheden 1879: t = = = 14.92, t [99] = 1.98, p-værdi 1882: t = = 2.05, t [22] = 2.07, p-værdi = Nanostatistik: Test af hypotese p. 38/50
39 Teste µ 1 = µ 2, σ 2 x σ 2 y Model: X 1,...,X n uafhængige, X i N(µ 1,σ 2 x) Y 1,...,Y m uafhængige, Y i N(µ 2,σ 2 y) To forskellige målemetoder, så σ 2 x σ 2 y Hypotese: µ 1 = µ 2 Alternativ: µ 1 µ 2 Under hypotesen er E( X Ȳ ) = µ 1 µ 2 = 0 V ( X Ȳ ) = σ2 x n + σ2 y m X Ȳ N(0, σ2 x n + σ2 y m ) eller X Ȳ σ 2 x n + σ2 y m N(0, 1) Nanostatistik: Test af hypotese p. 39/50
40 Teste µ 1 = µ 2, σ 2 x σ 2 y Vi estimerer de to varianser ved s 2 x = n 1 1 n i=1 (X i X) 2, s 2 y = m 1 1 n i=1 (Y i Ȳ )2 Teststørelse: T = X Ȳ s 2 x n + s2 y m Denne er ikke exact t-fordelt, men vi kan bruge en t-fordeling som approximation T t[f], f = ( ) s 2 2 xn + s2 y m (s 2 x )2 n 2 (n 1) + (s2 y )2 m 2 (m 1) Accept: t < t [f], Forkast: t t [f] Nanostatistik: Test af hypotese p. 40/50
41 Michelsons lysmålinger n = 100, x = , s 2 x = m = 23, ȳ = , s 2 y = s 2 x og s 2 y ser noget forskellige ud s2 y s 2 x p-værdi på 4%) = 1.84 (Test giver Teststørrelse: t = frihedsgrader: f = ( ) 2 (6242.7) ( ) t [f]: 2.05 (før: 1.98) p-værdi: (før: ) = 3.05 (før: t = 3.68) = (før: f = 121) Konklusion: Det rigtige her er nok at sige σ 2 x σ 2 y, men vi får stadig en kraftig forskel mellem de to experimenter Nanostatistik: Test af hypotese p. 41/50
42 To normalfordelinger: teste σ 2 x = σ 2 y Model: X 1,...,X n uafhængige, X i N(µ 1,σ 2 x) Y 1,...,Y m uafhængige, Y i N(µ 2,σ 2 y) Hypotese: Alternativ: σ 2 x = σ 2 y σ 2 x σ 2 y Under hypotesen er s 2 x s σ2 xχ 2 [n 1]/(n 1) 2 y σyχ 2 2 [m 1]/(m 1) = χ2 [n 1]/(n 1) χ 2 [m 1]/(m 1) = F[n 1,m 1] per definition af en F -fordeling: Hvis V 1 χ 2 [f 1 ] og V 2 χ 2 [f 2 ], V 1 og V 2 uafhængige, så siges V 1/f 1 V 2 /f 2 at have en F -fordeling med f 1 frihedsgrader i tælleren og f 2 frihedsgrader i nævneren. Dette skrives V 1 /f 1 V 2 /f 2 F[f 1,f 2 ] Nanostatistik: Test af hypotese p. 42/50
43 To normalfordelinger: teste σ 2 x = σ 2 y Teststørrelse: W = s2 x s 2 y F[n 1,m 1] Accept: F α/2 [n 1,m 1] < w < F 1 α/2 [n 1,m 1] Forkast: w F α/2 [n 1,m 1] eller w F 1 α/2 [n 1,m 1] { 2F p-værdi: [n 1,m 1] (w) w < 1 2(1 F [n 1,m 1] (w)) w > 1 Ex: Michelsons lysmålinger: n = 100, s 2 x = , m = 23, s 2 y = w = = 0.54 p-værdi = 2F [99,22] (0.54) = Nanostatistik: Test af hypotese p. 43/50
44 Teste µ 1 µ 2 = δ 0 Model: X 1,...,X n uafhængige, X i N(µ + δ,σ 2 ) Y 1,...,Y m uafhængige, Y i N(µ,σ 2 ) Hypotese: δ = δ 0 Alternativ: δ δ 0 Hvis vi lader X i = X i δ skal vi som før teste µ 1 = µ 2 Under hypotesen er E( X Ȳ δ 0) = µ + δ 0 µ δ 0 = 0 V ( X Ȳ δ 0) = σ2 n + σ2 m X Ȳ δ 0 N(0,σ 2 ( n 1 + m 1 )) eller X Ȳ δ 0 σ 2 1 n + 1 m N(0, 1) Nanostatistik: Test af hypotese p. 44/50
45 Teste µ 1 µ2 = δ 0 Variansestimat: s 2 1 { = n n+m 2 i=1 (X i X) 2 + m i=1 (Y i Ȳ )2} Beregn T = X Ȳ δ 0 t[n + m 2] s2 ( ) n m Accept: t < t [n + m 2], F t[f] (t [f]) = Forkast: t t [n + m 2] p-værdi = 2[1 F t[n+m 2] ( t )] Nanostatistik: Test af hypotese p. 45/50
46 Fedme Ex: Overvægt ved sessionsmåling (BMI>30) 1. halvdel 2003: n 1 = 11527, x 1 = halvdel 2003: n 2 = 13000, x 2 = 871 Kurven er knækket, færre fede unge; Fedmen har kulmineret" (Søndagsavisen, 18/1/2003) Er der en forskel mellem de to halvår? ˆp 1 = = 0.069, ˆp 2 = = Er ˆp 1 tæt på ˆp 2? Model: X 1 binomial(n 1,p 1 ), X 2 binomial(n 2,p 2 ), uafhængige Hypotese: p 1 = p 2 (fælles værdi p) Alternativ: p 1 p 2 Nanostatistik: Test af hypotese p. 46/50
47 To binomialfordelinger. Teste p 1 = p 2 Under hypotesen har vi E(ˆp 1 ˆp 2 ) = n 1p 1 n 1 n 2p 2 n 2 = p 1 p 2 = p p = 0 V (ˆp 1 ˆp 2 ) = n 1p 1 (1 p 1 ) = ( n n 1 2 )p(1 p) Lad Z = n 2 1 ˆp 1 ˆp 2 p(1 p)( 1 n n 2 ) E( Z) = 0, V ( Z) = 1 n 2p 2 (1 p 2 ) n 2 2 Normalfordelingsapproximation: Z N(0, 1) Regel: n 1ˆp > 5, n 2ˆp > 5, n 1 (1 ˆp) > 5, n 2 (1 ˆp) > 5 Nanostatistik: Test af hypotese p. 47/50
48 To binomialfordelinger. Teste p 1 = p 2 p er ukendt: Estimat for p under hypotesen: (X 1 + X 2 ) binomial(n 1 + n 2,p), ˆp = X 1+X 2 n 1 +n 2 Beregn: Z = ˆp 1 ˆp 2 ˆp(1 ˆp)( 1 n n 2 ) Accept: z < u Forkast: z u p-værdi: 2[1 Φ( z )] Sessionsfedme: ˆp 1 = , ˆp 2 = , ˆp = , z = 0.61 Konklusion: ingen grund til at tro der er sket en ændring Nanostatistik: Test af hypotese p. 48/50
49 ABO-blodtype For at undersøge om frekvensen af fænotype A indenfor ABO-blodtypen havde ændret sig over tid undersøgte man 651 tilfældig valgte børn under 16 år og 1151 tilfældig valgte ældre over 65 år. A ikke A total under 16 år over 65 år Vi vil betragte dette som to uafhængige binomialfordelte målinger og teste p 1 = p 2 Nanostatistik: Test af hypotese p. 49/50
50 ABO-blodtype n 1 = 651, ˆp 1 = = n 2 = 1151, ˆp 2 = = ˆp = = Testtørrelse: z = = ( )( ) u : 1.96 p-værdi: 2[1 Φ(1.946)] = Konklusion: Ikke noget klart svar på accept eller forkastelse Nanostatistik: Test af hypotese p. 50/50
StatDataN: Test af hypotese
StatDataN: Test af hypotese JLJ StatDataN: Test af hypotese p. 1/69 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling
Læs mereNanostatistik: Konfidensinterval
Nanostatistik: Konfidensinterval JLJ Nanostatistik: Konfidensinterval p. 1/37 Fraktilpåmindelse u p : Φ(u p ) = p, Φ( z ) = 1 Φ( z ) t p [f] : F t[f] (t p [f]) = p, F t[f] ( t ) = 1 F t[f] ( t ) F-fordeling:
Læs mereStatDataN: Plot af data
StatDataN: Plot af data JLJ StatDataN: Plot af data p. 1/39 Repetition binomial(n,p): P(X = k) = ( n) k p k (1 p) n k n uafhængige kast med en mønt, X= antal krone X binomial(n, p), Y binomial(m, p), uafhængige
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereProgram: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Læs meret-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.
t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,
Læs mereNanostatistik: Opgavebesvarelser
Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereBinomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Læs mereAgenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Læs mereProgram. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Læs mereNanostatistik: Opgaver
Nanostatistik: Opgaver Jens Ledet Jensen, 19/01/05 Opgaver 1 Opgaver fra Indblik i Statistik 5 Eksamensopgaver fra tidligere år 11 i ii NANOSTATISTIK: OPGAVER Opgaver Opgave 1 God opgaveskik: Når I regner
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereOverheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.
Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereDagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at
Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereKvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
Læs mereStatistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte Helle Sørensen Uge 9, onsdag SaSt2 (Uge 9, onsdag) Normalfordelingens venner 1 / 20 Program Resultaterne fra denne uge skal bruges
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereHvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm
Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation
Læs mereLandmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:
Læs mereLandmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen
Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,
Læs mereUge 10 Teoretisk Statistik 1. marts 2004
1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereEt statistisk test er en konfrontation af virkelighenden (data) med en teori (model).
Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: 2019-03-17) 1 / 40 Statistisk test Et statistisk test er en konfrontation
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereDefinition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereTeoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.
Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt
Læs mereSusanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller
Læs mereEx µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:
Normal fordeling Tæthedsfunktion for normalfordeling med middelværdi µ og varians σ 2 : Program (8.15-10): f() = 1 µ)2 ep( ( 2πσ 2 2σ 2 ) E µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4 1. vigtige sandsynlighedsfordelinger:
Læs mereEstimation og konfidensintervaller
Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereStatistiske principper
Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis
Læs mereLandmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3
Landmålingens fejlteori Repetition - Kontinuerte stokastiske variable Lektion 4 - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf10 Institut for Matematiske Fag Aalborg Universitet 29. april
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereMotivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser
Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereResumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
Læs merePraktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser
Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag
Læs mereForelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Læs mereSupplement til kapitel 7: Approksimationen til normalfordelingen, s. 136
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man
Læs mereDagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22
Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som
Læs mere1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Læs mereSandsynlighedsregning
Mogens Bladt www2.imm.dtu.dk/courses/02405 21. September, 2007 Lidt om binomialkoefficienter n størrelsen af en mængde/population. Vi ønsker at udtage en sub population af størrelse r. To sub populationer
Læs mereForelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereProgram. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger
Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt
Læs mereFor nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.
1 Uge 11 Teoretisk Statistik 8. marts 2004 Kapitel 3: Fordeling af en stokastisk variabel, X Kapitel 4: Fordeling af flere stokastiske variable, X 1,,X m (på en gang). NB: X 1,,X m kan være gentagne observationer
Læs mereHypotesetests, fejltyper og p-værdier
Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet
Læs mereKvantitative Metoder 1 - Forår Dagens program
Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereBasal statistik. 11.september 2007
Basal statistik 11.september 2007 Statistisk inferens Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab,
Læs mereBasal statistik. 6. februar 2007
Basal statistik 6. februar 2007 Statistisk inferens Sandsynligheder Fordelinger Modeller Statistisk analyse Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns
Læs mereNote om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Læs mereHypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Læs mereNanostatistik: Lineær regression
Nanostatistik: Lineær regression JLJ Nanostatistik: Lineær regression p. 1/41 Sammenhænge Funktionssammenhæng: y er en funktion af x. Ex: Hvis jeg kender afstanden mellem to galakser så kender jeg også
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.
Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Læs mereOpgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)
Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereProgram. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12
Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption
Læs mereOm hypoteseprøvning (1)
E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;
Læs merePreben Blæsild og Jens Ledet Jensen
χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt
Læs mereBasal statistik. 11.september Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke
Basal statistik 11.september 2007 Statistisk inferens Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab,
Læs mereKvantitative Metoder 1 - Efterår Dagens program
Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1
Læs mereBasal statistik. 6. februar 2007
Basal statistik 6. februar 2007 Statistisk inferens Sandsynligheder Fordelinger Modeller Statistisk analyse Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns
Læs mereHvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand
Læs mereLandmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8
Landmålingens fejlteori Repetition - Fordeling af slutfejl Lektion 8 - tvede@math.aau.dk http://www.math.aau.dk/ tvede/teaching/l4 Institut for Matematiske Fag Aalborg Universitet 15. maj 2008 1/13 Fordeling
Læs mereRettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Læs mereModule 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Læs mereForelæsning 9: Inferens for andele (kapitel 10)
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereKvantitative Metoder 1 - Efterår Dagens program
Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler
Læs mereKursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Læs mereLandmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable
Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset
Læs mereOpgaver til kapitel 3
Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereSandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Læs mereBinomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.
Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereDefinition. Definitioner
Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/
Læs mereHvorfor er normalfordelingen så normal?
Hvorfor er normalfordelingen så normal? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 24, 2018 normalfordelingen så normal? October 24, 2018 1 / 13 Højde af kvinder Histogram
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet
Læs mereHøjde af kvinder 2 / 18
Hvorfor er normalfordelingen så normal? og er den nu også det? Søren Højsgaard (updated: 2019-03-17) 1 / 18 Højde af kvinder 2 / 18 Inddeler man i mindre grupper kan man forestille sig at histogrammet
Læs mereLidt om fordelinger, afledt af normalfordelingen
IMM, 2002-10-10 Poul Thyregod Lidt om fordelinger, afledt af normalfordelingen 1 Introduktion I forbindelse med inferens i normalfordelinger optræder forskellige fordelinger, der er afledt af normalfordelingen,
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs mereBasal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder
Læs mere5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14
Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5
Læs mere02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4
02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 Vejledende løsning 5.46 P (0.010 < error < 0.015) = (0.015 0.010)/0.050 = 0.1 > punif(0.015,-0.025,0.025)-punif(0.01,-0.025,0.025) [1] 0.1
Læs mereSandsynlighed og Statistik
36 Sandsynlighed og Statistik 6.1 Indledning Denne note beskriver de statistiske begreber og formler som man med rimelig sandsynlighed kan komme ud for i eksperimentelle øvelser. Alt er yderst korfattet,
Læs mereElementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder
Læs mere