Konfidensintervaller og Hypotesetest
|
|
|
- Alma Karla Therkildsen
- 10 år siden
- Visninger:
Transkript
1 Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele
2 Repetition fra sidst: Konfidensintervaller Et punkt-estimat estimerer værdien af en ukendt populations parameter ved en enkelt værdi. Fx: Middelhøjden blandt oecon studernde x =17,73. Et konfidens interval er et interval, der estimerer værdien af en ukendt populations parameter. Kaldes også et interval estimat. Sammen med intervallet gives et mål for, hvor sikker man er på, at den sande populations parameter ligger i intervallet. Dette mål kaldes for konfidens niveauet. Et punkt estimat indeholder ikke meget information om den faktiske værdi af μ fx hvor sikkert er vores punkt estimat? Et interval estimat indeholder flere informationer, for eksempel: Vi er 95% sikre på, at intervallet [164,8 ; 18,7] indeholde den sande middelværdi μ. Eller vi er 9% sikre på, at intervallet [166,1 ; 179,3] indeholder den sande middelværdi μ.
3 Repetition fra sidst (1-α)1% konfidens interval for: Populations middelværdi μ, når X er normal fordelt (eller stikprøven er stor) og σ er kendt: x ± z α σ n α Populations middelværdi μ, når X er normal fordelt og σ er ukendt: s x ± t α n α z α Husk: n-1 frihedsgrader t α
4 Konfidensinterval for andele Estimatet af populations-andelen, p, er stikprøve-andelen,,dvs. andelen af succeser i stikprøven. pˆ Hvis np>5 og n(1-p)>5, så er stikprøve-fordelingen af stikprøve-andelen ca normalfordelt: p p Pˆ (1 ) ~ N p, n Et (1-α)1% konfidensinterval for p er pˆ ± z α pˆ(1 n pˆ)
5 Eksempel 6-4 For For en en given produkttype: Hvor stor stor en en andel af af det det amerikanske marked er er besat af af udenlandske virksomheder? En En stikprøve på på1 forbrugere udtages og og af af disse bruger et et udenlandske produkt; resten bruger et et amerikanske produkt. Giv Giv et et 95% 95% konfidensinterval for for andelen af af brugere af af udenlandske produkter. pˆ ± z α pq ˆ ˆ n (.34)(.66) =.34 ± =.34 ± (1.96)(.4737) =.34 ±.98 = [.47,.438]
6 χ -fordelingen χ -fordelingen [ki-i-anden] er asymmetrisk og kun defineret for positive tal. χ -fordelingen er (li som t-fordelingen) specificeret ved antal frihedsgrader (df). Notation: X~χ (n) [X følger en χ - fordelingenmed n frihedsgrader]. Chi-Square D istrib ution: df=1, df=3, df=5 χ 5 -fordelingen er sandsynligheds χ fordelingen for en sum af uafhængige kvadrerede standard normal fordelte stokastiske variable. Hvis X~χ (df) gælder: Middelværdien er lig med antallet af frihedsgraden, E(X)=df Variansen er lig med to gange antallet af frihedsgrader, V(X)=df df = 1 df = 3 df = 5 1
7 χ -fordelingen og stikprøvevariansen Stikprøve variansen, S n n ( X X ) n 1 X i= i i= 1 i = = n 1 n 1 er en central estimator for populations variansen σ². Hvis stikprøven er taget fra en normal-fordeling, så er den stokastiske variabel: ( n 1) S χ = σ χ -fordelt med n-1 frihedsgrader. ( ) n X i= 1 Konfidensintervaller for populations-variansen er baseret på χ -fordelingen. i
8 Sandsynligheder i χ fordelingen Tabel 4 s778 α Areal i højre hale (α) χ α
9 Konfidens interval for populations variansen, σ Et (1-α)1% konfidens interval for populations variansen σ (hvis populationen er normal fordelt) er givet som: ( n ) s 1, ( n 1 ) s χ α χ α 1 α hvor er fraktilen i χ fordelingen og χ α χ α 1 er 1 α fraktilen. Bemærk: Fordi Fordi χ fordelingen er er skæv, skæv, er er konfidens-intervallet for for populations-variansen ikke ikke symmetrisk omkring s..
10 Eksempel 6-5 En En maskine fylder kaffekander (med kaffe ;-) ;-) Hvis Hvis det det gennemsnitlige indhold er er forskellig fra fra hvad det det skal skal være, kan kan maskinen justeres. Hvis Hvis variansen er er for for høj, høj, skal skal maskinen sendes til til reparation. En En stikprøve på på3 3 kander giver et et varians estimat på påss = 18,54. Giv Giv et et 95% 95% konfidens interval for for populations variansen, σ.. ( n 1) s ( n 1) s, χ α α χ 1 =
11 Eksempel 6-5 Chi-Square Distribution: df = 9 ( n 1) s ( n 1) s, χ α α χ 1 f(χ ) χ χ 4 = 16 5 χ = Areal i højre hale df
12 Hypoteser og hypotesetest. En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable Fx Er middelhøjden af de Oecon studerende lig 175cm? I en hypotesetest testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra data. For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til 17,7 cm. Er det (signifikant) forskellig fra 175? Det er forskellig fra 175, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation, afhængig af eksempelvis stikprøvestørrelsen? En hypotesetest består af 5 elementer: I. Antagelser II. Hypoteser III. Teststørrelser IV. p-værdi V. Beslutning/konklusion
13 I: Antagelser Type af data: Se på om det er diskrete eller kontinuerte data. Populationsfordeling: Se på hvilken fordeling populationen har. Stikprøve: Hvilken metode er brugt til at indsamle data. Skal være en simpel stikprøve i de test vi bruger. Stikprøvestørrelse: Hvor stor er den stikprøve vi har til at beregne test størrelsen?
14 II: Hypoteser Nul hypotesen H : En påstand om en populationsparameter. Er sand indtil vi statistisk er bevist at den er sand. Den alternative hypotese H 1 : En påstand om alle situationer, der ikke er dækket af H, dvs. det modsatte af H. Nul hypotesen er sand indtil det modsatte er bevist. Eksempel: Nul- og alternativ-hypoteser for middelværdien H : μ = 5 H : μ 5 1 H : μ 5 H : μ < 5 1 H : μ 5 H : μ > 5 1 Oecon eksempel: H : μ = 175 vs H 1 : μ 175
15 III: Test størrelsen Teststørrelsen beregnes fra stikprøve data og bruges til at vurdere nul-hypotesen H. Den indeholder typisk et punktestimat for den parameter, der indgår i nul hypotesen for eksempel stikprøve gennemsnittet som punktestimat for middelværdien. Oecon eksempel: Stikprøvegennemsnittet er teststørrelsen til test af H hypotesen μ = 175. Konkret x = , hvilket er ufavorabelt for H, men er det bevis nok til at afvise H eller er det bare tilfældighedernes spil? x
16 IV: p-værdi p-værdien er et mål for troværdigheden af H set i lyset af den aktuelle stikprøve. Formelt er p-værdien af en test, er sandsynligheden for at observere en ny teststørrelse, der er mindst lige så ufarvorabel for H som den observerede teststørrelse, når nul hypotesen er sand. Jo mindre p-værdi jo mere signifikant siger man testet er. Bemærk: Selvom H er sand kan man godt få en lille p- værdi og omvendt.
17 V: Konklusion/beslutnings regel En beslutningsregel for en hypotese test, er en regel for under hvilke betingelse nul hypotesen kan forkastes. Betragt H : μ=175. Beslutnings reglen kan her være at forkaste H, når stikprøve gennemsnittet er under 17. Typisk bruges dog p-værdien for testen. Så en beslutningsregel er for eksempel at forkaste H, når p-værdien er mindre end.5. Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den. Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til at sige, at den alternative hypotese er sand.
18 Signifikansniveau α Signifikansniveauet α er et tal, således at H forkastes, hvis p- værdien er mindre end α. α er normalvis.5 eller.1. Vælges før analysen foretages. Konklusion p-værdi H H 1 p < α Forkast Accepter p > α Forkast ikke Accepter ikke Hvor lille et signifikans niveau man vælger, afhænger af hvilke konsekvenser beslutningen om at forkaste H har. Hvis det er et spørgsmål om liv eller død, for eksempel i medicinske forsøg, vælges α meget lille. Men hvis det bare er at teste om et folketingsparti er større end et andet, kan man godt α større.
19 Test af middelværdi (to-sidet test) Antagelse: Test af μ, X kvantitativ variabel og n>3. Hypoteser: H H 1 : μ = μ : μ μ Stikprøvefordeling af X når H er sand er approksimativ normal med middelværdi μ og standard afvigelse σ n standardisering Teststørrelse: Z = μ x X μ σ n z
20 Beregning af p-værdi Når H er sand, er fordelingen af Z approksimativt standard normal fordelt (dvs. normal fordelt med middelværdi og standard afvigelse 1). p-værdien er sandsynligheden for at observere en teststørrelse mindst så ufavorabel, som den observerede, givet at H er sand. I formler: P( Z > beregnet z værdi), svarende til sandsynligheden for at observere et gennemsnit der er længere fra μ end, hvis H er sand. Sansynligheden ovenfor bestemmes ved tabelopslag (det er derfor vi standardiserer). x Meget nemmere at se ved hjælp af et eksempel
21 Eksempel Hypoteser: H : μ = 3 H 1 : μ 3 Stikprøve: n = 5 x = 31.5 σ = 5 p-værdi: p = p( Z >,1) = p( Z >,1) =.17 =.34 Lille p-værdi, så H forkastes. Fordeling: Teststørrelse: Z = =, z =.1 z =. 1
22 Summe opgave H: μ = 3 H1: μ 3 H: μ = 3 H1: μ 3 Stikprøve: n = x = 31.5 σ = 5 Stikprøve: n = 1 x = 31.5 σ = 5 Beregn værdien af test størrelsen og p-værdien. Beregn værdien af test størrelsen og p-værdien
23 Relation til konfidens intervaller 95% konfidensinterval for μ, dvs. α =.5: σ 5 x± 1.96 = 31.5 ± 1.96 n 5 Middelværdi under H 95% konfidensinterval omkring observeret middelværdi μ = x = 31.5 Da (1 α)1% konfidensintervallet ikke overlapper μ er p-værdien mindre end α=.5, dvs. vi forkaster H.
24 Hvorfor = i nul hypotesen H : μ μ H1 : μ > μ H skrives i det H : μ = μ H : μ > μ 1 følgende som : Grunden til dette er, at man på denne måde "lader tvivlen komme H til gode". Desuden er vi kun interesseret i, om μ er større ( eller mindre, hvis < ) end en givet værdi, ikke hvor meget den evt. er mindre.
25 Højresidet test (et en-sidet test) Antagelse: Test af μ, X kontinuert variabel og n>3. Hypoteser: H H 1 : μ = μ : μ > μ Stikprøve fordeling af X når H er sand er approksimativ normal med middelværdi μ og standard afvigelse σ n Teststørrelse: Z = X μ σ n P-værdien: p( Z > observeret z værdi)
26 Eksempel højresidet test H: μ = 3 H1: μ > 3 Stikprøve: n = 5 x = 31.5 σ = 5 Test størrelse: P-værdi: p = p( z >,1) =.17 Lille p-værdi, så H forkastes Fordeling: Z=,1.17 Z = =, μ =3 x=31.5
27 Venstresidet test Antagelse: Test af μ, X kvantitativ variabel og n>3. Hypoteser: H H 1 : μ = μ : μ < μ Stikprøve fordeling af X når H er sand er approksimativ normal med middelværdi μ og standard afvigelse σ n Teststørrelse: Z = X μ σ n P-værdien: p( Z < observeret z værdi)
28 Eksempel venstresidet test H: μ = 3 H1: μ < 3 Stikprøve: n = 5 x = 31.5 σ = 5 Test størrelse: Z = 5 5 =,1 P-værdi: Stor p-værdi, så H forkastes ikke Fordeling: p = p( z <,1) = 1.17 μ =3 Z=,1 x=31.5
29 Test af middelværdi for ukendt varians Antagelse: Test af μ, X normalfordelt variabel og σ² ukendt (estimeret ved s²). Hypoteser: H H 1 : μ = μ : μ μ Teststørrelse t er t-fordelt med (n-1) frihedsgrader: p-værdien: p( t > observeret t værdi) kan ikke bestemmes ved tabel opslag, men SPSS gør det! Venstre og højre sidet test efter samme princip som før. X t = s μ n
30 Eksempel H: μ = 3 H1: μ 3 Stikprøve: n = 5 x = 31.5 s = 5 P-værdi: p = p( t >,1) = p( t >,1) =. =.4 Lille p-værdi, så H forkastes. Fordeling: Test størrelse: t = =,1 5 5 Svært at slå op i tabel. Ligger mellem.5 og μ =3 x= 31.5 x=31.5
31 Eksempel - fortsat H : μ = 3 H 1 : μ 3 Stikprøve: n = 5 x = 31.5 s = 5 Test størrelse: t = =,1 5 5 Svært at slå op i tabel. Ligger mellem.5 og.1. I stedet for p-værdi, vælges signifikans niveau α, for eksempel α=,5. Slå op i t-tabellen med 49 frihedsgrader under,5, da det er en -sidet test. t-værdien er cirka lig med.1. Da,1 er større end,1, forkastes H. Hvis t=-,1 skulle vi have sagt, da -,1 er mindre end -.1, forkastes H.
32 Hypotesetest for middelværdi i SPSS SPSS: Analyze > Compare Means > One Sample T-Test Angiver (1 α)1% konfidensinterval μ i H hypotesen (1 α)1% konfidensinterval for μ μ Typisk output af spss One-Sample Statistics N Mean Std. Deviation Std. Error Mean Højde 4 17,79 18, ,8519 Højde One-Sample Test Test Value = % Confidence Interval of the Mean Difference t df Sig. (-tailed) Difference Lower Upper -,59 3,561 -,783-1,378 5,696 p-værdi for to-sidet t-test, dvs. H n x s s n 1 : μ μ
33 Test af en andel Antagelse: Test af populations andel p, når np>5 og n(1-p)>5. Hypoteser: Stikprøve fordeling af når H er sand er approksimativ normal med middelværdi og standard afvigelse p 1 p ) / n Teststørrelse: p P-værdien: p( Z > beregnet z værdi) pˆ Z = p H H 1 pˆ (1 : p = p : p p p p ) / n ( Højresidet og venstresidet test efter samme princip som før.
34 Test af variansen Antagelse: Test af populations variansen σ², X normal fordelt. Hypoteser: H H 1 : σ : σ = σ σ Teststørrelse: ( n 1) s χ = σ ( χ fordelt med(n -1) frihedsgrader) P-værdi: p( Χ² > beregnet Χ² værdi) kan ikke beregnes ved tabel opslag. Højresidet og venstresidet test efter samme princip som før.
35 Test af varians - eksempel H : σ =1 H 1 : σ <1 α=.5, s =.8659, n=5 χ ( n 1) s = σ (5 1).8659 = 1 =.78 Venstre sidet test, så H forkastes, hvis χ < χ1 α ( n 1). Da χ > χ1 α ( n 1) kan vi ikke forkaste H χ α 1 ( n 1) = χ.95(4) = 13.85
Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau
ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer
Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Tema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Vejledende besvarelser til opgaver i kapitel 14
Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden
Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks
Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse
Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres
Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220
Forelæsning 9: Inferens for andele (kapitel 10)
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Normalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
To-sidet varians analyse
To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),
Vejledende løsninger kapitel 8 opgaver
KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse
Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Løsninger til kapitel 9
Opgave 9.1 a) test for spredning, ensidet b) test for middelværdi, ensidet c) test for andel, ensidet d) test for to andele, ensidet e) test for spredning, tosidet f) test for middelværdi, ensidet g) test
1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Konfidensinterval for µ (σ kendt)
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)
Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: [email protected] I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Løsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens
Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve
Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data
Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: [email protected] Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration
Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Modul 5: Test for én stikprøve
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................
MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Note til styrkefunktionen
Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H
Kapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige
Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud
Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet
Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater
Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger
Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:
ca. 5 min. STATISTISKE TEGN
ca. 5 min. STATISTISKE TEGN I statistik støder du tit på forskellige tegn - det som også kaldes for statistisk notation. Det kan virke forvirrende og uoverskueligt i starten. Men bare rolig: For det første
Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
Kapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: [email protected]
Opgaver til kapitel 3
Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie
Logistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Module 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1
Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering
Skriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version
university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Kapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Kvantitative Metoder 1 - Efterår Dagens program
Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1
Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Appendiks Økonometrisk teori... II
Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan
