Kapitel 12 Variansanalyse

Størrelse: px
Starte visningen fra side:

Download "Kapitel 12 Variansanalyse"

Transkript

1 Kapitel 12 Variansanalyse Peter Tibert Stoltze Elementær statistik F2011 Version 7 april 2011

2 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning

3 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning

4 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan foretages med t-test i en passende variant Hvis der er tre eller flere grupper kan man lave en række parvise t-tests, men ved mange tests skal man justere p-værdien (signifikanssandsynligheden) for disse multiple sammenligninger Bedre er det at lave variansanalyse (ANOVA), hvor vi sammenligner variansen indenfor grupper med variansen mellem grupper for at vurdere, om grupperne er forskellige Grupperne er karakteriset ved en eller flere faktorer på et bestemt niveau faktorerne er typisk målt på nominal eller ordinal skala

5 Eksempel Et eksempel kan være score i en læsetest, hvor der for hver elev på et bestemt klassetrin er noteret resultat, køn og familiebaggrund Køn er en faktor med to niveauer: Pige Dreng Familiebaggrund er en faktor med her tre niveauer: Bor hos begge forældre Bor hos én af sine forældre Bor ikke hos forældre

6 Eksempel (fortsat) I alt haves 2 3 = 6 grupper, og variansanalysen giver os et mål for faktorernes indflydelse på responset (scoren) Betragter vi kun køn kan vi klare os med et t-test Betragter vi kun familiebaggrund skal vi lave ensidet variansanalyse Betragter vi både køn og familiebaggrund (og eventuelt vekselvirkninger mellem disse) skal vi lave tosidet variansanalyse

7 Balancerede data Er der tale om et forsøg, så kan man planlægge at have lige mange observationer i hver gruppe man siger da, at forsøget er balanceret Er der tale om en ikke-eksperimentel undersøgelse er data oftest ubalancerede dette behøver ikke at være et problem I balancerede forsøg kan variansanalysen beregnes i hånden, da kvadratsummerne kan beregnes på en let måde Der er lidt mere arbejde i ubalancerede forsøg

8 Ikke-parametrisk alternativ Ved sammenligning mellem to stikprøver kan t-testet erstattes af Mann-Whitney testet, hvis forudsætninger for t-testet ikke er opfyldt (fx hvis data ikke kan antages at stamme fra normalfordelte populationer) Det ikke-parametriske alternativ til ensidet ANOVO hedder Kruskal-Wallis testet, der er en udvidelse af Mann-Whitney testet til at håndtere tre eller flere grupper Vi gennemgår ikke dette test, men nu ved I at det findes

9 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning

10 Notation og model Antag at vi har a uafhængige stikprøver på normalfordelte populationer med samme varians, og at hver stikprøve består af n observationer Lad nu X ij betegne den j te observation i den i te stikprøve Vi har nu an uafhængige stokastiske variable X ij, i = 1,, a og j = 1,, n, hvor X ij N(µ i, σ 2 )

11 Notation og model (fortsat) Vores model er nu X ij = µ i + ε ij hvor {ε ij } er uafhængige og N(0, σ 2 ) Modellen kan også skrives hvor µ = 1 a X ij = µ + α i + ε ij a µ i og α i = µ i µ i=1 så α i er effekten af α-faktorens ite niveau

12 Alternativ formulering En alternativ formulering af modellen er x ij = x ij + x i x i + x x = x + ( x i x ) }{{} gruppesnit ift fællessnit + (x ij x i ) }{{} individ ift gruppesnit En observation kan altså dekomponeres i et generelt niveau, gruppens afvigelse fra det generelle niveau og endelig en individuel afvigelse fra gruppens niveau

13 Hypotese og test Hypotesen om, at alle stikprøverne har ens gennemsnit (faktoren α har ingen betydning) kan formuleres som H 0 : µ 1 = µ 2 = = µ a eller ækvivalent hermed H 0 : α i = 0, i = 1,, a Alternativhypotesen er at α i 0 for i hvert fald ét i H 1 : i {1,, a}, α i 0

14 Hypotese og test Variation Kvadratsum Frihedsgrader Middelsum F -værdi SAK DF MS F obs Mellem grupper SAK a a 1 MS a = SAKa a 1 Indenfor SAK e a(n 1) MS e = SAKe a(n 1) grupper Total SAK tot an 1 F obs = MSa MS e

15 Hypotese og test Beregning af kvadratsummer: SAK tot = a SAK a = n SAK e = i=1 j=1 n (X ij X ) 2 = a ( X i X ) 2 = 1 n i=1 a i=1 j=1 a n i=1 j=1 a i=1 Xij 2 1 an X 2 Xi 2 1 an X 2 n (X ij X i ) 2 = SAK tot SAK e

16 Hypotese og test Signifikanssandsynligheden p er sandsynligheden for at få en lige så stor eller større teststørrelse F obs givet at nulhypotesen er sand Teststørrelsen beregnes ud fra en F -fordeling med a 1 frihedsgrader i tæller og a(n 1) frihedsgrader i nævner: p = P(F a 1,a(n 1) F obs ) Hvis p er meget lille følger det, at nulhypotesen (alle gruppper er ens) ikke er ret sandsynlig, så vi antager i stedet alternativhypotesen (mindst to grupper er parvist forskellige)

17 Eksempel: Bægerblade på Iris sp

18 Eksempel: Bægerblade på Iris sp Data indsamlet på Gaspe halvøen i østlige Canada Længde og bredde af bæger- og kronblade for 50 individer af tre forskellige arter (i alt 150 observationer af 5 variable) Analysen beskrevet i 1936 af RA Fisher, der er en af grundlæggerne af den moderne statistik setosa versicolor virginica 3,5 3,2 3,3 3,0 3,2 2,7 3,2 3,1 3,0 3,1 2,3 2,9 3,6 2,8 3,0 3,9 2,8 3,0 3,4 3,3 2,5 3,4 2,4 2,9 2,9 2,9 2,5 3,1 2,7 3,6

19 Eksempel: Bægerblade på Iris sp Bredde af bægerblad [mm] setosa versicolor virginica Observation

20 Eksempel: Bægerblade på Iris sp i art n i X i S i 1 setosa 10 3,31 0,307 2 versicolor 10 2,87 0,340 3 virginica 10 2,94 0,337 Arten setosa skiller sig ud fra de to andre med et højere gennemsnit og en lidt lavere spredning Vi tester ikke eksplicit for, om spredningerne kan antages at være ens (det burde vi faktisk gøre, fx med Bartletts test eller Levenes test)

21 Eksempel: Bægerblade på Iris sp Tætheds af normalfordeling setosa versicolor virginica Bredde af bægerblade [mm]

22 Eksempel: Bægerblade på Iris sp i art n i X i 1 setosa 10 33,1 2 versicolor 10 28,7 3 virginica 10 29, ,2

23 Eksempel: Bægerblade på Iris sp i art n i X i 1 setosa 10 33,1 2 versicolor 10 28,7 3 virginica 10 29, , i=1 j=1 X 2 ij = 281, 28

24 Eksempel: Bægerblade på Iris sp i art n i X i 1 setosa 10 33,1 2 versicolor 10 28,7 3 virginica 10 29, , i=1 j=1 X 2 ij = 281, 28 SAK tot = 281, , 22 = 4, 0320

25 Eksempel: Bægerblade på Iris sp i art n i X i 1 setosa 10 33,1 2 versicolor 10 28,7 3 virginica 10 29, , i=1 j=1 X 2 ij = 281, 28 SAK tot = 281, , 22 = 4, 0320 SAK a = 1 10 (33, , , 4 2 ) , 22 = 1, 1180

26 Eksempel: Bægerblade på Iris sp i art n i X i 1 setosa 10 33,1 2 versicolor 10 28,7 3 virginica 10 29, , i=1 j=1 X 2 ij = 281, 28 SAK tot = 281, , 22 = 4, 0320 SAK a = 1 10 (33, , , 4 2 ) , 22 = 1, 1180 SAK res = 4, , 1180 = 2, 9140

27 Eksempel: Bægerblade på Iris sp Total Within Between i x ij x i x x ij x x ij x i x i x (x ij x ) 2 (x ij x i ) 2 ( x i x ) 2 1 3,5 3,31 3,04 0,46 0,19 0,27 0,2116 0,0361 0, ,0 3,31 3,04-0,04-0,31 0,27 0,0016 0,0961 0, ,2 3,31 3,04 0,16-0,11 0,27 0,0256 0,0121 0, ,1 3,31 3,04 0,06-0,21 0,27 0,0036 0,0441 0, ,2 2,87 3,04 0,16 0,33-0,17 0,0256 0,1089 0, ,2 2,87 3,04 0,16 0,33-0,17 0,0256 0,1089 0, ,1 2,87 3,04 0,06 0,23-0,17 0,0036 0,0529 0, ,7 2,87 3,04-0,34-0,17-0,17 0,1156 0,0289 0, ,3 2,94 3,04 0,26 0,36-0,10 0,0676 0,1296 0, ,7 2,94 3,04-0,34-0,24-0,10 0,1156 0,0576 0, ,0 2,94 3,04-0,04 0,06-0,10 0,0016 0,0036 0, ,6 2,94 3,04 0,56 0,66-0,10 0,3136 0,4356 0,0100 0,00 0,00 0,00 4,0320 2,9140 1,1180

28 Eksempel: Bægerblade på Iris sp Variation Kvadratsum Frihedsgrader Middelsum F -værdi SAK DF MS F obs Mellem 1, ,5590 5,1795 grupper Indenfor 2, ,1079 grupper Total 4,

29 Eksempel: Bægerblade på Iris sp Et interval for signifikanssandsynligheden p bestemmes ved at sammenligne med kritiske værdier: α 0,05 0,01 0,001 F 1 α,2,27 3,35 5,49 9,02 Vi kan se at 0, 01 < p < 0, 05 Nøjagtig beregning giver at p = 0,013 så vi kan forkaste nulhypotesen (alle arter ens) med ret stor sikkerhed

30 Eksempel: Bægerblade på Iris sp Da F -testet er signifikant kan vi være interesserede i at vide hvordan de tre stikprøver er forskellige: Er alle tre forskellige eller er to indbyrdes ens

31 Eksempel: Bægerblade på Iris sp Da F -testet er signifikant kan vi være interesserede i at vide hvordan de tre stikprøver er forskellige: Er alle tre forskellige eller er to indbyrdes ens Sammenligning af to grupper kan ske med et t-test, hvor signifikanssandsynligheden korrigeres for det antal sammenligninger, man planlægger at lave (Bonferroni)

32 Eksempel: Bægerblade på Iris sp Da F -testet er signifikant kan vi være interesserede i at vide hvordan de tre stikprøver er forskellige: Er alle tre forskellige eller er to indbyrdes ens Sammenligning af to grupper kan ske med et t-test, hvor signifikanssandsynligheden korrigeres for det antal sammenligninger, man planlægger at lave (Bonferroni) En mere præcis metode er at benytte Scheffes metode, der omfatter et F -test, der i opbygning minder om t-testet

33 Eksempel: Bægerblade på Iris sp Da F -testet er signifikant kan vi være interesserede i at vide hvordan de tre stikprøver er forskellige: Er alle tre forskellige eller er to indbyrdes ens Sammenligning af to grupper kan ske med et t-test, hvor signifikanssandsynligheden korrigeres for det antal sammenligninger, man planlægger at lave (Bonferroni) En mere præcis metode er at benytte Scheffes metode, der omfatter et F -test, der i opbygning minder om t-testet Med mange grupper er den letteste metode dog Fishers LSD

34 Eksempel: Bægerblade på Iris sp Hvis F -testet for ANOVA-tabellen er signifikant kan man starte med at lave parvise sammenligninger Med Sheffes metode sammenlignes to grupper (i og j) med følgende test: F = ( X i X j ) 2 S 2 e ( 1 n i + 1 n j ) Teststørrelses evalueres mod en F -test, der har frihedsgrader fra de to første rækker i ANOVA-tabellen Desuden ganges de kritiske værdier med k 1, hvor k er antallet af grupper I vores tilfælde benyttes fraktiler fra en F fordeling med (2, 27) frihedsgrader, der ganges med 3 1: F 2, F

35 Eksempel: Bægerblade på Iris sp Vi starter med at teste versicolor mod virginica ( )2 F = 01079( ) = hvilket ses ikke at være signifikant Vi kan altså (i statistisk forstand) ikke se forskel på de to arter

36 Eksempel: Bægerblade på Iris sp Vi starter med at teste versicolor mod virginica ( )2 F = 01079( ) = hvilket ses ikke at være signifikant Vi kan altså (i statistisk forstand) ikke se forskel på de to arter Vi sammenligner derfor setosa mod de to andre arter under et F = ( ) ( ) = og denne sammenligning ses at være signifikant med 001 < p < 005

37 Eksempel: Bægerblade på Iris sp Er antallet af grupper højt kan vi benytte Fishers LSD (Least SignificantDifference) til hurtigt at få et overblik over hvilke grupper der kan siges at være forskellige Størrelsen beregnes på niveauet α som LSD α = t 1 α 2,DFw MS w ( 1 n i + 1 n j )

38 Eksempel: Bægerblade på Iris sp Er antallet af grupper højt kan vi benytte Fishers LSD (Least SignificantDifference) til hurtigt at få et overblik over hvilke grupper der kan siges at være forskellige Størrelsen beregnes på niveauet α som LSD α = t 1 α 2,DFw MS w ( 1 n i + 1 n j ) Da alle stikprøver har samme størrelse behøver vi kun at beregne en enkelt LSD-værdi LSD 005 = ( ) = 03014

39 Eksempel: Bægerblade på Iris sp Er antallet af grupper højt kan vi benytte Fishers LSD (Least SignificantDifference) til hurtigt at få et overblik over hvilke grupper der kan siges at være forskellige Størrelsen beregnes på niveauet α som LSD α = t 1 α 2,DFw MS w ( 1 n i + 1 n j ) Da alle stikprøver har samme størrelse behøver vi kun at beregne en enkelt LSD-værdi LSD 005 = ( ) = Grupper der har en absolut forskel større end kan siges at være forskellige (på 5 pct niveau)

40 Eksempel: Bægerblade på Iris sp X i X j setosa versicolor virginica setosa versicolor virginica

41 Eksempel: Bægerblade på Iris sp X i X j setosa versicolor virginica setosa versicolor virginica

42 Eksempel: Bægerblade på Iris sp For det fulde Iris-datasæt med 50 observationer af hver art er der bestemt følgende summer og kvadratsummer i Art n i X i Xi 2 1 setosa ,4 594,60 2 versicolor ,5 388,47 3 virginica ,7 447,33 Variation Kvadratsum Frihedsgrader Middelsum F -værdi SAK DF MS F obs Mellem 11,34 2 5,67 49,13 grupper Indenfor 16, ,1154 grupper Total 28,31 149

43 Eksempel: Bægerblade på Iris sp Ny beregning af LSD giver LSD 005 = ( ) = 01345

44 Eksempel: Bægerblade på Iris sp Ny beregning af LSD giver LSD 005 = ( ) = Med 10 observationer i hver gruppe var tallet mere end dobbelt så stort, 03014

45 Eksempel: Bægerblade på Iris sp Ny beregning af LSD giver LSD 005 = ( ) = Med 10 observationer i hver gruppe var tallet mere end dobbelt så stort, Forskellen er er nu signifikant! x versicolor x virginica = 2, , 9740 = 0, 2040

46 Eksempel: Beregning med Excel

47 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning

48 Tosidet variansanalyse uden vekselvirkning: Blokforsøg Ensidet ANOVA blev brugt til at analysere forsøg med én faktor, α, men nu udvider nu med endnu en faktor, β

49 Tosidet variansanalyse uden vekselvirkning: Blokforsøg Ensidet ANOVA blev brugt til at analysere forsøg med én faktor, α, men nu udvider nu med endnu en faktor, β Hvis vi har én observation for hver kombination af α og β kan vi undersøge hovedvirkningerne af de to faktorer med en model for blokforsøg

50 Tosidet variansanalyse uden vekselvirkning: Blokforsøg Ensidet ANOVA blev brugt til at analysere forsøg med én faktor, α, men nu udvider nu med endnu en faktor, β Hvis vi har én observation for hver kombination af α og β kan vi undersøge hovedvirkningerne af de to faktorer med en model for blokforsøg (Hvis vi har gentagelser indenfor kombinationer af α og β kan vi også undersøge for vekselvirkninger dette kommer senere ) Man kan tænke på blokforsøg som en udvidelse af den ensidede variansanalyse, hvor gentagelserne er organiseret på tværs efter et eller andet fællestræk

51 Eksempel: Design af forsøg På 4 skoler, hvor der på hver skole er 3 klasser på 6 klassetrin, har man lavet en samarbejdsprøve Den enkelte klasse skal løse den samme opgave på tid, men der er udarbejdet tre forskellige instruktioner til opgaven På hver skole fordeles de tre instrukser ved lodtrækning tilfældigt på klasserne Man registrerer hvor mange sekunder klassen er om at løse opgaven

52 Eksempel: Design af forsøg På 4 skoler, hvor der på hver skole er 3 klasser på 6 klassetrin, har man lavet en samarbejdsprøve Den enkelte klasse skal løse den samme opgave på tid, men der er udarbejdet tre forskellige instruktioner til opgaven På hver skole fordeles de tre instrukser ved lodtrækning tilfældigt på klasserne Man registrerer hvor mange sekunder klassen er om at løse opgaven Instruksen er behandlingen og skolen er blokken

53 Eksempel: Data Tid [sek] Skole 1 Skole 2 Skole 3 Skole 4 Snit Instruks A ,0 Instruks B ,0 Instruks C ,0 Snit 161,7 176,0 180,7 203,0 180,0

54 Eksempel: Data Tid [sek] Skole 1 Skole 2 Skole 3 Skole 4 Snit Instruks A ,0 Instruks B ,0 Instruks C ,0 Snit 161,7 176,0 180,7 203,0 180,0 Er der en signifikant behandlingseffekt, dvs giver instruksen en sikker påvirkning af løsningstiden?

55 Eksempel: Data Tid [sek] Skole 1 Skole 2 Skole 3 Skole 4 Snit Instruks A ,0 Instruks B ,0 Instruks C ,0 Snit 161,7 176,0 180,7 203,0 180,0 Er der en signifikant behandlingseffekt, dvs giver instruksen en sikker påvirkning af løsningstiden? Er der en signifikant blokeffekt, dvs er der forskellige niveauer for skolerne?

56 Eksempel: Data Tid [sek] Skole 1 Skole 2 Skole 3 Skole 4 Snit Instruks A ,0 Instruks B ,0 Instruks C ,0 Snit 161,7 176,0 180,7 203,0 180,0 Er der en signifikant behandlingseffekt, dvs giver instruksen en sikker påvirkning af løsningstiden? Er der en signifikant blokeffekt, dvs er der forskellige niveauer for skolerne? Kunne blokeffekten være den interessante?

57 Eksempel: Illustration af data Løsningstid [s] Skole 1 Skole 2 Skole 3 Skole 4 Instruks A Instruks B Instruks C

58 Eksempel: Illustration af data Løsningstid [s] Instruks A Instruks B Instruks C Skole 1 Skole 2 Skole 3 Skole 4

59 Teori: Statistisk model Modellen for den ensidede variansanalyse, X ij = µ + α i + ε ij udvider vi med en blokeffekt β j, j = 1,, b så modellen nu kan skrives som X ij = µ + α i + β j + ε ij De tilfældige fejl {ε ij } antages uafhængige og fra en normalfordeling med middelværdi 0 og varians σ 2 Der gælder at i α i = j β j = 0

60 Teori: ANOVA-tabel Variation Frihedsgrader Middelsum F -værdi DF MS F obs Rækker (behandling) a 1 MS a = SAKa a 1 Søjler (blokke) b 1 MS b = SAK b b 1 SAK e Residual (a 1)(b 1) MS e = (a 1)(b 1) Total ab 1 F a = MSa MS e F b = MS b MS e Der gælder at SAK tot = SAK a + SAK b + SAK e Detaljer i separat note

61 Eksempel: Beregning af SAKer i \ j

62 Eksempel: Beregning af SAKer i \ j i=1 j=1 X 2 ij =

63 Eksempel: Beregning af SAKer i \ j i=1 j=1 X 2 ij = SAK tot = = 3696, 67

64 Eksempel: Beregning af SAKer i \ j i=1 j=1 X 2 ij = SAK tot = = 3696, 67 SAK a = 1 4 ( ) = 690, 67

65 Eksempel: Beregning af SAKer i \ j i=1 j=1 X 2 ij = SAK tot = = 3696, 67 SAK a = 1 4 ( ) = 690, 67 SAK b = 1 3 ( ) = 2643, 33

66 Eksempel: Beregning af SAKer i \ j i=1 j=1 X 2 ij = SAK tot = = 3696, 67 SAK a = 1 4 ( ) = 690, 67 SAK b = 1 3 ( ) = 2643, 33 SAK res = 3696, , , 33 = 362, 67

67 Eksempel: ANOVA-tabel Variation Behandling (instruks) Blok (skole) Residual Total

68 Eksempel: ANOVA-tabel Variation SAK Behandling (instruks) 690,67 Blok (skole) 2643,33 Residual 362,67 Total 3696,67

69 Eksempel: ANOVA-tabel Variation SAK Frihedsgrader Behandling (instruks) 690,67 2 Blok (skole) 2643,33 3 Residual 362,67 6 Total 3696,67 11

70 Eksempel: ANOVA-tabel Variation SAK Frihedsgrader Middelsum Behandling (instruks) 690, ,33 Blok (skole) 2643, ,11 Residual 362, ,44 Total 3696,67 11

71 Eksempel: ANOVA-tabel Variation SAK Frihedsgrader Middelsum F -værdi Behandling (instruks) 690, ,33 5,71 Blok (skole) 2643, ,11 14,58 Residual 362, ,44 Total 3696,67 11

72 Eksempel: ANOVA-tabel Variation SAK Frihedsgrader Middelsum F -værdi Behandling (instruks) 690, ,33 5,71 Blok (skole) 2643, ,11 14,58 Residual 362, ,44 Total 3696,67 11 Kritiske værdier: α 0,05 0,01 0,001 F 2,6 5,14 10,92 27,00 F 3,6 4,76 9,78 23,70

73 Eksempel: ANOVA-tabel Variation SAK Frihedsgrader Middelsum F -værdi Behandling (instruks) 690, ,33 5,71 Blok (skole) 2643, ,11 14,58 Residual 362, ,44 Total 3696,67 11 Kritiske værdier: α 0,05 0,01 0,001 F 2,6 5,14 10,92 27,00 F 3,6 4,76 9,78 23,70

74 Blokforsøg: Beregning med Excel

75 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning

76 Tosidet variansanalyse med vekselvirkning Har vi gentagelser indenfor hver kombination af de to faktorer, så kan vi estimere en vekselvirkning Vekselvirkning betyder, at effekten af en faktor også afhænger af den anden faktor modellen er ikke længere rent additiv

77 Tosidet variansanalyse med vekselvirkning Har vi gentagelser indenfor hver kombination af de to faktorer, så kan vi estimere en vekselvirkning Vekselvirkning betyder, at effekten af en faktor også afhænger af den anden faktor modellen er ikke længere rent additiv Den statistiske model er nu udvidet til X ijk = µ + α i + β j + γ ij + ε ijk hvor henholdsvis X ijk er den kte gentagelse og γ er vekselvirkningen for kombination ij af de to faktorer

78 Tosidet variansanalyse med vekselvirkning Har vi gentagelser indenfor hver kombination af de to faktorer, så kan vi estimere en vekselvirkning Vekselvirkning betyder, at effekten af en faktor også afhænger af den anden faktor modellen er ikke længere rent additiv Den statistiske model er nu udvidet til X ijk = µ + α i + β j + γ ij + ε ijk hvor henholdsvis X ijk er den kte gentagelse og γ er vekselvirkningen for kombination ij af de to faktorer De tilfældige fejl {ε ijk } antages uafhængige og fra en normalfordeling med middelværdi 0 og varians σ 2 Der gælder at α i = β j = γ ij = 0

79 Vekselvirkning: ANOVA-tabel Variation Frihedsgrader Middelsum F -værdi DF MS F obs Rækker (faktor A) a 1 MS A = SAK A a 1 F A = MS A MS e Søjler (faktor B) b 1 MS B = SAK B b 1 F B = MS B MS e Vekselvirkning (A B) (a 1)(b 1) MS AB = SAK AB (a 1)(b 1) Residual ab(n 1) MS e = SAKe ab(n 1) Total abn 1 F AB = MS AB MS e Detaljer i separat note

80 Vekselvirkning: Eksempel Svartider på sætninger der varierer mht reversibilitet og aktiv passiv Aktiv Passiv Irreversibel Reversibel

81 Vekselvirkning: Eksempel Svartider på sætninger der varierer mht reversibilitet og aktiv passiv Aktiv Passiv Irreversibel Reversibel svartid [ms] Aktiv Passiv irreversibel reversibel

82 Vekselvirkning: Eksempel Svartider på sætninger der varierer mht reversibilitet og aktiv passiv Aktiv Passiv Irreversibel Reversibel svartid [ms] Aktiv Passiv irreversibel reversibel Det ses at kombinationen aktiv irreversibel giver meget korte svartider, mens kombinationen passiv reversibel giver meget lange svartider

83 Vekselvirkning: Beregning

84 Vekselvirkning: Beregning med Excel

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Kapitel 13 Reliabilitet og enighed

Kapitel 13 Reliabilitet og enighed Kapitel 13 Reliabilitet og enighed Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 Version 11. april 2011 1 / 23 Indledning En observation er sammensat af en sand værdi og en målefejl

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al Program Tosidet variansanalyse og forsøgsplanlægning Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Ensidet ANOVA: repetition og Collinge eksempel. Additiv tosidet ANOVA (blokforsøg) Tosidet ANOVA

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Kapitel 8 Chi-i-anden (χ 2 ) prøven Kapitel 8 Chi-i-anden (χ 2 ) prøven Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 19 Indledning Forskelle mellem stikprøver undersøges med z-test eller t-test for data målt på

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression 1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Kapitel 1 Statistiske grundbegreber

Kapitel 1 Statistiske grundbegreber Kapitel 1 Statistiske grundbegreber Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Population versus stikprøve 3 Variabeltyper og måleskalaer 4 Parametrisk versus ikke-parametrisk

Læs mere

Ensidet variansanalyse

Ensidet variansanalyse Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger

Læs mere

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:

Læs mere

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren Faculty of Life Sciences Program Sammenligning af grupper Ensidet ANOVA Claus Ekstrøm E-mail: ekstrom@life.ku.dk Sammenligning af to grupper: tre eksempler Sammenligning af mere end to grupper: ensidet

Læs mere

Løsninger til kapitel 9

Løsninger til kapitel 9 Opgave 9.1 a) test for spredning, ensidet b) test for middelværdi, ensidet c) test for andel, ensidet d) test for to andele, ensidet e) test for spredning, tosidet f) test for middelværdi, ensidet g) test

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Modul 12: Regression og korrelation

Modul 12: Regression og korrelation Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Program 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Dæktyper og brændstofforbrug Data fra opgave 10.43, side 360: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance Plot af B j + ǫ ij (Y ij µ α i )): Program: res 4 2 0 2 B1 B2 B3 B4 B5 1. vi starter med at gennemgå opgave 3 side 513. 2. nyt: to-sidet variansanalyse 1 2 3 4 5 block σ 2 : within blocks variance σb 2

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Program. Flersidet variansanalyse og hierarkiske modeller. Eksempel: iltoptag for krabber. Eksempel: iltoptag for krabber.

Program. Flersidet variansanalyse og hierarkiske modeller. Eksempel: iltoptag for krabber. Eksempel: iltoptag for krabber. Program Flersidet variansanalyse og hierarkiske modeller Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 50, mandag) Flersidet ANOVA 1 / 19 StatBK (Uge 50, mandag) Flersidet ANOVA 2 / 19 Eksempel:

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Løsninger til kapitel 14

Løsninger til kapitel 14 Opgave 14.1 a) Linjetilpasningsplottet bliver: Løsninger til kapitel 14 Idet datapunkterne ligger tæt på og jævnt fordelt omkring den rette linje, så ser det ud til, at der med rimelighed er tale om en

Læs mere

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 30. maj 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Preben Blæsild og Jens Ledet Jensen

Preben Blæsild og Jens Ledet Jensen χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010 Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary 1 Kontingenstabeller Betinget fordeling Uafhængighed 2 Chi-kvadrat test for uafhængighed Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1 Tag-hjem prøve 1. juli 2010 24 timer Alle hjælpemidler er tilladt. Det er tilladt at skrive med blyant og benytte viskelæder,

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere