Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Størrelse: px
Starte visningen fra side:

Download "Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)"

Transkript

1 Formelsamlingen 1

2 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2

3 Kovariansen COVAR(X, Y) 1 n n i1 (X - M X )(Y - M Y ) ZX+Y VAR(X + Y) VAR(X)+ 2COVAR(X,Y)+ VAR(Y) VAR( X ) VAR( Y ) COVAR( X, Y ) VAR( X ) VAR( Y ) Standardafvigelsen SD ( X ) VAR( X ) 3

4 Sandsynlighedsregning P(A eller B) P(A) + P(B) P(ikke A) 1 P(A) P ( A B) P( A, B) P( B) Multiplikationssætningen: To hændelser, A og B, er stokastisk uafhængige, hvis og kun hvis den simultane sandsynlighed for de to hændelser er lig med produktet af de marginale sandsynligheder for hver af dem. Dvs. hvis og kun hvis P(A,B) P(A) P(B) 4

5 Kvantitative mål for chancer: Odds og logits Sandsynligheden p odds p 1 p p odds 1 + odds Logit-værdier: α ln( odds) ln( 1 p ) p ln( p) ln(1 p) α e p 1 + e α 5

6 Reference mellem empiriske og teoretiske begreber Empiriside Modelside n observationer: x 1,,x n Den absolutte fordeling: n x antal personer med værdien x Den relative fordeling: h x n x /n Den kumulerede fordeling: 1 n x x n h i i 1 i 1 Percentiler defineret ud fra den kumulerede fordeling Empirisk middelværdi: x Én stokastisk variabel, X Det forventede antal med en bestemt værdi: e x np x Sandsynligheden for at Xx: p x P(Xx) Fordelingsfunktionen: x F( x) p P( X x) i 1 i Percentiler defineret ud fra fordelingsfunktionen Teoretisk middelværdi: M X x xh x (forventet værdi) E( X ) xp x x Empirisk varians: n VAR( X ) hx ( x M X ) n 1 x 2 Teoretisk varians: ( ( )) 2 σ X p x x E X 2 x 6

7 Bernoulli fordelingen: En fordeling af en variabel, X, med to udfald: X 0 En bestemt begivenhed forekommer ikke X 1 En bestemt begivenhed forekommer Fordelingen indeholder én sandsynlighed: p P(X1) Sandsynligheden for at begivenheden ikke forekommer er lig med P(X0) 1-p Fordelingsindikatorer for Bernoullifordelingen E(X) p σ 2 (X) p(1-p) 7

8 Fordelingsindikatorer efter omkodning S X + Y E(S) E(X) + E(Y) σ 2 (S) σ 2 (X) + σ 2 (Y) + 2σ 2 (X,Y) Hvis X og Y er stokastisk uafhængige, er den kovarians, σ 2 (X,Y) lig med nul σ 2 (X+Y) σ 2 (X) + σ 2 (Y) 8

9 Binomialfordelingen Y er binomialfordelt, Y ~ Bin(n,p), hvis den er lig med summen af n indbyrdes uafhængige identisk fordelte Bernoulli variable med sandsynligheden p: Dvs. Y i1..n X i Teoretisk middelværdi E(Y) n p Teoretisk varians σ 2 (Y) n p (1-p) Teoretisk standardafvigelse σ(y) n p (1-p) 9

10 Standardiserede variable Z X E( X ) σ ( X ) hvor σ(x) er variablens standardafvigelse E(Z) 0 og σ 2 (Z) 1. 10

11 Kontinuerte variable Har tætheder, f(x) i stedet for sandsynligheder Fordelingsfunktionen F (x) P(X f (x) x) d dx x F(x) f(x)dx 11

12 Normalfordelingen Symmetriske fordelinger fastlagt ved middelværdi og varians Tre normalfordelinger Standardiseret normalfordeling P(Z < -1.96) P(Z > +1.96) P( Z >1.96) % af værdierne af en normalt fordelt variabel med middelværdi,ξ, og standardafvigelse,σ, vil ligge inden for intervallet ξ ± 1.96σ 12

13 Den centrale grænseværdisætning Antag, at X 1,..,X n er n identisk fordelte uafhængige variable med middelværdi, E(X), og varians, σ X 2. Under denne forudsætning vil den empiriske middelværdi, M X 1 i, altid være approksimativt i X n normalt fordelt med middelværdi, E(X), og varians, 2 σ X /n. 13

14 χ 2 fordelingen Antag, at Z er en variabel med en standardiseret normalfordeling. Fordelingen af Z 2 er en såkaldt χ 2 fordelingen med 1 frihedsgrad. Fordelingen af summen af k uafhængige χ 2 fordelte variable kan beregnes. Den omtales som en χ 2 fordeling med k frihedsgrader (df k). 14

15 Konfidensintervaller for estimater Standardiser estimatet: Z T T τ σ Den centrale grænseværdisætning garanterer i de fleste tilfælde, at T er normalfordelt. T Z T er derfor tilnærmelsesvist fordelt som en standardiseret normalfordeling τ T ZT σ er også en standardiseret normalfordeling Der er derfor 95 % sandsynlighed for at T T τ < T 196. < σ T 196. σ < τ < T σ T T 15

16 Odds-ratio værdier for 2x2 tabeller a b c d Odds-ratio er lig med krydsproduktforholdet κ ad bc Gamma koefficienten for 2 x 2 tabeller γ OR OR

17 Gamma koefficienten Definition af positiv og negativ sammenhæng p C sandsynligheden for at en sammenligning mellem to personer resulterer i konkordans p D sandsynligheden for at en sammenligning mellem to personer resulterer i diskordans p S sandsynligheden for at en sammenligning mellem to personer resulterer i sammenfald Positiv sammenhæng mellem to variable, hvis p C > p D Negativ sammenhæng hvis p D > p C γ p p C C + p p D D 17

18 χ 2 -testet En vægtet sum af de kvadrerede residualer. χ 2 e 2 ij ) ( n ij e ij Antal frihedsgrader (df) (antal rækker-1)x(antal søjler -1) 18

19 To fejltyper: Statistiske fejlslutninger Fejl af type I forekommer, når man forkaster en rigtig nulhypotese. Fejl af type II forekommer, når man accepterer en forkert nul-hypotese. Testets størrelse er lig med sandsynligheden for, at der ikke begås en type I fejl, hvis nul-hypotesen er korrekt, Størrelse P(Nul-hypotesen accepteres Sand nul-hypotese) Styrken er sandsynligheden for, at der ikke bliver begået en type II fejl, hvis nul-hypotesen er forkert, Styrke P(Nul-hypotesen forkastes Falsk nul-hypotese) 19

20 Det globale χ 2 -test Summen af uafhængige χ 2 fordelte størrelse er χ 2 fordelt. Antallet af frihedsgrader er lig med summen af frihedsgraderne. Den partielle γ-koefficient Et ( vægtet) gennemsnit af γ-koefficienter er derfor også tilnærmelsesvist normalfordelt Den partielle γ-koefficient wγ i i i w i 1 VARi 1 VAR j j 20

21 Betinget uafhængighed To variable, A og B, er betinget uafhængige givet en eller flere kontrolvariable, C 1,...C k, hvis A og B er uafhængige inden for samtlige de grupper, der kan defineres ved kombinationer af værdier af kontrolvariablene. Symbolsk angives betinget uafhængighed på følgende måde A B C 1,...C k 21

22 Mantel-Haensel analyser Mantel og Haensel (1959) estimatet af den fælles odds-ratio k ( v ) ω ω MH 1 ω MH er et vægtet gennemsnit af odds-ratio erne fra de enkelte strata. Vægtene er lig med, v bc n bic i i n i 22

23 Breslow-day test for homogenitet Et klassisk χ 2 test af forskel på det observerede og det forventede. Den forventede tabel: 1) Samme række- og søjlesummer som observeret. 2) Odds-ratio værdierne er lig med ω MH i alle strata Tallene a, b, c, d, erstattes altså at forventede værdier E(a ), E(b ), E(c ), E(d ) for hvilke det gælder at E( a ) E( d ) E( b ) E( c ) ω MH Breslow-Day testet er 2 χ k ( a E( a )) ( b E( b )) ( c E( c )) ( d E( d )) E( a ) E( b ) E( c ) E( d ) Asymptotisk χ 2 fordelt med k-1 frihedsgrader. 23

24 Cochrans og Mantel-Haensel s test Beregn den observerede og forventede marginale fordeling for de to variable under nul-hypotesen ved at summere samtlige forventede værdier i hver celle henover de forskellige strata. De observerede frekvenser er givet ved a c a, b b, c, d d De forventede værdier er givet ved, F( b) F( b ), F( a) F( a ) F( c) F( c ), F( d) F( d ) Beregn derefter et konventionelt χ 2 test til sammenligning af ovenstående observerede og forventede frekvenser. 24

25 Z-test og Wald test Wald test for parvise sammenligninger βˆ ˆ b β se a er tilnærmelsesvist fordelt som en standardiseret normalfordeling Wald Z 2 er tilnærmelsesvist fordelt som en χ 2 fordeling med 1 frihedsgrad 25

26 Wald testet for sammenligning af mere end to grupper Wald testet for hypotesen, at risikoen er den samme i alle grupper, er en generalisering af testet for to grupper. Det er tilnærmelsesvist fordelt som en χ 2 fordeling med et antal frihedsgrader, der er lig med antal grupper minus 1 26

27 Den logistiske regressionsmodel Y binær afhængig variabel med to udfald kodet som 0 eller 1 X 1, X 2, X 3, X k er afhængige variable i e P(Y 1 X,.., X ) i 1 + e α+ β x +β x x i i ab a b 1 k α+ β x +β x x i i ab a b Hvor produktledet fortæller, at der er interaktion mellem x a og x b Hvis X er en kategorivariabel kan man skrive e P(Y 1 X x) 1 + e α+β x α+β x 27

28 H 28

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Lær nemt! Statistik - Kompendium

Lær nemt! Statistik - Kompendium David Brink Lær nemt! Statistik - Kompendium Ventus wwwventusdk Lær nemt! Statistik - Kompendium 005 David Brink Nielsen og Ventus Download kompendiet gratis på wwwventusdk ISBN 87-7681-01-7 Ventus Falkoner

Læs mere

matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring

matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring 7. april 2011 Indhold 1 Undersøgelsesdesign 5 1.1 Kausalitet............................. 5 1.2 Validitet og bias......................... 6 1.3

Læs mere

Statistik for ankomstprocesser

Statistik for ankomstprocesser Statistik for ankomstprocesser Anders Gorst-Rasmussen 20. september 2006 Resumé Denne note er en kortfattet gennemgang af grundlæggende statistiske værktøjer, man kunne tænke sig brugt til at vurdere rimeligheden

Læs mere

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable IMM, 00--6 Poul Thyregod Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable Todimensionale stokastiske variable Lærebogens afsnit 4 introducerede sandsynlighedsmodeller formuleret

Læs mere

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Forskningsenheden for Statistik IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt.

Læs mere

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )} Stokastisk eksperiment Et stokastisk eksperiment er et eksperiment, hvor vi fornuftigvis ikke på forhånd kan have en formodning om resultatet af eksperimentet. Til gengæld kan vi prøve at sige noget om,

Læs mere

IDRÆTSSTATISTIK BIND 2

IDRÆTSSTATISTIK BIND 2 IDRÆTSSTATISTIK BIND 2 ii Det Naturvidenskabelige Fakultet Aarhus Universitet Reprocenter Preben Blæsild og Jørgen Granfeldt 2001 ISBN 87-87436-07-8 Bd.2 iii Forord Denne bog er skrevet til brug i et statistikkursus

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

En Introduktion til Sandsynlighedsregning

En Introduktion til Sandsynlighedsregning En Introduktion til Sandsynlighedsregning 4. Udgave Michael Sørensen 26. juni 2003 0 Forord Til 2. udgave Disse forelæsningsnoter trækker i betydelig grad på noter udarbejdet af en række kolleger. Det

Læs mere

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp.

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp. Udarbejdet af Thomas Jensen og Morten Overgård Nielsen Indhold Introduktion til materialet. s. 2 Introduktion til chi i anden test. s. 4 Et eksempel hastighed og ulykker på motorveje s. 8 Sådan udregnes

Læs mere

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt? Projektet drejer sig om at udvikle en metode, til at undersøge om et givet talmateriale med rimelighed kan siges at være normalfordelt.

Læs mere

Sandsynlighedregning

Sandsynlighedregning MOGENS ODDERSHEDE LARSEN Sandsynlighedregning + = - P(A B) = P(A) + P(B) P(A B). 1. udgave 2007 FORORD Dette notat giver en kort gennemgang af de grundlæggende begreber i sandsynlighedsregning. Det forudsættes,

Læs mere

χ 2 test Formål med noten... 2 Goodness of fit metoden (GOF)... 2 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)...

χ 2 test Formål med noten... 2 Goodness of fit metoden (GOF)... 2 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)... χ Indhold Formål med noten... Goodness of fit metoden (GOF)... 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)... ) χ -fordelingerne (fordelingsfunktionernes egenskaber)... 6 3) χ -

Læs mere

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri Introduktion til Statistiske Modeller for Finansielle Tidsserier Forelæsningsnoter til Finansiel Økonometri Jesper Lund mail@jesperlund.com http://www.jesperlund.com 14. marts 2006 1 Indledning Formålet

Læs mere

Risikoholdning og valg af porteføljeandele

Risikoholdning og valg af porteføljeandele Handelshøjskolen i København Institut for Produktion og Erhvervsøkonomi Projektvejleder: Lars Thorlund-Petersen Kandidatafhandling på Erhvervsøkonomi-Matematik-Studiet 2004 Risikoholdning og valg af porteføljeandele

Læs mere

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Til Gribskovløbet 006 gennemførte 118 kvinder 1,4 km distancen. Fordelingen af kvindernes løbstider

Læs mere

Temaopgave i statistik for

Temaopgave i statistik for Temaopgave i statistik for matematik B og A Indhold Opgave 1. Kast med 12 terninger 20 gange i praksis... 3 Opgave 2. Kast med 12 terninger teoretisk... 4 Opgave 3. Kast med 12 terninger 20 gange simulering...

Læs mere

CIVILINGENIØREKSAMEN. Side 1 af 18 sider. Skriftlig prøve, den: 2. juni 2009 Kursus nr : 02405. Kursus navn: Sandsynlighedsregning

CIVILINGENIØREKSAMEN. Side 1 af 18 sider. Skriftlig prøve, den: 2. juni 2009 Kursus nr : 02405. Kursus navn: Sandsynlighedsregning CIVILINGENIØREKSAMEN Side 1 af 18 sider Skriftlig prøve, den: 2. juni 2009 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: (navn) (underskrift)

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 10.b 015 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen :

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 10a 015 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen :

Læs mere

Matematiske emner SPIL. Sandsynligheder og Strategier

Matematiske emner SPIL. Sandsynligheder og Strategier Matematiske emner SPIL Sandsynligheder og Strategier Ole Witt-Hansen Køge Gymnasium 2006 INDHOLD Kap. Sandsynligheder ved spil.... Lotto... øvelser...2 2. Poker...3 3. Ruinsandsynligheder ved Roulette

Læs mere

Teknikker til analyse af tal med Excel

Teknikker til analyse af tal med Excel 1 Appendiks 2 Teknikker til analyse af tal med Excel Dette appendiks indeholder mange gentagelser fra kapitel 10, afsnit 4 Teknikker til analyse af tal i Den skinbarlige virkelighed) dog med den forskel,

Læs mere

IDRÆTSSTATISTIK BIND 1

IDRÆTSSTATISTIK BIND 1 IDRÆTSSTATISTIK BIND 1 ii Det Naturvidenskabelige Fakultet Aarhus Universitet Reprocenter Preben Blæsild og Jørgen Granfeldt 2001 ISBN 87-87436-05-1 Bd.1 iii Forord Denne bog er skrevet til brug i et statistikkursus

Læs mere

Sociologi, 2. semester Københavns Universitet Forår 2013

Sociologi, 2. semester Københavns Universitet Forår 2013 Indholdsfortegnelse 1. Problem og motivation: Bolig og ulighed i byen (1052, 852), (1040, 840), (1027, 827), (1105, 905)... 3 1.1 Teoretiske hypoteser... 4 2. Teoretisk udgangspunkt: Et steds betydning

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

R i 02402: Introduktion til Statistik

R i 02402: Introduktion til Statistik R i 02402: Introduktion til Statistik Per Bruun Brockhoff DTU Informatik, DK-2800 Lyngby 20. juni 2011 Indhold 1 Anvendelse af R på Databar-systemet på DTU 5 1.1 Adgang......................................

Læs mere