Kvantitative metoder 2

Relaterede dokumenter
Kvantitative metoder 2

Kvantitative metoder 2

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statistik II 1. Lektion. Analyse af kontingenstabeller

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Module 4: Ensidig variansanalyse

Løsning eksamen d. 15. december 2008

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kapitel 12 Variansanalyse

Kvantitative Metoder 1 - Efterår Dagens program

1 Hb SS Hb Sβ Hb SC = , (s = )

Tema. Dagens tema: Indfør centrale statistiske begreber.

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Kapitel 12 Variansanalyse

Løsning til eksaminen d. 14. december 2009

Kvantitative metoder 2

Kvantitative metoder 2

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Kvantitative metoder 2

Kvantitative Metoder 1 - Forår 2007

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Kvantitative Metoder 1 - Forår Dagens program

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Konfidensintervaller og Hypotesetest

Kapitel 7 Forskelle mellem centraltendenser

Statistik II 4. Lektion. Logistisk regression

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Schweynoch, Se eventuelt

Kvantitative Metoder 1 - Forår Dagens program

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Kvantitative Metoder 1 - Efterår Dagens program

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Forelæsning 9: Inferens for andele (kapitel 10)

Nanostatistik: Stokastisk variabel

Dagens program. Praktisk information:

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Løsning til eksaminen d. 29. maj 2009

Nanostatistik: Stokastisk variabel

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Morten Frydenberg 14. marts 2006

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Kvantitative metoder 2

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Projektopgave til Mat2SS. Espen Højsgaard (CPR xxxx) Rune Højsgaard (CPR xxxx)

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

02402 Løsning til testquiz02402f (Test VI)

Kønsproportion og familiemønstre.

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Noter til Specialkursus i videregående statistik

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Statistik og Sandsynlighedsregning 2

Dagens program. Afsnit Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Kapitel 1 Statistiske grundbegreber

Kvantitative Metoder 1 - Forår Dagens program

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

statistik statistik viden fra data statistik viden fra data Jens Ledet Jensen Aarhus Universitetsforlag Aarhus Universitetsforlag

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Multipel Lineær Regression

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Statistiske modeller

Løsning til eksamen d.27 Maj 2010

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Transkript:

Kvantitative metoder 2 Beskrivende statistik og analyse af kvalitatitive data 12. februar 2007 Kvantitative metoder 2: F3 1

Program for i dag: Test i multinomialfordelingen: Q-testet (BL.13.1-2) Opsamling fra sidste gang To eksempler To-dimensionale kontingenstabeller (BL.13.5) 2 x 2 tabeller Generelle r x c tabeller Test af uafhængighed og homogenitet Ex: Ledelsestransitioner i danske virksomheder Kvantitative metoder 2: F3 2

Analyse af to-dimensionale kontingenstabeller Krydser to kategoriserede variabler, X og Y Ex. (fortsat fra sidste gang): Bennedsen mfl. Ledelsestransitioner i familieejede virksomheder To typer af transitioner: Familie eller ej-familie To værdier af kønnet på afgående direktørs førstefødte barn: Pige eller dreng 2x2 tabel: Begge variabler har to kategorier Danske virksomheder fordelt efter køn på afgående direktørs førstefødte barn og transitionstype Pige Dreng Familie 704 1084 1788 Ejfamilie 1745 1691 3436 2449 2775 5224 Kvantitative metoder 2: F3 3

Analyse af to-dimensionale kontingenstabeller: 2x2 tilfældet Generel notation: Y=1 Y=2 n ij antal udfald hvor X=i og Y=j n i+ antal udfald hvor X=i = n i1 + n i2 n +j antal udfald hvor Y=j = n 1j + n 2j X=1 X=2 n 11 n 21 n +1 n 12 n 22 n +2 n 1+ n 2+ n Estimat af sandsynlighed i den simultane fordeling af X og Y: pˆ = n / n ij ij Estimat af marginale sandsynligheder: pˆ = n / n og pˆ = n / n i+ i+ + j + j Kvantitative metoder 2: F3 4

Analyse af to-dimensionale kontingenstabeller: 2x2 tilfældet Uafhængighed mellem X og Y: Hvis og kun hvis for alle i og j: p = p p ij i+ + j Test af H 0 : Uafhængighed overfor H 1 : Generel form for afhængighed Testet baseret på sammenligning af urestrikterede sandsynligheder og sandsynligheder pålagt uafhængighedsantagelsen. Urestrikteret Y=1 Y=2 X=1 X=2 Marg. Under uafhængighed X=1 X=2 Marg. p 11 p 12 p 21 p 22 p +1 p +2 Y=1 Y=2 p 1+ p +1 p 1+ p +2 p 2+ p +1 p 2+ p +2 p +1 p +2 Marg. p 1+ p 2+ 1 Marg. p 1+ p 2+ 1 Kvantitative metoder 2: F3 5

Analyse af to-dimensionale kontingenstabeller: 2x2 tilfældet Under H 0 : Uafhængighed bliver den forventede cellefrekvens: 0 n n n n i+ e ˆ ˆ ˆ ij = npij = npi+ p+ j = n = n n n + j i+ + j hvor estimaterne af de marginale sandsynligheder er sat ind. Danske virksomheder fordelt efter køn på afgående direktørs førstefødte barn og transitionstype: n ij og e ij Familie Ejfamilie Pige 704 838.2 1745 1610.8 2449 Forventede cellefrekvenser med kursiv Dreng 1084 949.8 1691 1825.2 2775 1788 3436 5224 Kvantitative metoder 2: F3 6

Analyse af to-dimensionale kontingenstabeller: 2x2 tilfældet Q-testet for uafhængighed for 2x2 tabel: 2 2 ( nij eij ) (704 838.2) (1745 1610.8) (1084 949.8) (1691 1825.2) Q = = + + + e 838.2 1610.8 949.8 1825.2 i= 1 j= 1 ij 2 2 2 2 2 H X Y Q 2 * Under 0 : og uafhængige er χ (1) asymp. i ekse H0 mplet. afvises for store værdier. Antal frihedsgrader i testet: Den urestrikterede 2x2 tabel har 3 frie sandsynligheder (summen er lig 1) Den restrikterede 2x2 tabel har 2 frie (marginale) sandsynligheder. Eller brug generelt resultat for parametrisk multinomialfordeling: Antal frihedsgrader = k 1 r = 1, hvor k = 4 og r = 2 : antal parametre under H (de to marginalsandsynligheder). 0 FAMTRANS.SAS beregner testet Q = 61.05. Konklusion: H afvises meget markant! 0 Kvantitative metoder 2: F3 7

Analyse af to-dimensionale kontingenstabeller: rxc tilfældet Q-testet for uafhængighed for rx c tabel (NB. BL "genbruger" symbolet r): Q = r c ( n e ) ij e i= 1 j= 1 ij ij 2 * Under H : X og Y uafhængige er Q χ (( r 1)( c 1)) asymp. H afvises for store værdier. 2 0 0 Antal frihedsgrader i testet: Brug generelt resultat for parametrisk multinomialfordeling: Antal frihedsgrader = k 1 f, hvor k = rc og f er antal parametre under H0: r 1 frie rækkesandsynligheder og c 1 frie kolonnesandsynligheder. Samlet: k 1 f = rc 1 ( r 1) ( c 1) = ( r 1)( c 1) Kvantitative metoder 2: F3 8

Analyse af to-dimensionale kontingenstabeller: Homogenitetstestet I uafhængighedstestet betragtes stikprøven som et tilfældigt udvalg, hvor (X,Y) kombinationen registreres for hvert individ. Alternativ betragtning: Analysere fordelingen af udfaldene over Y for r givne værdier af X. Relevant i tilfælde, hvor værdien af X kan kontrolleres: Fx udtrækkes lige mange personer af hvert køn til stikprøven. Teste om de r betingede fordelinger af Y er ens. Hypotesen kan formuleres som No difference between subpopulations eller homogenitetshypotesen Q-testet er uændret i forhold til uafhængighedstestet. Antal frihedsgrader i testet også uændret. Kvantitative metoder 2: F3 9

Resume og NB er: Beskrivende statistisk analyse for at undersøge datasættets struktur (grafisk eller som tabel) Introducere et nyt statistisk redskab til analysen: Fordelinger af kategoriserede data. Q-testet til test af simple hypoteser på sandsynligheder Q-testet til test af sammensatte hypoteser i kontingenstabel: Estimation af frie parametre under nulhypotesen giver reduktion i antal frihedsgrader Test for uafhængighed og homogenitet er formelt ækvivalente, men afspejler forskellig fortolkning af data. Kvantitative metoder 2: F3 10

Hvad bliver det næste? Næste forelæsning: Onsdag den 14. februar: Lineær regression. W.2 Øvelserne: Begynder i denne uge. Læs Ugeseddel 1 Kast et blik på Varians kap. 6 om forbrugerens problem NB: Hold 1: Øvelser flyttet til onsdag kl. 15-18 i Større Øvelsessal Kvantitative metoder 2: F3 11