Kvantitative metoder 2

Relaterede dokumenter
Kvantitative metoder 2

Kvantitative metoder 2

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Statistik II 1. Lektion. Analyse af kontingenstabeller

Løsning eksamen d. 15. december 2008

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Kvantitative Metoder 1 - Forår 2007

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kvantitative Metoder 1 - Efterår Dagens program

Tema. Dagens tema: Indfør centrale statistiske begreber.

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Dagens program. Praktisk information:

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Løsning til eksaminen d. 14. december 2009

Kvantitative metoder 2

Kvantitative metoder 2

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Kvantitative metoder 2

Module 4: Ensidig variansanalyse

Kvantitative Metoder 1 - Forår Dagens program

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Kapitel 7 Forskelle mellem centraltendenser

Statistik II 4. Lektion. Logistisk regression

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Løsning til eksaminen d. 29. maj 2009

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Kapitel 12 Variansanalyse

Kvantitative Metoder 1 - Forår Dagens program

Schweynoch, Se eventuelt

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

1 Hb SS Hb Sβ Hb SC = , (s = )

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Kvantitative Metoder 1 - Efterår Dagens program

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Kapitel 12 Variansanalyse

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Morten Frydenberg 14. marts 2006

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Forelæsning 9: Inferens for andele (kapitel 10)

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Projektopgave til Mat2SS. Espen Højsgaard (CPR xxxx) Rune Højsgaard (CPR xxxx)

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistiske modeller

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

02402 Løsning til testquiz02402f (Test VI)

Kønsproportion og familiemønstre.

Noter til Specialkursus i videregående statistik

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Statistik og Sandsynlighedsregning 2

Dagens program. Afsnit Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Kapitel 1 Statistiske grundbegreber

Kvantitative Metoder 1 - Forår Dagens program

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

statistik statistik viden fra data statistik viden fra data Jens Ledet Jensen Aarhus Universitetsforlag Aarhus Universitetsforlag

Basal Statistik Kategoriske Data

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Multipel Lineær Regression

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Nanostatistik: Stokastisk variabel

Løsning til eksamen d.27 Maj 2010

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Transkript:

Program for i dag: Kvantitative metoder Beskrivende statistik og analyse af kvalitatitive data 1. februar 007 Test i multinomialfordelingen: Q-testet (BL.13.1-) Opsamling fra sidste gang To eksempler To-dimensionale kontingenstabeller (BL.13.5) x tabeller Generelle r x c tabeller Test af uafhængighed og homogenitet Ex: Ledelsestransitioner i danske virksomheder Kvantitative metoder : F3 1 Kvantitative metoder : F3 1

Analyse af to-dimensionale kontingenstabeller Analyse af to-dimensionale kontingenstabeller: x tilfældet Krydser to kategoriserede variabler, X og Y Ex. (fortsat fra sidste gang): Bennedsen mfl. Ledelsestransitioner i familieejede virksomheder To typer af transitioner: Familie eller ej-familie To værdier af kønnet på afgående direktørs førstefødte barn: Pige eller dreng x tabel: Begge variabler har to kategorier Danske virksomheder fordelt efter køn på afgående direktørs førstefødte barn og transitionstype Pige Dreng Familie 704 1084 1788 Ejfamilie 1745 1691 3436 449 775 54 Generel notation: n antal udfald hvor X=i og Y=j n i+ antal udfald hvor X=i = n i1 + n i n +j antal udfald hvor Y=j = n 1j + n j Estimat af sandsynlighed i den simultane fordeling af X og Y: Estimat af marginale sandsynligheder: X=1 X= Y=1 n 11 n 1 n +1 pˆ = n / n Y= n 1 n n + pˆ = n / n og pˆ = n / n i+ i+ + j + j n 1+ n + n Kvantitative metoder : F3 3 Kvantitative metoder : F3 4

Analyse af to-dimensionale kontingenstabeller: x tilfældet Analyse af to-dimensionale kontingenstabeller: x tilfældet Uafhængighed mellem X og Y: Hvis og kun hvis for alle i og j: p = p p i+ + j Test af H 0 : Uafhængighed overfor H 1 : Generel form for afhængighed Testet baseret på sammenligning af urestrikterede sandsynligheder og sandsynligheder pålagt uafhængighedsantagelsen. Urestrikteret Y=1 Y= X=1 X= Under uafhængighed X=1 X= p 11 p 1 p 1 p p +1 p + Y=1 Y= p 1+ p +1 p 1+ p + p + p +1 p + p + p +1 p + p 1+ p + 1 p 1+ p + 1 Under H 0 : Uafhængighed bliver den forventede cellefrekvens: 0 n n n n i+ e ˆ ˆ ˆ = np = npi+ p+ j = n = n n n + j i+ + j hvor estimaterne af de marginale sandsynligheder er sat ind. Forventede cellefrekvenser med kursiv Danske virksomheder fordelt efter køn på afgående direktørs førstefødte barn og transitionstype: n og e Familie Ejfamilie Pige Dreng 704 838. 1084 949.8 1788 1745 1610.8 1691 185. 3436 449 775 54 Kvantitative metoder : F3 5 Kvantitative metoder : F3 6 3

Analyse af to-dimensionale kontingenstabeller: x tilfældet Analyse af to-dimensionale kontingenstabeller: rxc tilfældet Q-testet for uafhængighed for x tabel: ( n e ) (704 838.) (1745 1610.8) (1084 949.8) (1691 185.) Q = = + + + e 838. 1610.8 949.8 185. i= 1 j= 1 * Under H0 : X og Y uafhængige er Q χ (1) asymp. i ekse H0 mplet. afvises for store værdier. Antal frihedsgrader i testet: Den urestrikterede x tabel har 3 frie sandsynligheder (summen er lig 1) Den restrikterede x tabel har frie (marginale) sandsynligheder. Eller brug generelt resultat for parametrisk multinomialfordeling: Antal frihedsgrader = k 1 r = 1, hvor k = 4 og r = : antal parametre under H (de to marginalsandsynligheder). 0 Q-testet for uafhængighed for rc x tabel (NB. BL "genbruger" symbolet r): r c ( n e ) Q = e i= 1 j= 1 * Under H : X og Y uafhængige er Q χ (( r 1)( c 1)) asymp. H afvises for store værdier. 0 0 Antal frihedsgrader i testet: Brug generelt resultat for parametrisk multinomialfordeling: Antal frihedsgrader = k 1 f, hvor k = rc og f er antal parametre under H0: r 1 frie rækkesandsynligheder og c 1 frie kolonnesandsynligheder. Samlet: k 1 f = rc 1 ( r 1) ( c 1) = ( r 1)( c 1) FAMTRANS.SAS beregner testet Q = 61.05. Konklusion: H afvises meget markant! 0 Kvantitative metoder : F3 7 Kvantitative metoder : F3 8 4

Analyse af to-dimensionale kontingenstabeller: Homogenitetstestet I uafhængighedstestet betragtes stikprøven som et tilfældigt udvalg, hvor (X,Y) kombinationen registreres for hvert individ. Alternativ betragtning: Analysere fordelingen af udfaldene over Y for r givne værdier af X. Relevant i tilfælde, hvor værdien af X kan kontrolleres: Fx udtrækkes lige mange personer af hvert køn til stikprøven. Teste om de r betingede fordelinger af Y er ens. Hypotesen kan formuleres som No difference between subpopulations eller homogenitetshypotesen Q-testet er uændret i forhold til uafhængighedstestet. Antal frihedsgrader i testet også uændret. Resume og NB er: Beskrivende statistisk analyse for at undersøge datasættets struktur (grafisk eller som tabel) Introducere et nyt statistisk redskab til analysen: Fordelinger af kategoriserede data. Q-testet til test af simple hypoteser på sandsynligheder Q-testet til test af sammensatte hypoteser i kontingenstabel: Estimation af frie parametre under nulhypotesen giver reduktion i antal frihedsgrader Test for uafhængighed og homogenitet er formelt ækvivalente, men afspejler forskellig fortolkning af data. Kvantitative metoder : F3 9 Kvantitative metoder : F3 10 5

Hvad bliver det næste? Næste forelæsning: Onsdag den 14. februar: Lineær regression. W. Øvelserne: Begynder i denne uge. Læs Ugeseddel 1 Kast et blik på Varians kap. 6 om forbrugerens problem NB: Hold 1: Øvelser flyttet til onsdag kl. 15-18 i Større Øvelsessal Kvantitative metoder : F3 11 6