Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)



Relaterede dokumenter
Uge 13 referat hold 4

SAS-øvelse: Vi starter ud med model et hvor x=(kvotient, eksald, halvaar, kvinde, MatB,, Gif).

Løsning til øvelsesopgaver dag 4 spg 5-9

BLÅ MEMOSERIE. Memo nr Januar Hvem består på politstudiet? Karsten Albæk. (særtryk af Nationaløkonomisk Tidsskrift, 2001(2))

Optag vinter 2010 Diplomingeniør

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Optag vinter 2011 Diplomingeniør

Statistiske Modeller 1: Kontingenstabeller i SAS

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

NOTAT EFFEKTEN AF HF. Metode

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative metoder 2

Optag vinter 2013 Diplomingeniør

Morten Frydenberg 14. marts 2006

Økonometri 1 Efterår 2006 Ugeseddel 11

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

Lineær og logistisk regression

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Note om Monte Carlo eksperimenter

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Statistik II 4. Lektion. Logistisk regression

Optag sommer Bachelor i teknisk videnskab (civilbachelor) og Diplomingeniør. Profil af de studerende. Afdelingen for Uddannelse og Studerende

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Dokumentation af programmering i Python 2.75

Miniguide til optagelse.dk

ÅRGANG Profil af de studerende, der er optaget på DTU sommeren Studieadministrationen

Morten Frydenberg 26. april 2004

Hvorfor SAS Kort intro til SAS

Velkommen til ABC Analyzer! Grundkursusmanual 2 vil introducere dig til ABC Analyzers mere avancerede funktioner, bl.a.:

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Simpel og multipel logistisk regression

Optag sommer Bachelor i teknisk videnskab (civilbachelor) og Diplomingeniør. Profil af de studerende. Afdelingen for Uddannelse og Studerende

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Økonometri 1 Forår 2006 Ugeseddel 11

Optag Bachelor i teknisk videnskab (civilbachelor) og diplomingeniøruddannelsen. Profil af de studerende

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Bekendtgørelse om adgang til bacheloruddannelser ved universiteterne (bacheloradgangsbekendtgørelsen)

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Opgavebesvarelse, logistisk regression

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Kvantitative Metoder 1 - Efterår Dagens program

9. Chi-i-anden test, case-control data, logistisk regression.

Kvantitative Metoder 1 - Forår Dagens program

Statistik Rapport for 2005

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Økonometri, ugeseddel 8 Hold 1 1/4-2003

MATEMATIK B. Videooversigt

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Dansk Erhvervs gymnasieeffekt - sådan gjorde vi

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Rygtespredning: Et logistisk eksperiment

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Dansk Erhvervs gymnasieeffekt - sådan gør vi

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Dansk Erhvervs gymnasieanalyse Sådan gør vi

Optag sommer Bachelor i teknisk videnskab (civilbachelor) og Diplomingeniør. Profil af de studerende

Løsning til opgave i logistisk regression

Studenter og resultater

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Skriftlig eksamen Science statistik- ST501

Introduktion til GLIMMIX

Hvor længe venter de studerende inden de begynder uddannelse? Og hvad laver de imens?

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Kom i gang-opgaver til differentialregning

Varmeligningen og cosinuspolynomier.

ergoterapeut Optagelse 2013

Maple 11 - Chi-i-anden test

Bilag 7. SFA-modellen

Eksempel på logistisk vækst med TI-Nspire CAS

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Kort om Eksponentielle Sammenhænge

Skriftlig eksamen i Datalogi

a) For at bestemme a og b i y=ax+b defineres to lister med data fra opgaven År d 0, 1, 2, 3, 4, 5, 6 :

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

SPSS introduktion Om at komme igang 1

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Variabelsammenhænge og grafer

NYOPTAG SOMMER Profil af de studerende. af Maria Skou og Lene Thorsen

GrundlÄggende variabelsammenhänge

Politrådets Socialundersøgelse

Statistik for Biokemikere Projekt

Kommentarer til matematik B-projektet 2015

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Matematik B. Højere handelseksamen

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

To-sidet variansanalyse

Analyse af bivirkninger på besætningsniveau efter vaccination med inaktiveret BlueTongue Virus (BTV) serotype 8 i danske malkekvægsbesætninger

Markante sæsonudsving på boligmarkedet

MPH specialmodul Epidemiologi og Biostatistik

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Transkript:

Økonometri 1 Forår 2003 Ugeseddel 13 Program for øvelserne: Gruppearbejde Opsamling af gruppearbejdet og introduktion af SAS SAS-øvelser i computerkælderen Øvelsesopgave 6: Hvem består første årsprøve på polit.? Denne øvelsesopgave drejer sig om at forklare, hvem der består første årsprøve på polit.-studiet. Til dette formål benyttes information om de studerendes adgangsgivende eksamen, optagelsesår, køn etc. Responsvariablen er altså en binær variabel og i øvelsesopgaven benyttes logit- og probitmodeller til at opstille en model for, hvem der består. Data: Data stammer fra Københavns Universitets studieadministration. Data indeholder information om studerende, som startede på polit.-studiet i perioden fra sommeroptaget i 1997 til vinteroptaget i 2000. I alt indeholder datasættet information fra 1105 studerende. Disse data er stillet til rådighed af lektor Karsten Albæk, som har analyseret, hvem der består første årsprøve på polit.-studiet, se Nationaløkonomisk tidsskrift, 139(2) 2001, s. 208-222, http://www.econ.ku.dk/wpa/ (blå memoserie). En detaljeret beskrivelse af data kan ses i denne publikation. Den afhængige variabel (bestd12) angiver, om den studerende har bestået første årsprøve i løbet af første studieår. De øvrige variable i datasættet er: Startaar: Startår på polit.-studiet Halvaar: 1: vinteroptag, 2: sommeroptag Eksald: Alder på adgangsgivende eksamen Kvotient: Kvotient fra adgangsgivende eksamen. (Kvotient er trunkeret ved 6.9 og 10, dvs. for kvotient <6.9 er kvotient sat lig 6.9 og hvis kvotient >10 er kvotient=10) Kvinde: Dummy for kvinde Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A) MatB: MatM: Sproglig: HF: HHX: HTX: Udland: GIF: Dummy for Matematisk student med matematik på B niveau Dummy for Matematisk student (niveauet for matematik er ikke oplyst) Dummy for Sproglig student Dummy for Højere Forberedelseseksamen Dummy for Højere Handelseksamen Dummy for Højere Teknisk eksamen Dummy for Udenlandsk adgangsgivende eksamen Dummy for Anden studentereksamen 1

Den økonometriske analyse: På baggrund af ovenstående variable ønskes en økonometrisk analyse af, hvem der består polit.- studiet. I denne opgave tager vi udgangspunkt i en logitmodel. Modellens parametre estimeres med maximum likelihood estimation. I denne opgave starter vi med at betragte følgende specifikation af sandsynligheden for at bestå første årsprøve: Model (1): P( y = 1 x) = G( β + β halvaar + β eksald + β kvotient + β kvinde + β matb + + β GIF) hvor exp( z) Gz ( ) = 1 + exp( z) Gruppearbejde (30 min): 0 1 2 3 4 5 12 Hver gruppe vælger en talsmand, som afrapporterer for gruppen i den efterfølgende plenumdiskussion. Én af grupperne vil desuden blive bedt om at lave en kort opsamling (½-1 side) af hele holdets konklusioner. Øvelseslæreren er til stede og kan hjælpe med at afklare spørgsmål undervejs. 1. Diskuter evt. problemer med den valgte specifikation: a. Er variablen kvotient inkluderet på en hensigtsmæssig måde? Har du forslag til alternative specifikationer? b. Er variablen eksald inkluderet på en hensigtsmæssig måde? Alternative forslag? 2. Hvordan udføres et test for, om typen af adgangsgivende eksamen har betydning? Beskriv de enkelte trin i et LR test. 3. Diskuter hvordan parametrene i logitmodellen skal fortolkes. 4. Diskuter forskellen mellem en logit, probit og en lineær sandsynlighedsmodel. 5. Hvis man fra politisk side ønsker at øge andelen, som består første årsprøve, hvilke anbefalinger kan man så give på baggrund af denne type af analyse? SAS øvelse: 1. Indlæsning af data. Data ligger i en fil (uge13.sas7bdat), som kan hentes på hjemmesiden for øvelserne. Lav en deskriptiv analyse af variablene i datasættet ved at anvende proc univariate eller proc freq. Man kan med fordel omdefinere variablen halvaar, således at det er en rigtig dummyvariabel (antager værdier 0 og 1). 2. Estimer modellen (1) ved Maximum likelihood estimation. Følgende programskitse kan være til hjælp: proc logistic data= datanavn descending; model bestd12= ; 2

Optionen Descending angiver, at parametrene henviser til sandsynligheden for, at responsvariablen er lig 1. Udelades optionen, henviser parametrene til sandsynligheden for, at responsvariablen er lig 0. 3. Test vha. et LR test om typen af adgangsgivende eksamen har betydning for, om man består. (Hint: udfør en estimation uden dummyerne for de adgangsgivende eksamener og benyt log likelihood værdien for de to estimationer til at beregne LR testet). Sammenlign med resultaterne når du bruger test optionen i proc reg. Overvej hvad det er for et test, test optionen i proc reg laver. 4. Undersøg om der er en monoton sammenhæng mellem alderen på den adgangsgivende eksamen og sandsynligheden for at bestå. Dette gøres ved at benytte dummyvariable for alderen af den adgangsgivende eksamen (lav en dummy for eksald=>6). Model (2): P( y = 1 x) = G( β + β halvaar + β kvotient + β kvinde + β matb + + β GIF + δ eksald1+ + δ eksald6) exp( z) Gz ( ) = 1 + exp( z) 0 1 3 4 5 12 1 6 5. Undersøg om der er en monoton sammenhæng mellem kvotient og sandsynligheden for at bestå. Vurder også om de øvrige resultater ændrer sig (meget), hvis man bruger en anden specifikation af kvotient end i model (2). 6. Lav et Goodness of fit check af model (2). (Hint benyt OUTPUT OUT til at danne et nyt datasæt med den prædikterede sandsynlighed for at bestå (PREDICTED). Dernæst kan følgende programstump bruges): data fit; set p_bestaa; if p_ssh>0.5 then p_best=1; else p_best=0; proc freq data=fit; tabl e bestd12*p_best; 7. Fortolk resultaterne fra analysen (i model (2)). Dette kan gøres ved at udregne de partielle effekter (se Wooddridge side 556-557). For at udregne disse partielle personer skal man bruge en standard person. Standard personen er udvalgt til at have følgende karakteristika: en mandlig, matematisk student med matematik på A niveau, kvotient på 8.5, eksamensalder nul år, og som er optaget om sommeren (svarende til alle dummy variable er lig 0). Datasættet marginal indeholder en standard personen, og 16 andre personer, hvor de enkelte dummy variable på skift er sat til 1. På baggrund af disse fiktive personer kan de partielle effekter beregnes (husk at partielle effekter af kontinuerte variable beregnes ved formel (17.7) mens for dummy variable anvendes (17.8). Følgende programstump kan anvendes: * Udregning af partielle effekter (spørgsmål 7); * Nyt data med standard personer. 17 forskellige personer lægges til data; data p_effekt; 3

set aarsproeve ind.marginal; * Estimation af model (2) samt prediktion af ssh og lineært index; proc logistic data=p_effekt descending; model bestd12=halvaard kvotient kvinde matb matm sproglig HF HHX HTX udland GIF deksald1 deksald2 deksald3 deksald4 deksald5 deksald6; output out=p_effekter1 predicted=ssh xbeta=xb; * Nyt data kun med standard personer; data standard; set p_effekter1; if bestd12=.; * Udskrivning af ssh og lineære index for standard personer; proc print data=standard; Fortolk parameteren til halvårsvariablen. Forklar det fundne resultat (kan resultatet skyldes udeladte variable?) 8. Argumenter på baggrund af dine analyser for hvordan man ville kunne hæve andelen, som består første årsprøve i løbet af første studieår. 9. Sammenlign resultaterne fra en logit specifikation med en probitmodel og en lineær sandsynlighedsmodel. Estimationen af en probitmodel kan foretages ved at man specificerer link, som sættes til probit (se nedenstående program): proc logistic data=p_bestaa descending; model bestd12=halvaard kvotient kvinde matb matm sproglig HF HHX HTX udland GIF deksald1 deksald2 deksald3 deksald4 deksald5 deksald6/ link=probit; output out=probit predicted=pp_ssh; Den lineære sandsynlighedsmodel estimeres med proc reg. 11. Undersøg også hvordan de prædikterede sandsynligheder ser ud for forskellige værdier af variablen kvotient. Dette kan f.eks. gøres ved at sammenligne de prædikterede sandsynligheder for de tre modeller for en mandlig, matematisk student med matematik på A niveau, eksamensalder et år, og som er optaget om sommeren. Dette gøres ved at udregne de prædikterede sandsynligheder for hver af de tre modeller ved hjælp af optionen OUTPUT og PREDICTED. For at tegne en graf med de tre sandsynligheder kan følgende programstump anvendes: data graf; set samlet; if kvinde=0 and halvaar=2 and eksald=1 and matb=0 and Matm=0 and sproglig=0 and HF=0 and HTX=0 and HHX=0 and HF=0 and udland=0 and GIF=0; 4

proc sort data=graf out=sgraf; by kvotient; proc gplot data=sgraf; plot pl_ssh*kvotient=1 pp_ssh*kvotient=2 lpm_ssh*kvotient=3/overlay; symbol1 interpol=join co=red; symbol2 interpol=join co=blue; symbol3 interpol=join co=green; quit; 5