Fortolkning, illustration mm. af interaktion i lineære regressionsmodeller ved hjælp af MS Excel og SPSS

Størrelse: px
Starte visningen fra side:

Download "Fortolkning, illustration mm. af interaktion i lineære regressionsmodeller ved hjælp af MS Excel og SPSS"

Transkript

1 Fortolkning, illustration mm. af interaktion i lineære regressionsmodeller ved hjælp af MS Excel og SPSS KIM MANNEMAR SØNDERSKOV Tlf ks@ps.au.dk INSTITUT FOR STATSKUNDSKAB AARHUS UNIVERSITET UNIVERSITETSPARKEN 8000 ÅRHUS C Version 1.6 December 2010

2 0. Indledning 1 Denne note gennemgår hvordan interaktion i lineære regressionsmodeller kan illustreres grafisk og behandler nogle yderligere forhold omkring interaktionsmodeller særligt deres fortolkning. Notatet bygger på Brambor et al. (2006) og Kam & Franzese (2007) samt delvist Agresti & Finlay (2009). Se endvidere Sønderskov og Nielsen (2009) for en mere detaljeret og avanceret behandling af illustrationsdelen. Gennemgangen tager udgangspunkt i en model med følgende variable: Y en metrisk afhængig variabel X 1 en metrisk uafhængig variabel som interessen samler sig om (den primære variabel) X 2 en metrisk uafhængig variabel, som potentielt modererer X 1 s effekt på Y X 1 X 2 interaktionsleddet, som er dannet med krydsproduktet mellem X 1 og X 2 K en metrisk kontrolvariabel, som ikke indgår i interaktionsleddet Det vil løbende blive beskrevet, hvordan den primære og den modererende variabel kan erstattes med kategoriske variable. Bemærk at X 1 og X 2 samlet kaldes de konstituerende led eller 1. ordensleddene, mens interaktionsleddet også kaldes 2. ordensleddet. Test, fortolkning og illustration af interaktionsmodeller vil typisk følge en procedure a la denne: 1. Problemstilling, teori, hypotese og model 2. Operationalisering og dannelse af interaktionsled 3. Estimation af interaktionsmodellen 4. Vurdering af forudsætninger 5. Rapportering af relevante estimater/statistikker 6. Fortolkning af koefficienter og tilhørende P-værdier 7. Illustration af den forudsagte sammenhæng mellem X 1 og Y ved udvalgte niveauer af X 2 8. Beregning af signifikansniveauer for X 1 ved udvalgte niveauer af X 2 9. Konklusion på problemstillingen Dette notat er struktureret efter denne procedure, om end punkt 4 og 9 kun behandles overfladisk. 1. Problemstilling, teori, hypotese og model Proceduren eksemplificeres med følgende problemstilling: Er effekten af ulandsbistand på økonomisk vækst betinget af kvaliteten af de statslige institutioner, der er til stede i bistandsmodtagerlandene? Sagt på en anden måde: modererer kvaliteten af statslige institutioner ulandsbistands effekt på økonomisk vækst? På baggrund af litteraturen (fx Burnside & Dollar, 2000) kan det forventes at ulandsbistand har den mest positive effekt på økonomisk vækst i lande, hvor de statslige institutioner understøtter vækst (fx ved fravær af korruption og tilstedeværelse af institutionelle mekanismer, der sikrer at politikerne bliver holdt ansvarlige for deres handlinger). 1 Notatet er skrevet med udgangspunkt i SPSS/PASW Statistics 18 og MS Excel Tak til Simon Calmar Andersen, Helene Marie Fisker, Jacob Seier Petersen, Lars Engelbrecht Jensen, Lasse Laustsen, Peter Thorgård og Søren Heldgaard Olesen for konstruktive kommentarer og forslag. 1

3 Hypotesen er dermed at ulandsbistand har den mest positive effekt i lande, hvor kvaliteten af de statslige institutioner er høj. Denne problemstilling og hypotese er oplagt at undersøge ved hjælp af en interaktionsmodel, da der forventes en interaktiv sammenhæng mellem ulandsbistand (den primære variabel (X 1 )) og økonomisk vækst (Y) på den måde at effekten af ulandsbistand forventes at variere afhængigt af institutionel kvalitet (den modererende variabel (X 2 )). Figur 1 illustrerer denne forventning. Figur 1: Forventet sammenhæng X 1 : Ulandbistand Y: Vækst X 2 : Institutionel kvalitet Modelopbygningen bør følge de samme procedurer som enhver test af kausale påstand med multipel regression hvilket blandt andet betyder at modellen bør inkludere alle relevante kontrolvariable (jf. Stubager & Sønderskov, 2011). Her inkluderes for eksemplets skyld en enkelt kontrolvariabel: initial velstand altså velstand på et tidligere tidspunkt. Logikken bag inddragelsen af denne kontrolvariabel er, at velstående lande har tendens til at have lavere vækstrater end fattigere økonomier (se fx Justesen, 2006). Samtidigt er det yderst plausibelt at fortidige velstandsniveauer påvirker såvel fremtidige niveauer af ulandsbistand og institutionel kvalitet Operationalisering og dannelse af interaktionsled Den afhængige variabel (Y), økonomisk vækst, operationaliseres som den gennemsnitlige årlige vækst i brutto nationalproduktet (BNP) i perioden , og måles med data fra Verdensbankens World Development Indicators (WDI) (Verdensbanken, 2010) samt fra Penn World Tables (2010). Den primære uafhængige variabel (X 1 ), ulandsbistand, operationaliseres som gennemsnitlig modtaget ulandsbistand per indbygger i perioden målt i amerikanske dollars (2000 niveau). Data er fra WDI. Den modererende variabel (X 2 ), institutionel kvalitet, operationaliseres som den gennemsnitlige score på fem indikatorer angående kvaliteten af statslige institutioner i år 2000 (Worldwide Governance Indicators fra Verdensbanken (2010)). Da denne variabel ikke har en meningsfuld skala er den reskaleret så den går fra 0 til 1, hvor 1 udtrykker det højeste kvalitetsniveau af statslige institutioner blandt de inkluderede lande. Kontrolvariablen (K) Initial velstand operationaliseres som BNP per capita i år 1990 og måles med data fra samme kilder som vækstvariablen. 2 Bemærk at modellen ikke er uproblematisk; der kan nemt identificeres flere relevante kontrolvariable (se Justesen, 2006), endogenitetsbias kan ikke afvises og, som det vil fremgå om lidt, stikprøven er ikke en stikprøve. Resultaterne skal derfor tages med visse forbehold og tjener primært som eksempel. 2

4 Tabel 1 viser deskriptive statistikker for modellens variable, hvor i_aidxinsti er interaktionsleddet. Dette led er dannet i SPSS med følgende kommando (hvor bistand og instikval er navnene på hhv. X 1 og X 2 i datasættet): COMPUTE i_aidxinsti = bistand*instikval. Tabel 1: Deskriptive statistikker for inkluderede variable (i SPSS-format) 3 3. Estimation af interaktionsmodellen Y X 1 X 2 K X 1 X 2 Estimation af lineære interaktionsmodeller foregår på samme måde som andre multiple regressionsmodeller. I nærværende tilfælde estimeres følgende model: E(Y) = α + β 1 X 1 + β 2 X 2 + β 3 X 1 X 2 + β 4 K Bemærk at både de konstituerende led (X 1 og X 2 ) samt interaktionsleddet er inkluderet i modellen. Interaktionsmodeller skal som udgangspunkt indeholde alle konstituerende led. Estimationsresultaterne fremgår af Tabel 2. Tabel 2: Parameterestimater mm. fra interaktionsregressionen 3 Bemærk at SPSS-output normalt ikke regnes for fyldestgørende til eksamen i Metode på Institut for Statskundskab. 3

5 4. Vurdering af forudsætinger Vurderingen af hvorvidt forudsætningerne er opfyldt i nærværende eksempel gennemgås ikke her, men i interaktionsmodeller gælder de samme forudsætninger som i normale additive regressionsmodeller (se fx Stubager & Sønderskov, 2011). Dog vil man normalt ikke undersøge linearitetsforudsætningen for interaktionsleddet samt de konstituerende led (altså X 1 X 2, X 1 og X 2 ), da dette ikke umiddelbart er muligt (jf. Stubager & Sønderskov, 2011: note 9). Linearitetsforudsætningen for disse variable må derfor blot antages at være opfyldt. Derudover vil man normalt se bort fra multikollinearitetsproblemer, der vedrører interaktionsleddet og de konstituerende variable (jf. note 4 nedenfor). Det bør i denne sammenhæng bemærkes at centrering af variable ikke løser multikollinearitetsproblemer (som det ellers anføres visse steder og antydes i Agresti & Finlay, 2009: 343f). 5. Rapportering af relevante estimater/statistikker Figur 2 viser hvordan afrapportering af estimationsresultaterne kan tage sig ud. Figur 2: Forslag til afrapportering af resultater 6. Fortolkning af koefficienter og tilhørende P-værdier Det første man bør bemærke i forbindelse med resultaterne fra en interaktionsmodel er P- værdien for interaktionsleddet (X 1 X 2 ). Hvis interaktionsleddet er insignifikant ved konventionelle niveauer, er konklusionen, at der ikke er interaktion. I vort tilfælde ville et insignifikant interaktionsled indikere, at effekten af ulandsbistand ikke afhænger af institutionel kvalitet. I 4

6 sådanne tilfælde vil en interaktionsanalyse typisk stoppe her. 4 Næste skridt vil typisk være at se på fortegnet for interaktionsleddet. Fortegnet angiver modellens bud på om effekten af den primære variable på E(Y) stiger (+) eller falder (-) når den modererende variabel stiger. Dette skal forstås numerisk; fortegnet viser om effekten falder eller stiger numerisk set og dermed ikke nødvendigvis om effekten bliver større eller mindre i absolutte termer. I nærværende tilfælde viser fortegnet, at effekten af ulandsbistand stiger (bliver mere positiv) når kvaliteten af de statslige institutioner stiger. Dette understøtter hypotesen, da resultaterne indikerer at effekten af ulandsbistand er mere positiv i lande med velfungerende institutioner end i lande med ringere institutioner. I visse tilfælde kunne analysen stoppe her, da hypotesen på sin vis er undersøgt. I langt de fleste tilfælde vil man dog gå videre. I nærværende tilfælde er interaktionsleddet signifikant (på 0,05-niveauet) og det kan på den baggrund konkluderes at effekten af ulandsbistand på økonomisk vækst varierer med kvaliteten af statslige institutioner. Næste skridt vil være at se på koefficienten for interaktionsleddet. Koefficienten viser modellens bud på hvor meget koefficienten for X 1 (βx 1 ) ændrer sig, når X 2 ændres med +1. I nærværende tilfælde er fortolkningen af koefficienten (+0,18), at effekten af ulandsbistand på vækst stiger med 0,18 når institutionel kvalitet stiger med 1. Da institutionel kvalitet her er skaleret fra 0 til 1, udtrykker koefficienten ændringen i effekten af bistand, når institutionel kvalitet ændres fra minimumsværdien til maksimumsværdien. Koefficienten og signifikanstesten for X 1 har også en direkte fortolkning, men man vil dog sjældent fortolke indgående på disse værdier. I stedet vil man oftest illustrere sammenhængen som gennemgået nedenfor. For fuldstændighedens skyld gennemgås fortolkningen af koefficienten og P-værdien for X 1 dog her. Koefficienten for X 1 udtrykker den estimerede ændring i E(Y) når X 1 ændres med +1 for X 2 =0. På et enkelt punkt adskiller dette sig fra tolkningen i en model uden interaktion. I en sådan model udtrykker koefficienten for X 1 den estimerede ændring i E(Y) når X 1 stiger 1 og når X 2 holdes konstant. Med andre ord er fortolkningen af koefficienten for X 1 delvist den samme som i en model uden interaktion, men adskiller sig på den måde, at X 2 ikke bare er holdt konstant, men holdt på niveauet 0. 5, 6 Pointen i interaktionsmodeller er jo, at effekten af X 1 på Y ændres når X 2 ændres. I en interaktionsmodel giver det derfor ikke mening at tale om 4 Bemærk dog at grundet multikollinearitet vil standardfejlen for interaktionsleddet (og de konstituerede led) ofte være høje, hvilket betyder, at der med en vis sandsynlighed begås en type II-fejl når insignifikante interaktionsled medfører afvisning af interaktion. På trods af dette er standarden i litteraturen at afvise interaktion når P-værdien for interaktionsleddet er over konventionelle niveauer. Bemærk også at interaktionsmodeller med krydsprodukter kun kan afgøre om X 1 s effekt på Y er monotomt stigende eller faldende med X 2. På den baggrund kan man med en krydsproduktsinteraktionsmodel ikke afvise at andre former for interaktion forekommer, eksempelvis at effekten først stiger og siden falder. 5 Fortolkningen af koefficienten for X 2 er parallel til fortolkningen for X 1. Koefficienten for X 2 udtrykker ændringen i Y når X 2 stiger 1 for X 1 =0. Koefficienter for variable der ikke indgår i interaktionsled (her BNP per capita) har helt samme fortolkning som i modeller uden interaktion: Koefficienten udtrykker ændringen i Y-hat når variablen stiger 1 og alle øvrige variable holdes konstant. 6 Bemærk at koefficienten for X 1 kan være meningsløs, hvis X 2 ikke antager værdien 0 helt på samme måde som konstanten fra alle typer regressionsmodeller kan være meningsløs hvis 0 ligger udenfor observationsområdet. 5

7 effekten af X 1 på Y når X 2 holdes konstant. I nærværende eksempel viser koefficienten på -0,09, at ulandsbistand ifølge modellen har en negativ effekt på den økonomiske vækst i lande med relativt dårlige institutioner (IK=0). Fortolkningen af P-værdier er derimod helt analogt til modeller uden interaktion. Det betyder her at den negative effekt af bistand under relativt dårlige institutioner er statistisk signifikant. Resultaterne fortæller os blandt andet følgende: Effekten af ulandsbistand på økonomisk vækst afhænger af kvaliteten af de institutioner, der er til stede i de lande der modtager bistand. Effekten stiger når kvaliteten stiger, og denne stigning er statistisk signifikant dette fremgår af det positive og signifikante interaktionsled. Derudover fremgår det, at ulandsbistand har en signifikant negativ effekt på vækst i lande med relativt ringe statslige institutioner (da koefficienten for X 1 udtrykker effekten af X 1 for X 2 =0). Endelig kan man forholdsvis nemt udregne, at i lande med relativt gode institutioner (X 2, institutionel kvalitet = 1) er effekten af ulandsbistand 0,09: (bx 1 X 2 =1) = (b ulandsbistand IK = 1) = bx 1 + 1*bX 1 X 2 = -0,09+0,18 = 0,09 - da bx 1 X 2 (0,18) netop udtrykker forskellen i effekten af X 1 når X 2 stiger med 1. Med andre ord er der altså en positiv effekt af ulandsbistand i lande med relativt velfungerende institutioner. Hvad resultaterne ikke umiddelbart fortæller os, er om denne effekt er signifikant forskellig fra 0 og heller ikke hvad effekten af ulandsbistand er ved andre niveauer af X 2. Typisk vil disse forhold også være interessante og relevante i fortolkningen, hvorfor videre arbejde er nødvendigt. Den videre proces kan inddeles i to procedurer: 1) Illustration af sammenhængen mellem den primære variabel (X 1 ) og Y ved udvalgte niveauer af den modererende variabel (X 2 ). 2) beregning af hvornår den primære variabel har en signifikant effekt på Y. Resten af notatet omhandler disse to procedurer. 7. Illustration af den forudsagte sammenhæng mellem X1 og Y ved udvalgte niveauer af X2 Figur 3 er et (foreløbigt) eksempel på hvordan den forudsagte sammenhæng mellem ulandsbistand og økonomisk vækst kan illustreres kan illustreres ved udvalgte niveauer af institutionel kvalitet. 6

8 Figur 3: Foreløbigt eksempel på illustration af resultaterne Som vi skal se om lidt er figuren dannet på baggrund at estimationsresultaterne som fremkom ovenfor. Figuren illustrerer den interaktive sammenhæng mellem ulandsbistand og vækst, idet den fremhæver at sammenhængen mellem de to variable afhænger af niveauet på variablen Institutionel kvalitet. Mere konkret viser figur 3 at stigende ulandsbistand medfører faldende vækst i lande med relativt dårlige institutioner (IK=0) eller rettere at ulandsbistand medfører negativ vækst i sådanne lande. Dette resultat svarer til koefficienten for ulandsbistand som vi estimerede ovenfor (b udlandsbistand = bx 1 = -0,09). Den øverste linje viser at stigende bistand medfører øget vækst i lande med relativt gode institutioner (IK=1). Dette resultat svarer til beregningen der blev foretaget ovenfor, hvor b udlandsbistand blev beregnet for IK = 1. Den mellemste linje viser sammenhængen mellem ulandsbistand og vækst ved IK=0,41, som er gennemsnittet for institutionel kvalitet i stikprøven (jf. Tabel 1). De følgende afsnit gennemgår, hvordan Figur 3 er dannet. Første skridt i denne procedure er at afgøre, hvor mange og hvilke niveauer af den modererende variabel (X 2, her IK), sammenhængen mellem X 1 og Y skal vises for. Typisk vil man illustrere sammenhængen for 3-4 niveauer af den modererende variabel. 7 Hvilke niveauer af den modererende variabel sammenhængen bør vises for er svært at sige generelt, da problemstillingen eller andre forhold vil spille ind her. To generelle muligheder er dog at vise sammenhængen mellem X 1 og Y ved følgende niveauer af den modererende variabel: X 2 = minimum, middel, maksimum eller X 2 = 25. percentiel, middel/median, og 75. percentiel hvor den sidstnævnte kombination i mange tilfælde vil være den mest oplagte, da sammenhængen dermed illustreres for ikke-ekstreme værdier af X 2. Her er sammenhængen mellem ulandsbistand og økonomisk vækst dog beregnet for X 2 = min/middel/max altså for 7 Hvis den modererende variabel er kategorisk vil man naturligt anvende disse kategorier i illustrationen. 7

9 institutionel kvalitet = 0, 0,41 og 1 (jf. Tabel 1). Andre værdier kan også være meningsfulde, men X 2 -værdierne bør ligge indenfor (eller tæt på) observationsområdet på X 2 ellers vil der være tale om (meningsløs) ekstrapolation. Næste skridt er at vælge, hvilken range af X 1 -værdierne sammenhængen skal vises for, altså spændet på X-aksen i figuren. Det oplagte valg er spændet (range) mellem minimum og maksimum for X 1 -værdierne i stikprøven (eller hele tal der ligger tæt herpå). Her er følgende range valgt: (jf. Tabel 1). At vise sammenhængen for X 1 -værdier udenfor observationsområdet ville være ekstrapolation. Hvis der er øvrige variable i modellen skal disse holdes konstant på et fastsat niveau i illustrationen typisk middel, median eller mode. Her vælges det at sætte BNP per capita til middelværdien (= 5.845). Bemærk at dette niveau bør fremgå i noterne til figuren (hvilket det endnu ikke gør ) Resten af illustrationsarbejdet kan udføres i Excel. Det er en god ide at kopiere estimationsresultaterne fra SPSS til Excel, da man dermed har de relevante tal ved hånden. Dette minimerer muligheden for fejl. Efter kopiering indtastes navnet på den primære variabel som den skal fremstå på X-aksen i en tom celle (her Ulandshjælp/capita jf. Figur 4). I de to celler under denne celle indtastes rangen for X-værdierne (her 0 og 130). Til venstre for navnet på X-aksen indtastes navnet på den modererende variabel samt de værdier den sættes til. Her forkortes Institutionel kvalitet til IK jf. figur 4. Figur 4: Forberedelse af et Excel-ark For at vise den forudsagte sammenhæng mellem X 1 og Y ved forskellige niveauer af X 2 skal Y-hat beregnes for yderpunkterne for X 1 (her 0 og 130) for hver af de værdier af X 2 som vi har valgt at vise sammenhængen for (her 0; 0,41 og 1). Med andre ord skal Y-hat beregnes ved at indsætte parameterestimaterne og de fastsatte værdier for X 1, X 2 og kontrol ind i følgende ligning: Y-hat = a + b 1 x 1 + b 2 X 2 + b 3 X 1 X 2 +b 4 *k 8

10 Figur 5 viser, hvordan Y-hat for Ulandshjælp=0 og IK=0 beregnes. I feltet indtastes ligningen for Y- hat ved at indsætte parameterestimaterne og de værdierne der blev fastsat ovenfor bemærk hvordan SPSS-outputtet anvendes direkte i beregningen. De øvrige kombinationer af X 1 og X 2 beregnes på samme måde og Figur 6 viser beregningen for Y-hat for Ulandhjælp = 130 og IK = 1. Figur 5: Beregning af Y-hat for Ulandshjælp=0 og IK=0 b for X2 X2 = 0 her b for X1X2 Konstanten X1 = 0 her b for X1 X1 og X2 = 0 her b for Kontrol Kontrol = middel 9

11 Figur 6: Beregning af Y-hat for Ulandhjælp = 130 og IK = 1 Når Y-hat er beregnet for alle kombinationer kan sammenhængen illustreres. Marker dataområdet som vist i Figur 7, klik på fanen Indsæt, på Punktdiagram > Punktdiagram med lige streger. Den resulterende graf vender i de fleste tilfælde forkert, hvilket afhjælpes ved (på fanen Design) at klikke på Skift række/kolonne se Figur 7. Figur 7: Illustration Med lidt arbejde, lidt held og særligt ved hjælp af Fanen Layout kan man få grafen til at se ud som vist i Figur 3, ovenfor Havde X 1 været kategorisk er det lettere misvisende at fremstille sammenhængen som ovenfor, da X 1 og dermed og Y-hat ikke antager værdierne indikeret i figuren. For eksemplets skyld kunne vi forestille os at ulandsbistand kun antager to værdier lav og høj i dette tilfælde kan man overveje at fremstille sammenhængen som vist i Figur 8. 10

12 Figur 8: Grafisk illustration med X 1 som kategorisk variabel 20 Gennemsnitlig årlig vækst (%) IK=0 IK=0,41 IK=1-15 LAV Ulandsbistand/capita (US$) HØJ 8. Beregning af signifikansniveauer for X1 ved udvalgte niveauer af X2 Figur 3 (og til dels Figur 8) viser den forudsagte sammenhæng mellem ulandbistand og vækst ved udvalgte niveauer af institutionel kvalitet. Hvad figuren i midlertidig ikke viser er, om de enkelte sammenhænge mellem ulandsbistand og vækst er signifikante. Ovenfor, i afsnit 6, fandt vi at sammenhængen er signifikant negativ for IK=0, mens vi ikke kender signifikansniveauerne for de øvrige sammenhænge. Disse kan beregnes i hånden, men det er nemmere at lade SPSS beregne dem. Konkret gøres det ved at udnytte at SPSS beregner signifikansniveauet for X 1 ved X 2 = 0. Man kan altså omkode X 2 så den har nulpunkt, der hvor man gerne vil beregne signifikansniveauet for X 1. Med andre ord kan man parallelforskyde X 2 til X 2 * der har nulpunkt der hvor vi vil signifikansteste og derefter estimere modellen med den omkodede X 2 = X 2 * (og X 1 X 2 *) I nærværende tilfælde skal vi have dannet to ny variable (da vi allerede har signifikanstesten for den ene af de tre linjer: for IK=0). Disse skal have nulpunkt ved henholdsvis X 2 =0,41 og X 2 =1. Vi skal altså have trukket henholdsvis 0,41 og 1 fra X 2. COMPUTE x2middel=instikval COMPUTE x2max=instikval-1. Dernæst skal der dannes to nye interaktionsled med disse nye variable COMPUTE i_middel = x2middel*bistand. COMPUTE i_max =x2max*bistand. Endelig skal sammenhængene estimeres igen med de nye variable. Dette resulterer i nedenstående estimater, hvor det første output (bl.a.) viser koefficienten og signifikanstesten for X 1 ved X 2 = middel og det andet for X 1 ved X 2 = max. 11

13 Tabel 3: Estimater med parallelforskudte X 2 -værdier Det fremgår at den svage negative effekt af ulandshjælp med gennemsnitlige institutioner er insignifikant (P= 0,24), mens den positive effekt af bistand under de bedste institutioner ikke er signifikant på 0,05-niveauet, men på 0,1-niveauet (P=0,06). Disse beregninger kan tilføjes illustrationen som vist i Figur 9 der samtidigt indeholder de informationer, der kan siges at være nødvendige i forbindelse illustration af interaktionsmodeller. 12

14 Figur 9: Forslag til illustration af interaktionsmodeller 9. Konklusion Overlades i dette tilfælde til læseren (hvilket dog ikke kan anbefales i en eksamenssituation ) Litteratur Agresti, A. & Finlay, B. (2009). Statistical methods for the social sciences, Fourth edn. Upper Saddle River: Pearson Prentice Hall. Brambor, T., Clark, W.R., & Golder, M. (2006). Understanding Interaction Models: Improving Empirical Analyses. Political Analysis, 14(1), Burnside, C. & Dollar, D. (2000). Aid, Policies, and Growth. American Economic Review, 90(4), Justesen, M.K. (2006). Politiske institutioner og økonomisk vækst. Politica, 38(3), Kam, C.D. & Franzese, R.J. (2007). Modeling and Interpreting Interactive Hypotheses in Regression Analysis. Ann Arbor: University of Michigan Press. Penn World Tables (2010). Penn World Tables v6.2 fra Data hentet 6. marts Stubager,R. & Sønderskov,K.M. (2011). Forudsætninger for lineær regression og variansanalyse efter mindste kvadraters metode, 5. udg., Århus: Institut for Statskundskab. Sønderskov, K.M. og Nielsen,J. (2009). Illustration af interaktionsmodeller i Stata, 3. udgave. Pt. tilgængelig på IFSK s interne drev: N:\STAFF\Soenderskov\Noter. Verdensbanken (2010) Wold development indicators fra Data hentet 6. marts

Fokus på Forsyning. Datagrundlag og metode

Fokus på Forsyning. Datagrundlag og metode Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Stolpediagrammer for kategoriske data med -catplot-

Stolpediagrammer for kategoriske data med -catplot- Stolpediagrammer for kategoriske data med -catplot- [Revideret 4. oktober 2013] Kim Mannemar Sønderskov Institut for Statskundskab, Aarhus Universitet ks@ps.au.dk Denne note gennemgår, hvordan resultaterne

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Analyse af en lineær regression med lav R 2 -værdi

Analyse af en lineær regression med lav R 2 -værdi Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold

Læs mere

Program dag 2 (11. april 2011)

Program dag 2 (11. april 2011) Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;

Læs mere

Regressionsanalyse i SurveyBanken

Regressionsanalyse i SurveyBanken Først vælges datasættet De Kommunale Nøgletal. Klik på Variable Description og derefter De Kommunale Nøgletal 2010. De enkelte variable i datasættet bliver nu oplistet og kan vælges. Klik herefter på Analysis

Læs mere

Hus 20, hus P10 og hus 22: forelæsning kl samt opfølgning i eget hus kl

Hus 20, hus P10 og hus 22: forelæsning kl samt opfølgning i eget hus kl basiskursus 8: Kvantitativ metode Om kurset Fag Den samfundsvidenskabelige bacheloruddannelse Kursustype Basiskursus Kursus starter 14-02-2014 Kursus slutter 09-05-2014 Undervisningstidspunkt Hus P11 og

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Lineære sammenhænge, residualplot og regression

Lineære sammenhænge, residualplot og regression Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression ! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression 1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Kvadratisk regression

Kvadratisk regression Kvadratisk regression Helle Sørensen Institut for Matematiske Fag Københavns Universitet Juli 2011 I kapitlet om lineær regression blev det vist hvordan man kan modellere en lineær sammenhæng mellem to

Læs mere

Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere

Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere Bilag I afrapportering af signifikanstest i tabeller i artikel er der benyttet følgende illustration af signifikans: * p

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2. C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011

Læs mere

Lineære sammenhænge. Udgave 2. 2009 Karsten Juul

Lineære sammenhænge. Udgave 2. 2009 Karsten Juul Lineære sammenhænge Udgave 2 y = 0,5x 2,5 2009 Karsten Juul Dette hæfte er en fortsættelse af hæftet "Variabelsammenhænge, 2. udgave 2009". Indhold 1. Lineære sammenhænge, ligning og graf... 1 2. Lineær

Læs mere

Test nr. 6 af centrale elementer 02402

Test nr. 6 af centrale elementer 02402 QuizComposer 2001- Olaf Kayser & Gunnar Mohr Contact: admin@quizcomposer.dk Main site: www.quizcomposer.dk Test nr. 6 af centrale elementer 02402 Denne quiz angår forståelse af centrale elementer i kursus

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Modul 12: Regression og korrelation

Modul 12: Regression og korrelation Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Peter Harremoës Mat A delprøve med hjælpemidler 15 december 2015

Peter Harremoës Mat A delprøve med hjælpemidler 15 december 2015 Opgave 6 a) Stationært punkt beregnes. f (x) = 0 Den afledte sættes lig nul for at bestemme stationært punkt. 5 ln (x) + 5 = 0 Funktionen er differentieret ved hjælp af produktreglen. ln (x) = 1 Der er

Læs mere

Produktivitetsudviklingen og arbejdsmarkedet

Produktivitetsudviklingen og arbejdsmarkedet d. 15.10.2010 Jesper Gregers Linaa Produktivitetsudviklingen og arbejdsmarkedet Det undersøges, hvorvidt arbejdsmarkedets tilstand (konjunkturelt og strukturelt) kan bidrage til at forstå udviklingen i

Læs mere

For at få tegnet en graf trykkes på knappen for graftegning. Knap for graftegning

For at få tegnet en graf trykkes på knappen for graftegning. Knap for graftegning Graftegning på regneark. Ved hjælp af Excel regneark kan man nemt tegne grafer. Man åbner for regnearket ligger under Microsoft Office. Så indtaster man tallene fra tabellen i regnearkets celler i en vandret

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Seminaropgave: Præsentation af idé

Seminaropgave: Præsentation af idé Seminaropgave: Præsentation af idé Erik Gahner Larsen Kausalanalyse i offentlig politik Dagsorden Opsamling på kausalmodeller Seminaropgaven: Praktisk info Præsentation Seminaropgaven: Ideer og råd Kausalmodeller

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

Test for strukturelle ændringer i investeringsadfærden

Test for strukturelle ændringer i investeringsadfærden d. 6.10.2016 De Økonomiske Råds Sekretariat Test for strukturelle ændringer i investeringsadfærden Dette notat redegør for de stabilitetstest af forskellige tidsserier vedrørende investeringsadfærden i

Læs mere

Opgave 6. Opgave 7. Peter Harremoës Mat A eksamen med hjælpemidler 25. maj 2013. (x + a) 1 /2. dx = 42 løses ved hjælp af GeoGebra CAS: Ligningen 15

Opgave 6. Opgave 7. Peter Harremoës Mat A eksamen med hjælpemidler 25. maj 2013. (x + a) 1 /2. dx = 42 løses ved hjælp af GeoGebra CAS: Ligningen 15 Opgave 6 Ligningen 15 0 (x + 1 /2 dx = 42 løses ved hjælp af GeoGebra CAS: Løsningen er derfor a = 1. Se Bilag 2! Opgave 7 Et søjlediagram over hyppighed af lønsum er vist nedenfor. Gennemsnittet er 64.4

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

ISCC. IMM Statistical Consulting Center. Brugervejledning til beregningsmodul til robust estimation af nugget effect. Technical University of Denmark

ISCC. IMM Statistical Consulting Center. Brugervejledning til beregningsmodul til robust estimation af nugget effect. Technical University of Denmark IMM Statistical Consulting Center Technical University of Denmark ISCC Brugervejledning til beregningsmodul til robust estimation af nugget effect Endelig udgave til Eurofins af Christian Dehlendorff 15.

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1 Rettevejledning til Økonomisk Kandidateksamen 005I, Økonometri Vurderingsgrundlaget er selve opgavebesvarelsen og bilaget, inklusive det afleverede SAS program. Materialet på diskette/cd bedømmes som sådan

Læs mere

Quick Guide til RKKP-dokumentation.dk. - Find rundt i databasernes dokumentation i online systemet på RKKP-Dokumentation.dk

Quick Guide til RKKP-dokumentation.dk. - Find rundt i databasernes dokumentation i online systemet på RKKP-Dokumentation.dk Quick Guide til RKKP-dokumentation.dk - Find rundt i databasernes dokumentation i online systemet på RKKP-Dokumentation.dk Kontakt: Ann Qvist Rasmussen E-mail: anncrs@rm.dk Version 1.0 Senest redigeret:

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

SUPPLEMENT TIL EVALUERING AF DE NATIONALE TEST RAPPORT

SUPPLEMENT TIL EVALUERING AF DE NATIONALE TEST RAPPORT Til Undervisningsministeriet (Kvalitets- og Tilsynsstyrelsen) Dokumenttype Rapport Dato August 2014 SUPPLEMENT TIL EVALUERING AF DE NATIONALE TEST RAPPORT NATIONALE TEST RAPPORT INDHOLD 1. Indledning og

Læs mere

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst 17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser

Læs mere

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition

Læs mere

Eksempel på logistisk vækst med TI-Nspire CAS

Eksempel på logistisk vækst med TI-Nspire CAS Eksempel på logistisk vækst med TI-Nspire CAS Tabellen herunder viser udviklingen af USA's befolkning fra 1850-1910 hvor befolkningstallet er angivet i millioner: Vi har tidligere redegjort for at antallet

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen 1 Velkommen til kurset Teoretisk Statistik Lærer: Niels-Erik Jensen Plan for i dag: 1. Eks: Er euro'en skæv? 4. Praktiske informationer 2. Eks: Regressionsmodel (kap. 1) 5. Lidt om kursets indhold 3. Hvad

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse. Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med

Læs mere

Markante sæsonudsving på boligmarkedet

Markante sæsonudsving på boligmarkedet N O T A T Markante sæsonudsving på boligmarkedet 9. marts 0 Denne analyse estimerer effekten af de sæsonudsving, der præger prisudviklingen på boligmarkedet. Disse priseffekter kan være hensigtsmæssige

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1 Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Effekten af indvandring på indfødte danskeres løn og beskæftigelse

Effekten af indvandring på indfødte danskeres løn og beskæftigelse d. 22.05.2017 Brian Krogh Graversen (DØRS) Effekten af indvandring på indfødte danskeres løn og beskæftigelse I kapitlet Udenlandsk arbejdskraft i Dansk Økonomi, forår 2017 analyseres det, hvordan indvandringen

Læs mere

Uddybende beregninger til Produktivitetskommissionen

Uddybende beregninger til Produktivitetskommissionen David Tønners Uddybende beregninger til Produktivitetskommissionen I forlængelse af mødet i Produktivitetskommissionen og i anledning af e-mail fra Produktivitetskommissionen med ønske om ekstra analyser

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Opgave 6. Opgave 7. Opgave 8. Peter Harremoës Mat A delprøve med hjælpemidler 15 december 2015

Opgave 6. Opgave 7. Opgave 8. Peter Harremoës Mat A delprøve med hjælpemidler 15 december 2015 Opgave 6 a) Se Bilag 3! b) Funktionen differentieres, sættes lig nul og ligningen løses. g (x) = 0 K ln (x) + K = 0 K ln (x) = K ln (x) = 1 x = e 1. Det stationære punkt har x = e 1. Opgave 7 a) Data indlæses

Læs mere

FORUDSÆTNINGER FOR LINEÆR REGRESSION OG VARIANSANALYSE EFTER MINDSTE KVADRATERS METODE

FORUDSÆTNINGER FOR LINEÆR REGRESSION OG VARIANSANALYSE EFTER MINDSTE KVADRATERS METODE FORUDSÆTNINGER FOR LINEÆR REGRESSION OG VARIANSANALYSE EFTER MINDSTE KVADRATERS METODE AF RUNE STUBAGER & KIM MANNEMAR SØNDERSKOV 5. udgave, januar 2011 DEPARTMENT OF POLITICAL SCIENCE Aarhus University

Læs mere

Peter Harremoës Mat A eksamen med hjælpemidler 21. april 2014

Peter Harremoës Mat A eksamen med hjælpemidler 21. april 2014 Opgave 6 Ved hjælp af GeoGebra CAS ses at udtrykkes reduceres til noget som er forskelligt fra b 3 ab 2. Dette kan også ses ved f.eks. at indsætte a = 0 og b = 1. Se bilag 2! Opgave 7 Data er indlæst i

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Psykisk arbejdsmiljø og stress

Psykisk arbejdsmiljø og stress Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Reestimation af importrelationer

Reestimation af importrelationer Danmarks Statistik MODELGRUPPEN Arbejdspapir Nis Mathias Schulte Matzen 28. november 211 Reestimation af importrelationer Resumé: Papiret estimerer import relationerne på to forskellige datasæt. Et korrigeret

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere DET ØKONOMISKE RÅD S E K R E T A R I A T E T d. 20. maj 2005 SG Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere Baggrundsnotat vedr. Dansk Økonomi, forår 2005, kapitel

Læs mere

Excel tutorial om lineær regression

Excel tutorial om lineær regression Excel tutorial om lineær regression I denne tutorial skal du lære at foretage lineær regression i Microsoft Excel 2007. Det forudsættes, at læseren har været igennem det indledende om lineære funktioner.

Læs mere

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008 Indholdsfortegnelse 1 INDLEDNING OG PROBLEMSTILLING... 2 1.1 OVERVÆGT SOM CASE... 2 2 ANALYSEFORBEREDELSER... 4 2.1 HEPRO-UNDERSØGELSEN... 4 2.2 DEN AFHÆNGIGE VARIABEL VIGTIGHED AF ÆNDRINGEN AF VÆGT...

Læs mere

Statistik (deskriptiv)

Statistik (deskriptiv) Statistik (deskriptiv) Ikke-grupperede data For at behandle ikke-grupperede data i TI, skal data tastes ind i en liste. Dette kan gøres ved brug af List, hvis ikon er nr. 5 fra venstre på værktøjsbjælken

Læs mere

Peter Harremoës Matematik A med hjælpemidler 15. december 2016 = 25 = x = = 10 2 =

Peter Harremoës Matematik A med hjælpemidler 15. december 2016 = 25 = x = = 10 2 = Opgave 6 a) Se bilag 2! Opgave 7 a) Omsætningen er givet ved R (x) = p (x) x = 500 x 1 /2 x = 500 x 1 /2 b) Den afsætning, som giver det største dækningsbidrag, bestemmes ved at løse ligningen R (x) =

Læs mere

De variable, som er inkluderet i de forskellige modeller, er følgende:

De variable, som er inkluderet i de forskellige modeller, er følgende: DUL II. Undersøgelse af hvilke faktorer, der er væsentlige for at understøtte, at der er klare og veltilrettelagte mål tilstede i arbejdet med elevernes læring Følgende er en statistisk analyse af ovenstående

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Modellering af elektroniske komponenter

Modellering af elektroniske komponenter Modellering af elektroniske komponenter Formålet er at give studerende indblik i hvordan matematik som fag kan bruges i forbindelse med at modellere fysiske fænomener. Herunder anvendelse af Grafregner(TI-89)

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

K.U. 29-03-2006 Metode Skriveøvelse 1 Af Marie Hammer og Steffen Tiedemann Christensen. Indholdsfortegnelse... 1. Opgave 1... 2. Opgave 2...

K.U. 29-03-2006 Metode Skriveøvelse 1 Af Marie Hammer og Steffen Tiedemann Christensen. Indholdsfortegnelse... 1. Opgave 1... 2. Opgave 2... Indholdsfortegnelse Indholdsfortegnelse... 1 Opgave 1... 2 Opgave 2... 2 Forforståelse:...2 Deskriptiv statistik:...3 Overvejelser:...12 Opgave 3... 13 Opgave 4... 15 Opgave 5... 16 Opgave 6... 17 Konklusion:...20

Læs mere