En meget kort introduktion til R på polit

Størrelse: px
Starte visningen fra side:

Download "En meget kort introduktion til R på polit"

Transkript

1 En meget kort introduktion til R på polit Sebastian Barfort Indhold 1 Introduktion 1 2 R som lommeregner 2 3 Tabeller, grafer og estimation 6 4 Økonomiske figurer 11 1 Introduktion Økonomistudiet er ofte forbundet med en hel del praktiske problemstillinger og problemer i forhold til hvilken platform man bruger på sin computer. I denne korte note vil gøre lidt reklame for det gratis statiskprogram R, som kan stort set alt hvad man kommer igennem i statistik og økonometri på polit. Der er en del generelle fordele ved at bruge R, blandt andet Det er gratis, det er uafhængigt af platform, og fungerer lige godt på Windows, Linu og Mac, det er open source, og der kommer opdateringer og nye muligheder hele tiden, Specifikt kan R hjælpe dig på polit til at lave figurer til blandt andet Økonomiske Principper, Mikro og Makro, lave tabeller, figurer, og estimationer til blandt andet Kvantitative Metoder I-III og til senere brug i speciale eller øvelser, løse hjemmeopgaver i Matematik I-II, R er i udgangspunktet et meget fleksibelt statistikprogram, og det kan bruges til alt muligt. Det er primært anvendt blandt biologer og folk indenfor naturvidenskab, men finder større og større udbredelse blandt økonomer, politologer og sociologer. Der er så vidt jeg kan se primært én ulempe ved R, og det er at det er svært at lære. Der er dog masser af gode introduktioner på nettet. Du kan downloade R her, R s generelle brugerflade er ikke vildt seet, og det kan anbefales at køre R gennem RStudio, som kan downloades her. Denne tekst er skrevet i R. Du kan downloade denne fil og bruge den til hvad du har lyst til her. For at køre dokumentet kræves, at man har L A TEX installeret på sin computer. Du kan downloade L A TEX her, 1

2 2 R som lommeregner > a=5 > b=3 > c=4 En helt simpel brug af R kan være som lommeregner. Lad eksempelvis a = 5, b = 3 og c = 4 så kan R eksempelvis fortælle os, at a + b = 8 og at a/c = En lille smule mere kompliceret. Betragt følgende tal R kan nemt finde gennemsnit > num <- c(5.4,7.8,0.9,19.5,10,2.1,0.0001,9) > mean(num) [1] og kvadratroden > sqrt(num) [1] Vi kan også bruge R til lineær algebra. Vi kan eksempelvis løse det lineære system A = b, hvor b er en vektor c(9,5,14) og A er givet ved [,1] [,2] [,3] [1,] [2,] [3,] Vi kan finde svaret som > c1 <- c(12,15,6) > c2 <- c(10,2,9) > c3 <- 3:1 > b <- c(9,5,14) > solve(cbind(c1,c2,c3),b=b) [1] Vi kan også matri multiplicere i R. Vi kan eksempelvis gange M1 med M2, eller multiplicere den transponerede M2 med M1. [,1] [,2] [,1] [,2] [,3] [1,] 1 2 [1,] [2,] 2 1 [2,] > M1 <- rbind(1:2,2:1) > M2 <- matri(3:8,nrow=2,ncol=3) > M1%*%M2 [,1] [,2] [,3] [1,] [2,]

3 > t(m2)%*%m1 [,1] [,2] [1,] [2,] [3,] Vi kan også bruge R til bedre at forstå fordelinger i statistik. Et kendt eksempel er den centrale grænseværdisætning. De følgende grafer viser et histogram af trækninger fra 4 kendte fordelinger for to forskellige værdier af n. 3

4 > library(teachingdemos) > clt.eamp() sample size = 1 Normal Gamma Uniform Beta

5 > clt.eamp(500) sample size = 500 Normal Gamma Uniform Beta

6 3 Tabeller, grafer og estimation Hvis man sidder med en empirisk øvelse, eller hvis man laver opgaver i Kvantitative Metoder I-III, kunne R være en oplagt mulighed at bruge. I det følgende vil vi kigge på lidt simpel deskriptiv statistik fra Grunfeld (1958): The determinants of corporate investment, og bagefter vil vi udføre et par simple estimationer. Grunfeld dataen består af 5 variable, og vi kan se variabelnavnene således > data("grunfeld", package="aer") > names(grunfeld) [1] "invest" "value" "capital" "firm" "year" Vi kan lave følgende tabel med simpel deskriptiv statistik med én kommando > stargazer(grunfeld1) Tabel 1: Statistic N Mean St. Dev. Min Ma invest , value , , capital , I det følgende plotter vi først udviklingen i investeringer over tid, dernæst separerer vi udviklingen på hver virksomhed, og til sidst undersøger vi sammenhængen mellem kapital- og investeringsniveau grafisk. 6

7 > library(ggplot2) > p <- ggplot(grunfeld, aes(year, invest)) > p+geom_point()+geom_smooth()+labs(list(title = "", = "", y = ""))+theme_bw() Figur 1: Investeringer over tid 7

8 > p <- ggplot(grunfeld, aes(year, invest)) > p+geom_point()+geom_smooth()+labs(list(title = "", = "", y = ""))+theme_bw()+ + facet_wrap(~ firm, scales = "free")+ + theme(strip.tet. = element_tet(size = 11), strip.background = element_rect(fill="white")) General Motors US Steel General Electric Chrysler Atlantic Refining IBM Union Oil Westinghouse Goodyear Diamond Match Figur 2: Investeringer over tid opgjort på virksomhed 8

9 > p <- ggplot(grunfeld, aes(capital, invest)) > p+geom_point()+geom_smooth(method="lm")+labs(list(title = "", = "", y = ""))+theme_bw() Figur 3: Investeringer og kapitalniveau 9

10 Nu kan vi prøve at estimere et par simple lineære modeller for et undersøge sammenhængen mellem kapital og investeringsniveau. Lad os nu sige, at vi gerne vil estimere OLS, og en fied og random effects model alla invest it = β 0 + β 1 value it + β 2 capital it + δ i + ɛ it, (1) hvor korrelationen mellem δ i og vores forklarende variable bestemmer, hvilken model vi bør benytte. I R foretages estimationerne således > library(plm) > gr_ols <- lm(invest ~ value + capital, data = Grunfeld) > gr_fe <- plm(invest~value+capital, model="within", + effect="individual", inde = c("firm"), data=grunfeld) > gr_re <- plm(invest ~ value + capital, data = Grunfeld, model = "random", + random.method = "swar", effect="individual", inde = c("firm")) og vi kan hurtigt lave en flot tabel > stargazer(gr_ols, gr_re, gr_fe) OLS Tabel 2: Dependent variable: invest panel linear (1) (2) (3) value (0.006) (0.010) (0.012) capital (0.025) (0.017) (0.017) Constant (9.512) (28.899) Observations R Adjusted R Residual Std. Error (df = 197) F statistic (df = 2; 197) (df = 2; 197) (df = 2; 188) Note: p < 0.1; p < 0.05; p < 0.01 Vi kan også lave en Hausman test > phtest(gr_fe, gr_re) Hausman Test data: invest ~ value + capital chisq = , df = 2, p-value = alternative hypothesis: one model is inconsistent 10

11 4 Økonomiske figurer R kan bruges til meget mere end empiriske analyser. Et eksempel er udbuds-efterspørgselsfigurer som jeg aldrig rigtig fandt en god løsning på at lave da jeg læste på bachelordelen. Vi kan eksempelvis lave et par simple tetbook grafer af udbud og efterspørgsel. 11

12 D S D S Price Price Quantity Quantity D D1 D2 S Price S Price Quantity Quantity Figur 4: Udbud og efterspørgsel 12

13 Koden til den første figur ser således ud > library(hmisc) > library(proy) > library(grid) > <- c(1, 8, 9) > y <- c(1, 5, 9) > supply1 <- data.frame(bezier(, y, evaluation = 500)) > <- c(1, 3, 9) > y <- c(9, 3, 1) > demand1 <- data.frame(bezier(, y, evaluation = 500)) > # Helper function to identify approimate curve intersections by brute force > approintersection <- function(path1, path2){ + distancematri <- proy::dist(path1, path2) + whichmin <- which(distancematri == min(distancematri), arr.ind = TRUE) + return((path1[whichmin[1], ]+path2[whichmin[2], ])/2) + } # This is where a long bezier() output vector is useful > intersections <- approintersection(supply1, demand1) > tetannotations <- data.frame(label = c("s", "D"), + = c(8, 1), # DF of line labels + y = c(8, 8)) > zp1 <- qplot( = 0:10, y = 0:10, geom = "blank") # Draw an empty plot > zp1 <- zp1 + geom_path(data = supply1, aes( =, y = y), # Add supply curve + size = 1, colour = "BLUE") > zp1 <- zp1 + geom_path(data = demand1, aes( =, y = y), # Add demand 1 + size = 1, colour = "RED") > zp1 <- zp1 + geom_point(data = intersections, # Add points at intersections + aes( =, y = y), size = 3) > zp1 <- zp1 + geom_segment(data = intersections, # Add dotted lines + aes( =, y = 0, end =, yend = y), + lty = 2) > zp1 <- zp1 + geom_segment(data = intersections, # Add dotted lines + aes( = 0, y = y, end =, yend = y), + lty = 2) > zp1 <- zp1 + geom_tet(data = tetannotations, # Add curve labels + aes( =, y = y, label = label)) > zp1 <- zp1 + theme_classic() # New in ggplot Time to update! > zp1 <- zp1 + coord_equal() # Force fied -y relationship > zp1 + labs(list(title = "", = "Quantity", y = "Price")) og resten af koden kan downloades på Github. 13

R i 02402: Introduktion til Statistik

R i 02402: Introduktion til Statistik R i 02402: Introduktion til Statistik Per Bruun Brockhoff DTU Informatik, DK-2800 Lyngby 20. juni 2011 Indhold 1 Anvendelse af R på Databar-systemet på DTU 5 1.1 Adgang......................................

Læs mere

Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata

Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata Århus 27. januar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata Hvad er Stata? Stata er et program, der kan lave statistiske analyser af

Læs mere

Introduktion til SPSS

Introduktion til SPSS Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger

Læs mere

STATISTIK MED SAS. MORTEN FENGER Cand.merc.(scm.) på den nemme måde med step-by-step cases, som alle kan forholde sig til.

STATISTIK MED SAS. MORTEN FENGER Cand.merc.(scm.) på den nemme måde med step-by-step cases, som alle kan forholde sig til. MORTEN FENGER Cand.merc.(scm.) Denne e-bog introducerer dig til markedets stærkeste statistikværktøj. SAS kan alt inden for analytics og er samtidig let at lære. Derfor er det bare med at komme i gang

Læs mere

Mindmapping med FreeMind. En Introduktion til programmet FreeMind

Mindmapping med FreeMind. En Introduktion til programmet FreeMind En Introduktion til programmet FreeMind Jan Leffers 2006 Indholdsfortegnelse Indledning...2 Hvad er et mindmap...2 Mindmap guidelines...3 Download og installation...3 Kom hurtigt i gang...4 Det første

Læs mere

Programmerings Journal

Programmerings Journal Programmerings Journal Python Figur Udregner Jakob Jelstad & Thomas Gram Vejleder : Christoffer Soya "Jeg bekræfter herved med min underskrift, at opgavebesvarelsen er udarbejdet af mig. Jeg har ikke anvendt

Læs mere

Ydelseskatalog. Tak fordi du downloadede dette dokument vores ydelseskatalog. Vi hjælper dig helt i mål! Ydelseskatalog. Indhold

Ydelseskatalog. Tak fordi du downloadede dette dokument vores ydelseskatalog. Vi hjælper dig helt i mål! Ydelseskatalog. Indhold Indhold 2 Business intelligence workshops 3 Customer Intelligence workshops 4 at få flere kunder 5 at kunne vækste sine kunder 6 at kunne fastholde sine kunder 7 Generelt om segmentering 8 Behovsbasere

Læs mere

Eksamensprojekt. Afsluttende Projekt i Informationsteknologi B / Programmering C

Eksamensprojekt. Afsluttende Projekt i Informationsteknologi B / Programmering C Eksamensprojekt i Informationsteknologi B / Programmering C Anders Olsen & Nichlas Olsson, klasse 3.3i 20-05-2010 Synopsis Vi er to gymnasieelever fra Roskilde Tekniske Gymnasium og vi hedder Anders Olsen

Læs mere

Sikre Beregninger. Kryptologi ved Datalogisk Institut, Aarhus Universitet

Sikre Beregninger. Kryptologi ved Datalogisk Institut, Aarhus Universitet Sikre Beregninger Kryptologi ved Datalogisk Institut, Aarhus Universitet 1 Introduktion I denne note skal vi kigge på hvordan man kan regne på data med maksimal sikkerhed, dvs. uden at kigge på de tal

Læs mere

Administrator - installation og brug i Windows

Administrator - installation og brug i Windows 1 Administrator - installation og brug i Windows Grundforfattet af Allan, OZ1DIS, redigeret/udgivet af Palle, OZ6YM Det her beskrevne er IKKE noget nyt, og har været gældende siden Windows NT og version

Læs mere

Øvelse 6. Modeller 81 6.1 Oprettelse af og arbejde med modeller 82 6.2 Videre øvelser 87 6.3 Øvelser i eget projekt 87

Øvelse 6. Modeller 81 6.1 Oprettelse af og arbejde med modeller 82 6.2 Videre øvelser 87 6.3 Øvelser i eget projekt 87 Indhold Indledning 7 Øvelse 1. Introduktion til NVivo 11 1.1 NVivos skærmbillede og funktioner 12 1.2 Sources 13 1.3 Nodes 15 1.4 Classifications 17 1.5 Queries 18 1.6 Models 19 1.7 Videre øvelser 19 Øvelse

Læs mere

RSA-kryptosystemet. RSA-kryptosystemet Erik Vestergaard

RSA-kryptosystemet. RSA-kryptosystemet Erik Vestergaard RSA-kryptosystemet RSA-kryptosystemet Erik Vestergaard Erik Vestergaard www.matematikfysik.dk Erik Vestergaard, 007. Billeder: Forside: istock.com/demo10 Erik Vestergaard www.matematikfysik.dk 3 1. Indledning

Læs mere

Kuglen triller. Hej med dig!

Kuglen triller. Hej med dig! Kuglen triller Hej med dig! Jeg er Thomas Tandstærk, og jeg ved en masse om teknik og natur. Jeg skal lære dig noget om at lave forsøg og undersøgelser. Når klassen er færdig får I et flot diplom! I dette

Læs mere

Hvordan gør de professionelle?

Hvordan gør de professionelle? Hvordan gør de professionelle? ( Oversat af Ivan Larsen, Samsø Dart Club, Marts 2010 fra How the Pros do it af: Ken Berman 1999 ) Der er to aspekter i det at blive en god dartspiller, det er præcision

Læs mere

Roskilde Tekniske Gymnasium. Eksamensprojekt. Programmering C niveau

Roskilde Tekniske Gymnasium. Eksamensprojekt. Programmering C niveau Roskilde Tekniske Gymnasium Eksamensprojekt Programmering C niveau Andreas Sode 09-05-2014 Indhold Eksamensprojekt Programmering C niveau... 2 Forord... 2 Indledning... 2 Problemformulering... 2 Krav til

Læs mere

Programmering C 3.36 Eksamensprojekt - Tavledokumentation

Programmering C 3.36 Eksamensprojekt - Tavledokumentation Programmering C 3.36 Eksamensprojekt - Tavledokumentation August Møbius Roskilde HTX - Klasse 3.6 August Møbius 1 Indhold Indledende aktivitet... 3 Idégenerering... 3 Mit produkt(kort beskrivelse)... 3

Læs mere

SMATH. Et gratis CAS-værktøj til din matematikundervisning Computer Algebra System. Version: November 2014

SMATH. Et gratis CAS-værktøj til din matematikundervisning Computer Algebra System. Version: November 2014 SMATH Et gratis CAS-værktøj til din matematikundervisning Computer Algebra System Version: November 2014 Indholdsfortegnelse Hvad er SMATH?...5 Hent programmet eller kør direkte i browser...5 Udgangspunkt

Læs mere

Supplerende noter til Kursus i brug af SAS

Supplerende noter til Kursus i brug af SAS Supplerende noter til Kursus i brug af SAS Søren Højsgaard Biometry Research Unit Danish Institute of Agricultural Sciences Research Centre Foulum DK 8830 Tjele Flemming Skjøth Dansk Kvæg Landbrugets Rådgivningscenter

Læs mere

AT-EKSAMEN: HVAD ER ET TALEPAPIR?

AT-EKSAMEN: HVAD ER ET TALEPAPIR? AT-EKSAMEN: HVAD ER ET TALEPAPIR? Fra synopsis til talepapir Formålet med dette papir er at give dig en indføring i hvordan du kan forberede dig til en AT-eksamen. Der er to dele, der overlapper en smule:

Læs mere

I Windows fil struktur er der følgende ting Drev, Mapper, Filer og Genveje.

I Windows fil struktur er der følgende ting Drev, Mapper, Filer og Genveje. Windows Fil Struktur I Windows fil struktur er der følgende ting Drev, Mapper, Filer og Genveje. Hvad er et drev Et drev, er en afgrænsning af fil strukturen. Når du går ind på et drev vil du stå i roden

Læs mere

Læringsprogram. Talkonvertering. Benjamin Andreas Olander Christiansen Niclas Larsen Jens Werner Nielsen. Klasse 2.4. 1.

Læringsprogram. Talkonvertering. Benjamin Andreas Olander Christiansen Niclas Larsen Jens Werner Nielsen. Klasse 2.4. 1. Læringsprogram Talkonvertering Benjamin Andreas Olander Christiansen Niclas Larsen Jens Werner Nielsen Klasse 2.4 1. marts 2011 Fag: Vejleder: Skole: Informationsteknologi B Karl G. Bjarnason Roskilde

Læs mere

Kapitel 2 Tal og variable

Kapitel 2 Tal og variable Tal og variable Uden tal ingen matematik - matematik handler om tal og anvendelse af tal. Matematik beskæftiger sig ikke udelukkende med konkrete problemer fra andre fag, og de konkrete tal fra andre fagområder

Læs mere

Hjælp mig med at arbejde med mine kundedata (Customer Intelligence)

Hjælp mig med at arbejde med mine kundedata (Customer Intelligence) Hjælp mig med at arbejde med mine kundedata (Customer Intelligence) Kundelivstidsværdi, Customer Insights, Customer Life Time Management, Customer Life Time Value, CRM strategi, kundeloyalitet osv. Det

Læs mere

ØVEHÆFTE FOR MATEMATIK C FORMLER OG LIGNINGER

ØVEHÆFTE FOR MATEMATIK C FORMLER OG LIGNINGER ØVEHÆFTE FOR MATEMATIK C FORMLER OG LIGNINGER INDHOLDSFORTEGNELSE 0. FORMELSAMLING TIL FORMLER OG LIGNINGER... 2 Tal, regneoperationer og ligninger... 2 Ligning med + - / hvor x optræder 1 gang... 3 IT-programmer

Læs mere

SKRIFTLIGHED I DE N TURVIDENSKABELIG FAG

SKRIFTLIGHED I DE N TURVIDENSKABELIG FAG SKRIFTLIGHED I DE N TURVIDENSKABELIG FAG Indholdsfortegnelse INDLEDNING... 3 1. FORMLER... 4 2. FIGURFORKLARING... 5 3. FIGURFREMSTILLING... 7 4. ORDFORKLARING... 8 5. REGRESSION... 9 6. SAMMENHÆNGE I

Læs mere

Postervejledning. Indhold. Meningen med en poster

Postervejledning. Indhold. Meningen med en poster Postervejledning Meningen med en poster En plakat, eller det der på engelsk kaldes en poster, bruges i videnskabelige kredse til at præsentere forskningsresultater. I det følgende vil der blive givet en

Læs mere

Lærervejledning. - til computerprogrammet Google Sketchup og Mathcad

Lærervejledning. - til computerprogrammet Google Sketchup og Mathcad Lærervejledning - til computerprogrammet Google Sketchup og Mathcad Klassetrin/niveau: 4.-6. klasse/ mellemtrinet. Opgaverne kan dog med fordel anvendes i indskolingen og udskolingen. Introduktion: Google

Læs mere

Bliv opdaget på Internettet! - 10 gode råd til at optimere din hjemmeside til søgemaskiner

Bliv opdaget på Internettet! - 10 gode råd til at optimere din hjemmeside til søgemaskiner Bliv opdaget på Internettet! - 10 gode råd til at optimere din hjemmeside til søgemaskiner Af Henrik Bro og Martin T. Hansen I har måske allerede en flot, og informativ hjemmeside. Og alle jeres kursister

Læs mere

Baggrundspapir til analyser af fusionseffekter baseret på aktiekurser

Baggrundspapir til analyser af fusionseffekter baseret på aktiekurser 1 af 28 21-08-2013 16:05 Baggrundspapir til analyser af fusionseffekter baseret på aktiekurser Indledning Det er generelt vanskeligt at vurdere, om en fusion har ført til svækket konkurrence, eller om

Læs mere

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri Introduktion til Statistiske Modeller for Finansielle Tidsserier Forelæsningsnoter til Finansiel Økonometri Jesper Lund mail@jesperlund.com http://www.jesperlund.com 14. marts 2006 1 Indledning Formålet

Læs mere