Lineær regression i samfundsvidenskab

Størrelse: px
Starte visningen fra side:

Download "Lineær regression i samfundsvidenskab"

Transkript

1 Lineær regression i samfundsvidenskab af Bent Fischer-Nielsen, fagkonsulent i samfundsfag Formålet med dette notat er at forklare - hvordan man anvender lineær regression i samfundsvidenskab - hvad man skal kunne om lineær regression i samfundsfag - hvordan man beregner R 2 -værdien - hvilke muligheder og begrænsninger, der er ved at bruge R 2. Den anvendte statistik er forklaret trin for trin og forudsætter ikke forkundskaber i matematik. Anvendelse af lineær regression i samfundsvidenskab I samfundsvidenskab bruges lineær regression til at undersøge i hvor høj grad der kan påvises en sammenhæng mellem to variable, og hvilken effekt den ene variabel har på den anden variabel. En forudsætning for en sådan påvisning er, at der fagligt kan argumenteres for, at der er en sammenhæng. Ud fra økonomisk, sociologisk eller politologisk viden eller teori skal der være faglige argumenter for at en variabel har virkning på en anden variabel. Eksempel: BNP pr. indbygger har indflydelse på CO 2 -udslip pr. indbygger. Økonomisk kan man argumentere for, at jo større produktion pr. indbygger der er i et land, jo større vil energiforbruget være pr. indbygger, og dermed jo større vil CO 2 -udslippet være pr. indbygger. BNP pr. indbygger er årsagen og dermed den uafhængige variabel, og CO 2 - udslip pr. indbygger er virkningen og dermed den afhængige variabel. Men andre faktorer vil også være i spil. Brug af visse energiformer medfører et mindre CO 2 -udslip end andre, og nogle lande udnytter energien mere effektivt end andre. Det er derfor interessant at undersøge, i hvor høj grad et højere BNP pr. indbygger har virkning på CO 2 -udslip pr. indbygger, og hvilke lande der har et større eller mindre CO 2 -udslip end forventet ud fra deres BNP pr. indbygger. Lineær regression er velegnet til at undersøge både grad af sammenhæng mellem to variable og afvigelser fra den forventede sammenhæng. Konstruktion af punktdiagram, tendenslinje, ligning og R 2 Markér de tal (og kun selve tallene) i regnearket, som skal undersøges for lineær regression. Dvs. to rækker eller søjler med samhørende tal, fx BNP pr. indbygger og CO 2 -udslip pr. indbygger for en række lande (bilag 2). Vælg Indsæt > Punktdiagram. Et punktdiagram tegnes nu. Vælg et Diagramlayout. Skriv det rette indhold i Diagramtitel og Aksetitel. Excel 2010: Vælg Diagramlayout med fx og få tegnet tendenslinjen inkl. ligning og R 2 -værdi. Excel 2013-: Vælg i Hurtigt layout diagram med fx og få tegnet tendenslinje mm. MAC: Gør nogenlunde som ovenfor eller: Højreklik på et af punkterne i diagrammet og vælg Tilføj tendenslinje og sæt hak i Vis ligning i diagram og i Vis R-kvadreret. Dette kan man også gøre i Excel. Du har nu konstrueret et diagram med lineær regression. En figur med tilføjelse af landenes navne vil se ud som i Figur 1. 1

2 CO 2 -udledning i kg pr. indbygger Figur 1. BNP pr. indbygger i US dollars og CO 2 -udledning i kg pr. indbygger Australien Canada USA y = 0,14x R² = 0, Rusland New Zealand Slovakiet Den arabiske Arg.tina Ungarn verden Portugal Mexico Tyrkiet Indien - Kina Sydafrika Brasilien Nigeria Ghana, Kenya Israel Grækenland Japan Tyskland Danmark Storbritannien BNP pr. indbygger i US dollars Sverige Norge Tolkning af punktdiagram, tendenslinje, ligning og R 2 1. Den overordnede sammenhæng mellem de to variable fremgår af punkternes beliggenhed i diagrammet (figur 1): Jo større BNP pr. indbygger, jo større CO 2 -udslip pr indbygger. Dermed bekræftes den faglige argumentation for, at der er sammenhæng mellem de to variable. Der ses dog også en betydelig spredning af punkterne, hvilket bekræfter, at andre faktorer end BNP har betydning for CO 2 -udslippet. 2. Den tegnede tendenslinje i diagrammet er den linje, der ligger tættest på punkterne. Ligningen (forskriften) for linjen er af typen y = ax + b, hvor a angiver hældningskoefficienten (= regressionskoefficienten) for linjen: I ligningen y = 0,14x er hældningskoefficienten 0,14: Når x (BNP pr. indbygger) stiger med 1 $., stiger y med 0,14 kg (CO 2 -udslip pr. indbygger ). Eller: Når BNP pr. indbygger stiger med $., stiger CO 2 -udslip pr. indbygger med kg, hvilket kan aflæses på tendenslinjen. Hældningskoefficienten udtrykker effekten på y, hvis x stiger med én enhed. Vi kan derfor ikke blot sige, at CO 2 -udslippet pr. indbygger stiger, når BNP pr indbygger stiger. Vi kan også sige hvor meget CO 2 -udslippet pr. indbygger stiger ifølge modellen, når BNP pr. indbygger stiger med 1 $. Modellen udtrykker dermed sammenhængen mellem de to variable kvantitativt. Det er dog ikke en entydig sammenhæng, som det fremgår af det følgende. 3. Punkternes beliggenhed i diagrammet viser en stor spredning omkring tendenslinjen. Det viser som sagt, at der er andre faktorer end BNP pr. indbygger, der har indflydelse på CO 2 -udslip pr. indbygger. Store afvigelser 2

3 fra tendenslinjen kaldes for outliers. De lande, der ligger under tendenslinjen, har et lavere CO 2 -udslip pr. indbygger end forventet ifølge tendenslinjen (modellen). Vi kan ud fra viden om de pågældende landes energiforhold opstille hypoteser om, hvilke årsager der kan være til afvigelserne. Fx kan årsagen til Sveriges beliggenhed langt under tendenslinjen være brug af atomkraft og vandkraft. Danmarks beliggenhed kan skyldes brug af vindkraft, og at afgifter på energi har tilskyndet forbrugere og virksomheder til energibesparende foranstaltninger. Lande over tendenslinjen har et højt CO 2 -udslip pr. indbygger i forhold til deres BNP pr. indbygger. Det kan fx skyldes en lav energieffektivitet eller brug af energiformer som fx kul med et højt udspil af CO 2 i forhold til den producerede energimængde. 4. R 2 kaldes som regel forklaringsgraden (eller determinationskoefficienten) og udtrykker, hvor stor en del af variationen i den afhængige variabel y, der forklares/beskrives af den uafhængige variabel x/tendenslinjen/ligningen/modellen. Lineær regression beskriver en samvariation mellem to variable, og er ikke i sig selv et bevis for, at der er en årsagssammenhæng. For at kunne tale om en sammenhæng (kausalitet) skal vi fagligt/teoretisk kunne begrunde en sammenhæng mellem de to variable, som det er gjort ovenfor. R 2 varierer mellem 0 og 1. Hvis R 2 er 1, ligger alle punkterne præcis på den rette linje, og tendenslinjen kan forklare 100 % af variationen i den afhængige variabel y. Jo tættere punkterne ligger på tendenslinjen, jo højere bliver R 2. Jo mere spredt punkterne ligger i forhold til linjen, jo mere vil R 2 nærme sig 0. Hvis R 2 som i eksemplet ovenfor er 0,36, ligger punkterne meget spredt i forhold til linjen, men der er stadig en stigende tendens i punkternes beliggenhed. De ligger som et bredt bånd omkring linjen. x/tendenslinjen/ligningen/modellen kan forklare 36 % af variationen i y. Der er ikke en fast accepteret standard for, hvor stor R 2 skal være for, at vi taler om en stærk, moderat eller svag sammenhæng. Derfor nøjes man med at sige, hvor stor en andel af variationen i den afhængige variabel, som kan forklares af den uafhængige variabel. I samfundsfag skal det udtrykkes med det relevante indhold af x og y som fx: R 2 på 0,36 viser, at 36 % af variationen i CO 2 -udslip pr. indbygger kan forklares ud fra BNP pr. indbygger. Ovennævnte fortolkning af R 2 kan give anledning til diskussion. I bilag 1 ses dokumentation for, at det faktisk er sådan, man fortolker R 2 i statistiske lærebøger. Fortolkningerne i lærebøgerne er ikke helt identiske, men indholdet i fortolkningerne er det samme. Beregning af forklaringsgraden R 2 Vi vil nu se nærmere på, hvordan man beregner R 2 og dermed opnå en bedre forståelse af, hvad dette mål viser. Det er dog ikke et krav i samfundsfag at kunne forklare, hvordan R 2 beregnes. 3

4 Figur 2. Total variation og residual variation Figur 2.a. Figur 2.b. SAK residual SAK total Kilde: Agresti and Finlay (1997): Statistical Methods for the Social Sciences, Prentice Hall side 324 og Morten Oddershede Larsen (2005): Videregående statistik II. Regressionanalyse. Danmarks Tekniske Universitet side 7. Når vi siger, at x kan forklare 36 % af variationen i y, hvad er så variationen i y, og hvordan måles den? Variationen i y måles ved hjælp af punkternes afvigelse fra gennemsnittet af y-værdierne. I figur 2.a er vist afstanden mellem punkternes beliggenhed og gennemsnittet af y-værdierne. Gennemsnittet af Y-værdierne er vist som den vandrette linje Ȳ (udtales Y-streg ). Afstanden (forskellen) mellem Y og Ȳ (Y - Ȳ) er vist som punkterede lodrette linjer fra Y til den vandrette linje Ȳ. Punkterne ligger både under og over linjen med gennemsnitsværdien og summen af disse forskelle mellem Y og Ȳ (Y - Ȳ) vil være nul. For at få en talværdi, der kan bruges, kvadreres afstandene. For hvert punkt kvadreres forskellen mellem Y og Ȳ, og alle disse kvadrerede forskelle lægges sammen. Summen af de kvadrerede forskelle mellem Y og Ȳ skrives som SAK total = (Y Ȳ) 2. SAK total = Sum Af Kvadrater af punkternes afstand til den vandrette linje Ȳ er et mål for den totale variation af y- værdierne. I figur 2b er tegnet tendenslinjen. Det ses, at afstandene mellem punkterne og tendenslinjen i figur 2b er mindre end afstandene mellem punkterne og linjen for gennemsnittet i figur 2a. Tendenslinjen og den tilhørende ligning/forskrift giver et bedre bud på Y-værdierne end linjen med gennemsnittet af Y. Forskellen mellem Y og tendenslinjen skrives som Y Ŷ. Ŷ (udtales Y hat ) udtrykker værdien af Y beregnet efter ligningen for tendenslinjen. For hver X-værdi kan beregnes en Y-værdi ud fra tendenslinjens ligning, og denne Y- værdi kaldes Ŷ. Disse Ŷ-værdier ses på figur 2.b som Y-værdien for det punkt på tendenslinjen, hvor den punkterede lodrette streg rammer tendenslinjen. Afstanden (forskellen) mellem Y og Ŷ (Y - Ŷ) er vist som punkterede lodrette linjer fra Y til tendenslinjen med Ȳ-værdierne. Som ovenfor kvadreres forskellene for hvert punkt, og alle de kvadrerede forskelle lægges sammen. 4

5 Summen af de kvadrerede forskelle mellem Y og Ŷ skrives som SAK residual = (Y Ŷ) 2. SAK residual = Sum Af Kvadrater på de enkelte punkters afstand til den fundne tendenslinje kaldes restvariationen eller residualvariationen, og udtrykker den del af variationen af Y-værdierne, som tendenslinjen (modellen) ikke kan forklare. Forskellen mellem den totale variation af Y og restvariationen af Y i forhold til den totale variation i Y er den del af variationen i Y, som kan forklares af vores tendenslinje/model og tilhørende ligning. R 2 er netop den del af variationen i Y, som kan forklares ud fra tendenslinjen med tilhørende ligning. R 2 kan således med brug af ovennævnte forkortelser skrives som R 2 = SAKtotal SAKresidual SAKtotal = (Y Ȳ)2 (Y Ŷ) 2 (Y Ȳ) 2 I eksemplet ovenfor kan den totale variation i Y beregnes til 533 og restvariationen til 341. R 2 kan beregnes som R 2 = SAKtotal SAKresidual SAKtotal = = = 0.36 R 2 er den del af variationen i Y, som kan forklares ud fra tendenslinjen med tilhørende ligning af typen Y = ax + b. Det er det samme som, at R 2 udtrykker, hvor stor en del af variationen i Y, som kan forklares ud fra X. 36 % af variationen i Y kan forklares ud fra X ud fra ligningen y = 0,14x % af variationen i landenes udslip af CO 2 pr. indbygger kan forklares ud fra landenes BNP pr. indbygger. Restvariationen er på 64 % og dermed ganske betydelig. Andre faktorer end BNP pr. indbygger har betydning for CO 2 -udslip pr. indbygger. Totalvariation og restvariation kan beregnes ved hjælp af tilføjelsesprogrammet Data Analysis i Excel: Vælg Data > Data Analysis > Regression. Kopier felterne med alle Y-værdier og indsæt i feltet Input Y Range i Regression. Gør tilsvarende med felterne med alle X-værdier. Nu fremkommer følgende regressionsanalyse (i uddrag og på dansk): Regressionsstatistik Multiple R 0,60 R-kvadreret 0,36 Justeret R-kvadreret 0,33 Standardfejl 3650 Observationer 27 SAK Regression = den forklarede variation ifølge model (SAK model ) Residual = restvariation (SAK residual ) Total variation (SAK total )

6 Vi får her beregnet total variation (SAK total ), residual (SAK residual ) og den forklarede variation ifølge model (SAK model ), og vi kan som før nævnt se, at R 2 = (Total variation Residual)/Totalvariation = ( )/ = 0,36. Muligheder og begrænsninger i brug af lineær regression Kan vi være sikre på at den ene variabel påvirker den anden variabel, blot fordi R 2 er høj, eller kan der tænkes andre forklaringer? For det første viser R 2 ikke, om X er årsag til Y, eller om det er Y, der er årsag til X. Hvis vi bytter om på de to variable vil R 2 være det samme. En høj R 2 er altså ikke bevis på, hvad der er årsag, og hvad der er virkning. Her er indholdet i den faglige argumentation afgørende. I nogle tilfælde er det indlysende, hvad der årsag, og hvad der er virkning. Fx påvirkes en baggrundsvariabel som alder ikke af bestemte holdninger, mens kun det omvendte kan være tilfældet. Men i andre tilfælde kan det fagligt diskuteres, hvad vej kausaliteten går, og om den evt. går begge veje. Hvis den ene faktor i tid optræder før den anden faktor, er den første faktor årsag til den anden faktor. For det andet må der bl.a. tages forbehold for, om der er en tredje bagvedliggende variabel (spuriøs sammenhæng), der kan forklare variationen i de to faktorer. Eller om der er en tredje mellemliggende variabel (kædereaktion), der kan forklare sammenhængen mellem de to undersøgte variable. Det kan indvendes mod brugen af R 2, at man med samme R 2 -værdi kan have meget forskellig beliggenhed af punkterne. Se fx Anscombes fire fiktive datasæt i figur 3. I alle fire diagrammer er R 2 = 0,69. R 2 siger dermed ikke noget om punkternes beliggehed i diagrammet. Det giver ikke mening alene ud fra R 2 at udlede noget om sammenhængen mellem to variable, herunder om der er en lineær sammenhæng eller ej. Det giver kun mening at tolke R 2 i sammenhæng med en tolkning af punkternes beliggenhed i diagrammet. Hvis punkterne ligger som i typen øverst til venstre, giver det mening at tale om en lineær sammenhæng, og det er netop sådan, at punkterne ofte vil ligge, når man undersøger sammenhæng mellem to variable i samfundsvidenskab. Figur 3. Anscombes fire fiktive datasæt med samme R 2 -værdi. En anden begrænsning ved R 2 er, at den afhænger af om data er individdata (et punkt for hvert individ) eller såkaldt aggregerede data, hvor hvert punkt repræsenterer data for en gruppe, som fx data for en gruppe individer i en kommune eller i et land. Ved individdata er R 2 typisk lav, og selv en R 2 på 0,10-0,20 regnes som en betydelig 6

7 forklaringsgrad 1. Ved aggregerede data vil R 2 typisk være højere end ved individdata. Dette medvirker til, at der som tidligere nævnt, ikke er en alment accepteret standard for, hvor stor R 2 skal være for at vi taler om en svag, moderat eller stærk sammenhæng. Ved test af naturvidenskabelige sammenhænge fx i fysik eller kemi vil man typisk stille krav om, at R 2 skal være mindst 0,95 for at acceptere, at der er en bestemt sammenhæng mellem de to variable. Dette krav stilles ikke til samfundsvidenskabelige sammenhænge, da der er tale om menneskers adfærd, som påvirkes af mange faktorer. Derfor vil R 2 for en enkelt faktor meget sjældent være over 0,95. Man vil i samfundsvidenskab ikke hævde, at man kan finde og én og kun én uafhængig variabel, der kan forklare næsten hele variationen i den afhængige variabel. Forskelle i tolkningen af R 2 kan bruges konstruktivt til at belyse forskelle mellem naturvidenskab og samfundsvidenskab. 1 Johanne Grøndahl Glavind og Helene Helboe Pedersen: Gode spørgsmål, rigtige svar. Grundbog i samfundsfaglig metode. Gyldendal (p. 97) 7

8 Bilag 1. Fortolkninger af R 2 i ti statistiske lærebøger Agresti, Alan (University of Florida) and Finlay, Barbara (Texas University) (1997): Statistical Methods for the Social Sciences, Prentice Hall. Thus, the r 2 result is often expressed as X explains 39% of the variability in Y or 39% of the variability of Y is explained by its linear relationship with X. (p. 326) Agresti og Finlay s lærebog i statistik anvendes på Statskundskab på AU og SDU. Bertelsen, Aksel, Lic. Scient. i matematisk statistik (2005): Statistik med matematik. Systime. r^2 angiver, hvor stor del af variationen i y-værdierne, der bliver forklaret ved regressionslinjen Nogle steder kaldes r^2 forklaringsgrad eller forklaringskraft, men andre navne kan også forekomme. I eksemplet forrige side bliver r^2 = 0,21, så forældrenes højde forklarede 21 % af variationen i børnenes højde. (p. 137) Berenson, Levine and Krehbiel (2012): Basic Business Statistics, Pearson. The coefficient of determination measures the proportion of the variation in Y that is explained by the variation in the independent variable X. (p. 564) Bruun, Bodil, Felsager, Bjørn m.fl. (red.) 2010: MATHIT, Matematiklæreforeningen. Vi siger derfor, at den lineære model har en forklaringsgrad på 43,8 %, fordi den kan forklare 43,8 % af datapunkternes variation, men der er altså en betydelig restvariation, som modellen ikke kan forklare. Den kan så enten skyldes skjulte variable, som f.eks. køn eller tilfældige variationer (p. 63) Bryman, A. (2004): Social Research Methods, Oxford. If you square a value of Pearson s r, you can derive a further useful statistic namely the coefficient of determination, which expresses how much of the variation in one variable is due to the other variable. (p. 233). Hellevik, Ottar (1980): Forskningsmetode I Sociologi og Statsvetenskab, Universitetsforlaget. Når vi fant at r xy for sammenhengen mellom folketall og Nobelpriser var 0,84, betyr dette altså, at folketall forklarer 71 procent av variansen I Nobelprisfordelingen (0,84 2 = 0,71). (p. 238) Larsen, Morten Oddershede (2005): Videregående statistik II. Regressionsanalyse. Danmarks Tekniske Universitet. Man siger også, at den fundne model forklarer r % af den totale variation. I eksempel 13.2 forklarer den fundne model således 75.2% af den totale variation. (p. 8) Lind, Marchal and Wanthen (2013), Business Statistics for Business and Economics, McGraw Hill. The proportion of the total variation in the dependent variable Y that is explained, or accounted for, by the variation in the independent variable X. (p. 416) Nachmias, C. F. og D. Nachmias (1996): Research Methods in the social sciences, St. Martins Press. Thus R 2 is 0,82 2, which indicates a proportional reduction of error of 67 percent when percent of urban population is used to predict robberies per population. Another way to express this is to say that 67 percent of the variance in robbery rates is accounted for by the percent of urban population. (p. 420) Vejrup-Hansen, Per (2012): Statistik med Excel 2. udg. Samfundslitteratur. R^2 værdien er determinationskoefficienten i regressionsanalysen, og den udtrykker hvor stor en del af variationen i den afhængige variabel y, der forklares af modellen eller linjen. (p. 93) 8

9 Bilag 2. BNP og CO 2 -udledning i en række lande Land BNP pr. indbygger. $ CO2-udledning pr. indb. Kg Den arabiske verden Argentina Australien Brasilien Canada Kina Tyskland Danmark Storbritannien Ghana Indien Japan Kenya Mexico Grækenland Nigeria Norge New Zealand Rusland Sverige Tyrkiet USA Sydafrika Portugal Ungarn Slovakiet Israel

Samfundsfag og matematik

Samfundsfag og matematik Samfundsfag og matematik Piketty: Kapitalismens 2. grundlæggende lov: β = s/g Lineær regression: y = ax + b Beregninger med Excel: Indekstal = C6/$B6*100. Diagram Chi^2-test: p = 0,04 Brug af egen spørgeskemaundersøgelse

Læs mere

Citation for published version (APA): Larsen, C. A. (2016). Trump og den amerikanske drøm. Samfundsfagsnyt, 2016(4).

Citation for published version (APA): Larsen, C. A. (2016). Trump og den amerikanske drøm. Samfundsfagsnyt, 2016(4). Aalborg Universitet Trump og den amerikanske drøm Larsen, Christian Albrekt Published in: Samfundsfagsnyt Publication date: 2016 Link to publication from Aalborg University Citation for published version

Læs mere

Lineære sammenhænge, residualplot og regression

Lineære sammenhænge, residualplot og regression Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge

Læs mere

Analyse af en lineær regression med lav R 2 -værdi

Analyse af en lineær regression med lav R 2 -værdi Analyse af en lineær regression med lav R 2 -værdi Denne gennemgang omhandler figur 13 i Regn med biologi. Man kan sagtens lave beregninger på egne data. Forsøgsmæssigt kræver det bare en tommestok tapet

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Opgaverne dækkede et bredt udsnit af de faglige mål og centralt kernestof i sociologi, økonomi, politik og international politik.

Opgaverne dækkede et bredt udsnit af de faglige mål og centralt kernestof i sociologi, økonomi, politik og international politik. 02.10.2014 NYT FRA FAGKONSULENTEN I SAMFUNDSFAG, NYHEDSBREV NR. 24 SKRIFTLIG PRØVE I SAMFUNDSFAG 2014 1. Karakteristik af eksamenssæt Der blev stillet fire sæt til skriftlig prøve i samfundsfag 2014: 26.

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Regressionsanalyse i SurveyBanken

Regressionsanalyse i SurveyBanken Først vælges datasættet De Kommunale Nøgletal. Klik på Variable Description og derefter De Kommunale Nøgletal 2010. De enkelte variable i datasættet bliver nu oplistet og kan vælges. Klik herefter på Analysis

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Potensfunktioner samt proportional og omvent proportional. for hf Karsten Juul

Potensfunktioner samt proportional og omvent proportional. for hf Karsten Juul Potensfunktioner samt proportional og omvent proportional for hf 2018 Karsten Juul Potensfunktion 1. Oplæg til forskrift for potensfunktion...1 2. Forskrift for potensfunktion...2 3. Udregn x eller y i

Læs mere

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014 Vejledning til udvalgte opgave fra Matematik B, sommer 2014 Opgave 7 Størrelsen og udbudsprisen på 100 fritidshuse på Rømø er indsamlet via boligsiden.dk. a) Grafisk præsentation, der beskriver fordelingen

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Samfundsfagslærerens lille manual vol. II

Samfundsfagslærerens lille manual vol. II Samfundsfagslærerens lille manual vol. II Hvilke beregningsopgaver bør trænes i undervisningen? Formålet her er, at danne overblik over hvilke beregningsopgaver der hører ind under daglig samfundsfagsundervisningen

Læs mere

Bedste rette linje ved mindste kvadraters metode

Bedste rette linje ved mindste kvadraters metode 1/9 Bedste rette linje ved mindste kvadraters metode - fra www.borgeleo.dk Figur 1: Tre datapunkter og den bedste rette linje bestemt af A, B og C Målepunkter og bedste rette linje I ovenstående koordinatsystem

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Eksempel på logistisk vækst med TI-Nspire CAS

Eksempel på logistisk vækst med TI-Nspire CAS Eksempel på logistisk vækst med TI-Nspire CAS Tabellen herunder viser udviklingen af USA's befolkning fra 1850-1910 hvor befolkningstallet er angivet i millioner: Vi har tidligere redegjort for at antallet

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

Modellering af elektroniske komponenter

Modellering af elektroniske komponenter Modellering af elektroniske komponenter Formålet er at give studerende indblik i hvordan matematik som fag kan bruges i forbindelse med at modellere fysiske fænomener. Herunder anvendelse af Grafregner(TI-89)

Læs mere

Statistisk modellering og regressionsanalyse

Statistisk modellering og regressionsanalyse Statistisk modellering og regressionsanalyse Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Oktober 25, 2018 Slides @ biostatistics.dk/talks/ 1 2 Hvad er statistik? Statistics is a science, not

Læs mere

Perspektiver i Matematik-Økonomi: Linær regression

Perspektiver i Matematik-Økonomi: Linær regression Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: jlj@imf.au.dk Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem

Læs mere

Fokus på Forsyning. Datagrundlag og metode

Fokus på Forsyning. Datagrundlag og metode Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere

Læs mere

Fremtidsscenarie: Hvis Danmark skal leve af viden, hvem skal så købe den af os?

Fremtidsscenarie: Hvis Danmark skal leve af viden, hvem skal så købe den af os? Fremtidsscenarie: Hvis Danmark skal leve af viden, hvem skal så købe den af os? SÆLG DIN VIDEN TIL NYE MARKEDER VÆKSTMØDE OM INTERNATIONALISERING AF VIDENVIRKSOMHEDER ONSDAG DEN 30. NOVEMBER V/ Axel Olesen,

Læs mere

To samhørende variable

To samhørende variable To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen

Læs mere

Om at finde bedste rette linie med Excel

Om at finde bedste rette linie med Excel Om at finde bedste rette linie med Excel Det er en vigtig og interessant opgave at beskrive fænomener i naturen eller i samfundet matematisk. Dels for at få en forståelse af sammenhængende indenfor det

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Deskriptiv statistik for hf-matc

Deskriptiv statistik for hf-matc Deskriptiv statistik for hf-matc 75 50 25 2018 Karsten Juul Deskriptiv statistik for hf-matc Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede og ugrupperede data?...

Læs mere

Funktioner. 1. del Karsten Juul

Funktioner. 1. del Karsten Juul Funktioner 1. del 0,6 5, 9 2018 Karsten Juul 1. Koordinater 1.1 Koordinatsystem... 1 1.2 Kvadranter... 1 1.3 Koordinater... 2 1.4 Aflæs x-koordinat... 2 1.5 Aflæs y-koordinat... 2 1.6 Koordinatsæt... 2

Læs mere

OpenOffice Calc ver 3.3 (regneark)

OpenOffice Calc ver 3.3 (regneark) OpenOffice Calc ver 3.3 (regneark) Lineær regression Indtast benævnelser som for eksempel x og y og tilhørende talsæt Anbring markøren på cellen B4, hold venstre musetast nedtrykket og træk markøren ned

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Deskriptiv statistik for matc i stx og hf

Deskriptiv statistik for matc i stx og hf Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Excel tutorial om lineær regression

Excel tutorial om lineær regression Excel tutorial om lineær regression I denne tutorial skal du lære at foretage lineær regression i Microsoft Excel 2007. Det forudsættes, at læseren har været igennem det indledende om lineære funktioner.

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Tegning af grafer. Grafen for en ligning (almindelig) Skriv ligningen ind. Højreklik og vælg Plots -> 2-D Plot of Right Side.

Tegning af grafer. Grafen for en ligning (almindelig) Skriv ligningen ind. Højreklik og vælg Plots -> 2-D Plot of Right Side. TgPakken TgPakken er en række kommandoer til Maple tilegnet til det danske gymnasium. Det er rigtig smart til at kontrollere ens opgaver, men som alenestående svar til en eksamen er det ikke altid tilstrækkeligt.

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Module 3: Statistiske modeller

Module 3: Statistiske modeller Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression 1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet

Læs mere

VL døgn Nationalbankdirektør Nils Bernstein

VL døgn Nationalbankdirektør Nils Bernstein VL døgn 1 Nationalbankdirektør Nils Bernstein 1. Aktuel krise. Lav vækst i produktiviteten 3. Uholdbare offentlige finanser V E L S T A N D 1 Velstand, Danmark og udlandet BNP pr. indbygger, købekraftskorrigeret

Læs mere

Residualer i grundforløbet

Residualer i grundforløbet Erik Vestergaard www.matematikfysik.dk 1 Residualer i grundforløbet I dette lille tillæg til grundforløbet, skal vi kigge på begreberne residualer, residualplot samt residualspredning. Vi vil se, hvad

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Berlin eksempel på opgavebesvarelse i Word m/mathematics

Berlin eksempel på opgavebesvarelse i Word m/mathematics Berlin eksempel på opgavebesvarelse i Word m/mathematics 1.1 Gennemsnitsfarten findes ved at dividere den kørte strækning med den forbrugte tid i decimaltal. I regnearket bliver formlen =A24/D24. Resultatet

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Kvadratisk regression

Kvadratisk regression Kvadratisk regression Helle Sørensen Institut for Matematiske Fag Københavns Universitet Juli 2011 I kapitlet om lineær regression blev det vist hvordan man kan modellere en lineær sammenhæng mellem to

Læs mere

for gymnasiet og hf 2017 Karsten Juul

for gymnasiet og hf 2017 Karsten Juul for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Bedre udsigter for eksporten af forbrugsvarer

Bedre udsigter for eksporten af forbrugsvarer ERHVERVSØKONOMISK ANALYSE Juli 2015 Bedre udsigter for eksporten af forbrugsvarer I 2015 og 2016 er der bedste udsigter for eksporten af forbrugsvarer i mere end syv år. I de foregående år er det særligt

Læs mere

Dig og din puls. 17-10-2004 Dig og din puls Side 1 af 17

Dig og din puls. 17-10-2004 Dig og din puls Side 1 af 17 Dig og din puls Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004 Dig og din puls Side 1 af 17

Læs mere

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark. Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark. Denne opgavetype kan tage sig ud på forskellig vis, da det udleverede materiale enten kan være en tabel eller en figur. Nedenfor

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

DET PRIVATE FORBRUG PR. INDBYGGER LIGGER NR. 14 I OECD EN NEDGANG FRA EN 6. PLADS I 1970

DET PRIVATE FORBRUG PR. INDBYGGER LIGGER NR. 14 I OECD EN NEDGANG FRA EN 6. PLADS I 1970 1970 197 197 197 197 197 198 198 198 198 198 199 199 199 199 00 010 011 Af Cheføkonom Mads Lundby Hansen Direkte telefon 1 79. december 01 DET PRIVATE FORBRUG PR. INDBYGGER LIGGER NR. 1 I OECD EN NEDGANG

Læs mere

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) Projekt 2.4 Menneskets proportioner (Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der) I. Deskriptiv analyse

Læs mere

ATV-konference 2. november 2017 på Christiansborg Anders Bjarklev, rektor, DTU. 1 DTU det bli r til noget

ATV-konference 2. november 2017 på Christiansborg Anders Bjarklev, rektor, DTU. 1 DTU det bli r til noget ATV-konference 2. november 2017 på Christiansborg Anders Bjarklev, rektor, DTU 1 DTU det bli r til noget Leiden 2017 1 15 41 109 Norden På virksomhedssamarbejder i verden Europa Verden Antal studerende

Læs mere

Matematik i grundforløbet

Matematik i grundforløbet Mike Vandal Auerbach Matematik i grundforløbet y x www.mathematicus.dk Matematik i grundforløbet. udgave, 208 Disse matematiknoter er skrevet til matematikundervisningen i grundforløbet (som det ser ud

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition

Læs mere

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst 17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Diagrammer visualiser dine tal

Diagrammer visualiser dine tal Diagrammer visualiser dine tal Indledning På de efterfølgende sider vil du blive præsenteret for nye måder at arbejde med Diagrammer på i Excel. Vejledningen herunder er vist i Excel 2007 versionen, og

Læs mere

I. Deskriptiv analyse af kroppens proportioner

I. Deskriptiv analyse af kroppens proportioner Projektet er delt i to, og man kan vælge kun at gennemføre den ene del. Man kan vælge selv at frembringe data, fx gennem et samarbejde med idræt eller biologi, eller man kan anvende de foreliggende data,

Læs mere

DET PRIVATE FORBRUG PR. INDBYGGER LIGGER NR. 14 I OECD EN NEDGANG FRA EN 6. PLADS I 1970

DET PRIVATE FORBRUG PR. INDBYGGER LIGGER NR. 14 I OECD EN NEDGANG FRA EN 6. PLADS I 1970 970 97 97 97 97 97 97 977 978 979 980 98 98 98 98 98 98 987 988 989 990 99 99 99 99 99 99 000 00 00 00 00 00 00 007 008 009 00 0 Af Cheføkonom Mads Lundby Hansen Direkte telefon 79. december 0 DET PRIVATE

Læs mere

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer. Kvant Eksamen December 2010 3 timer med hjælpemidler 1 Hvad er en continuous variable? Giv 2 illustrationer. What is a continuous variable? Give two illustrations. 2 Hvorfor kan man bedre drage konklusioner

Læs mere

Simpel Lineær Regression: Model

Simpel Lineær Regression: Model Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]

Læs mere

Tilfældige rektangler: Et matematikeksperiment Variable og sammenhænge

Tilfældige rektangler: Et matematikeksperiment Variable og sammenhænge Tilfældige rektangler: Et matematikeksperiment Variable og sammenhænge Baggrund: I de senere år har en del gymnasieskoler eksperimenteret med HOT-programmet i matematik og fysik, hvor HOT står for Higher

Læs mere

Regneark Excel fortsat

Regneark Excel fortsat Regneark Excel fortsat Indhold SÅDAN TEGNES GRAFER I REGNEARK EXCEL... 1 i Excel 97-2003... 1 I Excel 2007... 1 ØVELSE... 2 I Excel 97-2003:... 2 I Excel 2007... 3 OM E-OPGAVER 12A... 4 Sådan tegnes grafer

Læs mere

Tak for kaffe! 17-10-2004 Tak for kaffe! Side 1 af 16

Tak for kaffe! 17-10-2004 Tak for kaffe! Side 1 af 16 Tak for kaffe! Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004 Tak for kaffe! Side 1 af 16 Tak

Læs mere

Løsninger til kapitel 14

Løsninger til kapitel 14 Opgave 14.1 a) Linjetilpasningsplottet bliver: Løsninger til kapitel 14 Idet datapunkterne ligger tæt på og jævnt fordelt omkring den rette linje, så ser det ud til, at der med rimelighed er tale om en

Læs mere

ANALYSENOTAT Prognose: Den samlede beklædningsog fodtøjseksport når nye højder

ANALYSENOTAT Prognose: Den samlede beklædningsog fodtøjseksport når nye højder ANALYSENOTAT Prognose: Den samlede beklædningsog fodtøjseksport når nye højder AF SEKRETARIATSCHEF NIKOLAI KLAUSEN OG ANALYSEKONSULENT JAKOB KÆSTEL MADSEN Beklædnings- og fodtøjseksport for 32,8 mia. kr.

Læs mere

Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ

Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ Per Bruun Brockhoff, DTU Compute, Claus Thorn Ekstrøm, KU Biostatistik, Ernst Hansen, KU Matematik January 17, 2017 Abstract

Læs mere

PATENT PROSECUTION HIGHWAY. Effektiv sagsbehandling af patentansøgning

PATENT PROSECUTION HIGHWAY. Effektiv sagsbehandling af patentansøgning PROSECUTION HIGHWAY Effektiv sagsbehandling af patentansøgning Effektiv sagsbehandling af din patentansøgning med Patent Prosecution Highway (PPH) PPH kan være en genvej til patent, hvis du fx ønsker Hvilke

Læs mere

Vejledende løsninger kapitel 9 opgaver

Vejledende løsninger kapitel 9 opgaver KAPITEL 9 OPGAVE 1 a) Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H 1 : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Ny metode Gammel metode

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Eksemplets titel: Analyse af befolkningsudvikling- og befolkningssammensætning. Kategori: Analyse. Kommune: Faxe. Kontaktperson: Brian Sørensen

Eksemplets titel: Analyse af befolkningsudvikling- og befolkningssammensætning. Kategori: Analyse. Kommune: Faxe. Kontaktperson: Brian Sørensen Eksemplets titel: Analyse af befolkningsudvikling- og befolkningssammensætning Kategori: Analyse Kommune: Faxe Kontaktperson: Brian Sørensen Beskrivelse: Faxe Kommune har lavet en analyse over befolkningsudviklingen

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Oversigt over resultaterne i PISA Ved Hans Hummelgaard, formand for det danske PISA-konsortium og analyse- og forskningschef i KORA

Oversigt over resultaterne i PISA Ved Hans Hummelgaard, formand for det danske PISA-konsortium og analyse- og forskningschef i KORA Oversigt over resultaterne i PISA 2015 Ved Hans Hummelgaard, formand for det danske PISA-konsortium og analyse- og forskningschef i KORA Formålet med PISA Måle, om unge har kompetencer, der kan bruges

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Det teknisk-naturvidenskabelige basisår Matematik 1A, Efterår 2005, Hold 3 Prøveopgave B

Det teknisk-naturvidenskabelige basisår Matematik 1A, Efterår 2005, Hold 3 Prøveopgave B Det teknisk-naturvidenskabelige basisår Matematik 1A, Efterår 2005, Hold 3 Opgaven består af fire dele, hver med en række spørgsmål, efterfulgt af en liste af teorispørgsmål. I alle opgavespørgsmålene

Læs mere

Råd og vink 2013 om den skriftlige prøve i Samfundsfag A

Råd og vink 2013 om den skriftlige prøve i Samfundsfag A Råd og vink 2013 om den skriftlige prøve i Samfundsfag A Ministeriet for Børn og Undervisning Center for Kvalitetsudvikling, Prøver og Eksamen August 2013 1. Karakterfordeling Karakterfordelingen til den

Læs mere

PISA 2015 Danske unge i en international sammenligning. Gå-hjem-møde

PISA 2015 Danske unge i en international sammenligning. Gå-hjem-møde PISA 2015 Danske unge i en international sammenligning Gå-hjem-møde Oversigt over resultaterne i PISA 2015 Ved Hans Hummelgaard, formand for det danske PISA-konsortium og analyse- og forskningschef i KORA

Læs mere

Internationale studerende i Viborg Kommune 2014

Internationale studerende i Viborg Kommune 2014 Sagsnr. 14/142258 Sagsansvarlig: vpjacu Internationale studerende i Viborg Kommune 2014 Uddannelsesinstitutioner med internationale studerende Viborg Kommunes udviklingsstrategi beskriver indsatsområderne

Læs mere