Løsninger til kapitel 15. størrelsen i kvadratmeter, X. en dummy-variabel, som indikerer om der er havudsigt eller ej, så er modellen

Relaterede dokumenter
Løsninger til kapitel 14

Vejledende løsninger kapitel 9 opgaver

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Fokus på Forsyning. Datagrundlag og metode

Regression og geometrisk data analyse (1. del)

Appendiks Økonometrisk teori... II

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Forelæsning 11: Kapitel 11: Regressionsanalyse

Kapitel 11 Lineær regression

Bilag 12 Regressionsanalysens tabeller og forklaringer

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR

Anvendt Statistik Lektion 8. Multipel Lineær Regression

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Kvantitative metoder 2

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Ifølge Dansk Energis analyse kan stigningen i grundbeløbsstøtten forklare størstedelen eller 72 % af faldet i fjernvarmepriserne fra 2010 til 2016.

Statistik Lektion 4. Variansanalyse Modelkontrol

Baggrundsnotat: Modelteknisk

1 Multipel lineær regression

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

1 Multipel lineær regression

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Test nr. 6 af centrale elementer 02402

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Bilag 1: Skanparametre Cerebrum Axial

1 Regressionsproblemet 2

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Out-of-sample forecast samt reestimation af ADAMs lønligning

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Peter Harremoës Matematik A eksamen med hjælpemidler 25. maj For at finde ekstrema skal ligningen f (x) = 0 løses. f er differentieret.

Metodenotat FLIS sammenligningskommuner 2016-data

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Opgavebesvarelse, brain weight

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Københavnske ejerlejlighedspriser en meget begrænset indikator for hele landets boligmarked

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Udeladelse af én observation. Note til kapitlerne 4, 5 og 6

Løsninger til kapitel 9

Eksamen i Statistik og skalavalidering

MAT A HHX FACITLISTE TIL KAPITEL 8. Øvelser. Øvelse 1 Graf tegnes med CAS. Øvelse 2. Bedste rette linie: Øvelse 3. Øvelse 4.

Baggrundsnotat: Modelteknisk

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Multipel Lineær Regression

Flemmings Maplekursus 1. Løsning af ligninger

Rettevejledning til Økonomisk Kandidateksamen 2008II. Kvantitative Metoder 2: Tag-hjem eksamen

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Kvantitative metoder 2

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Rettevejledning til Økonomisk Kandidateksamen 2004I, Økonometri 1

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Kvantitative metoder 2

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Fokus på forsyning Investeringer I: Behov og afkast Investeringer II: Konsekvenser

Den samlede model til estimation af lønpræmien er da givet ved:

02402 Løsning til testquiz02402f (Test VI)

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Bilag 1: Beregning af omkostningsækvivalenter

Samfundsfag og matematik

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Anna Kock Maj Bilag 7: Interview med Anders Rene Jensen, indkøbs- og marketingchef i Rema 1000

Perspektiver i Matematik-Økonomi: Linær regression

Fortolkning, illustration mm. af interaktion i lineære regressionsmodeller ved hjælp af MS Excel og SPSS

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Statistisk modellering og regressionsanalyse

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Statistik Lektion 17 Multipel Lineær Regression

Opgavebesvarelse, brain weight

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Appendix 3: TSIV-korrektioner for modkausalitet

En sammenligning af 5 reestimationer af lønrelationen

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Bilag 5 - Forsyningssekretariatets bemærkninger til høringssvar fra DANVA og FVD

Vejr og vejkapacitet. Thomas C. Jensen

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Vejledende løsninger kapitel 8 opgaver

Kvantitative metoder 2

Markante sæsonudsving på boligmarkedet

Psykisk arbejdsmiljø og stress

Test for strukturelle ændringer i investeringsadfærden

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Opgavebesvarelse, brain weight

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING

Korrelation Pearson korrelationen

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Kunderne betaler højere bankskat

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Transkript:

Løsninger til kapitel 5 Opgave 5. a) Hvis Y indikerer prisen, størrelsen i kvadratmeter, afstanden i meter til vandet og en dummy-variael, som indikerer om der er havudsigt eller ej, så er modellen Y = a + + + + ε Estimaterne på koefficienterne er a ˆ = 4495, ˆ = 68, = 79, og ˆ = 7949. ˆ ˆ = 68 indikerer, at kvadratmeterprisen er på 68, dvs. for hver kvadratmeter huset gøres større, stiger prisen med 68 kr. ˆ = 79 indikerer, at for hvert ekstra meter, der er til vandet, falder prisen med 79 kr. ˆ = 7949 indikerer, at havudsigt forøger husets værdi med 7949 kr. a ˆ = 4495 er prisen for et hus uden areal, 0 m til vandet og uden havudsigt. Dette er naturligvis ikke særligt meningsfyldt... ) Modellen er signifikant, idet p-værdien for nulhypotesen H 0 : = = = 0 er 6 forsvindende lille, på, 0, og denne nulhypotese kan derfor forkastes. De forklarende variale og er signifikante, mens er insignifikant, idet nulhypotesen H 0 får p-værdien 6,84% og derfor ikke kan afvises. 0 : = Modellen er signifikant og dermed rugar, men man kunne formentligt få en edre og simplere model ved at udelade, afstanden til vandet. c) Ved indsættelse af de relevante værdier i regressionsligningen fås den forudsagte værdi: Y = a + + + = 4495 + 68 0 79 00 + 7949 =.80.84 Sommerhuset ør altså koste omkring.80.84 kr.

Løsninger til kapitel 5 Opgave 5. a) ørst og fremmest gennemføres en korrelationsanalyse for at få overlik over data: Køn. Boligtype Boligstørrelse Månedlig husleje Køn. Boligtype 0,85 Boligstørrelse 0,485 0,7656 Månedlig husleje 0,408 0,76859 0,877868 Det ses, at der ikke er den store korrelation mellem huslejen eller kønnet, men at huslejen er tæt korreleret med åde oligtype og oligstørrelse. Endelig er oligtypen og oligstørrelsen ligeledes tæt korreleret, så der er muligvis tale om multikollinaritet. I den første regression eskrives huslejen som funktion af kønnet, oligtypen og størrelsen: Multipel R 0,88899 R kvadreret 0,79077 kvadreret 0,770 Standardfejl 87,6966 Oservationer 7 fg SK MK Regression 9486567 6756 4,45,7E Residual 590408 7645,7 I alt 6,E+08 Skæring 07,8 66,577,905 0,0060 8,64 88,475 Køn. 9,4484 95,097 0,09946 0,974 570,98 69,6075 Boligtype 8,8704 47,074,74899 0,08960 4,57 78,78 Boligstørrelse 49,856 8,57048 5,7489,06E 06,7887 66,6554 Ikke overraskende ses det, at kønnet ikke er signifikant (med p-værdien for insignifikans på 9%), så denne variael skal elimineres. Det overrasker heller ikke, at oligtypen ikke umiddelart er signifikant, men den er jo tæt korreleret med oligstørrelsen.

Løsninger til kapitel 5 I den næste analyse eskrives huslejen som funktion af oligstørrelsen og oligtypen: Multipel R 0,888884 R kvadreret 0,7904 kvadreret 0,777768 Standardfejl 860,88 Oservationer 7 fg SK MK Regression 9485776 4748858 6,9965,98E Residual 4 597960 746,5 I alt 6,E+08 Skæring 09,66 99,67,6547 0,000864 485,748 70,049 Boligtype 88,86 460,8505,77559 0,08475 8,79 754,84 Boligstørrelse 49,75 8,44477 5,887,44E 06,0555 66,7898 Det ses, at oligtypen stadigvæk er insignifikant (p-værdi på 8,47%), og vi eliminerer derfor denne variael. Den tredie model er derfor følgende: Multipel R 0,877868 R kvadreret 0,77065 kvadreret 0,764 Standardfejl 886,96 Oservationer 7 fg SK MK Regression 958 958 7,6067 9,74E Residual 5 75449 786699,8 I alt 6,E+08 Skæring 067,8 08,07,4664 0,0045 44,95 69, Boligstørrelse 60,6977 5,59697 0,84466 9,74E 49,48 7,0597

Løsninger til kapitel 5 hvilket er en udmærket model. or en god ordens skyld undersøges endelig en model, hvor huslejen eskrives vha. oligtypen: Multipel R 0,76859 R kvadreret 0,58049 kvadreret 0,56844 Standardfejl 99,665 Oservationer 7 fg SK MK Regression 6968785 6968785 48,485 4,E 08 Residual 5 50789 4997 I alt 6,E+08 Skæring 46,54,77 6,45089,98E 07 470,68 8,66 Boligtype 874,679 4,7 6,9584 4,E 08 05,987 7,7 Her er oligtypen signifikant, hvilket ekræfter mistanken om multikollinaritet. Blandt de to sidste modeller vælges den næstsidste, da den har den højeste forklaringsgrad på 77% imod den sidste med en forklaringsgrad på lot 58%. Endvidere fravælges den tredjesidste model, idet inddragelsen af oligtypen kun hæver forklaringsgraden fra 77% til 79%, hvilket er en marginal foredring til en fordoling af modellens kompleksitet. Den valgte model er altså, hvor er oligstørrelsen og Y er huslejen. ) Skæringen i modellen estimeres til 067, hvilket tolkes som at en olig med størrelse 0 koster 067 om måneden. Dette er naturligvis asurd, men eløet kan tolkes som en asishusleje, som etales uanset oligens størrelse. Hældningen i modellen estimeres til 60,7, hvilket etyder, at for hver yderligere kvadratmeter, oligens forøges med, så stiger huslejen med 60,67 kr. 4

Løsninger til kapitel 5 Opgave 5. a) Korrelationsanalysen afslører, at salget er tæt korreleret med antal gæster, temperaturen og fridagen, men ikke med antal ansatte. Endvidere ses det, at der er multikollinaritet landt de forklarende variale i modellen, idet antal gæster og fridag er tæt korellerede. Den første model er signifikant som helhed, idet p-værdien for nulhypotesen om insignifikans er på, og dette er mindre end signifikansniveauet på 5%. Men denne model indeholder en række insignifikante varialer, nemlig antal ansatte og fridagen. I den næste model, som stadigvæk er signifikant, er antal ansatte elimineret. Men denne model indeholder stadigvæk en insignifikant variael, nemlig fridag. I den tredie model er egge indgående variale signifikante, og med en forklaringsgrad på 99% er dette en ganske god model. I de to sidste modeller er en af varialerne fra den tredie model elimineret. Disse modeller er stadigvæk signifikante, men har en meget mindre forklaringsgrad end den tre model, så disse er ikke gode nok. ) Det ses, at den tredie model er den edste. Modellen er ganske god med en forklaringsgrad på 99%, og da standardfejlen er på 7,4, og en god tommelfingerregel er, at fejlen ved prognoser i modellen altid er mindst den doelte standardfejl, så er der en fejl i forudsigelserne på mindst 75 is. Dette er acceptaelt, idet is kan holde sig i en fryser i mange måneder, og man derfor kan køe stort ind og opevare is gennem længere tid - det var værre med letfordærvelige fødevarer som ananer. Modellen er, hvor Y er solgte is, er antallet af gæster og er temperaturen. Skæringen a estimeres til -44,9, hvilket tolkes som at på en dag med 0 gæster og en temperatur på 0 grader sælges der -44,9 is. Dette er naturligvis meningsløst. Hældningen estimeres til 0,68, hvilket etyder, at for hver gæst, der lukkes ind, så stiger salget af is med 0,68. Hældningen estimeres til 88,85, hvilket etyder, at for hver grad, temperaturen stiger, så sælges der yderligere 88,85 is. c) Ved indsættelse i regressionsligningen ovenfor fås Der forventes altså at live solgt 8 is. 5