Løsninger til kapitel 5 Opgave 5. a) Hvis Y indikerer prisen, størrelsen i kvadratmeter, afstanden i meter til vandet og en dummy-variael, som indikerer om der er havudsigt eller ej, så er modellen Y = a + + + + ε Estimaterne på koefficienterne er a ˆ = 4495, ˆ = 68, = 79, og ˆ = 7949. ˆ ˆ = 68 indikerer, at kvadratmeterprisen er på 68, dvs. for hver kvadratmeter huset gøres større, stiger prisen med 68 kr. ˆ = 79 indikerer, at for hvert ekstra meter, der er til vandet, falder prisen med 79 kr. ˆ = 7949 indikerer, at havudsigt forøger husets værdi med 7949 kr. a ˆ = 4495 er prisen for et hus uden areal, 0 m til vandet og uden havudsigt. Dette er naturligvis ikke særligt meningsfyldt... ) Modellen er signifikant, idet p-værdien for nulhypotesen H 0 : = = = 0 er 6 forsvindende lille, på, 0, og denne nulhypotese kan derfor forkastes. De forklarende variale og er signifikante, mens er insignifikant, idet nulhypotesen H 0 får p-værdien 6,84% og derfor ikke kan afvises. 0 : = Modellen er signifikant og dermed rugar, men man kunne formentligt få en edre og simplere model ved at udelade, afstanden til vandet. c) Ved indsættelse af de relevante værdier i regressionsligningen fås den forudsagte værdi: Y = a + + + = 4495 + 68 0 79 00 + 7949 =.80.84 Sommerhuset ør altså koste omkring.80.84 kr.
Løsninger til kapitel 5 Opgave 5. a) ørst og fremmest gennemføres en korrelationsanalyse for at få overlik over data: Køn. Boligtype Boligstørrelse Månedlig husleje Køn. Boligtype 0,85 Boligstørrelse 0,485 0,7656 Månedlig husleje 0,408 0,76859 0,877868 Det ses, at der ikke er den store korrelation mellem huslejen eller kønnet, men at huslejen er tæt korreleret med åde oligtype og oligstørrelse. Endelig er oligtypen og oligstørrelsen ligeledes tæt korreleret, så der er muligvis tale om multikollinaritet. I den første regression eskrives huslejen som funktion af kønnet, oligtypen og størrelsen: Multipel R 0,88899 R kvadreret 0,79077 kvadreret 0,770 Standardfejl 87,6966 Oservationer 7 fg SK MK Regression 9486567 6756 4,45,7E Residual 590408 7645,7 I alt 6,E+08 Skæring 07,8 66,577,905 0,0060 8,64 88,475 Køn. 9,4484 95,097 0,09946 0,974 570,98 69,6075 Boligtype 8,8704 47,074,74899 0,08960 4,57 78,78 Boligstørrelse 49,856 8,57048 5,7489,06E 06,7887 66,6554 Ikke overraskende ses det, at kønnet ikke er signifikant (med p-værdien for insignifikans på 9%), så denne variael skal elimineres. Det overrasker heller ikke, at oligtypen ikke umiddelart er signifikant, men den er jo tæt korreleret med oligstørrelsen.
Løsninger til kapitel 5 I den næste analyse eskrives huslejen som funktion af oligstørrelsen og oligtypen: Multipel R 0,888884 R kvadreret 0,7904 kvadreret 0,777768 Standardfejl 860,88 Oservationer 7 fg SK MK Regression 9485776 4748858 6,9965,98E Residual 4 597960 746,5 I alt 6,E+08 Skæring 09,66 99,67,6547 0,000864 485,748 70,049 Boligtype 88,86 460,8505,77559 0,08475 8,79 754,84 Boligstørrelse 49,75 8,44477 5,887,44E 06,0555 66,7898 Det ses, at oligtypen stadigvæk er insignifikant (p-værdi på 8,47%), og vi eliminerer derfor denne variael. Den tredie model er derfor følgende: Multipel R 0,877868 R kvadreret 0,77065 kvadreret 0,764 Standardfejl 886,96 Oservationer 7 fg SK MK Regression 958 958 7,6067 9,74E Residual 5 75449 786699,8 I alt 6,E+08 Skæring 067,8 08,07,4664 0,0045 44,95 69, Boligstørrelse 60,6977 5,59697 0,84466 9,74E 49,48 7,0597
Løsninger til kapitel 5 hvilket er en udmærket model. or en god ordens skyld undersøges endelig en model, hvor huslejen eskrives vha. oligtypen: Multipel R 0,76859 R kvadreret 0,58049 kvadreret 0,56844 Standardfejl 99,665 Oservationer 7 fg SK MK Regression 6968785 6968785 48,485 4,E 08 Residual 5 50789 4997 I alt 6,E+08 Skæring 46,54,77 6,45089,98E 07 470,68 8,66 Boligtype 874,679 4,7 6,9584 4,E 08 05,987 7,7 Her er oligtypen signifikant, hvilket ekræfter mistanken om multikollinaritet. Blandt de to sidste modeller vælges den næstsidste, da den har den højeste forklaringsgrad på 77% imod den sidste med en forklaringsgrad på lot 58%. Endvidere fravælges den tredjesidste model, idet inddragelsen af oligtypen kun hæver forklaringsgraden fra 77% til 79%, hvilket er en marginal foredring til en fordoling af modellens kompleksitet. Den valgte model er altså, hvor er oligstørrelsen og Y er huslejen. ) Skæringen i modellen estimeres til 067, hvilket tolkes som at en olig med størrelse 0 koster 067 om måneden. Dette er naturligvis asurd, men eløet kan tolkes som en asishusleje, som etales uanset oligens størrelse. Hældningen i modellen estimeres til 60,7, hvilket etyder, at for hver yderligere kvadratmeter, oligens forøges med, så stiger huslejen med 60,67 kr. 4
Løsninger til kapitel 5 Opgave 5. a) Korrelationsanalysen afslører, at salget er tæt korreleret med antal gæster, temperaturen og fridagen, men ikke med antal ansatte. Endvidere ses det, at der er multikollinaritet landt de forklarende variale i modellen, idet antal gæster og fridag er tæt korellerede. Den første model er signifikant som helhed, idet p-værdien for nulhypotesen om insignifikans er på, og dette er mindre end signifikansniveauet på 5%. Men denne model indeholder en række insignifikante varialer, nemlig antal ansatte og fridagen. I den næste model, som stadigvæk er signifikant, er antal ansatte elimineret. Men denne model indeholder stadigvæk en insignifikant variael, nemlig fridag. I den tredie model er egge indgående variale signifikante, og med en forklaringsgrad på 99% er dette en ganske god model. I de to sidste modeller er en af varialerne fra den tredie model elimineret. Disse modeller er stadigvæk signifikante, men har en meget mindre forklaringsgrad end den tre model, så disse er ikke gode nok. ) Det ses, at den tredie model er den edste. Modellen er ganske god med en forklaringsgrad på 99%, og da standardfejlen er på 7,4, og en god tommelfingerregel er, at fejlen ved prognoser i modellen altid er mindst den doelte standardfejl, så er der en fejl i forudsigelserne på mindst 75 is. Dette er acceptaelt, idet is kan holde sig i en fryser i mange måneder, og man derfor kan køe stort ind og opevare is gennem længere tid - det var værre med letfordærvelige fødevarer som ananer. Modellen er, hvor Y er solgte is, er antallet af gæster og er temperaturen. Skæringen a estimeres til -44,9, hvilket tolkes som at på en dag med 0 gæster og en temperatur på 0 grader sælges der -44,9 is. Dette er naturligvis meningsløst. Hældningen estimeres til 0,68, hvilket etyder, at for hver gæst, der lukkes ind, så stiger salget af is med 0,68. Hældningen estimeres til 88,85, hvilket etyder, at for hver grad, temperaturen stiger, så sælges der yderligere 88,85 is. c) Ved indsættelse i regressionsligningen ovenfor fås Der forventes altså at live solgt 8 is. 5