Opgave 14.1 a) Linjetilpasningsplottet bliver: Løsninger til kapitel 14 Idet datapunkterne ligger tæt på og jævnt fordelt omkring den rette linje, så ser det ud til, at der med rimelighed er tale om en lineær sammenhæng. b) Modellen er, hvor X er antal forudsolgte billetter og Y er antal solgte måltider. Skæringen a estimeres til 8,86, hvilket tolkes som, at hvis der er 0 forudbestilte billetter, så vil der sælges 8,86 måltider. Hældningen estimeres til 1,70, hvilket betyder, at for hver gang antallet af forudbestilte billetter forøges, så stiger salget af måltider med 1,70. c) Modellens signifikans testes ved nulhypotesen, altså at modellen ikke er signifikant. Fra Excel-udskriften ses, at p-værdien for denne test er på, og da dette er mindre end signifikansniveauet på 5%, så kan nulhypotesen forkastes, og det konkluderes, at modellen er signifikant. d) I princippet ja, men i praksis er sagen lidt mere kompliceret. Regressionens standardfejl er på, og idet usikkerheden på enhver forudsigelse er mindst den dobbelte standardfejl, dvs. på 17,5, så er der altid en usikkerhed på 17,5 måltider i prognosen. Dette er meget i forhold til de typiske værdier, antallet af solgte måltider antager, men omvendt så kan man jo fryse fast-food-måtiderne ned, så de kan holde sig. SÅ ja, modellen er anvendelig. e) HypoStat giver: 42,90683 20 0,95 23,60206 62,21161 Det ses, at med 95% sikkerhed ligger antallet af måltider mellem 23,6 og 62,21. f) Forudsætninger for at kunne behandle denne model er følgende: 1) Der skal være tale om en lineær sammenhæng, dvs. E ( ε i ) = 0. 2) Spredningerne af residualerne σ ε ) skal være konstant. ( i 1
3) ρ( x i, εi ) = 0, dvs. der må ikke være nogen korrelation mellem den forklarende variabel og residualerne. 4) ρ( ε, ε ) = 0, dvs. ingen autokorrelation mellem residualerne. i j 5) Residualerne skal være normalfordelte. Forudsætning 1 er kontrolleret i delopgave a. Forudsætningerne 2-4 kontrolleres ved at tegne residualplottet: Det ses, at spredningen af residualerne er nogenlunde konstant og at der ingen indlysende korrelation er mellem hverken residualerne selv eller mellem residualerne og den forklarende variabel. Forudsætning 5 kontrolleres ved at tegne et normalfraktilplot af residualerne: Idet punkterne fordeler sig jævnt omkring den rette linje, er residualerne med god tilnærmelse normalfordelte, og derfor er alle forudsætningerne opfyldt. 2
Opgave 14.2 a) Linjetilpasningsplottet er: og da punkterne er jævnt fordelte omkring regressionslinjen, så kan det ikke afvises, at der er tale om en lineær model. b) Modellen er, hvor X er antal slagtilbud og Y er omsætningen. Skæringen a estimeres til 40,98, hvilket tolkes som, at hvis der ingen slagtilbud er, så er omsætningen på 40,98 tusinde kr. Hældningen estimeres til 4,64, hvilke betyder, at for slagtilbud forøges omsætningen med 4,64 tusinde kr. c) Modellens signifikans testes ved nulhypotesen, altså at modellen ikke er signifikant. Fra Excel-udskriften ses, at p-værdien for denne test er på, og da dette er mindre end signifikansniveauet på 5%, så kan nulhypotesen forkastes, og det konkluderes, at modellen er signifikant. d) I princippet ja, men i praksis er sagen lidt mere kompliceret. Regressionens standardfejl er på, og idet usikkerheden på enhver forudsigelse er mindst den dobbelte standardfejl, dvs, på 14,2, så er der altid en usikkerhed på 14,2 tusinde kr i omsætningen. Dette er en betragtelig usikkerhed, og modellen er derfor ikke brugbar i praksis. e) HypoStat giver: 73,43333 7 0,95 53,99752 92,86915 Det ses, at med 7 slagtilbud vil omsætningen med 95% sikkerhed ligge mellem 54,00 og 92,87 tusinde kr. f) Idet estimatet for hældningen er på 4,64, og dette er mindre end 5, så testes der venstresidet med alternativhypotesen og den tilsvarende nulhypotese HypoStat giver: 3
T E S T P Å B E T A α = 0,05 H 0 : β 5 FORUDSÆTNING H 1 : β < 5 b β T = 0 Teststørrelse s b T = 0,2798 STIKPRØVEDATA b = 4,636667 s 2 e = 50,58592 s 2 b = 1,686197 n x = 15 Beslutningsregel Forkast H 0, hvis T < - t n-2, α = 1,77093 P-værdi 0,392016 (1-α) Nedre Øvre b t s β b + t 0,95 1,831349 7,441985 n 2, α / 2 b n 2, α / 2 s b 4 Idet p-værdien er på 39,2%, og dette er mere end signifikansniveauet på 5%, så kan nulhypotesen ikke afvises, og vi kan ikke afvise, at omsætningen stiger med 5000 kr for hvert slagtilbud. g) Forudsætningerne for at kunne behandle denne model er følgende: 1) Der skal være tale om en lineær sammenhæng, dvs. E ( ε i ) = 0. 2) Spredningerne af residualerne σ ( ε i ) skal være konstant. 3) ρ( x i, εi ) = 0, dvs. der må ikke være nogen korrelation mellem den forklarende variabel og residualerne. 4) ρ( εi, ε j ) = 0, dvs. ingen autokorrelation mellem residualerne. 5) Residualerne skal være normalfordelte. Forudsætning 1 er kontrolleret i delopgave a. Forudsætningerne 2-4 kontrolleres ved at tegne residualplottet:
Det ses, at spredningen af residualerne er nogenlunde konstant, og at der ingen indlysende korrelation er mellem hverken residualerne selv eller mellem residualerne og den forklarende variabel. Forudsætning 5 kontrolleres ved at tegne et normalfraktilplot af residualerne: Idet punkterne fordeler sig jævnt omkring den rette linje, er residualerne med god tilnærmelse normalfordelte, og derfor er alle forudsætningerne opfyldte. 5
Opgave 14.3 a) Modellen er, hvor X er mængden og Y er prisen. Skæringen a estimeres til 49,3, hvilket tolkes som, at hvis der er 0 fisk til salg, så vil prisen være 49,3. Hældningen estimeres til -3,96, hvilke betyder, at for hver gang antallet af fisk stiger med en enhed, så falder prisen med 3,96 kr. b) Forklaringsgraden aflæses i Excel-outputtet til 68,7%. Dette betyder, at 68,7% af variationen i priserne kan forklares ved variationen i mængderne. c) HypoStat giver: Forudsigelsesinterval 2 xn x Yn ± tn + + + 1 2 + 1 2 2 1 1 ( ), α/ Se n SAK x 29,48306 5 0,95 11,77539 47,19072 Det ses, at med 95% sikkerhed vil prisen ligge mellem 11,77 og 47,19 kr. d) HypoStat giver: Forventningsinterval 2 1 ( xn x Yn ± tn + + 1 ) 2 + 1 2, α/ 2 Se n SAK x 41,36547 2 0,95 34,46 48,27094 Det ses, at prisen med 95% sikkerhed vil ligge mellem 34,46 og 48,27 kr. 6
e) Linjetilpasningsplottet bliver: Idet datapunkterne ligger tæt på og jævnt fordelt omkring den rette linje, så ser det ud til, at der med rimelighed er tale om en lineær sammenhæng. (Man kan dog diskutere, om en potentiel sammenhæng af formen ikke ville passe bedre (Regressionslinjen i Excel sættes til 'Strøm': 7