Betænkning om kommunernes udgiftsbehov. Bilag (med metodediskussion af professor Anders Milhøj)
|
|
|
- Trine Kjær
- 10 år siden
- Visninger:
Transkript
1 Betækg om kommueres udgftsbehov Blag (med metodedskusso af professor Aders Mlhøj) Betækg r. 36 Oktober 998
2 Kommueres Udgftsbehov Betækg om kommueres udgftsbehov - Redegørelse fra arbejdsgruppe uder Idergsmsterets Fasergsudvalg - Blag (med metodedskusso af professor Aders Mlhøj) - Betækg 36, Idergsmsteret, oktober 998. Udgver: IdergsMsteret, Økoomsk afdelg, Chrstasborg Slotsplads, 8 Købehav K. Prs for betækg og blag: 5 kr. kl. moms Publkatoe ka købes ved hevedelse tl: States Iformato INFOservce, telf eller Idergsmsterets økoomske afdelg telf Tryk: J.H. Schultz Grafsk A/S ISBN: Oplag:
3 Kommueres Udgftsbehov Kroologsk fortegelse over betækger Betækg om elektrosk Statstdede 39 Udfordrger sygehusvæseet 33 Betækg vedrørede samarbejdet mellem rettere og presse 33 Lejeforhold Lejelovskommssoes betækg 33 Betækg om frvllgt socalt arbejde + blagsdel 333 Laddstrkteres udvklgsmulgheder 334 Betækg om offetlg kostforplejg Damark 335 Betækg om formato og samtykke forbdelse med forsøg 336 Tlgægelghed for alle 337 Itegrato 338 Iteratoal adopto 339 Frst- og forældelsesregler 34 Forslag tl e atoal strateg for fskerforskge 34 Småsagsudvalgets betækg 34 Iformato tl tde 343 Betækg om forlystelser 344 Betækg om spl på forlystelsessteder, restauratoer og foreger 345 Behadlg af persooplysger + blagsdel 346 Betækg om revso af lov om patetforskrg 347 Betækg om bblotekere formatossamfudet + blagsdel 348 Betækg om stasordge cvle retssager 349 Betækg om aktdsgt persoalesager 35 Betækg om børs retsstllg Ladbrugets strukturudvklg 35 Betækg om behadlg af ævgesager 353 Fremtdes butksstruktur 354 Forholdet mellem mster og erbedsmæd 355 Straffelovsrådets betækg om e lov om fuldbyrdelse af straf m.v. 356 Rapport fra Skattemsterets t-udvalg 357 Udfordrger på lægerddelområdet 358 Betækg om varetægtsfægslg solato 359 Ikke Offetlggjort 36 Betækg om blledkust States Iformato Nørre Farmagsgade 65 Postboks 3 9 Købehav K Telefo Fax
4 Kommueres Udgftsbehov KAPITEL. METODEDISKUSSION AF PROFESSOR ANDERS MILHØJ.. 5. INDLEDNING MULTIPEL LINEÆR REGRESSION De multple leære regressosmodel Modelkotrol INDFLYDELSEN FRA ENKELTE DATAPUNKTER Afvgede værder af resposvarable Outlertest Dagostcergsstørrelser for dflydelse Avedelse af dagostcs for dflydelse De samtdge dflydelse fra mere ed ét datapukt Behadlg af dflydelsesrge observatoer TRANSFORMATIONER Box-Cox trasformato Trasformato af resposvarable Ikke-leær regresso DUMMY-VARIABLE KOLLINARITET De varasflaterede faktor Metoder tl afhjælpg af kolleartet Udeladelse af e forklarede varabel Forudsgelse VÆGTET MK-REGRESSION Behov for vægtg ud fra teoretske krterer Bestemmelse af vægte ud fra data ROBUST OG RESISTENT REGRESSION M-estmatorer Mdste kvadrerede medas metode KAPITEL. MODELKONTROL AF DE PRIMÆRKOMMUNALE UDGIFTSANALYSER BIBLIOTEKS-, FRITIDS- OG KULTURUDGIFTER KONTANTHJÆLPSUDGIFTER ÆLDREUDGIFTER FOLKESKOLEUDGIFTER BOLIGSIKRINGS- OG BOLIGYDELSESUDGIFTER Bolgskrgsudgfter Bolgydelsesudgfter BØRNEPASNINGSUDGIFTER Hovedstadskommueres børepasgsudgfter pr. -6-årg DØGNINSTITUTIONSUDGIFTER BESKÆFTIGELSES- OG UDDANNELSESUDGIFTER VEJUDGIFTER UDGIFTER TIL FØRTIDSPENSION, REVALIDERING OG SYGEDAGPENGE
5 Kommueres Udgftsbehov 4. ADMINISTRATIONSUDGIFTER KAPITEL 3. MODELKONTROL AF DE AMTSKOMMUNALE UDGIFTSANALYSER GYMNASIEUDGIFTER SYGEHUSUDGIFTER SYGESIKRINGSUDGIFTER VEJUDGIFTER
6 Kommueres Udgftsbehov Kaptel. Metodedskusso af professor Aders Mlhøj. Idledg I dette kaptel geemgås e række tekske forhold ved brug af regressosaalyse på data for kommuale udgfter. Der avedes et teksk sprog, me præcse matematske formler etc. er vdest mulgt omfag udgået. Emere er valgt samarbejde med Idergsmsteret, så otatet ka dae grudlag for det vdere arbejde med at aalysere de kommuale budgetadfærd, bl.a. tl brug ved revsoe af udlggssystemere. Notatet deholder udover dee dledg følgede afst: Multpel leær regresso Regressosmodelle opstlles, og det beskrves hvorledes, der sædvalgvs estmeres, hvlke forudsætger modelle bygger på, samt hvorledes dsse modelforudsætger ka kotrolleres. 3 Idflydelse fra ekelte datapukter I mage aalyser fdes der ekelte observatoer, der har større dflydelse på de tlpassede model ed adre. Det er vgtgt at opdage, om dsse datapukter er udtryk for fejl, om de af e eller ade grud blot kke passer d modelle, eller om det blot er sæt med e gavlg dflydelse på resultatere af de statstske aalyse. 4 Trasformatoer I vsse sammehæge dgår de forklarede varable kke leært beskrvelse af resposvarable. Det ka være udtryk for "faldede græseytte", faldede græseomkostger på grud af stordrftsfordele etc. 5 Dummyvarable Det er kke skkert, at sammehæge mellem de forklarede varable er de samme alle ladsdele eller alle kommuetyper. Ved hjælp af dummyvarable ka ma på e ekelt måde dele materalet op, så evetuelle forskelle ka 5
7 Kommueres Udgftsbehov 6 opdages og darbejdes modelle. 6 Kolleartet Mage forklarede varable beskrver ofte samme egeskab ved e kommue, f.eks. des størrelse. I de statstske aalyse ka vrkge af dsse forklarede varable kke adsklles, hvlket teksk set beteges multkolleartet. Det er aturlgvs vgtgt at gøre sg klart, hvor stort omfaget af multkolleartet er, og hvlke følger det får. Især skal ma være påpasselg ved forudsgelser, da værdere af de forklarede varable, der avedes e forudsgelse, skal lge de forklarede varable, der avedes aalyse. 7 Vægtet MK-estmato I vsse tlfælde vl det være aturlgt at lade kommuer med mage dbyggere veje tugere bestemmelse af de statske relato ed små kommuer. Dette spørgsmål hæger samme med forudsætgere for avedelse af regressosmodelle, og det ka delvs afklares ved hjælp af data. 8 Robust og resstet regresso Når fejlleddee følger e fordelg, hvs haler er tugere ed ormalfordelge, ka adre estmatosmetoder gve e mere præcs bestemmelse af regressoskoeffcetere. Ved hjælp af metoder, der er kke påvrkes væsetlgt af ekstreme observatoer såvel resposvarable som de forklarede varable, ka ma detfcere grupper af datapukter med e væsetlg dflydelse på aalyse og opdage homogeteter data. 6
8 Kommueres Udgftsbehov. Multpel leær regresso.. De multple leære regressosmodel Atag at resposvarable y skal beskrves ved e fukto af p - forklarede varable, x,...,x p. Kostatleddet modelle dgår desude som e forklarede varabel x, der ku atager værde. Data forelgger form af datapukter eller sæt af observatoer (y, x,x 3,..., x p ), =,...,. Hvert datapukt består således af sammehørede observatoer af de p varable y, x,...,x p. Der ka være tale om observatoer fra samme kommue eller amt. Hvs y ka beskrves ved e leær fukto af de p - forklarede varable fremstlles y på forme y = β + β x β p x p + e, =,...,. Fejlleddee e,...,e repræseterer dflydelse fra varable, der påvrker resposvarable, me som kke eksplct optræder på højresde, ete ford ma kke har kedskab tl værdere af de pågældede varable, eller ford de hver for sg ku har e margal betydg for varatoe resposvarable. Desude repræseterer de vrkge af, at sammehæge mellem de forklarede varable og resposvarable evetuelt kke er leær. Idet fejlleddet e dgår addtvt, spalter modelle resposvarable e sum af e systematsk, eller strukturel, kompoet, β + β x β p x p, og e fejlkompoet, e. At varatoe er tlfældg omkrg regressosfuktoe formalseres ved hjælp af fejlledsbetgelsere, E[e ] =, =,...,, var[e ] = σ, =,...,, cov(e,e k ) = for k. Dsse betgelser kaldes stadardforudsætgere om fejlleddees fordelg. 7
9 Kommueres Udgftsbehov 8 Stadardforudsætgere skrer, at de forvetede værd af y gvet de fude værder af x-ere er E[y x-ere] = β + β x β p x p. Ofte atages desude at fejlleddee er ormalfordelte med mddelværd og varasstruktur agvet ved () - (). Regressoskoeffcetere de multple leære regressosmodel estmeres oftest ved avedelse af mdste kvadraters metode eller forkortet MK-metode. MK-estmatere βˆ, βˆ,..., βˆ p deferes som de værder af regressoskoeffcetere, der mmerer, Σ(y - β - β x β p x p ). MK-estmatet ka bestemmes som et eksplct udtryk af y-ere og x-ere. De tlpassede værd deferes som ŷ = βˆ + βˆ x βˆ x, p p ved dsættelse af x,...,x p de estmerede regressosfukto y = βˆ ˆ ˆ. + β x β px p Det 'te resdual, ê = y ŷ, repræseterer de del af de observerede respos, der kke lader sg beskrve ved de estmerede regressosfukto. Resdualere er approksmatoer tl modelles fejlled, der kke ka observeres på grud af ukedskab tl regressoskoeffceteres sade værder. Fejlledsvarase σ estmeres ved, s = Σe /( - p) = RKS/( - p). 8
10 Kommueres Udgftsbehov Atages fordelge af fejlleddee at være ormal, blver fordelge af MK estmatore også ormal, ˆβ j ~ N( β j, σ v jj ), hvor v jj ka bereges ud fra x-eres værder. Ud fra dette resultat ka der opstlles teststørrelser tl test af hypoteser om parametrees værder, f.eks. hypotese β j =, der svarer tl, at de j'te forklarede varabel ka udelades af modelle. Et umersk mål for hvor godt de estmerede regressosfukto beskrver data er determatoskoeffcete også kaldet R, (ŷ - y ) = (y - y ) ê =- (y - y ) R Ma kalder SAK y = Σ(y -y ) for de totale varato y, mes resdualkvadratsumme RKS = ê fortolkes som et udtryk for de kkeforklarede del af varatoe resposvarable. Determatoskoeffcete er således de adel af varatoe resposvarable, der beskrves ved de estmerede regressosfukto... Modelkotrol Efter at regressoskoeffcetere er estmeret, bør det kotrolleres om modelle er brugbar, dvs. om de tre stadardforudsætger er opfyldt. De omhadler alle fejlleddees fordelg, som ka kotrolleres ved at avede de fude resdualer som skø over fejlleddees værder. Imdlertd vl resdualere kke opfylde () - (), selvom stadardbetgelsere er opfyldt for fejlleddee. For at udgå problemer med at resdualere har forskellge varaser, stadardseres de ved dvso med et estmat for deres stadardafvgelse, således at modelkotrolle foretages på baggrud af de stadardserede resdualer kaldet r,. r = s ê - h, hvor h, som ærmere dskuteres afst.3, ku afhæger af x-eres 9
11 Kommueres Udgftsbehov værder. Betgelse (), der skrer, at resposvarable faktsk er e leær fukto af x-ere, kotrolleres ved at afsætte de stadardserede resdualer mod de ekelte forklarede varable dagrammer. Hvs der er afvgelser fra leartete, ka det overvejes om resposvarable eller e eller flere af de forklarede varable skal trasformeres, jf. afst.4. Homoskedastctete () kotrolleres lgeledes ved hjælp af dsse dagrammer suppleret med dagrammer, hvor r afsættes mod de tlpassede værder eller adre størrelser, der kue tækes at påvrke varases størrelse, f.eks. kommues dbyggertal. Vser det sg, at fejlledsvarase afhæger af dsse størrelser, skal der ete trasformeres, jf. afst.4, eller der skal estmeres ved vægtet regresso, som behadles afst.7. Fordelge af fejlleddee ka studeres ved hjælp af et ormalfraktldagram for de stadardserede resdualer. Er der væsetlge afvgelser fra ormalfordelgstlpasge, ka der estmeres ved adre metoder, sær robuste og resstete metoder, der også har gode egeskaber for kke ormalfordelte fejlled, jf afst.8. Mdre afvgelser fra ormalfordelgstlpasge ses der som regel bort fra, da MK estmatere edda ka have attraktve egeskaber; me testresultater etc. skal tages med større forbehold.
12 Kommueres Udgftsbehov.3 Idflydelse fra ekelte datapukter Det er vgtgt at skele mellem tlfælde, hvor resposvarable atager e værd, der kke ka forklares ved de forklarede varable med de samme parameterværder som de øvrge datapukter og tlfælde, hvor de forklarede varable atager afvgede værder, me hvor resposvarable godt ka forklares af de forklarede varables værder med de samme parameterværder som avedes for de resterede datapukter. Hvs de forklarede varable atager afvgede værder, mes værde af resposvarable bestemmes godt af regressosmodelle med de samme parameterværder, som avedes for de øvrge datapukter, er puktet gavlgt. Det skyldes, at puktets tlstedeværelse forøger præcsoe på de avedte estmatorer væsetlgt. Hvs de forklarede varable kke atager usædvalge værder, me resposvarable atager e væsetlg aderledes værd, ed de forklarede varable tlsger, er der tale om e afvgede værd af resposvarable - e outler - der vl gve et stort resdual og forrger præcsoe hele de udførte aalyse. De værste stuato er et pukt, hvor de forklarede varable atager usædvalge værder, samtdgt med at resposvarable atager e værd, der kke ka beskrves ud fra de forklarede varable med de samme parameterværder som avedes ved de øvrge datapukter. De dårlge tlpasg tl det ekstreme pukt medfører emlg e dårlg tlpasg tl de øvrge datapukter, da parameterestmatere forskydes e retg, der forbedrer tlpasge tl det dårlge pukt på bekostg af tlpasge tl de resterede pukter..3. Afvgede værder af resposvarable Modelles eve tl at beskrve de ekelte datapukter vurderes på grudlag af resdualere, dvs. forskellee mellem de observerede og de forvetede værder af resposvarable for de ekelte datapukter. Sædvalgvs stadardseres resdualere, det ma herved skrer sg at resdualere, såfremt stadardforudsætgere er opfyldte, har e esartet spredg, og at deres værder ka vurderes forhold tl e t-fordelg eller blot e stadardseret ormalfordelg. Ma ka vælge at uderkaste alle stadardserede resdualer, hvs umerske værder er større ed, e ærmere udersøgelse. Det skyldes aturlgvs kke, at sådae resdualer
13 Kommueres Udgftsbehov kke ka forekomme uder ormaltetsatagelse, me dermod at datapukter med store resdualer både ka have e betydelg dflydelse på aalyse og ka deholde væsetlg formato om evetuelle modeldefekter. Numersk store resdualer ka have flere årsager, f.eks. ka der være tale om e usædvalg hædelse defor de betragtede model, ormalfordelge gver kke e tlfredsstllede beskrvelse af de tlfældge varato omkrg regressosfuktoe, der ka være tale om e datafejl, modelle gver lokalt e dårlg beskrvelse af data eller datapuktet er fremkommet uder specelle forhold..3. Outlertest E outler ka beskrves som e observato, der størrelse adskller sg markat fra de øvrge observatoer, med hvlke de burde være sammelgelg. Et outlertest er et formelt test for, om et bestemt resdual er ekstremt defor rammere af modelles forudsætger, dvs. om fejlleddet det pågældede datapukt ka tækes at være frembragt af de samme ormalfordelg som de øvrge datapukters fejlled, eller om det må betragtes som e outler. Idet omkrg 5 % af observatoere fra e stadardseret ormalfordelg har e umersk værd større ed, behøver der kke umddelbart at være oget suspekt ved et datapukt, blot ford de umerske værd af dets stadardserede resdualer større ed. Jo flere datapukter der er, jo større er sadsylghede for at mdst et stadardseret resdual er umersk større ed. V skal først betragte de stuato, hvor det skal udersøges om resposvarable et datapukt er ekstrem, det ma, før aalyse påbegydtes, havde e specel aledg tl at teressere sg for datapuktet. Et eksempel ka være, at ma vl skre sg, at sættet svarede tl Købehavs Kommue kke gver aledg tl et specelt stort resdual. Problemstllge ka mere formelt beskrves på følgede måde: Der forelgger datapukter af hvlke de - alle ka beskrves ved de samme regressosmodel. Ma spørger u om datapuktet ka beskrves ved de samme model. Som teststørrelse beyttes e brøk, hvor tællere er forskelle mellem de observerede værd y og de forudsagte værd år parameterestmatet (), der
14 Kommueres Udgftsbehov er bestemt ude avedelse af det 'te datapukt, avedes, og hvor ævere er stadardafvgelse på dee forudsgelse. Dee teststørrelse, kaldet t følger e t-fordelg med - p - frhedsgrader. Sgfkassadsylghede er derfor, P ( T t ). Ofte er ma mdlertd teresseret at vde, om det største bladt resdualer ka ases for at være ekstremt, dvs. om resposvarable det tlsvarede datapukt ka ases for at være e outler. Først betragtes de stuato, hvor der forelgger uafhægge observatoer fra samme t- fordelg med - p - frhedsgrader. Det svarer tl, at de teststørrelser opfattes som uafhægge observatoer, t,...,t, og v spørger efter sadsylghede, P ( max T max t ), dvs. efter sadsylghede for, at de største bladt uafhægge t( - p - ) fordelte stokastske varable atager e værd større ed de umersk største af observatoere t,...,t. Atag at α = P( T > max t ), hvor T ~ t( - p - ). Da er, P ( max T max t ) =- P(max T max t ) P( T max t ) =- (- α ). =- = For α =.5 og = 75 (atal kommuer) blver dee sadsylghed , altså æste, således at ma er så godt som skker på at mdst é kommue vl have et resdual, der soleret set er sgfkat på 5% veau. Sadsylghede α er således kke sgfkassadsylghede for outlertestet. Sgfkassadsylghede er dermod - ( - α), der ka være edog meget større ed α. Idet resdualere kke er uafhægge, ka ma stedet udytte e såkaldt Boferro ulghed tl beregg af e øvre græse for outlertestets 3
15 Kommueres Udgftsbehov 4 sgfkassadsylghed. Vælger ma de krtske værd som ( - α/)- fraktle t-fordelge med - p - frhedsgrader, vl sgfkasveauet kke blve større ed α, dvs. P ( max T > t ( - p -;-α / ) ) α. Atag at max t er de umersk største bladt t,...,t. Hvs max t er større ed ( - α/)-fraktle t-fordelge med - p - frhedsgrader afvses hypotese om, at der kke fdes outlere ved et test hvs veau er højst α. For α =.5 og = 75 fås dermed græse 3.74 for max t, hvlket jo er væsetlgt større ed..3.3 Dagostcergsstørrelser for dflydelse Der fdes et meget stort atal af dagostcergsstørrelser eller kort dagostcs, der avedes tl at detektere dflydelsesrge observatoer. De ka alle udtrykkes ved resdualere ê, varase s og hatmatrces dagoalelemeter h, der deferes det følgede. Derved fremtræder dsse størrelser som de grudlæggede ved vurderge af ekeltobservatoers dflydelse. Hatmatrces dagoalelemeter (eller kort hat-værdere) h afhæger ku af de forklarede varables værder. Hat-værde h er et mål for hvor lag afstade er fra værde af de forklarede varable for det 'te datapukt og tl de geemstlge værder af de forklarede varable for alle datapuktere. Dee afstad er ormeret så værder af h tæt ved agver e stor afstad, mes værder tæt ved ul agver e llle afstad. Jo tættere h lgger ved, der er de øvre græse for h, dvs. jo mere ekstreme de forklarede varable for datapuktet er, jo større er puktets potetelle dflydelse som følge af de forklarede varables værder alee. Hatmatrces dagoalelemeter ka derfor avedes som e dagostc, der vser oget om de forklarede varable ude at værdere af resposvarable ddrages. Hatmatrces dagoalelemeter kaldes også potetalet. Betegelse hatmatrce stammer fra at multplkato med dee matrx fører de observerede værder af resposvarable over de tlpassede værder ŷ. Med ˆβ j() beteges MK-estmatet for β j bereget ude avedelse af det 'te datapukt. Størrelse af ædrge β ˆ j βˆ j() de j'te regressoskoeffcet afhæger af de eheder, hvlke x j måles. Derfor vælger ma ofte at betragte 4
16 Kommueres Udgftsbehov de stadardserede dfferes, det der ormeres med e passede valgt stadardafvgelse, (DFBETAS) j() βˆ - ˆ j β = s() v hvor v jj dgår ( ˆ j ) j() jj, var β, og s () er fejlledsvarase estmeret ude avedelse af det 'te datapukt. Avedelse af DFBETAS har mdlertd de ulempe, at ma skal overskue p forskellge tal. Derfor betragtes også et samlet mål for afstade mellem ˆβ j og ˆβ j() for alle j =,.., p. Størrelse kaldes Cook's afstad eller Cook's D. Cook's D ka mdlertd skrves på forme r h D = p - h, hvor r er det 'te stadardserede resdual og h er det 'te dagoalelemet hatmatrce. Så selv om Cooks afstad D egetlg er et mål for, hvor meget udeladelse af é observato påvrker de estmerede parameterværder, er D blot et samlet udtryk for de stadardserede resdualer r og hat-værdere h. De samlede præcso, hvormed regressoskoeffcetere estmeres, udtrykkes ved kovarasmatrce var ( βˆ ), me da det er e uoverskuelg opgave at sammeholde de ekelte elemeter e dee kovarasmatrx estmeret hhv. på grudlag af det samlede datamaterale og estmeret ude avedelse af det 'te datapukt, avedes forholdet mellem varasmatrceres determater som målestok. Dette forhold kaldes COVRATIO, som mere præcst agver det kvadrerede forhold mellem rumfagee af kofdesellpsoder for regressoskoeffcetere estmeret med og ude det 'te datapukt. Da e stor kofdesellpsode betyder, at parametree er uskkert bestemt, vl sættet har e gavlg dflydelse på præcsoe, hvs COVRATIO er stor, dvs. væsetlgt større ed, og det vl forrge præcsoe, hvs COVRATIO er væsetlgt mdre ed. Der gælder desude, 5
17 Kommueres Udgftsbehov 6 s() (COVRATIO) = s p - h så også COVRATIO afhæger af hat-værde h., I oveståede avedes getage gage estmatet s () for σ, dvs. et estmat for σ bereget ude avedelse af det 'te datapukt. Det ka vses at, ( - p - )s () = ( - p)s -e /( - h ), således at også s () ekelt ka bestemmes. Atter ses, at datapukter med store resdualer ê komberet med ekstreme værder af de forklarede varable, og dermed store værder af h, har størst dflydelse på skøet over fejlledsvarase..3.4 Avedelse af dagostcs for dflydelse Det fremgår, at dflydelse fra det 'te datapukt dels afhæger af det stadardserede resdual, dvs. hvor ekstrem y er, set relato tl datapuktets forklarede varable, og dels af h, der vser de potetelle dflydelse som følge af de forklarede varables værder puktet. For at dae sg et dtryk af dagostcergsstørrelseres værder, sær for at se om der er datapukter, for hvlke dagostcergsstørrelsere atager værder, der er væsetlgt større ed værdere for de øvrge datapukter, udføres som regel e række tegger. Dsse dagrammer ka være størrelsere afsat mod observatosummeret, hvlket gver e let detfkato af de usædvalge datapukter. Adre mulgheder er at afsætte dem mod de tlpassede værder, de stadardserede resdualer eller mod hatmatrces dagoalelemeter. De bedste måde at dae sg et dtryk af de ekelte pukters dflydelse på aalyse er at afsætte de stadardserede resdualer r mod hatmatrces dagoalelemeter h et koordatsystem. Derved fremgår om dflydelse skyldes atypske værder af de forklarede varable, hvlket gver store værder af h, afvgede værder af resposvarable, der gver umersk store stadardserede resdualer, eller begge dele på e gag. Det vsuelle dtryk ka forbedres ved at markere de ekelte pukter med crkler, hvs arealer er proportoale med Cook's D. 6
18 Kommueres Udgftsbehov Når et pukt er detfceret ud fra f.eks. Cook's D, ka ma ved at se på hatmatrces dagoalelemet h og det stadardserede resdual r afgøre, om det er de forklarede varables værder, der er usædvalge, om det er resposvarable, der er usædvalg, eller evetuelt både de forklarede varable og resposvarable. De ærmere betydg af datapuktet for aalyse ka så studeres ved hjælp af DFBETAS, der vser puktets betydg for estmatere for de ekelte regressosparametre samt ved COVRATIO, der vser datapuktets dflydelse på præcsoe de samlede aalyse. Det er umulgt at gve præcse retgsler for, hvorår dagostcergsstørrelsere har værder, der bør påkalde sg særlg opmærksomhed. Det er emlg kke mulgt at støtte sg tl vurderger baseret på sadsylghedsovervejelser, ford størrelser som Cook's afstad og COVRATIO afspejler egeskaber ved de forklarede varable, om hvlke der kke gøres fordelgsmæssge atagelser modelle. E mulghed er at udsklle datapukter, hvs dagostcergsstørrelser er ekstreme forhold tl de tlsvarede størrelser for hovedparte af datapuktere. Dee udvælgelse foregår eklest med de ævte dagrammer. E ade mulghed er at vælge afskærgspukter, således at datapukter, for hvlke dagostcergsstørrelsere overstger afskærgspuktet, gøres tl gestad for e ærmere udersøgelse. Fælles for e række af dsse afskærgspukter er, at de er fastlagt med udgagspukt ormalfordelge, på trods af at der kke fdes oge som helst begrudelse for at værdere af de forklarede varable skulle være observatoer fra e flerdmesoal ormalfordelg. Dagoalelemetere hatmatrce : p beyttes som afskærgspukt. Cook's afstad : 4/( - p) beyttes som afskærgspukt. DFBETAS : ± beyttes som afskærgspukt. COVRATIO : ± 3p beyttes som afskærgspukter. 7
19 Kommueres Udgftsbehov De samtdge dflydelse fra mere ed ét datapukt Metodere tl dagostcerg eller detfkato af datapukter med stor dflydelse er effektve og velegede stuatoer, hvor der ku fdes et ekelt datapukt, hvs dflydelse på skller sg afgørede ud fra de øvrge pukters. Hvs der ku avedes é forklarede varabel, ka dflydelse fra mdre grupper af datapukters let opdages ved hjælp af et dagram, hvor resposvarable afsættes mod de ee forklarede varabel et koordatsystem, me modeller med to eller flere forklarede varable vl smple dagrammer, hvor respose afsættes mod hver af de forklarede varable, være stort set værdløse. Det er dog mulgt at kostruere dagrammer, der ka avedes stedet. V betragter to "regressosmodeller", é hvor resposvarable forklares ved alle de forklarede varable udtage de k'te og e ade hvor de k'te forklarede varabel forklares ved hjælp af de resterede forklarede varable. V bereger u MK-resdualere û k og vˆ k hhv. de to regressosmodeller, og det ka vses, at MK-estmatet for parametere β k modelle, û = β vˆ e, k k k + er detsk med MK-estmatet for β k, bereget drekte de oprdelge model. Dette resultat ka fortolkes på følgede måde: Idet û k repræseterer de del af y, der kke ka beskrves ved de forklarede varable x,...,x k-, x k+,...,x p, og vˆ k de del af x k, der kke ka beskrves ved dsse varable, udtrykker ˆβ k dflydelse fra x k på y, efter at der er justeret for dflydelse fra de øvrge forklarede varable. Ma ka u kostruere dagrammer der deholder de samme formato som et (x,y)-dagram e model med e ekelt forklarede varabel. Et dagram, hvor, (, ) vˆ, =,...,, k û k 8
20 Kommueres Udgftsbehov afsættes, vl deholde de samme formato om dflydelse fra de ekelte datapukter på ˆβ k som (x,y)-dagrammer modeller med e ekelt forklarede varable. Et dagram hvor puktere er afsat kaldes et tlføjet varabel dagram. I vsse sammehæge kaldes dette dagram også et partelregressos plot. Selv om det tlføjede varabel dagram kke gver oge kvatfcerg af dflydelse, er det allgevel yttgt tl at detfcere små grupper af datapukter med dflydelse på MK-estmatere. Cook's afstad lader sg prcppet let geeralsere tl et mål for de samtdge dflydelse fra to eller flere sæt. Hvs ˆβ j( I) beteger MK-estmatet for β j efter udeladelse af de m sæt med dces I = (,..., m ), ka afstade D (I) mellem βˆ og ˆβ j( I) bereges. Avedelse af dee multple verso af Cook's afstad fører mdlertd tl e væsetlg forøgelse af det bereggsmæssge arbejde, da estmatoe skal udføres for alle kombatoer beståede af m ud af de pukter datamateralet. Ved ku at se på de kombatoer, der gver de største værder af D (I) ka overskuelghede mdlertd bevares. Et smplere alteratv består successve beregger af Cook's afstad. Ma fder først det datapukt, der har de største værd af Cook's afstad. Fder ma, at dee værd er uforholdsmæssg stor, udelades det pågældede datapukt og e y beregg af Cook's afstad foretages. Ma ka u plukke datapukter ud, dtl der kke lægere forekommer værder af Cook's afstad, der er markat større ed for de øvrge datapukter. Der er mdlertd ge skkerhed for at udvælgelse af e gruppe datapukter ved dee tekk etop resulterer de gruppe, der tlsamme har de største dflydelse på værde af MK-estmatet..3.6 Behadlg af dflydelsesrge observatoer Som det ses af beskrvelse af dflydelsesrge observatoer, er der mage mulgheder for de vdere skrdt, efter at e eller flere kommuer er fudet at være specelt dflydelsesrge. Behadlge afhæger groft beskrevet om dflydelse ka karakterseres som gavlg eller skadelg. Gavlg: Hvs COVRATIO for e dflydelsesrg kommue er væsetlg større ed, vl udeladelse af kommue medfører, at parametree estmeres med e større uskkerhed. Kommue passer derfor godt d modelle og des dflydelse skyldes 9
21 Kommueres Udgftsbehov ku, at de med atypske værder af de forklarede varable bdrager mere ed adre tl de præcsoe af estmatoe. Sådae datapukter skal ma være glad for. Skadelg: Hvs Covrato er væsetlg mdre ed, samtdgt med at det stadardserede resdual er stort, eller hat-værde er stor, er det e kommue, der ka påvrke estmatoe uheldg retg. Som regel vl det være kommuer, der kke beskrves godt ved de fude model, me som allgevel vl trække estmatere e retg, der trods alt vl beskrve dem ogelude. Dee påvrkg af estmatere medfører så, at de øvrge kommuer beskrves tlsvarede dårlgt af modelle. Der ka selvfølgelg være tale om datafejl, måske deftosfejl eller perodeafgræsgsfejl regskabsoplysgere. Hvs det kke er tlfældet, er det deelle at bestemme, hvad der er atypsk ved dsse kommuer, f.eks. om det er de rge forstadskommuer. Derved ka det være mulgt at fde yderlgere forklarede varable, der ka brge dem d modelle ge. Ellers må ma beslutte, at dsse kommuer kke passer d de samme model, som beskrver de øvrge, og blot udelade dem fra estmatoe. Dee mulghed vl dog være svær at forsvare over for lokalpoltske teresser.
22 Kommueres Udgftsbehov.4 Trasformatoer Når regressosfuktoes form kke vælges ud fra teoretsk vde eller erfarg fra adre lgede aalyser, er det almdelgt først at betragte e leær regressosmodel for de varable, y, x,...,x p, af hvlke der er foretaget observatoer, dvs. modelle, y = β + β x β p x p + e. Atag u at modelkotrolle vser, at e eller flere af forudsætgere for avedelse af MK-metode kke ka ases at være opfyldt. Der ka være tale om, at de forvetede værd af resposvarable kke er leær e eller flere af de forklarede varable, at fejlleddees varas kke er kostat, eller at fejlleddee kke er ormalfordelte. I sådae tlfælde vl MK-metode bedste fald kke være optmal, værste fald vl aalyses koklusoer være helt upåldelge. E mulghed er at approksmere e krumlet fukto med et adegradspolyomum. Atag f.eks. at et resdualdagram vser, at der æppe er leartet de varable x. Ved at udvde de smple leære regressosmodel med x som forklarede varabel omformuleres modelle tl, y = β + β x + β 3 x + e. Sættes x 3 = x, ses at modelle ret teksk stadg blot er e sædvalg multpel leær regressosmodel. Hvs ma er tvvl, om hvorvdt det er ødvedgt at tage hesy tl e evetuel krumg, ka ma teste hypotese H : β 3 =. Accepteres dee hypotese, ka ma beslutte at se bort fra e evetuel krumg. Accepteres hypotese dermod kke, ka ma overveje, hvorledes ma øsker at modellere krumge. Må hypotese afvses, bør ma kke arbejde vdere med e model der er leær x. Ma ka også vælge at tlføje led af e potes højere ed. Herved får ma e model af forme, y = β + β x + β 3 x β p x p- + e, der kaldes e polyomal regresso. I dee model skal ma være opmærksom på at der er væsetlg samvarato mellem de forklarede varable, hvlket gver sg udslag kolleartet.
23 Kommueres Udgftsbehov E avedelse af polyomal regresso med det ee formål at opå e bedre tlpasg tl data, må mdlertd frarådes. Ma vl emlg ofte blot tlpasse modelle tl e varato resposvarable, der måske bør opfattes som tlfældg og æppe ka gefdes adre, lgede materaler. Ku hvs dee fuktosform ka begrudes f.eks. e aturlov, ka polyomal regresso tlrådes. Økoomske fæomeer som stordrftsfordele ka kke beskrves på dee måde, da et polyomum x vl dvergere mod ete plus eller mus uedelg for x gåede mod uedelg. Derfor vl et polyomum ku ka være avedelgt for værder af de forklarede varabel et begræset terval..4. Box-Cox trasformato I stedet for at avede polyomal regresso ka ma ved bestemmelse af regressosfuktoes form tage udgagspukt famle af potestrasformatoer, deferet ved, λ x -, λ x ( λ) = λ Fejl! Ukedt argumet for parameter. logx, λ =. Famle er parametrseret ved hjælp af λ, og de består af de egetlge potestrasformatoer x λ (for λ ) og af logartmetrasformatoer log(x) (for λ = ). De ldt specelle form er valgt for at opå kotutet λ, det, λ x - logx for λ. λ Famle af trasformatoer kaldes Box-Cox trasformatoer. Atag f.eks. at e kotrol af modelle har vst, at der æppe er tale om leartet x p. Ma ka da udersøge om leartetsatagelse er mere acceptabel, såfremt x p erstattes med potestrasformatoe x p λ. Herved fremkommer modelle, y = β + β x β p- x p- + β p x p λ + e. Såfremt λ er ukedt er det kke e leær model, det de kke er leær regressoskoeffcetere og λ, år også λ opfattes som ukedt parameter. Ved hjælp af e. ordes Taylor approksmato af fuktoe x p λ ka ma
24 Kommueres Udgftsbehov mdlertd defor rammere af e MK-aalyse udersøge, om der er oge fordel forbudet med, for e passede værd af λ, at erstatte x p med x p λ. V har at, x λ x + (λ - )xlogx, såfremt λ lgger ærhede af, da de afledede af x λ efter λ er x λ logx. Erstattes u x p λ med dee approksmato får regressosmodelle forme, y = β + β x β p x p + γx p logx p + e, hvor γ = β p (λ - ). Estmeres parametree ved MK-metode, ka λ bereges ud fra MK estmatore for γ og p for β p, y = β + β x β p x p + e. Potese λ estmeres ved, λ ˆ = γ ˆ β ˆ + p. Bemærk at β p, koeffcete tl x p, estmeres modelle ude leddet x p log(x p ). Hvs λˆ lgger tæt ved, gver data tet grudlag for at erstatte x p med e potestrasformato. Lgger λˆ dermod tæt ved ka det være fordelagtgt at erstatte x p med logx p, det ma sædvalgvs vl foretrække pæe værder af λ som f.eks.,.5,, -.5 eller -. Det er aturlgvs mulgt at foretage tlsvarede vurderger for samtlge forklarede varable. E fordel ved de her beskreve fremgagsmåde er, at ma ka vurdere, om behovet for at avede e potestrasformato prmært skyldes ekelte datapukter, eller om det er bredere fuderet. Dette gøres ved hjælp af dagostcergsstørrelsere tl vurderg af dflydelse fra ekelte datapukter på aalyses koklusoer sær på de estmerede værd af γ. Ofte vl det emlg være ogle få, ekstreme datapukter, der udgør de væsetlgste grud tl at e trasformato overvejes. 3
25 Kommueres Udgftsbehov 4 De her beskreve fremgagsmåde, baseret på famle af potestrasformatoer, tl vurderg af behovet for at trasformere é eller flere af de forklarede varable, kaldes Box-Tdwell metode..4. Trasformato af resposvarable Hvs de forvetede respos ka skrves på forme, E[y x ] = β exp{β x }, får ma ved at tage logartme tl begge sder, loge[y x ] = logβ + β x. De to udtryk er ækvvalete, det logartmefuktoe er mooto, så v altd bestemme det ee af udtrykkee ud fra kedskab tl det adet. Da det sdste udtryk er leært de ukedte regressoskoeffceter logβ = α og β, ka ma estmere dsse parametre ved MK metode. Hvs fejlleddee opfylder stadardforudsætgere, vl MK-metode gve varasmmale estmatorer for log(β ) og β. Atag at fejlleddee dgår multplkatvt det oprdelge udtryk, altså at, fås, y = β e xβ (+ e ), logy = logβ + β x + log( + e ). Idet var[e ] = σ er uafhægg af E[y x ], er også var[log( + e )] uafhægg af de forvetede værd af resposvarable. Imdlertd gælder, at E[log( + e )] = δ, uaset at E[e ] =. Skrves modelle på forme, logy = (α + δ ) + β x + u, vl fejlleddee u opfylde stadardbetgelsere, således at MK-metode ka avedes tl estmato af (α + δ ) og β, hvor jo etop β som oftest er af størst teresse. 4
26 Kommueres Udgftsbehov Det fremgår heraf, at år fejlleddet dgår multplkatvt, ka ma ved e logartmsk trasformato af begge sder af modelle frembrge e regressosmodel, der er leær de ukedte regressoskoeffceter (der gaske vst kke er helt detske med koeffcetere de oprdelge model), og hvs fejlled opfylder stadardbetgelsere. E estmato af parametree på grudlag af de trasformerede model gver derfor e optmal udyttelse af formatoe data. Hvs dermod fejlleddet er addtvt, dvs. modelle for y ka skrves på forme, fås, at, β x y = β e + e, log y = logβ + β x e + log +. E[y x] Hvs fejlled, der opfylder stadardbetgelsere, dgår addtvt, vl stadardbetgelsere altså kke være opfyldt de trasformerede model. Dette betyder, at de fordel ma ret bereggsmæssgt ved learserge modsvares af et tab præcso som følge af, at fejlleddee kke har kostat varas. I dee stuato ka ma avede kke-leær regresso tl estmato af β og β. Tlsvarede ka, E [y x ] = β x, β learseres ved e logartmsk trasformato. Hvs ma dee stuato fder, at fejlleddees varas tlsyeladede vokser med de forklarede varables veau, ka ma trasformere både x og y logartmsk håb om, at fejlleddee de trasformerede lgg har kostat varas. Oveståede betragtger ka aturlgvs geeralseres tl regressosfuktoer med flere forklarede varable. 5
27 Kommueres Udgftsbehov Ikke-leær regresso I forbdelse med estmatoe af parametree ævtes, at e learserg af de strukturelle kompoet og avedelse af MK-metode kke ødvedgvs er særlg hesgtsmæssg. I stedet ka ma, hvs fuktosudtrykket f.eks. har forme, E[y x ] = β exp{β x }, og fejlleddee dgår addtvt, bestemme MK-estmater ved at mmere, Σ(y - β exp{β x }). Dette kaldes kke-leær regresso. Her mmeres summe af de kvadrerede afvgelser mellem de observerede respos og regressosfuktoe. Dsse MK-estmater ka kke bestemmes eksplct, me de ka aturlgvs bestemmes ved e passede edb-procedure. Prcpelt ka ma aturlgvs forsøge at beskrve y ved e vlkårlg fukto af de forklarede varable og estmere parametree dee fukto ved MK-metode. I prakss vser det sg dog, at ma tt har svært ved at få de avedte procedure tl at kovergere og at de fuktosform, der opstlles, måske kke etydgt bestemmer parameterværdere. Ikke-leær regresso ka derfor være så komplceret, at ma foretrækker et leært udtryk evetuelt efter e trasformato. 6
28 Kommueres Udgftsbehov.5 Dummy-varable E bær varabel ka ku atage to værder, der det følgede sættes tl heholdsvs og. E bær varabel ka f.eks. deferes værde, hvs kommue har socalstsk styre og ellers. V betragter først e stuato, hvor resposvarable y skal beskrves ved to forklarede varable, de kvattatve varabel x og de bære varabel x 3. V ummererer datapuktere, således at x 3 = for de første og x 3 = for de sdste - datapukter. Idsættes de bære varabel drekte, får e leær regressosmodel forme, y = β + β x + β 3 x 3 + e, =,...,. For =,..., fås, y = β + β x + e, og for = +,..., fås, y = β + β x + β 3 + e = (β + β 3 )+ β x + e. Koeffcete tl de bære varabel med værdere og vl repræsetere de forvetede ædrg resposvarable, år x 3 ædres fra de første tl de ade kategor, e ædrg der er uafhægg af værde af x. På tlsvarede måde ka ma troducere e kategorseret varabel med K kategorer, f.eks. K ladsdele, form af K - bære varable. Modelle skrves som, y = β + β x + γ z γ K z K + e. Regressoskoeffcete γ k fortolkes dee model som afstade mellem regressosfuktoere for kategorere k og, der opfattes som e basskategor. Hvs ma skal vurdere om de kategorserede varabel yder et væsetlgt bdrag tl beskrvelse af resposvarable, må ma ved et F-test vurdere, om samtlge K - regressoskoeffceter γ k samtdg ka sættes tl. Hvs effekte på resposvarable af e ædrg de forklarede varabel, 7
29 Kommueres Udgftsbehov 8 x afhæger af veauet af e ade forklarede varabel, x 3, ka ma dføre produktleddet, x x 3 modelle, y = β + β x + β 3 x 3 + β 4 (x x 3 ) + e. Sættes x 4 = x x 3 er modelle e sædvalg leær regressosmodel, hvert fald ud fra e ret estmatosteksk betragtg. Ma sger, at modelle deholder e vekselvrkg mellem x og x 3. Modeller med produktled avedes tl at vurdere, om to eller flere regressosfuktoer er parallelle. Lad x være e kvattatv varabel og x 3 e bær varabel, hvs kategorer tldeles scorere og. Nu opstlles e smpel leær regressosmodel for x 3 = og x 3 = : x3 = : y = β + β x x3 =: y = β + β x + e + e. I modsætg tl modelle tdlgere forudsættes det altså kke, at de to regressosler har samme hældg. Ved avedelse af produktleddet x x 3 ka de to ler skrves på forme. y = β + β x + β 3 x 3 + β 4 (x x 3 ) + e. Sættes x 3 tl heholdsvs og ses at, β = β β = β β = β + β 3 β = β + β 4. Hypotese H : β = β om at de to ler har samme hældg, er altså modelle esbetydede med H : β 4 =. Accepteres hypotese om detske hældger, ka ma fortsætte med at teste om de to regressosler ka ases for at være sammefaldede. Dette ka ete gøres ved at teste H : β 3 8
30 Kommueres Udgftsbehov = efter at β 4 er sat tl, eller ved at teste de sammesatte hypotese H : β 3 = β 4 =. E lgede tekk ka aturlgvs beyttes tl at teste om K regressosler er parallelle eller om K regressosplaer er parallelle. Et problem ved modeller med mage dummyvarable er, at der ka optræde kolleartetsproblemer. Avedes f.eks. dummyvarable for ladsdele vl, de emlg samvarere med forklarede varable som f.eks. beskatgsgrudlaget, der jo er størst bykommuere og Købehavs forstæder. E oplagt avedelse af dummyvarable data om daske kommuer er at skre, at de mekasmer, f.eks. sammehæge mellem udgfte tl folkeskole pr. bar som fukto af adele elge forsørgere, regressosmodellere søger at afdække, er de samme by som på lad, altså at regressosplaere er parallelle. Dsse tests udføres ved at teste om vsse regressoskoeffceter tl dummyvarablee og produktvarablee er ul. Ku hvs det accepteres, at mekasmere er es de forskellge områder, er det rmelgt at estmere helt ude dummyvarable for at dae skø over de koeffceter, der bør avedes udlgge. 9
31 Kommueres Udgftsbehov 3.6 Kollartet Hvs der optræder tlærmelsesvs leære relatoer mellem værdere af de forklarede varable, sges at der er kolleartet eller multkolleartet data. Et hyppgt forekommede symptom på kolleartet er, at e varabel, ma på forhåd havde forvetet skulle splle e væsetlg rolle for beskrvelse af resposvarable, vser sg at være sgfkat. Årsage tl de maglede sgfkas ka emlg være, at de estmeres med e meget stor varas som følge af, at de varable er korreleret med e eller flere af de øvrge forklarede varable. De ka mdlertd også skyldes, at estmatet for fejlledsvarase er stort, ford værdere af de pågældede varabel har udvst e for rge varato, eller smpelthe at forhådsatagelse om de varables betydg var forkert. Et symptom, der ofte fremhæves, består at e regressoskoeffcet estmeres med et forteg, der er det modsatte, af hvad ma på forhåd havde forvetet. Det forkerte forteg ka emlg skyldes, at kolleartete gør uskkerhede på de estmerede koeffcet meget stor. E stor værd af R, samme med mage sgfkate regressoskoeffceter, ka også skyldes kolleartet. Da e t-værd afspejler betydge af e varabel, efter at der er justeret for værdere af de øvrge varable, ka årsage tl de maglede sgfkas emlg være, at de varable et vst omfag ka erstatte hade, ude at det går ud over forklargsgrade. Selvfølgelg ka årsage tl dette også blot være, at e del af de forklarede varable faktsk er ude væsetlg betydg. Et skkert symptom på kolleartet er høj korrelato mellem to forklarede varable. Derfor beyttes korrelatosmatrce for de forklarede varable ofte som grudlag for kolleartetsdagostcerge, me desværre ka et fravær af høje korrelatoer kke tages som et udtryk for fravær af kolleartet. Edelg ka kolleartet gve sg tl kede ved, at udeladelse af e forklarede varabel radkalt ædrer estmatere for koeffcetere tl e eller flere af de tlbageværede varable. Også ædrger MK-estmatere for regressoskoeffcetere ved udeladelse af et ekelt datapukt ka være et teg på kolleartet. 3
32 Kommueres Udgftsbehov.6. De varasflaterede faktor Kolleartet medfører bl.a. at det er mulgt at reproducere værdere af vsse af de varable rmelgt præcst ved leære fuktoer af e eller flere af de øvrge forklarede varable. I hvlket omfag det er tlfældet, ka vurderes ved faktsk at udføre regressoer af hver af de forklarede varable på de øvrge forklarede varable og berege determatoskoeffceter og t- værder for koeffcetere de ekelte relatoer. Selv om t-værdere kke ka tllægges oge statstsk betydg, da de forklarede varable opfattes som faste tal og kke som stokastske varable, ka de dog beyttes som dkatorer for hvlke af de varable, der sær samvarerer. Beteger R j determatoskoeffcete for e beskrvelse af x j ved e leær fukto af de øvrge forklarede varable, ka e høj værd af R j fortolkes som teg på e tlærmelsesvs leær relato mellem x j og e eller flere af de øvrge forklarede varable. I stedet for drekte at beytte R j aveder ma ofte, ved kolleartetsdagostcerge, VIFj = - R j, j =,...,p, der kaldes de varasflaterede faktor. Dee betegelse skyldes, at VIF j vser, hvor meget varase er forøget af kolleartete, forhold tl e hypotetsk stuato, hvor de varable var ukorreleret med alle de øvrge forklarede varable. De varasflaterede faktor vl være stor for alle forklarede varable, der dgår kollearteter. Der fdes ge faste regler for hvor stor VIF skal være for at kolleartete er væsetlg, me da VIF har e kokret fortolkg, ka ma hvert ekelt tlfælde vurdere, om f.eks. e 5-doblg af varase på e estmeret parameter som følge af kolleartet er meget eller ldt. Desude fdes adre, mere matematsk komplcerede, metoder tl at afdække kolleartetsforholdee..6. Metoder tl afhjælpg af kolleartet Når ma skal forsøge at afhjælpe kosekvesere af kolleartet, er det vgtgt at huske, at kolleartete kke er e følge af at modelle er forkert eller er fejlspecfceret. Dermod skyldes kolleartete, at data kke 3
33 Kommueres Udgftsbehov 3 deholder tlstrækkelg formato tl at belyse alle relevate aspekter af modelle, da vrkgere af de ekelte forklarede varable på resposvarable kke ka adsklles. Det er derfor ødvedgt at supplere de forelggede data med yderlgere formato om regressoskoeffcetere. E klde tl supplerg af formatoe er dsamlg af yderlgere datapukter; me det er kke relevat her, hvor datamateralet er alle ladets kommuer. E ade mulghed er tlføjelse af a pror vde om værdere af regressoskoeffcetere, hvlket leder frem tl forskellge former for Bayes estmato. E tredje mulghed er Rdge metode, hvorved der ka opås e estmator, der er mere præcs ed MK-estmatore mod de prs, at der opstår e skævhed estmatoe. Dsse mulgheder avedes prakss kke Damark, mes de de agelsaksske statstske tradto er mere udbredt. Det vl derfor kke være oge dé at troducere dem Idergsmsterets estmatoer..6.3 Udeladelse af e forklarede varabel E metode, der ofte foreslås tl afhjælpg af kosekvesere af kolleartet, er at udelade e forklarede varabel fra de opstllede model, selvom de udeladte varabel bdrager sgfkat tl forklarge af resposvarable. Atag f.eks. at de forklarede varable x og x 3 dgår e kolleær relato, og at derfor både β og β 3 estmeres med relatvt store varaser. Udelades f.eks. x 3 af modelle ka ma håbe på at varase på MK-estmatore for β reduceres. Hvs samtdg modelle ude x 3 gver e æste lgeså god beskrvelse af data som modelle med x 3, ka det umddelbart se ud tl at være e god dé at udelukke x 3 fra modelle, sær hvs kolleartete de reducerede model er ubetydelg. Hvs ma ku er teresseret på e smpel måde at beskrve sammehæge data mellem resposvarable og de forklarede varable, ka de reducerede model måske ases for at være tlfredsstllede. Er ma dermod teresseret at estmere regressoskoeffcetere med heblk på at opå dsgt hvorledes hver af de forklarede varable påvrker respose, dvs. at bestemme de datageererede mekasme, vl de reducerede model være utlfredsstllede. Dels estmeres β 3 overhovedet kke dee model, og de eeste begrudelse for at udelukke x 3 er, at de er volveret e kolleartet, kke at de ases for at være ude dflydelse på respose. V mster således mulghede for at vurdere hvorledes x 3 påvrker respose ved helt at udelade x 3 af aalyse. Også dflydelse fra x på respose ka mdlertd være vaskelg at vurdere de reducerede 3
34 Kommueres Udgftsbehov model. Det skyldes, at de formdskede varas på MK-estmatore for β ka være betalt med e betydelg skævhed, således at ˆβ, bestemt de reducerede model, ka gve et forteget bllede, af hvorledes x påvrker resposvarable. Også hvs de estmerede model skal beyttes tl beregg af forudsgelser af resposvarable, ka de llle model komme tl kort på grud af skævhede på ˆβ. Ved beregge af forudsgelser er det emlg kke præcsoe på de ekelte estmatorer, der har teresse, me dermod præcsoe på de samlede regressosfukto. Store varaser på de ekelte estmerede regressoskoeffceter ka opvejes af korrelatoe mellem dem, og det samlede resultat af e forudsgelse ved de store model ka derfor vse sg at være bedre ed resultatet af e forudsgelse ved hjælp af de reducerede model, hvor ma så ove købet ka rskere, at forudsgelse er behæftet med e betydelg skævhed. Koklusoe af dsse betragtger blver, at varabeludeladelse som et mddel tl at fjere kosekvesere af kolleartet bedste fald er værdløs, værste fald skadelg. Da kolleartetsproblemet opstår på grud af maglede formato data, er der ge grud tl at forvete, at problemet fjeres ved at reducere de forveje sparsomme mægde formato. I mage tlfælde skyldes kolleartete, at de forklarede varable beskrver forskellge aspekter af de samme egeskab ved kommue, f.eks. at des rgdom beskrves ved mage forklarede varable. I dsse tlfælde er det mulgt at sge, at ku é af de forklarede varable for rgdom medtages, dvs. egetlg at udelade de øvrge. E ade mulghed er at samle de mage forklarede varable tl é, e såkaldt prcpalkompoet, der samler formato fra alle de potetelle forklarede varable. Dee sdste mulghed vl dog være umulg at præsetere udadtl, da de forklarede varable blver umulg at fortolke. I mage eksempler er kolleartet e "selvforskyldt plage", der skyldes de måde, ma har valgt de forklarede varable. F.eks. vl polyomal regresso ofte gve kolleartetsproblemer, da der er e kolleær relato mellem e forklarede varabel og de samme varabel kvadreret. Lgeledes vl der ofte være kolleartet modeller med kategorserede forklarede varable. I dsse tlfælde løses tet problem ved at udelade e forklarede varabel. Dermod gver kolleartete aledg tl at revurdere om modelspecfkatoe u også er rmelg. Problemet er, at hvs dummyvarable og kotuerte forklarede varable forklarer de samme del 33
35 Kommueres Udgftsbehov 34 af resposvarables varato, ka data kke afgøre hvlke der forklarer hvad, så det op tl adre at afgøre dette. Hvs ete dummyvarable for ladsdele eller beskatgsgrudlaget som kotuert forklarede varabel forklarer varatoe e udgftspost må aalytkere beslutte, om varatoe skyldes, at der er forskelle beskatgsgrudlaget mellem by og lad eller om de skyldes forskelle urbasergsgrad..6.4 Forudsgelse V beytter estmatet, ˆ x β x pβ p, ˆ som forudsgelse. E forudsgelse bereget på grudlag af e estmeret regressosfukto er behæftet med uskkerhed. E del af dee uskkerhed skyldes avedelse af de estmerede regressoskoeffceter βˆ ved beregge stedet for de sade parameterværder β. Desude er der de uskkerhed, der skyldes at de observerede værd varerer omkrg forudsgelse som udtrykt ved fejlleddet e. Dsse statstske uskkerheder lader sg let kvatfcere form af varaser, forudsat aturlgvs at de betragtede model gver e passede beskrvelse af resposvarable. Uskkerhede ka mdlertd også skyldes adre forhold. De ka afhæge, af hvorledes de beyttede model er udvalgt og hvlke data, der har lgget tl grud for estmatoe af regressoskoeffcetere. Edvdere har det betydg at de forhold, uder hvlke forudsgelse skal bereges, er sammelgelge med de forhold uder hvlke selve datamateralet er dsamlet. I modsætg tl de statstske uskkerhed lader sådae problemer sg mdlertd ku vaskelgt kvatfcere. Når e estmeret model avedes tl forudsgelse, bør modelles form være valgt uafhæggt af estmatosmateralet. Edvdere skal estmatosmateralet helst udgøre e repræsetatv stkprøve fra e veldeferet populato, defor hvlke forudsgelse skal foretages. Dette udtrykkes også ved at sge, at de betgelser, uder hvlke forudsgelse foretages, kke må adsklle sg væsetlgt fra de betgelser, uder hvlke estmatosmateralet er dsamlet. Atag at ma på grudlag af sammehørede observatoer af e resposvarabel y og e ekelt forklarede varabel x, dvs. p =, har estmeret e smpel leær regressosmodel. De observerede værder af de forklarede varabel er alle deholdt 34
36 Kommueres Udgftsbehov tervallet [a,b], hvor a agver de mdste og b de største observerede værd af x. Ved e resdualaalyse ka ma udersøge om modelle gver e acceptabel beskrvelse af relatoe mellem x og y for værder af x deholdt [a,b]. Dette ka begrude avedelse af de estmerede model tl forudsgelser af y for værder af x tervallet. E såda forudsgelse kaldes e terpolato. Hvs ma øsker at beytte de estmerede model tl ekstrapolato, dvs. tl forudsgelse for værder af x udefor [a,b], vl ma mdlertd være på mdre skker grud. Udefor dette terval er der emlg kke oget emprsk grudlag for at beskrve resposvarable ved de estmerede model. Betragtes e regressosmodel med to forklarede varable, dvs. p = 3, vl ma emprsk kue begrude sammehæge mellem resposvarable og de forklarede varable for værder af de forklarede varable, der lger dem, der forekommer estmatosmateralet. Kombatoer af de forklarede varable udefor dette område vl dermod være ekstrapolatoer. E forudsgelse ka godt være e ekstrapolato, selv om værdere af de forklarede varable hver for sg er cetralt placerede forhold tl værdere af de forklarede varable estmatosmateralet. Bereges forudsgelse for e kombato, der kke forekommer estmatosmateralet, vl det være e ekstrapolato. I modeller med flere ed p = 3 forklarede varable er det kke mulgt at skele mellem ekstrapolatoer og terpolatoer på grudlag af grafske fremstllger af estmatosmateralet. For at karaktersere placerge af et yt sæt af værder af de forklarede varable forhold tl værdere af de forklarede varable estmatosmateralet, avedes stedet et umersk mål svarede tl hat-værdere h for afstade fra det ye sæt tl geemsttee af de forklarede varables værder datamateralet. Dee afstad sammelges med de tlsvarede afstade datamateralet og hvs de er mdre ed de største afstad datamateralet ka stuatoe opfattes som e terpolato. De kommuale udlgg foregår prakss efter metoder, der har store fællestræk med beregg af forudsgelser. Det vl derfor være e god dé, at ma ved kosekvesberegger af forskellge udlggsordger ser ærmere på de kommuer, der har de største hat-værder, det det vl være de kommuer, der sadsylgvs vl blve mest påvrket af ædrger bereggsformlere. 35
37 Kommueres Udgftsbehov 36.7 Vægtet MK-regresso E af betgelsere for, at MK-metode frembrger varasmmale estmatorer for regressoskoeffcetere, er varashomogetet eller homoskedastctet, dvs. at alle fejlled har samme varas. Er dee betgelse kke opfyldt, sges der at være heteroskedastctet. Heteroskedastctet medfører, at regressoskoeffcetere kke estmeres på optmal måde eller edda, at modelle fejlspecfceres ved mdste kvadraters metode og desude vl koklussoer på tests kue blve fejlagtge. Ma ka vsse tlfælde trasformere de størrelser, der dgår modelle, sær resposvarable, for at opå varashomogetet de trasformerede model. E ade mulghed er at avede e alteratv estmatosmetode, såfremt ma har kedskab tl størrelsesforholdee mellem de ekelte fejlledsvaraser. Dee fremgagsmåde er at foretrække, år de forvetede værd af resposvarable ret faktsk er leær de forklarede varable. Her ka trasformatoer af regressosmodelle emlg ødelægge leartete og desude vaskelggøre fortolkge af de estmerede regressoskoeffceter. Dette sdste argumet er af stor betydg aalyser af kommuale udgfter, da udgfter jo måles kroer og forklarede varable atal dvder etc. Atag at, var[e ] = σ = σ /w, hvor mdst to af vægtee w 'ere er forskellge. Ved tlpasge af regressosfuktoe er det da aturlgt, at datapukter med e llle fejlledsvaras σ (eller e stor værd af w ) tllægges større vægt ed datapukter med e stor fejlledsvaras. Begrudelse herfor er, at datapukter med små fejlledsvaraser forvetes at lgge tættere ved de sade regressosfukto ed datapukter med store fejlledsvaraser. Datapuktere med llle fejlledsvaras σ har derfor stor vægt w. Ma mmerer derfor, 36
38 Kommueres Udgftsbehov = (y - - β β x σ -..- β x p p ) = σ = w (y - β - β x -..- β x De værd, der mmerer dette udtryk, kaldes et vægtet MK-estmat eller et VMK-estmat med vægtee w,...,w. De vægtede kvadratafvgelsessum ka også, det der ses bort fra de fælles faktor /σ, skrves som, hvor Σ(y * - β w - β x * β p x p * ), p p ). y * = y w og x * j = x j w. Det vægtede MK-estmat er derfor detsk med MK-estmatet for β de trasformerede model, hvor x * -ere avedes om forklarede varable. Hvs modelle deholder et tercept, skal de første forklarede varabel være kvadratrode af w. Estmatet for σ bereges ved avedelse af resdualeree ê * fra de trasformerede model som s = - p * (ê ). Som grudlag for modelkotrolle avedes de stadardserede resdualer de trasformerede model. Lgeledes skal de forskellge dagostcergsstørrelser for ekeltobservatoers dflydelse bereges her. Hvs ma atager, at fejlleddee er ormalfordelte, vl de vægtede MKestmator være detsk med maksmum lkelhood estmatore for β, og de vl derfor være mdst lge så præcs som ehver ade mddelret estmator, dvs. at de vægtede estmator for β j har e præcso, der vl være større ed 37
39 Kommueres Udgftsbehov 38 præcsoe på MK-estmatore j..7. Behov for vægtg ud fra teoretske krterer Hvs respose y er bereget som et geemst over m dvder, der er uafhægge er σ = σ /m, hvor σ opfattes som varase kyttet tl ét dvd. Beyttes stedet for geemsttet summe over de m dvder som resposvarabel fås, at var[e ] = σ m, dvs. w = /m. Avedes de geemstlge udgft tl skoler pr. bar som resposvarabel er m lg med atal skolebør kommue. Dsse beregger forudsætter mdlertd, at udgfte pr. skolebar e kommue varerer med e mddelværd, der er bestemt ved hjælp af de forklarede varable og med samme varas. Desude kræver de, at udgftere pr. bar varerer uafhæggt fra bar tl bar, hvlket ka være e tvvlsom atagelse, da søskede eller mere geerelt bør samme del af kommue ofte har es udgftskrav. Det medfører, at varase σ = σ /m for et geemst, er for "llle", så f.eks., σ σ =, m er mere passede. Tlsvarede vl σ = σ m, år e total betragtes, gve for store vægte, så f.eks., σ = σ m,bedre beskrver heteroskedastctete. = λ Mere geerelt vl det være aturlgt at avede vægtee w m med e værd af λ over ul for e total og e værd af λ uder ul, år resposvarable er et geemst. Vl ma søge at bestemme vægtee teoretsk har ma følgede mulgheder: a) Ige vægtg. b) Vægt /m eller m for geemst resp. totaludgft. c) E vægt der afhæger af m, f.eks. af data. λ m, hvor de præcse form bestemmes 38
40 Kommueres Udgftsbehov I a) avedes de ekelte kommue som aalyseehed, ford ma sger, at hver kommue ud fra de ødvedge krav, befolkgssammesætg etc. udtrykt ved de forklarede varable stller, selv bestemmer st udgftsveau ved e procedure, som dee forbdelse ases at være stokastsk. I b) fokuseres på det ekelte dvd som aalyseehed. I s yderste kosekves betyder syspukt b), at kommuere kke tllægges dflydelse på skoleudgftere for det ekelte bar, me at udgftsbehovet bereges for hvert bar ladet ud fra de forklarede varables værder for et ekelte bar. Kommueres udgfter fdes da som summe af børees udgftsbehov. Mulghed c) er ofte mest realstsk. Idet avedelse af vægtee (ge vægtg) m eller /m alle vl gve sg udslag heteroskedastctet resdualere. Valget af vægte foregår prakss ved hjælp af e række dagrammer som beskrevet edefor..7. Bestemmelse af vægte ud fra data I mage eksempler vl varase vokse med resposvarables veau ŷ, det der populært sagt er mere at varere på for store værder ed for små. I avedelser på kommuale udgfter er det aturlgst at tæke sg e sammehæg mellem varase og kommues størrelse. Sammehæge ka aturlgvs være med forskellge mål for kommues størrelse - des samlede dbyggertal, det samlede skattegrudlag eller et adet mål for kommues velstad. På e fgur, hvor r er afsat mod de størrelse, der kue bestemme vægtge f.eks. ŷ, ka ma ved avedelse af e udglatgsmetode få et dtryk af ædrge fejlledsspredge som fukto af ŷ, det r er et udtryk for spredge på r. Ma ka også ddele de vadrette akse e række tervaller og hvert terval berege geemsttet af de tlpassede respos ŷ og geemsttet af de tlsvarede umerske stadardserede resdualer. Derefter afsættes geemsttet af resdualere mod geemsttet af de tlpassede resposer for hvert af tervallere. Ved at forbde dsse pukter fås lgeledes e beskrvelse af sammehæge mellem fejlledsspredge og de forvetede respos. For at dæmpe det vsuelle dtryk af de få ekstreme resdualer, der altd vl optræde, ka ma stedet afsætte kubkrode af r på de lodrette akse. Derved vl de ekstreme værder af r blve trykket samme, så de kke fremstå så 39
41 Kommueres Udgftsbehov 4 kraftgt, så det er lettere at se et overordet bllede af varatoes størrelse. log ŷ eller mere geerelt med m, da hældge på e evetuel retlet sammehæg på dette plot vl λ være et estmat for λ, e model med varaser gvet ved σ = σ m. Ofte er det e fordel at afsætte log( r ) mod ( ) Når ma aveder e edb-procedure tl geemførelse af e vægtet MKaalyse, skal ma være omhyggelg med, at vægtee (w 'ere) er deferet på de korrekte måde. Edvdere skal ma udersøge hvlke resdualer, der bereges, det såvel deftoe af vægte som af beregede resdualer ka varere fra procedure tl procedure. Ma bør også være opmærksom på, hvorledes determatoskoeffcete R bereges. Hvs R bereges drekte de trasformerede model, vl de kke kue sammelges med determatoskoeffcete fra e MK-aalyse, det resposvarable de to stuatoer kke er de samme. 4
42 Kommueres Udgftsbehov.8 Robust og resstet regresso Det er ku, hvs fejlleddee ka beskrves ved e ormalfordelg og der er kotrol over dflydelse fra samtlge datapukter, at mdste kvadraters metode fugerer optmalt. Derfor er der udvklet e række alteratve metoder tl estmato af koeffcetere e leær regressosfukto. I de eksploratve fase af aalyse søger ma at opå et overblk over de væsetlgste træk ved data. Ma er teresseret at fde evetuelle ekstreme observatoer, fejl og adre homogeteter data, f.eks. om der fdes mdre grupper af datapukter, der adskller sg fra de øvrge. I dee fase har ma brug for e tlpasg af regressosfuktoe, der prmært afspejler forholdee hovedparte af data. Ved avedelse af e såda tlpasg vl det være mulgt at detfcere såvel ekelte ekstreme datapukter samt ldt større grupper af datapukter, der på et eller flere pukter adskller sg fra de "ormale" datapukter. Metoder, der kke påvrkes væsetlgt af ædrger mdre dele af datamateralet, sges at være resstete. Ved mdste kvadraters bestemmes tlpasge tl data, således at store resdualer udgås, dvs. således at ma så vdt mulgt udgår e meget dårlg tlpasg tl oget datapukt, det e eller flere meget dårlge tlpasger vl medføre, at resdualkvadratsumme blver meget stor. Kosekvese heraf er mdlertd, at det blver vaskelgt at detfcere ekelte afvgede datapukter eller mdre grupper af datapukter, der på e esartet måde adskller sg fra hovedparte af data. Ved hjælp af de dagostcs er det mulgt at detfcere solerede datapukter med e ekstrem belggehed forhold tl de øvrge datapukter, og dflydelse fra sådae pukter på selve aalyse ka kvatfceres. Evetuelle ulemper ved MK-metode som følge af ekeltobservatoers dflydelse ka derfor erkedes, hvorved skadere begræses. Når det gælder detfkatoe af mdre grupper af afvgede datapukter, opstår der mdlertd problemer. Ma ka gaske vst geeralsere ekeltpuktsdagostcs som f.eks. Cook's afstad tl mål for de samtdge dflydelse fra et større atal pukter. Herved øges mdlertd atallet af beregede størrelser et sådat omfag, at det ka ærme sg det uoverskuelge. Alt alt må det derfor kokluderes, at MK-metode kke fugerer så hesgtsmæssgt de eksploratve fase af aalyse, da ehver avedelse af metode skal suppleres med et stort ekstraarbejde med 4
43 Kommueres Udgftsbehov 4 dagostcs etc.. I de kokluderede fase af e statstsk aalyse søger ma præcse estmater for regressoskoeffcetere, der testes hypoteser og der bereges forudsgelser og ma fortolker betydge af de ekelte forklarede varable. I dee fase er ma teresseret at udytte formatoe data optmalt. Uder forudsætg af at selve regressosfuktoes form er korrekt, gøres dette ved at gve e detaljeret beskrvelse af fejlledsfordelge og derefter udytte dee beskrvelse optmalt, f.eks. ved hjælp af maksmum lkelhood metode. Hovedproblemet de kokluderede del af aalyse er således fastlæggelse af fejlledsfordelge, specelt hvor præcst det er mulgt at beskrve dee fordelg og om hvlke betydg, det har for de valgte aalysemetode, at beskrvelse af fejlledsfordelge evetuelt kke er helt korrekt. MK-metode udytter ku formatoe data optmalt, år fejlleddee er ormalfordelte (forudsat at stadardforudsætgere er opfyldt). Det ka mdlertd vses, at afvgelser fra ormalfordelge forrger MKestmatores præcso væsetlgt. Heller kke de kokluderede fase er det derfor ubetget hesgtsmæssgt at avede MK-metode. I stedet ka ma avede metoder, hvs tlpasg prmært afspejler forholdee hovedparte af data, og hvs egeskaber kke er kyttet tl ormalfordelge. Sådae metoder kaldes robuste, hvlket både betyder, at de er robuste overfor påvrkge fra ekstreme datapukter, uaset om de ekstreme værder fdes resposvarable eller de forklarede varable, og at metodes præcso, år det gælder estmatoe af regressoskoeffcetere, kke er stærkt afhægg af sævre fordelgsmæssge atagelser om fejlledsfordelge..8. M-estmatorer De afvgelser fra ormaltetsatagelse, der først og fremmest skaber problemer ved avedelse af MK-metode, består at fejlledsfordelges haler er tugere ed halere ormalfordelge, dvs. at der optræder flere ekstreme observatoer af resposvarable, ed det forvetes uder ormaltetsatagelse. For at mmere resdualkvadratsumme må ma begræse resdualere fra de ekelte datapukter, det blot et ekelt stort resdual, år det kvadreres, gver e stærk forøgelse af 4
44 Kommueres Udgftsbehov resdualkvadratsumme. MK-metodes maglede robusthed overfor ekstreme værder af resposvarable skyldes således, at resdualeres kvadrater dgår drekte de sum, der søges mmeret. E estmator, der højere grad ed MK-estmatore er robust overfor afvgelser fra ormaltetsatagelse, fås ved stedet for at mmere summe af kvadratet på resdualere at mmere e fukto, der vokser lagsommere ed e kvadratsk fukto. Lad derfor ρ være e kke-egatv fukto, der er symmetrsk omkrg og atager st mmum. Et M- estmat ˆβ m mmerer, Σρ(y - β - β x β p x p ). MK metode svarer tl at sætte ρ(t) = t /. E oplagt mulghed er, at vælge ρ(t) = t, og dermed mmere, Σ y - β - β x β p x p, dvs. summe af de umerske resdualer. Dee sum ka umddelbart fortolkes som e værd kroer, hvs resposvarable er e udgft. Datapukter med ekstreme værder af resposvarable får mdre dflydelse på estmatet for β ed ved summe af de kvadrerede resdualer. Metode kaldes Mdste Absolutte Resdualers eller kort MAR metode eller LAR (Least Absolute Resduals). Det ka vses, at MAR estmatet er maksmum lkelhood estmatet for β, år regressosmodelles restled følger e dobbelt ekspoetalfordelg (også kaldet Laplace-fordelge), e fordelg hvs haler er tugere ed ormalfordelges haler. Fejlledsspredge ka estmeres ved, σ ~ = med y - β - β x β p x p, for de estmerede værder af β-ere. Dette estmat afhæger, modsætg tl det sædvalge estmat s for fejlleddees stadardafvgelse, kke af ekstremt store resdualer. M-estmatorer er stad tl at dæmpe dflydelse fra sæt med ekstreme værder af resposvarable. Dermod ka de ku et vst omfag dæmpe dflydelse fra sæt med ekstreme værder af de forklarede varable, dvs. at 43
45 Kommueres Udgftsbehov 44 de er mere robuste ed resstete. I prcppet ka et ekelt sæt påvrke også et M-estmat vlkårlgt meget, og derfor har ma foreslået avedelse af geeralserede M-estmatorer eller M-estmatorer med begræset dflydelse. Her bestemmes estmatet ved at mmere e vejet sum af e fukto ρ af de "stadardserede" resdualer. Herved udgår ma at ekelte sæt med ekstreme værder af de forklarede varable og/eller ekstreme værder af resposvarable udøver e domerede dflydelse på resultatet af aalyse..8. Mdste kvadrerede medas metode Årsage tl at MK estmatere påvrkes så kraftgt af ekstreme observatoer er, at ma ved at mmere summe af de kvadrerede resdualer opår jævt god tlpasg tl samtlge sæt. Forekommer der "dårlge" sæt, dvs. sæt, der deholder måle- eller dtastgsfejl, eller sæt, der på e eller ade måde adskller sg fra hovedparte af sættee, vl de derfor kke ødvedgvs gve sg tl kede form af ekstreme resdualer. De dårlge tlpasg tl sådae sæt vl emlg blve tværet ud over de øvrge sæt. Når ma beytter MK metode, ka det derfor blve ødvedgt at berege et stort atal dagostcs for at solere mdre grupper af afvgede sæt, og selv da ka detfkatoe af sådae sæt være vaskelg. Som et alteratv hertl ka ma avede estmatosmetoder, der højere grad ed MK metode er resstete overfor tlstedeværelse af sæt med ekstreme observatoer, det følgede beteget som dårlge sæt. Idee bag dsse metoder er at sættee ka opdeles gode og dårlge sæt, og tlpasge bestemmes udelukkede af de gode sæt. Ved e efterfølgede resdualberegg vl de dårlge observatoer så forhåbetlgt gve sg tl kede form af ekstreme resdualer. Det er øskværdgt, at metode prmært lader de gode sæt få dflydelse på estmatet for regressosfuktoe. Jo større adel af dårlge sæt metode ka tåle, ude at det får voldsom dflydelse på de estmerede regressosfukto, jo mere resstet sges de at være. Sammebrudspuktet for e estmatosmetode deferes som de maksmale adel af dårlge sæt, der ka tllades, ude at det får afgørede betydg for estmatoe af regressosfuktoe, og jo højere sammebrudspuktet er, jo mere resstet sges metode at være. Hvs formålet med avedelse af e resstet metode først og fremmest er at udsklle evetuelle afvgede observatoer, vl e metode med et højt sammebrudspukt være mest hesgtsmæssg. 44
46 Kommueres Udgftsbehov Resstete estmatosmetoder har mdlertd e række ulemper. Først og fremmest er de bereggsmæssgt set lagt mere komplcerede ed MK metode. Desude ka sær metoder med et højt sammebrudspukt være effcete, d.v.s. estmatorere for regressosparametre ka være meget upræcse. Edelg vl feresteore for metodere som oftest være baseret på asymptotske resultater. Derfor fder dsse metoder prmært avedelse de dledede, eksploratve, fase af aalyse. Mdste kvadrerede medas metode eller MKM-metode bestemmer regressosfuktoe ved at mmere medae for de kvadrerede resdualer, det MKM-estmatet ˆβ MKM mmerer medae af de kvadrerede afvgelser, med(y - β - β x β p x p ), over alle β. I e stuato med ku e ekelt forklarede varabel har le estmeret ved MKM metode e smpel geometrsk fortolkg. Det ka emlg vses, at metode bestemmer de smalleste strbe, afgræset af to parallelle ler, der deholder halvdele af observatoere. Afstade mellem lere måles ordatakses retg, og MKM-le vl være placeret mdt mellem de to ler. MKM-metode har et sammebrudspukt tæt ved 5 %, dvs. at tlpasge af regressosfuktoe stort set ku bestemmes af de gode sæt, også selv om dsse ku udgør 5 % af det samlede atal sæt. Dette betyder, at metode er stad tl at udsklle op mod halvdele af sættee som værede dårlge. Desværre er metode meget tdskrævede, så stedet avedes e søgeprocedure, der er meget bereggstug datamateraler med mage forklarede varable. Dee procedure vrker uheldgvs meget dårlgt, hvs der optræder dummyvarable eller adre varable, der ku atager få værder bladt de forklarede varable. Når approksmatoe βˆ tl MKM-estmatet er bestemt, ka MKMresdualere (eller rettere approksmatoer hertl) bereges som på sædvalg måde, og sættee med ekstreme resdualer ka gøres tl gestad for e ærmere udersøgelse. Desværre estmerer MKM-metode regressosparametree meget upræcst. Hvs ma mdlertd først opdeler data gode og dårlge sæt ved hjælp af 45
47 Kommueres Udgftsbehov 46 MKM-metode og deræst bestemmer et estmat for β med MK-metode avedt på ku de gode sæt, dvs. sættee med de umersk mdste resdualer, opås alt alt et resstet skø med e tlfredsstllede præcso. Dee opdelg foretages ved at stadardsere resdualere og avede e græse c, således at sæt med stadardserede resdualer med umersk værd mdre ed c sges at være gode, mes sæt med stadardserede resdualer med e umersk større værd sges at være dårlge. Det er foreslået, at avedelse c =.5, e værd tæt ved 99.5%-fraktle u-fordelge, me med 75 observatoer bør e større værd, f.eks. 3,5 sarere avedes. På grudlag af de stadardserede resdualer for de ye MK aalyse ka ma u udvælge evetuelle yderlgere sæt, der bør gøres tl gestad for e ærmere udersøgelse før de edelge estmato af modelles parametre. 46
48 Kommueres Udgftsbehov Kaptel. Modelkotrol af de prmærkommuale udgftsaalyser. Bbloteks-, frtds- og kulturudgfter Prmærkommueres bbloteks-, frtds- og kulturudgfter pr. dbygger er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres bbloteks-, frtds- og kulturudgfter), er e fukto af 4 forklarede varable, gvet ved laddstrktsgrade, udskrvgsgrudlaget, adele af udpedlere og adele af udlædge fra 3. verdeslade, samt et kostatled : (..) y = β + βx + β x + β 3x3 + β 4 x4 + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (..), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (..) på baggrud af hver ekelt af de forklarede varable modelle. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet: : = (..) β H : log( e ) β + βxk =, k =,,4. I tabel.. er vst resultatet fra estmato af modelle lgg (..) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at laddstrktsgrade, udskrvgsgrudlaget og adele af udlædge fra 3. verdeslade har sgfkate parametre, dvs. dsse tlfælde forkastes hypotese om homoskedastctet og de alteratve hypotese om heteroskedastctet accepteres. Det ka således kostateres, at modelle lgg (..) kke opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable, me er plaget af heteroskedastctet. 47
49 Kommueres Udgftsbehov 48 E kosekves af heteroskedastctet er, at modelles varasestmat kke er mddelret og, at teststørrelsere for parametree er utroværdge. Hermed er der rsko for at medtage varable modelle, der uder et korrekt varasestmat kke vlle have sgfkate parametre, mes adre varable, der uder et korrekt varasestmat vlle have sgfkate parametre, udelukkes fra modelle. I tabel.. agver de rude parateser teststørrelsesværde fra et t-test, mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra t-fordelge. Tabel.. Mdste kvadraters estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 64,59 % - β - Kostatled β - Laddstrktsgrad β - Udskrvgsgrudlag β 3 - Adel udpedlere β 4 - Adel udlædge 479,74 (-3,9) [,] -5,3 (-5,8) [,], (6,85) [,] -5,56 (-5,68) [,] 65,4 (6,8) [,] - -, (-3,9) [,],3 (3,43) [,], (,43) [,539],3 (3,83) [,] 48
50 Kommueres Udgftsbehov E estmatosmetode, som tager højde for afhægghede mellem modelles resdualer og de forklarede varable, er således påkrævet og alteratvt opstlles e loglkelhoodfukto, der uder estmato af modelles parametre samtdg korrgerer for heteroskedastctet ved at vægte med e eller flere af de varasstyrede forklarede varable opløftet poteser, der lgeledes estmeres uder maksmerg af loglkelhoodfuktoe. I det ormalfordelte og heteroskedastske tlfælde ka loglkelhoodfuktoe deferes ved, 75 π, = σ (..3) log L = log( ) log( σ ) + ( y ) β x hvor varase σ forvetes at være afhægg af laddstrktsgrade, udskrvgsgrudlaget og adele af udlædge, jf. Parks test, ete ekeltvs eller kombatoer af to eller tre. Uder optmerg af loglkelhoodfuktoe med forskellge kombatoer af de tre varasstyrede forklarede varable opås de højeste loglkelhoodværd ved at lade varase være e fukto af blot laddstrktsgrade og dermed gvet ved, α (..4) σ σ ( x ) =, =,,..., 75., Som estmat for σ avedes MK-estmatet. Loglkelhoodfuktoe ka derfor deferes ved, (..5) log L = log( π) log( σ ) α 75 = x, ( y ) 75 β x α σ = ( x, ) I det ormalfordelte og homoskedastske tlfælde er maxmum lkelhood metodes estmerede parametre detske med parametree estmeret uder mdste kvadraters metode, og loglkelhoodfuktoe er dette tlfælde. 49
51 Kommueres Udgftsbehov 5 gvet ved, 75 [ y ] π. σ (..6) log L = log( ) log( σ ) ( β x ) = Estmato af loglkelhoodfuktoere udføres matrceprogrammet IML SAS. De avedte procedure tager udgagspukt et bereggsmodel, hvor heholdsvs modelle, varasfuktoe og loglkelhoodfuktoe specfceres. Dette bereggsmodul kaldes af e kke-leær optmergsrute, NPLDD (No-Lear Double Dogleg Optmzato), der på bagrud af talpukter, evetuelle parameterrestrktoer, determatoskrterer og parameterkotrol fder maksmum for loglkelhoodfuktoere. Test af, hvorvdt ML-estmatere er lg med ul foretages ved Waldteststørrelse, (..7) W = ( Rψˆ r) R Σ ( ψˆ ) [ R] ( Rψˆ r) ~ χ Et estmat af kovarasmatrce bereges ved hjælp af e uderrute IML, NLPFDD (No-Lear Programmg Fte Dfferece Approxmato), der på baggrud af loglkelhood-fuktoe og de estmerede parametre bereger de umerske. ordes afledede og Hessematrce. Estmatet for kovarasmatrce, Σ ( ψˆ ), er herefter gvet ved de verterede og egatve Hessematrce. I to-sdet test af, hvorvdt de ekelte parameter er lg med ul, H ψ ˆ, H : ψˆ er Wald-testet gvet ved, : =. (..8) H ψ ˆ, H : ψˆ : : = W ψˆ = ~ N(, ), var ( ψˆ ) der er stadard ormalfordelt. I tabel.. agver de rude parateser teststørrelsesværde fra testet lgg (..8), mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra stadard ormalfordelge. Det skal bemærkes, at såfremt gve parametre lgger på græse tl det sgfkate eller hvs potesparametree har umersk store værder uderstøttes Wald-teststørrelse af et lkelhood rato test. 5
52 Kommueres Udgftsbehov Tabel.. Maxmum lkelhood estmato af uvægtet og vægtet model Loglkelhood uder ormalfordelge σ = σ α σ = σ ( x, ) R værd 64,59 % 59,54 % Loglkelhoodværd -88,78-863,8 β - Kostatled 479,74 (-3,9) [,] β - Laddstrktsgrad -5,3 (-5,8) [,] β - Udskrvgsgrudlag, (6,85) [,] β 3 - Adel udpedlere -5,56 (-5,68) [,] β 4 - Adel udlædge 65,4 (6,8) [,] 389,8 (-,9) [,43] -4,5 (-5,34) [,], (6,4) [,] -6,3 (-6,5) [,] 5,3 (4,) [,] α - Potes : laddstrktsgr. - -,6 (-5,3) [,] LR = (-863,8 - (-88,78)) = 37, ~ χ ( ) <, I tabel.. er agvet resultatere fra estmato af loglkelhoodfuktoe uder e atagelse om heholdsvs homoskedastctet, σ = σ, og α heteroskedastctet, σ σ ( x ) =. Som tdlgere ævt er maxmum, lkelhood metode det homoskedastske og ormalfordelte tlfælde detsk med mdste kvadraters metode, hvlket resulterer at parametre, 5
53 Kommueres Udgftsbehov 5 teststørrelsesværder og sgfkassadsylgheder tabel.. (. koloe) og tabel.. (. koloe) er detske. Det bemærkes, at estmatoe uder atagelse om homoskedastctet gver de højeste R -værd, hvlket mdlertd kke gør dee model relatvt mere attraktv, det de samtdg er udstyret med et skævt varasestmat. De højeste loglkelhoodværd, gvet ved -863,8, opås estmatoe uder atagelse om heteroskedastctet, mes loglkelhoodværde det homoskedastske tlfælde er på -88,78. I tabelles ederste række testes med et lkelhood rato test om dsse to loglkelhoodværder er lg med hade, hvlket med e sgfkassadsylghed på mdre ed, afvses. Det ka således kostateres, at loglkelhoodfuktoe uder atagelse om heteroskedastctet har de markat bedste loglkelhoodværd og dermed de bedste tlpasg. I det heteroskedastske tlfælde er varasspecfkatoe som vst gvet ved α σ = σ ( x, ) og tabelles æstsdste række ses, at potesparametere, α, er estmeret tl -,6, hvorved varasspecfkatoe mere præcst er gvet,6 ved, σ = σ ( Laddstrktsgrade ). Estmato uder dee formulerg medfører, forhold tl estmato uder det homoskedastske tlfælde, tl ædrger parameterestmatere, mest markat llustreret kostatleddet og adele af udlædge. Test for homoskedastctet de to ML-modeller er vst tabel..3 og sker ved heholdsvs Breusch-Paga og Koeker-Basset Lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. Testet ka geemføres ved, (..9) LM = e ESS = z. e e Deferes Z ved e ( P +) -matrx beståede af observatossæt af (, ) og deferes g som e vektor beståede af g = e ( e e ) ka z Breusch-Paga LM-testet specfceres ved, 5
54 Kommueres Udgftsbehov ( Z g ) (..) LM = g Z( Z Z) - Z = (, z ),, (, z ) N ( P+) [ ] K. [ ] - g = e ( e e ), e ( e e ),K.. I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (..) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e - ( ) ( ) e e e u =, K,., - = ( ) (, K,)... - e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved p. (..) Uder ~ χ. H er LM ( p) 53
55 Kommueres Udgftsbehov 54 Ved geemgag af tabel..3 s ederste række ka kostateres, at,6 korrekto af varase ved σ = σ ( Laddstrktsgrade ) fjerer de kostaterede heteroskedastctet fra modelle, og hypotese om homoskedastctet accepteres med sgfkassadsylgheder på heholdsvs 73,4 % og 78,63 %. I tlfældet hvor varase kke korrgeres for afhægghede tl de forklarede varable, d.v.s. hvor σ = σ, afvses hypotese om homoskedastctet stærkt, det sgfkassadsylghede er mdre e, % begge test og de alteratve hypotese om heteroskedastctet accepteres. Da varasestmatet modelle med mplct korrekto for heteroskedastctet vl have de højeste grad af mddelrethed foretrækkes at avede dee model aalyse. Tabel..3 Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM σ = σ (Logl = -88,8) σ = σ ( x ) α, (Logl = -88,8) 59,43 [<,],78 [,734] 47,3 [<,],43 [,7863] For at estmatere fra modelle med mplct korrekto for heteroskedastctet har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e pæ overesstemmelse mellem de emprske og teoretske fordelg med blot ekelte afvgelser. I formelle test accepteres ormalfordelgsatagelse for de stadardserede resdualer ved det kvadrerede Ch-Goodess-of-ft-test( χ = 4,85, p =,85), 54
56 Kommueres Udgftsbehov og Kolmogorov-Smrov(D =,4, p >,5)-, Aderso-Darlg(A =,46, p >,5)- og Cramer-vo Mses(W =,5, p >,5)-testee. Det ka derfor kokluderes, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. Fgur.. Blokdagram for stadardserede resdualer vægtet model 3 5 P e r c e t STDRES Curve: Normal ( Mu= S gma=) 55
57 Kommueres Udgftsbehov 56. Kotathjælpsudgfter Prmærkommueres kotathjælpsudgfter pr. aldersbestemt udgft er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres kotathjælpsudgfter), er e fukto af 4 forklarede varable, gvet ved adele af bør af elge forsørgere, adele af -59-årge ude beskæftgelse over 5 %, adele af 3-59-årge kke-forskrede ledge og bolgkrteret, samt et kostatled : (..) y = β + βx + β x + β 3x3 + β 4 x4 + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (..), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (..) på baggrud af hver ekelt af de forklarede varable modelle. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet: : = (..) β H : log( ) β + β xk =, k =,,4. e I tabel.. er vst resultatet fra estmato af modelle lgg (..) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at samtlge de forklarede varable har sgfkate parametre på et 5 % sgfkasveau, dvs. dsse tlfælde forkastes hypotese om homoskedastctet og de alteratve hypotese om heteroskedastctet accepteres. Det ka således kostateres, at modelle lgg (..) kke opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable, me er plaget af heteroskedastctet. Det skal dog bemærkes, at afhægghede er af forholdsvs beskede karakter, det ge af parametree tl de forklarede varable har t-værder på over 3, d.v.s. accept af de ekelte hypoteser om, at parametree kke er lg med ul er forholdsvs veuafølsomme for ædrger sgfkasveauet. 56
58 Kommueres Udgftsbehov E kosekves af heteroskedastctet er, at modelles varasestmat kke er mddelret, og at teststørrelsere for parametree er utroværdge. Hermed er der rsko for at medtage varable modelle, der uder et korrekt varasestmat kke vlle have sgfkate parametre, mes adre varable, der uder et korrekt varasestmat vlle have sgfkate parametre, udelukkes fra modelle. I tabel.. agver de rude parateser teststørrelsesværde fra et t-test, mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra t-fordelge. Tabel.. Mdste kvadraters estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 74,7 % - β - Kostatled β - Bør af elge forsørgere β årge u. beskæft. β 3 - Ikke-forskrede ledge β 4 - Bolgkrteret -44,88 (-3,7) [,5] 4,7 (8,79) [,] 9,5 (8,5) [,] 5,4 (5,5) [,],9 (,84) [,87] -, (,89) [,4],9 (,74) [,65],5 (,74) [,448],5 (,8) [,5] 57
59 Kommueres Udgftsbehov 58 På trods af, at afhægghede modelles resdualer og de forklarede varable er af forholsvs beskede karakter forsøges alteratvt avedt e estmatosmetode, der højere grad tager højde for afhægghede varase. Alteratvt opstlles e loglkelhoodfukto, som uder estmato af modelles parametre samtdg korrgerer for heteroskedastctet ved at vægte med e eller flere af de varasstyrede forklarede varable opløftet poteser, der lgeledes estmeres uder maksmerg af loglkelhoodfuktoe. I det ormalfordelte og heteroskedastske tlfælde ka loglkelhoodfuktoe deferes ved, 75 π, = σ (..3) log L = log( ) log( σ ) + ( y ) β x hvor varase σ forvetes at være afhægg af samtlge fre forklarede varable, jf. Parks test, ete ekeltvs eller kombatoer af to, tre eller fre. Uder optmerg af loglkelhoodfuktoe med forskellge kombatoer af de fre varasstyrede forklarede varable opås de højeste loglkelhoodværd ved at lade varase være e fukto af adele af bør af elge forsørgere, adele af -59-årge ude beskæftgelse over 5 % og adele af 3-59-årge kke-forskrede ledge og dermed gvet ved, α α α3 (..4) σ σ ( x x x ) =,,,,3 hvor x, er adele af bør af elge forsørgere, x, er adele af -59- årge ude beskæftgelse over 5 % og x, 3 er adele af 3-59-årge kkeforskrede ledge, og hvor estmatet for σ er gvet ved MK-estmatet. Loglkelhoodfuktoe ka derfor deferes ved, (..5) log L = log( π ) log( σ ), α α ( y β x ) 75 = x = = ( ),3 α α α3 σ x, x, x, 3 75 α x x. =, 58
60 Kommueres Udgftsbehov I det ormalfordelte og homoskedastske tlfælde er maxmum lkelhood metodes estmerede parametre detske med parametree estmeret uder mdste kvadraters metode, og loglkelhoodfuktoe er dette tlfælde gvet ved, 75 [ y ] π. σ (..6) log L = log( ) log( σ ) ( β x ) = Estmato af loglkelhoodfuktoere udføres matrceprogrammet IML SAS. De avedte procedure tager udgagspukt et bereggsmodel, hvor heholdsvs modelle, varasfuktoe og loglkelhoodfuktoe specfceres. Dette bereggsmodul kaldes af e kke-leær optmergsrute, NPLDD (No-Lear Double Dogleg Optmzato), der på bagrud af talpukter, evetuelle parameterrestrktoer, determatoskrterer og parameterkotrol fder maksmum for loglkelhoodfuktoere. Test af, hvorvdt ML-estmatere er lg med ul foretages ved Waldteststørrelse, (..7) W = ( Rψˆ r) R Σ ( ψˆ ) [ R] ( Rψˆ r) ~ χ Et estmat af kovarasmatrce bereges ved hjælp af e uderrute IML, NLPFDD (No-Lear Programmg Fte Dfferece Approxmato), der på baggrud af loglkelhoodfuktoe og de estmerede parametre bereger de umerske. ordes afledede og Hessematrce. Estmatet for kovarasmatrce, Σ ( ψˆ ), er herefter gvet ved de verterede og egatve Hessematrce. I to-sdet test af, hvorvdt de ekelte parameter er lg med ul, H ψ ˆ, H : ψˆ er Wald-testet gvet ved, : =. (..8) H ψ ˆ, H : ψˆ : : = der er stadard ormalfordelt. W ψˆ = ~ N(, ), var ( ψˆ ) 59
61 Kommueres Udgftsbehov 6 Tabel.. Maxmum lkelhood estmato af uvægtet og vægtet model Loglkelhood uder σ = σ σ = σ x ormalfordelge α α α3 ( x x ) R værd 74,7 % 74,77 % Loglkelhoodværd -54,7-536,75,,,3 β - Kostatled -44,88 (-3,7) [,5] β - Bør af elge forsørgere 4,7 (8,79) [,] β årge u. beskæftgelse 9,5 (8,5) [,] β 3 - Ikke-forskrede ledge 5,4 (5,5) [,] β 4 - Bolgkrteret,9 (,84) [,87] -49,95 (-3,36) [,4] 4,3 (8,9) [,] 9,5 (9,76) [,48] 5,7 (5,49) [,],9 (3,) [,4] α - Potes : Elge forsørgere - -,64 (,7) [,9] α - Potes : Ude beskæftgelse -,4 (,69) [,456] α 3 - Potes : Ikke-forskrede -,5 (,4) [,7] LR = (-536,75 - (-54,7)) = 6,64 ~ χ ( 3) <,36 6
62 Kommueres Udgftsbehov I tabel.. ses resultatere fra estmato af loglkelhoodfuktoe uder e atagelse om heholdsvs homoskedastctet, σ = σ, og hetero- α α α3 skedastctet, σ σ ( x x x ) =. Som tdlgere ævt er maxmum,,,3 lkelhood metode det homoskedastske og ormalfordelte tlfælde detsk med mdste kvadraters metode, hvlket resulterer at parametre, teststørrelsesværder og sgfkassadsylgheder tabel.. (. koloe) og tabel.. (. koloe) er detske. I tabel.. agver de rude parateser teststørrelsesværde fra testet lgg (..8), mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra stadard ormalfordelge. Det skal bemærkes, at såfremt gve parametre lgger på græse tl det sgfkate eller hvs potesparametree har umersk store værder uderstøttes Wald-teststørrelse af et lkelhood rato test. De højeste loglkelhoodværd, gvet ved -536,75, opås estmatoe uder atagelse om heteroskedastctet, mes loglkelhoodværde det homoskedastske tlfælde er på -54,7. I tabelles ederste række testes med et lkelhood rato test om dsse to loglkelhoodværder er lg med hade, hvlket med e sgfkassadsylghed på,36 afvses. Det ka således kostateres, at loglkelhoodfuktoe uder atagelse om heteroskedastctet har e aelse bedre loglkelhoodværd, og dermed de forholdsvs bedste tlpasg. Forbedrge er dog beskede, hvlket ka heføres tl de beskede grad af heteroskedstctet og dermed det beskede behov for korrekto af modelle. I det heteroskedastske tlfælde er varasspecfkatoe som vst gvet ved α α α3 σ = σ ( x, x, x,3 ) og tabelles æstsdste række ses, at potesparametree er estmeret tl heholdsvs -,64,,4 og,5, hvorved varasspecfkatoe mere præcst er gvet ved, (..9) σ σ,64 = ( Elge forsørgere,4,5 Ude beskæftgelse Ikke forskrede ledge ). Estmato uder dee formulerg medfører, forhold tl estmato uder det homoskedastske tlfælde, tl mdre ædrger parameterestmatere, mest markat llustreret kostatleddet. Test for homoskedastctet de to loglkelhoodmodeller er vst tabel..3 6
63 Kommueres Udgftsbehov 6 og sker ved heholdsvs Breusch-Paga og Koeker-Basset Lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. Testet ka geemføres ved, (..) LM = e ESS = z. e e Deferes Z ved e ( P +) -matrx beståede af observatossæt af (, ) og deferes g som e vektor beståede af g = e ( e e ) ka z Breusch-Paga LM-testet specfceres ved, ( Z g ) (..) LM = g Z( Z Z). - Z = (, z ),, (, z ) N ( P+) [ ] K. [ ] - g = e ( e e ), e ( e e ),K. I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (..) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e.. 6
64 Kommueres Udgftsbehov - = ( ) ( ) e e, K, e, u. - = ( ) (, K,). - e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved p. (..3) Uder H er LM ( p) ~ χ. Ved geemgag af tabel..3 s ederste række ka kostateres, at korrekto af varase ved lgg (..9) fjerer e del, me kke alt af de kostaterede heteroskedastctet fra modelle og hypotese om homoskedastctet accepteres kke på 5 % sgfkasveau. I tlfældet hvor varase kke korrgeres for afhægghede tl de forklarede varable, d.v.s. hvor σ = σ, afvses hypotese om homoskedastctet mdlertd edu stærkere. Tabel..3 Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM σ = σ (Logl = -54,7) σ = σ ( x ) α, (Logl = -536,75) 37,4 [<,] 8, [<,] 3,9 [<,] 7,5 [,4] Da varasestmatet modelle med mplct korrekto for 63
65 Kommueres Udgftsbehov 64 heteroskedastctet relatvt har de mdste grad af afhægghed resdualere og dermed de højeste grad af mddelrethed varasestmatet foretrækkes at avede dee model aalyse. For at estmatere fra modelle med mplct korrekto for heteroskedastctet har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e ogelude pæ overesstemmelse mellem de emprske og teoretske fordelg, dog med e markat afvgelse,-blokke. Fgur.. Blokdagram for stadardserede resdualer vægtet model 5 4 P e r c e t STDRES Curve: Normal ( Mu= S gma=) I formelle test af ormalfordelgsatagelse for de stadardserede resdualer afvses hypotese ved det kvadrerede Ch-Goodess-of-fttest( χ = 4,39, p <,), me accepteres ved Kolmogorov-Smrov(D =,7, p =,4)-testet, Aderso-Darlg(A =,9, p =,396)-testet og Cramer-vo Mses(W =,7, p =,38)-testet. Det må derfor ases for mest sadsylgt, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. 64
66 Kommueres Udgftsbehov.3 Ældreudgfter Prmærkommueres ældreudgfter pr. vægtet ældre er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres ældreudgfter), er e fukto af 3 forklarede varable, gvet ved dummy-varable for små/store bykommuer, adele af persoer udlejgsbolger og adele af persoer over 65 år, samt et kostatled: (.3.) y = β + βd + β x + β 3 x3 + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (.3.), hvor der foretages regresso på de kvadrerede resdualer fra estmato af lgg (.3.) på baggrud af hver ekelt af de forklarede varable modelle, dummy-varable dog udtaget. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet: (.3.) H β : e = β + βxk, k =,. : = I tabel.3. er vst resultatet fra estmato af modelle lgg (.3.) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at adele af persoer over 65 år har e sgfkat parameter på 5 % sgfkasveau, og det ka således kostateres, at modelle lgg (.3.) kke umddelbart opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable. 65
67 Kommueres Udgftsbehov 66 Tabel.3. Mdste kvadraters estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y e R værd 39,34 % - β - Kostatled β - Dummy-bykommuer β - Persoer udlejgsbolger β 3 - Ældre over 65 år , (4,33) [,].735,98 (3,) [,6] 54,85 (3,36) [,9] -6.77, (-,99) [,] ,5 (,9) [,994] -6.E7 (-,6) [,97] Yderlgere test for homoskedastctet er vst tabel.3. og sker ved heholdsvs Breusch-Paga og Koeker-Basset Lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. Testet ka geemføres ved, (.3.3) LM = e ESS = z. e e Deferes Z ved e ( P +) -matrx beståede af observatossæt af 66
68 Kommueres Udgftsbehov (, ) og deferes g som e vektor beståede af g e ( e e ) z Breusch-Paga LM-testet specfceres ved, ( Z g ) (.3.4) LM = g Z( Z Z). = ka - Z = (, z ),, (, z ) N ( P+) [ ] K. [ ] - g = e ( e e ), e ( e e ),K. I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (.3.5) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e - ( ) ( ) K u = e e,, e., - = ( ) (, K,)... - e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved 67
69 Kommueres Udgftsbehov 68 p. (.3.6) Uder H er LM ( p) ~ χ. Ved geemgag af tabel.3. ka kostateres, at hypotese om homoskedastctet lgeledes kke accepteres på 5 % sgfkasveau ved Breusch-Paga testet, det sgfkassadsylghede er 3,57 %. Hypotese om homoskedastctet accepteres dog af Koeker-Basset testet på 5 % sgfkasveau. Bereges yderlgere et Goldfeldt-Quadt test opås e F- teststørrelse på,4 og e tlhørede sgfkassadsylghed på 4,8 %. Det ka således kke udelukkes, at modelle e vs grad er plaget af heteroskedastctet. Tabel.3. Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM LM = e ESS = z e e,3 [,357] 7,67 [,43] På trods af, at afhægghede modelles resdualer og de forklarede varable gvet vs er af forholsvs beskede karakter forsøges alteratvt avedt e mere robust estmatosmetode, og der opstlles e loglkelhoodfukto, som uder estmato af modelles parametre, samtdg korrgerer for heteroskedastctet ved at vægte med e eller flere af de varasstyrede forklarede varable opløftet poteser, der lgeledes estmeres uder maksmerg af loglkelhoodfuktoe. I det ormalfordelte og heteroskedastske tlfælde ka loglkelhoodfuktoe deferes ved, 75 π, = σ (.3.7) log L = log( ) log( σ ) + ( y ) β x 68
70 Kommueres Udgftsbehov hvor varase σ ka være afhægg af begge de forklarede varable ete ekeltvs eller kombato. Uder optmerg af loglkelhoodfuktoe med forskellge kombatoer opås de højeste loglkelhoodværd ved at lade varase være e fukto af både adele af persoer udlejgsbolger og adele af persoer over 65 år og dermed gvet ved, α α3 (.3.8) σ σ ( x x ) =,,,3 hvor x, er adele af persoer udlejgbolger og x, 3 er adele af persoer over 65 år, og hvor estmatet for σ er gvet ved mdste kvadraters estmatet. Loglkelhoodfuktoe ka derfor deferes ved, 75 x, = (.3.9) log L = log( π ) log( σ ) α α ( y β x ) x = = ( ),3 α α3 σ x, x, 3 I det ormalfordelte og homoskedastske tlfælde er maxmum lkelhood metodes estmerede parametre detske med parametree estmeret uder mdste kvadraters metode, og loglkelhoodfuktoe er dette tlfælde gvet ved, (.3.) log L = log( ) log( σ ) ( β x ) 75 [ y ] π. σ = Estmato af loglkelhoodfuktoere udføres matrceprogrammet IML SAS. De avedte procedure tager udgagspukt et bereggsmodel, hvor heholdsvs modelle, varasfuktoe og loglkelhoodfuktoe specfceres. Dette bereggsmodul kaldes af e kke-leær optmergsrute, NPLDD (No-Lear Double Dogleg Optmzato), der på bagrud af talpukter, evetuelle parameterrestrktoer, determatoskrterer og parameterkotrol fder maksmum for loglkelhoodfuktoere. 69
71 Kommueres Udgftsbehov 7 Test af, hvorvdt ML-estmatere er lg med ul foretages ved Waldteststørrelse, (.3.) W = ( Rψˆ r) R Σ ( ψˆ ) [ R] ( Rψˆ r) ~ χ Et estmat af kovarasmatrce bereges ved hjælp af e uderrute IML, NLPFDD (No-Lear Programmg Fte Dfferece Approxmato), der på baggrud af loglkelhoodfuktoe og de estmerede parametre bereger de umerske. ordes afledede og Hessematrce. Estmatet for kovarasmatrce, Σ ( ψˆ ), er herefter gvet ved de verterede og egatve Hessematrce. I to-sdet test af, hvorvdt de ekelte parameter er lg med ul, H ψ ˆ, H : ψˆ er Wald-testet gvet ved, : =. (.3.) H ψ ˆ, H : ψˆ : : = W ψˆ = ~ N(, ), var ( ψˆ ) der er stadard ormalfordelt. I tabel.3.3 er agvet resultatere fra estmato af loglkelhoodfuktoe uder e atagelse om heholdsvs α α3 homoskedastctet, σ = σ, og heteroskedastctet, σ = σ ( x, x,3 ). Som tdlgere ævt er maxmum lkelhood metode det homoskedastske og ormalfordelte tlfælde detsk med mdste kvadraters metode, hvlket resulterer at parametre, teststørrelsesværder og sgfkassadsylgheder tabel.3. (. koloe) og tabel.3.3 (. koloe) er detske. I tabel.3.3 agver de rude parateser teststørrelsesværde fra testet lgg (.3.), mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra stadard ormalfordelge. Det skal bemærkes, at såfremt gve parametre lgger på græse tl det sgfkate eller hvs potesparametree har umersk store værder uderstøttes Waldteststørrelse af et lkelhood rato test. 7
72 Kommueres Udgftsbehov Tabel.3.3 Maxmum lkelhood estmato af uvægtet og vægtet model Loglkelhood uder σ = σ σ = σ ormalfordelge α α3 ( x x ) R værd 39,34 % 39,6 % Loglkelhoodværd -.58, ,5,,3 β - Kostatled , (4,33) [,] β - Dummy-varabel bykommuer.735,98 (3,) [,6] β - Persoer udlejgsbolger 54,85 (3,36) [,9] β 3 - Persoer over 65 år -6.77, (-,99) [,] 37.5, (39,9) [,].79,4 (3,55) [,] 48,69 (3,44) [,3] -64.5, (-,9) [,] α - Potes : Udlejgsbolger - -,43 (,74) [,3] α 3 - Potes : Persoer over 65 år - -,67 (,69) [,35] LR = (-.577,5 - (-.58,3)) = 7,57 ~ χ ( 3) <,7 7
73 Kommueres Udgftsbehov 7 De højeste loglkelhoodværd, gvet ved -.577,5, opås estmatoe uder atagelse om heteroskedastctet, mes loglkelhoodværde det homoskedastske tlfælde er på -.58,3. I tabelles ederste række testes med et lkelhood rato test om dsse to loglkelhoodværder er lg med hade, hvlket med e sgfkassadsylghed på,7 % afvses på 5 % sgfkasveau. Det ka således kostateres, at loglkelhoodfuktoe uder atagelse om heteroskedastctet har e aelse bedre loglkelhoodværd og dermed de forholdsvs bedste tlpasg. I det heteroskedastske tlfælde er varasspecfkatoe som vst gvet ved α α3 σ = σ ( x, x,3 ) og tabelles æstsdste række ses, at potesparametree er estmeret tl heholdsvs -,4 og -,67, hvorved varasspecfkatoe mere præcst er gvet ved, (.3.3) σ,4 = σ ( Persoer udlejgsbolger,67 Adel persoer over 65 år ). Estmato uder dee formulerg medfører, forhold tl estmato uder det homoskedastske tlfælde, tl ædrger parameterestmatere. Tabel.3.4 Test for homoskedastctet korrgeret aalyse Breusch-Paga LM Koeker-Basset LM LM = e ESS = z e e,9 [,578],53 [,639] I tabel.3.4 testes for homoskedastctet de korrgerede model og ved geemgag ka kostateres, at hypotese om homoskedastctet u accepteres stærkt begge test. Da varasestmatet modelle med mplct korrekto for heteroskedastctet således vl have de højeste grad af mddelrethed foretrækkes at avede dee model aalyse. 7
74 Kommueres Udgftsbehov For at estmatere fra modelle har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.3. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e pæ overesstemmelse mellem de emprske og teoretske fordelg med blot e mdre afvgelse -,6-blokke. Fgur.3. Blokdagram for stadardserede resdualer vægtet model 5 P e r c e t St udet zed Res dual Curve: Normal ( Mu= S gma=) I formelle test af ormalfordelgsatagelse for de stadardserede resdualer accepteres hypotese ved det kvadrerede Ch-Goodess-of-fttest( χ = 9,6, p =,5654), Kolmogorov-Smrov(D =,4, p >,5)-testet, Aderso-Darlg(A =,8, p >,5)-testet og Cramer-vo Mses(W =,5, p >,5)-testet. Det må derfor ases for mest sadsylgt, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. 73
75 Kommueres Udgftsbehov 74.4 Folkeskoleudgfter Prmærkommueres folkeskoleudgfter pr 7-6-årg er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres folkeskoleudgfter), er e fukto af 5 forklarede varable, gvet ved laddstrktsgrade, udskrvgsgrudlaget, adele af bør af elge forsørgere, adele af udlædge fra 3. verdeslade og de procetvse ædrg de 7-6-årge mellem 99 og 996, samt et kostatled : (.4.) y = β + βx + β x + β 3x3 + β 4 x4 + β 5x5 + ε for =,,..., 75., E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (.4.), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (.4.) på baggrud af hver ekelt af de forklarede varable modelle. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet: (.4.) β : = log H : ( e ) βxk = β +, k =,,5. I tabel.4. er vst resultatet fra estmato af modelle lgg (.4.) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at laddstrktsgrade, udskrvgsgrudlaget og adele af bør af elge forsørgere har sgfkate parametre, dvs. dsse tlfælde forkastes hypotese om homoskedastctet og de alteratve hypotese om heteroskedastctet accepteres. Det ka således kostateres, at modelle lgg (.4.) kke opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable, me er plaget af heteroskedastctet. 74
76 Kommueres Udgftsbehov Tabel.4. Mdste kvadrater estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 49,4 % - β - Kostatled β - Laddstrktsgrad β - Udskrvgsgrudlag β 3 - Bør af elge forsørgere β 4 - Adel udlædge β 5 - Ædrg 7-6-årge.6 (7,85) [,] 5,96 (,77) [,785],7 (8,8) [,] 44, (5,6) [,] 635,67 (3,5) [,5] -35, (-4,68) [,] -,8 (3,46) [,6],4 (4,8) [,],5 (4,) [,],6 (,77) [,773] -, (-,8) [,9343] E kosekves af heteroskedastctet er, at modelles varasestmat kke er mddelret, og at teststørrelsere for parametree er utroværdge. Hermed er der rsko for at medtage varable modelle, der uder et korrekt 75
77 Kommueres Udgftsbehov 76 varasestmat kke vlle have sgfkate parametre, mes adre varable, der uder et korrekt varasestmat vlle have sgfkate parametre, udelukkes fra modelle. I tabel.4. agver de rude parateser teststørrelsesværde fra et t-test, mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra t-fordelge. E estmatosmetode, som tager højde for afhægghede modelles resdualer og de forklarede varable, er således påkrævet, og alteratvt opstlles e loglkelhoodfukto, der uder estmato af modelles parametre samtdg korrgerer for heteroskedastctet ved at vægte med e eller flere af de varasstyrede forklarede varable opløftet poteser, der lgeledes estmeres uder maksmerg af loglkelhoodfuktoe. I det ormalfordelte og heteroskedastske tlfælde ka loglkelhoodfuktoe deferes ved, 75 π, = σ (.4.3) log L = log( ) log( σ ) + ( y ) β x hvor varase σ forvetes at være afhægg af laddstrktsgrade, udskrvgsgrudlaget og adele af bør af elge forsørgere, jf. Parks test, ete ekeltvs eller kombatoer af to eller tre. Uder optmerg af loglkelhoodfuktoe med forskellge kombatoer af de tre varasstyrede forklarede varable opås de højeste loglkelhoodværd ved at lade varase være e fukto af samtlge de pågældede varable og dermed gvet ved, α α α3 (.4.4) σ σ ( x x x ) =,,,,3 hvor x er laddstrktsgrade,, x er udskrvgsgrudlaget og, x er, 3 adele af bør af elge forsørgere, og hvor estmatet for σ er gvet ved mdste kvadraters estmatet. Loglkelhoodfuktoe ka derfor deferes ved, (.4.5) log L = log( π) log( σ ) x, α 75 = α 75 = x, 76
78 Kommueres Udgftsbehov α ( y β x ) x = = ( ),3 α α α3 σ x, x, x, 3 I det ormalfordelte og homoskedastske tlfælde er maxmum lkelhood metodes estmerede parametre detske med parametree estmeret uder mdste kvadraters metode, og loglkelhoodfuktoe er dette tlfælde gvet ved, (.4.6) log L = log( ) log( σ ) ( β x ). π. σ 75 [ y ] Estmato af loglkelhoodfuktoere udføres matrceprogrammet IML SAS. De avedte procedure tager udgagspukt et bereggsmodel, hvor heholdsvs modelle, varasfuktoe og loglkelhoodfuktoe specfceres. Dette bereggsmodul kaldes af e kke-leær optmergsrute, NPLDD (No-Lear Double Dogleg Optmzato), der på bagrud af talpukter, evetuelle parameterrestrktoer, determatoskrterer og parameterkotrol fder maksmum for loglkelhoodfuktoere. Test af, hvorvdt ML-estmatere er lg med ul foretages ved Waldteststørrelse, (.4.7) W = ( Rψˆ r) R Σ ( ψˆ ) = [ R] ( Rψˆ r) ~ χ Et estmat af kovarasmatrce bereges ved hjælp af e uderrute IML, NLPFDD (No-Lear Programmg Fte Dfferece Approxmato), der på baggrud af loglkelhoodfuktoe og de estmerede parametre bereger de umerske. ordes afledede og Hessematrce. Estmatet for kovarasmatrce, Σ ( ψˆ ), er herefter gvet ved de verterede og egatve Hessematrce. I to-sdet test af, hvorvdt de ekelte parameter er lg med ul, H ψ ˆ, H : ψˆ er Wald-testet gvet ved, : =. (.4.8) H ψ ˆ, H : ψˆ : : = ψˆ W = ~ N(, ), var ( ψˆ ) 77
79 Kommueres Udgftsbehov 78 der er stadard ormalfordelt. I tabel.4. agver de rude parateser teststørrelsesværde fra testet lgg (.4.8), mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra stadard ormalfordelge. Det skal bemærkes, at såfremt gve parametre lgger på græse tl det sgfkate eller hvs potesparametree har umersk store værder uderstøttes Wald-teststørrelse af et lkelhood rato test. I tabel.4. er agvet resultatere fra estmato af loglkelhoodfuktoe uder e atagelse om heholdsvs homoskedastctet, σ = σ, og α α α3 heteroskedastctet, σ σ ( x x x ) =. Som tdlgere ævt er,, maxmum lkelhood metode det homoskedastske og ormalfordelte tlfælde detsk med mdste kvadraters metode, hvlket resulterer at parametre, teststørrelsesværder og sgfkassadsylgheder tabel.4. (. koloe) og tabel.4. (. koloe) er detske. De højeste loglkelhoodværd, gvet ved -.644,7, opås estmatoe uder atagelse om heteroskedastctet, mes loglkelhoodværde det homoskedastske tlfælde er på -.657,63. I tabelles ederste række testes med et lkelhood rato test om dsse to loglkelhoodværder er lg med hade, hvlket med e sgfkassadsylghed på, % afvses på 5 % sgfkasveau. Det ka således kostateres, at loglkelhoodfuktoe uder atagelse om heteroskedastctet har e bedre loglkelhoodværd og dermed de forholdsvs bedste tlpasg. I det heteroskedastske tlfælde er varasspecfkatoe som vst gvet ved α α α3 σ = σ ( x, x, x,3 ) og tabelles æstsdste række ses, at potesparametree er estmeret tl heholdsvs -,5, -,7 og,7, hvorved varasspecfkatoe mere præcst er gvet ved,,3 (.4.9) σ,5 = σ ( Laddstrktsgrade,7 Udskrvgsgrudlaget Elge forsørgere,7 ). Estmato uder dee formulerg medfører, forhold tl estmato uder det homoskedastske tlfælde, tl ædrger parameterestmatere, mest markat llustreret kostatleddet, laddstrktsgrade og adele af udlædge fra 3. verdeslade, og tl ædrger teststørrelsesværdere. 78
80 Kommueres Udgftsbehov Tabel.4. Maxmum lkelhood estmato af uvægtet og vægtet model Loglkelhood uder σ = σ σ = σ x ormalfordelge α α α3 ( x x ) R værd 49,4 % 5,8 % Loglkelhoodværd -657,63-644,7,,,3 β - Kostatled β - Laddstrktsgrad β - Udskrvgsgrudlag β 3 - Bør af elge forsørgere β 4 - Adel udlædge.6 (7,7) [,] 5,96 (,73) [,48],7 (8,) [,] 44, (5,) [,] 635,68 (3,5) [,5] (5,35) [,] 39,65 (,89) [,9], (7,6) [,] 4,6 (4,8) [,] 484,4 (,5) [,58] β 5 - Ædrg 7-6-årge -35, (-4,65) [,] α - Potes : Laddstrktsgrad - α - Potes : Udskrvgsgrudl. - α 3 - Potes : Elge forsørgere - -,59 (-4,79) [,] -,5 (-3,7) [,] -,7 (-,64) [,4],7 (,) [,3] LR = (-644,7 - (-657,63)) = 7, ~ χ ( 3) =, 79
81 Kommueres Udgftsbehov 8 Test for homoskedastctet de to lkelhoodmodeller er vst tabel.4.3 og sker ved heholdsvs Breusch-Paga og Koeker-Basset lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. Testet ka geemføres ved, (.4.) LM = e ESS = z. e e Deferes Z ved e ( P +) -matrx beståede af observatossæt af (, ) og deferes g som e vektor beståede af g = e ( e e ) ka z Breusch-Paga LM-testet specfceres ved, ( Z g ) (.4.) LM = g Z( Z Z). - Z = (, z ),, (, z ) N ( P+) [ ] K. [ ] - g = e ( e e ), e ( e e ),K. I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (.4.) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e.. 8
82 Kommueres Udgftsbehov - ( ) ( ) e e K e u =,,., - = ( ) (, K,). - e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved p. (.4.3) Uder H er LM ( p) ~ χ. Ved geemgag af tabel.4.3 s ederste række ka kostateres, at korrekto af varase ved lgg (.4.9) fjerer størstedele af de kostaterede heteroskedastctet fra modelle og hypotese om homoskedastctet accepteres med sgfkassadsylgheder på heholdsvs,36 % og 3,63 %. I tlfældet hvor varase kke korrgeres for afhægghede tl de forklarede varable, d.v.s. hvor σ = σ, afvses hypotese om homoskedastctet stærkt, det sgfkassadsylghede er mdre e, % begge test og de alteratve hypotese om heteroskedastctet accepteres. Tabel.4.3 Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM σ = σ (Logl = -657,6) σ = σ α α 3 ( x x x ) α,,,3 (Logl = -644,) 74,99 [<,] 6,3 [,36] 64,85 [<,] 3,46 [,363] 8
83 Kommueres Udgftsbehov 8 Da varasestmatet modelle med mplct korrekto for heteroskedastctet vl have de højeste grad af mddelrethed foretrækkes at avede dee model aalyse. For at estmatere fra modelle med mplct korrekto for heteroskedastctet har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.4. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e ogelude pæ overesstemmelse mellem de emprske og teoretske fordelg, dog med e markat afvgelse,3 blokke. Fgur.4. Blokdagram for stadardserede resdualer vægtet model 35 3 P e r c e t STDRES Curve: Normal ( Mu= S gma=) I formelle test af ormalfordelgsatagelse for de stadardserede resdualer afvser det kvadrerede Ch-Goodess-of-ft-test( χ = 3,8, p =,8), mes atagelse accepteres på 5 % sgfkasveau ved Kolmogorov-Smrov(D =,8, p =,55)-testet, Aderso-Darlg(A =,7, p =,357)-testet og Cramer-vo Mses(W =,337, p =,79)- testet. Det må derfor ases for mest sadsylgt, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. 8
84 Kommueres Udgftsbehov.5 Bolgskrgs- og bolgydelsesudgfter.5. Bolgskrgsudgfter Prmærkommueres bolgskrgsudgfter pr. -59-årg er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres bolgskrgsudgfter), er e fukto af 5 forklarede varable, gvet ved dummy-varable for hovedstadskommuer og små/store bykommuer, adele af udlædge fra 3. verdeslade, adele af bør af elge forsørgere og bolgkrteret, samt et kostatled : (.5.) y = β + βd + β D + β 3x3 + β 4 x4 + β 5x5 + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (.5.), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (.5.) på baggrud af hver ekelt af de forklarede varable modelle, dummyvarable dog udtaget. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet : (.5.) β : = H : log( e ) β + βxk =, k =,,3. I tabel.5. er vst resultatet fra estmato af modelle lgg (.5.) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at adele af bør af elge forsørgere og bolgkrteret har sgfkate parametre på et 5 % sgfkasveau, dvs. dsse tlfælde forkastes hypotese om homoskedastctet og de alteratve hypotese om heteroskedastctet accepteres. Det ka således kostateres, at modelle lgg (.5.) kke opfylder atagelse om uafhægghed mellem resdualere og de 83
85 Kommueres Udgftsbehov 84 forklarede varable, me er plaget af heteroskedastctet. Det skal dog bemærkes, at afhægghede er af forholdsvs beskede karakter, det ge af parametree tl de forklarede varable har t-værder på over 3, d.v.s. accept af de ekelte hypoteser om, at parametree kke er lg med ul er forholdsvs veuafølsomme for ædrger sgfkasveauet. Tabel. Mdste kvadraters estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 77,97 % - β - Kostatled β - Dummy:Hovedstadskom. β - Dummy:Bykommuer β 3 - Adel udlædge β 4 - Elge forsørgere β 5 - Bolgkrteret -36, (-3,5) [,5] 6,3 (,58) [,5] 38,8 (3,58) [,4],4 (4,77) [,] 4,6 (,7) [,] 3,54 (5,86) [,] ,9 (,) [,993],9 (,46) [,45],4 (,6) [,48] 84
86 Kommueres Udgftsbehov E kosekves af heteroskedastctet er, at modelles varasestmat kke er mddelret, og at teststørrelsere for parametree er utroværdge. Hermed er der rsko for at medtage varable modelle, der uder et korrekt varasestmat kke vlle have sgfkate parametre, mes adre varable, der uder et korrekt varasestmat vlle have sgfkate parametre, udelukkes fra modelle. I tabel.5. agver de rude parateser teststørrelsesværde fra et t-test, mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra t-fordelge. På trods af, at afhægghede modelles resdualer og de forklarede varable er af forholdsvs beskede karakter forsøges avedt e estmatosmetode, der højere grad tager højde for varasafhægghede. Alteratvt opstlles e loglkelhoodfukto, som uder estmato af modelles parametre samtdg korrgerer for heteroskedastctet ved at vægte med e eller flere af de varasstyrede forklarede varable opløftet poteser, der lgeledes estmeres uder maksmerg af loglkelhoodfuktoe. I det ormalfordelte og heteroskedastske tlfælde ka loglkelhoodfuktoe deferes ved, 75 π, = σ (.5.3) log L = log( ) log( σ ) + ( y ) β x hvor varase σ forvetes at være afhægg af adele af bør af elge forsørgere og bolgkrteret, jf. Parks test, ete ekeltvs eller kombato. Uder optmerg af loglkelhoodfuktoe med forskellge kombatoer af de tovarasstyrede forklarede varable opås de højeste loglkelhoodværd ved at lade varase være e fukto af såvel adele af bør af elge forsørgere som bolgkrteret og dermed gvet ved, α4 α4 (.5.4) σ σ ( x x ) =,,4,5 hvor x, 4 er adele af bør af elge forsørgere og x, 5 er bolgkrteret, og hvor estmatet for σ er gvet ved mdste kvadraters estmatet. Loglkelhoodfuktoe ka derfor deferes ved, 85
87 Kommueres Udgftsbehov 86 α 75 x,4 = 4 (.5.5) log L = log( π ) log( σ ) α ( y β x ) x = = ( ),5 α4 α5 σ x,4 x, 5 I det ormalfordelte og homoskedastske tlfælde er maxmum lkelhood metodes estmerede parametre detske med parametree estmeret uder mdste kvadraters metode, og loglkelhoodfuktoe er dette tlfælde gvet ved, (.5.6) log L = log( ) log( σ ) ( β x ) 75 [ y ] π. σ = Estmato af loglkelhoodfuktoere udføres matrceprogrammet IML SAS. De avedte procedure tager udgagspukt et bereggsmodel, hvor heholdsvs modelle, varasfuktoe og loglkelhoodfuktoe specfceres. Dette bereggsmodul kaldes af e kke-leær optmergsrute, NPLDD (No-Lear Double Dogleg Optmzato), der på bagrud af talpukter, evetuelle parameterrestrktoer, determatoskrterer og parameterkotrol fder maksmum for loglkelhoodfuktoere. Test af, hvorvdt ML-estmatere er lg med ul foretages ved Waldteststørrelse, (.5.7) W = ( Rψˆ r) R Σ ( ψˆ ) [ R] ( Rψˆ r) ~ χ Et estmat af kovarasmatrce bereges ved hjælp af e uderrute IML, NLPFDD (No-Lear Programmg Fte Dfferece Approxmato), der på baggrud af loglkelhoodfuktoe og de estmerede parametre bereger de umerske. ordes afledede og Hessematrce. Estmatet for kovarasmatrce, Σ ( ψˆ ), er herefter gvet ved de verterede og egatve Hessematrce. I to-sdet test af, hvorvdt de ekelte parameter er lg med ul, H ψ ˆ, H : ψˆ er Wald-testet gvet ved, : =. 86
88 Kommueres Udgftsbehov (.5.8) H ψ ˆ, H : ψˆ : : = W ψˆ = ~ N(, ), var ( ψˆ ) der er stadard ormalfordelt. I tabel.5. agver de rude parateser teststørrelsesværde fra testet lgg (.5.8), mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra stadard ormalfordelge. Det skal bemærkes, at såfremt gve parametre lgger på græse tl det sgfkate eller hvs potesparametree har umersk store værder uderstøttes Wald-teststørrelse af et lkelhood rato test. I tabel.5. er agvet resultatere fra estmato af loglkelhoodfuktoe uder e atagelse om heholdsvs homoskedastctet, σ = σ, og α4 α5 heteroskedastctet, σ σ ( x x ) =. Som tdlgere ævt er maxmum,4,5 lkelhood metode det homoskedastske og ormalfordelte tlfælde detsk med mdste kvadraters metode, hvlket resulterer at parametre, teststørrelsesværder og sgfkassadsylgheder tabel.5. (. koloe) og tabel.5. (. koloe) er detske. De to loglkelhoodværder tabel.5. er æste detske, gvet ved heholdsvs -476,55 estmato det heteroskedastske tlfælde og - 476,99 estmato det homoskedastske tlfælde. I tabelles ederste række bekræftes dette med et lkelhood rato test, der tester om de to loglkelhoodværder er lg med hade, hvlket med e sgfkassadsylghed på 64,4 % klart accepteres. Det ka således kostateres, at loglkelhoodværde uder e atagelse om heteroskedastctet statstsk set er lg med loglkelhoodværde uder e atagelse om homoskedastctet, og dermed opås ge forbedrg ved avedelse af modelle lgg (.5.5). Dette er edvdere llustreret ved, at de estmerede potesparametre (,9 og -,3) varasspecfkatoe,,9,3 (.5.9) σ ( Elge forsørgere Bolgkrteret ) = σ, kke er sgfkate og dermed statstsk set kke har oge forklargskraft. Estmato uder dee formulerg medfører, forhold tl estmato uder det homoskedastske tlfælde, tl mdre ædrger parameterestmatere, mest markat llustreret kostatleddet. 87
89 Kommueres Udgftsbehov 88 Tabel.5. Maxmum lkelhood estmato af uvægtet og vægtet model Loglkelhood uder σ = σ σ = σ ormalfordelge α4 α5 ( x x ) R værd 77,97 % 78,37 % Loglkelhoodværd -476,98-476,55,4,5 β - Kostatled β - Dummy:Hovedstadskom. β - Dummy:Bykommuer β 3 - Adel udlædge β 4 - Elge forsørgere β 5 - Bolgkrteret -36, (-3,5) [,5] 6,3 (,58) [,5] 38,8 (3,58) [,4],4 (4,77) [,] 4,6 (,7) [,] 3,54 (5,54) [,] -34,53 (-,87) [,] 7,8 (,66) [,39] 37,98 (3,47) [,3],65 (4,84) [,] 5,5 (,96) [,] 3,9 (4,44) [,] α - Potes : Elge forsørgere α - Potes : Bolgkrteret -,9 (,9) [,798] - -,3 (,89) [,86] LR = (-476,55 - (-476,99)) =,88 ~ χ ( ) <,644 88
90 Kommueres Udgftsbehov Da maxmum lkelhood estmato med mplct korrekto for heteroskedastctet således kke forbedrer tlpasge tl de observerede værder forhold tl modelle lgg (.5.) estmeret med mdste kvadraters estmato bbeholdes MK-modelle, kke mdst ud fra e betragtg om, at afhægghede mellem dee models resdualer og de forklarede varable er af forholsvs beskede karakter. For at estmatere fra MK-modelle har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.5. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e pæ overesstemmelse mellem de emprske og teoretske fordelg. Fgur.5. Blokdagram for stadardserede resdualer vægtet model 5 P e r c e t St udet zed Res dual Curve: Normal ( Mu= S gma=) I formelle test af ormalfordelgsatagelse for de stadardserede resdualer afvses hypotese svagt på 5 % sgfkasveau ved det kvadrerede Ch-Goodess-of-ft-test( χ = 8,6, p =,344), me accepteres ved Kolmogorov-Smrov(D =,6, p >,5)-testet, Aderso- Darlg(A =,79, p >,5)-testet og Cramer-vo Mses(W =,9, p >,5)-testet. Det må derfor ases for mest sadsylgt, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. 89
91 Kommueres Udgftsbehov 9.5. Bolgydelsesudgfter Prmærkommueres bolgydelsesudgfter pr. pesost er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres bolgydelsesudgfter), er e fukto af 4 forklarede varable, gvet ved dummy-varable for hovedstadskommuer og små/store bykommuer, bolgkrteret og adele af udlejgsbolger samt et kostatled: (.5.) y = β + βd + β D + β 3x3 + β 4 x4 + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (.5.), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (.5.) på baggrud af hver ekelt af de forklarede varable modelle, dummy-varable dog udtaget. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet: (.5.) β : = log e H : ( ) k = β + β x, k =,. I tabel.5.3 er vst resultatet fra estmato af modelle lgg (.5.) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at ge af de forklarede varable har sgfkate parametre på selv meget lave sgfkasveauer, dvs. hypotese om homoskedastctet accepteres stærkt, og de alteratve hypotese om heteroskedastctet afvses. Det ka således umddelbart kostateres, at modelle lgg (.5.) opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable 9
92 Kommueres Udgftsbehov Tabel.5.3 Mdste kvadraters estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 69,83 % - β - Kostatled β - Dummy:Hovedstadskom. β - Dummy:Bykommuer β 3 - Bolgkrteret β 4 - Udlejgsbolger 68, (5,48) [,] 57,78 (3,55) [,5] 77,38 (3,47) [,6] 3,5 (5,6) [,] 9,79 (,3) [,] , (,) [,9997] -,4 (-,78) [,398] Yderlgere test for homoskedastctet er vst tabel.5.4 og sker ved heholdsvs Breusch-Paga og Koeker-Basset lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. De to test ka geemføres ved, 9
93 Kommueres Udgftsbehov 9 e (.5.) LM = ESS = z. e e Deferes Z ved e ( P + ) -matrx beståede af observatossæt af (, ) og deferes g som e vektor beståede af g = e ( e e ) ka z Breusch-Paga LM-testet specfceres ved, ( Z g ) (.5.3) LM = g Z( Z Z) - Z = (, z ),, (, z ) N ( P+) [ ] K.. [ ] - g = e ( e e ), e ( e e ),K. I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (.5.4) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e - ( ) ( ) e e K e u =,,., - = ( ) (, K,)... 9
94 Kommueres Udgftsbehov - e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved p. (.5.5) Uder H er LM ( p) ~ χ. Ved geemgag af tabel.5.4 ka kostateres, at hypotese om homoskedastctet er lgeledes blver accepteret ved Breusch-Paga og Koeker-Basset ed ved Parks på 5 % sgfkasveau. Der er således accept omkrg hypotese om homoskedastctet fra de avedte test og korrekto vurderes derfor kke ødvedg. Tabel.5.4 Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM LM = e ESS = z e e 5, [,74] 3,88 [,748] For at estmatere fra modelle har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.5. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e ogelude pæ overesstemmelse mellem de emprske og teoretske fordelg, dog med e markat afvgelse,-blokke. I formelle test af ormalfordelgsatagelse for de stadardserede resdualer accepteres hypotese ved det kvadrerede Ch-Goodess-of-fttest( χ = 7,9, p =,837), Kolmogorov-Smrov(D =,5, p >,5)- 93
95 Kommueres Udgftsbehov 94 testet, Aderso-Darlg(A =,89, p >,5)-testet og Cramer-vo Mses(W =,4, p >,5)-testet. Det må derfor ases for mest sadsylgt, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. Fgur.5. Blokdagram for stadardserede resdualer vægtet model 3 5 P e r c e t St udet zed Res dual Curve: Normal ( Mu= S gma=) 94
96 Kommueres Udgftsbehov.6 Børepasgsudgfter Prmærkommueres børepasgsudgfter pr. -6 årg er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres børepasgsudgfter), er e fukto af 4 forklarede varable, gvet ved dummy-varable for hovedstadskommuer, adele af famler med tre eller flere bør, adele af persoer udlejgsbolger og adele af -66-årge erhvervsaktve kvder, samt et kostatled: (.6.) y = β + βd + β x + β 3x3 + β 4 x4 + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (.6.), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (.6.) på baggrud af hver ekelt af de forklarede varable modelle, dummy-varable dog udtaget. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet: (.6.) β : = H : log( e ) β + βxk =, k =,,3. I tabel.6. er vst resultatet fra estmato af modelle lgg (.6.) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at ge af de forklarede varable har sgfkate parametre på selv meget lave sgfkasveauer, dvs. hypotese om homoskedastctet accepteres stærkt, og de alteratve hypotese om heteroskedastctet afvses. Det ka således umddelbart kostateres, at modelle lgg (.6.) opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable 95
97 Kommueres Udgftsbehov 96 Tabel.6. Mdste kvadraters estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 5,93 % - β - Kostatled β - Dummy:Hovedstadskom. β - Famler m. over tre bør β 3 - Adel udpedlere β 4 - Erhvervsaktve kvder 5.464,99 (,94) [,349].68,4 (3,5) [,5] -54,4 (-7,43) [,] 9,9 (4,45) [,] 33, (4,45) [,] - - -,8 (-,84) [,46],4 (,4) [,6879],3 (,77) [,4436] Yderlgere test for homoskedastctet er vst tabel.6. og sker ved heholdsvs Breusch-Paga og Koeker-Basset lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. Testet ka geemføres ved, 96
98 Kommueres Udgftsbehov e (.6.3) LM = ESS = z. e e Deferes Z ved e ( P +) -matrx beståede af observatossæt af (, ) og deferes g som e vektor beståede af g = e ( e e ) ka z Breusch-Paga LM-testet specfceres ved, ( Z g ) (.6.4) LM = g Z( Z Z) - Z = (, z ),, (, z ) N ( P+) [ ] K. [ ] - g = e ( e e ), e ( e e ),K. I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (.6.5) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e - ( ) ( ) u = e e, K, e., - = ( ) (, K,)
99 Kommueres Udgftsbehov 98 - e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved p. (.6.6) Uder H er LM ( p) ~ χ. Ved geemgag af tabel.6. ka kostateres, at hypotese om homoskedastctet lgeledes accepteres ved Breusch-Paga og Koeker- Basset testee på 5 % sgfkasveau, det sgfkassadsylghedere bereges tl heholdsvs 7,6 % og 5,7 %. Tabel.6. Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM LM = e ESS = z e e 8,45 [,76] 6,6 [,57] For at estmatere fra modelle har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.6. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e ogelude pæ overesstemmelse mellem de emprske og teoretske fordelg, dog med afvgelser, bl.a. -,6-blokke. I formelle test af ormalfordelgsatagelse for de stadardserede resdualer afvses hypotese ved det kvadrerede Ch-Goodess-of-fttest( χ = 4,5, p =,63), me accepteres på 5 % sgfkasveau ved Kolmogorov-Smrov(D =,6, p =,9)-testet, Aderso-Darlg(A = 98
100 Kommueres Udgftsbehov,47, p =,888)-testet og Cramer-vo Mses(W =,, p >,5)-testet. Det må derfor ases for mest sadsylgt, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. Fgur.6. Blokdagram for stadardserede resdualer vægtet model 3 5 P e r c e t St udet zed Res dual Curve: Normal ( Mu= S gma=).6. Hovedstadskommueres børepasgsudgfter pr. -6-årg Kommueres børepasgsudgfter pr. -6-årg for hovedstadskommuere er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres børepasgsudgfter), er e fukto af forklarede varable, gvet ved adele af -44-årge erhvervsaktve kvder og adele af udlejgsbolger, samt et kostatled : (.6.6) y = β + βx + β x + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (.6.7), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (.6.6) på baggrud af hver ekelt af de forklarede varable modelle. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad 99
101 Kommueres Udgftsbehov tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet : (.6.7) β : = H : log( e ) β + βxk =, k =,. Tabel.6.3 Mdste kvadrater estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 4,49 % - β - Kostatled β - Erhvervsaktve kvder β - Adel udlejgsbolger -8.3,68 (-,87) [,398] 4,5 (3,9) [,3] 7,74 (5,9) [,] - -, (-,) [,844] -,8 (-,384) [,77] I tabel.6.3 er vst resultatet fra estmato af modelle lgg (.6.6) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at ge af de forklarede varable har sgfkate parametre på selv meget lave sgfkasveauer, dvs. hypotese om homoskedastctet accepteres stærkt og og de alteratve hypotese om heteroskedastctet afvses. Det ka således umddelbart kostateres, at modelle lgg (.6.6) opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable
102 Kommueres Udgftsbehov Yderlgere test for homoskedastctet er vst tabel.6.4 og sker ved heholdsvs Breusch-Paga og Koeker-Basset Lagrage multplkator test. Ved geemgag af tabelle ka kostateres, at hypotese om homoskedastctet lgeledes accepteret stærkt ved Breusch-Paga og Koeker-Basset, det sgfkassadsylghedere er gvet ved heholdsvs 83,9 % og 86,5 %. Tabel.6.4 Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM LM = e ESS = z. e e,87 [,839],74 [,865] For at estmatere fra modelle har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.6. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e ogelude pæ overesstemmelse mellem de emprske og teoretske fordelg, dog med e ekelt afvgelse -,5-blokke. I formelle test af ormalfordelgsatagelse for de stadardserede resdualer accepteres hypotese ved det kvadrerede Ch-Goodess-of-fttest( χ = 3,5, p =,6), Kolmogorov-Smrov(D =,9, p >,5)-testet, Aderso-Darlg(A =,39, p >,5)-testet og Cramer-vo Mses(W =,7, p >,5)-testet. Det må derfor ases for mest sadsylgt, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer.
103 Kommueres Udgftsbehov Fgur.6. Blokdagram for stadardserede resdualer vægtet model 5 4 P e r c e t St udet zed Res dual Curve: Normal ( Mu= S gma=)
104 Kommueres Udgftsbehov.7 Døgsttutosudgfter Prmærkommueres døgsttutosudgfter pr. - årg er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres døgsttutosudgfter), er e fukto af forklarede varable, gvet ved adele af bør af elge forsørgere og bolgkrteret adel af alle bolger, samt et kostatled : (.7.) y = β + βx + β x + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (.7.), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (.7.) på baggrud af hver ekelt af de forklarede varable modelle. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet : (.7.) β : = H : log( e ) β + βxk =, k =,. I tabel.7. er vst resultatet fra estmato af modelle lgg (.7.) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at ge af de forklarede varable har sgfkate parametre på selv meget lave sgfkasveauer, dvs. hypotese om homoskedastctet accepteres stærkt og og de alteratve hypotese om heteroskedastctet afvses. Det ka således umddelbart kostateres, at modelle lgg (.7.) opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable 3
105 Kommueres Udgftsbehov 4 Tabel.7. Mdste kvadraters estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 37,3 % - β - Kostatled β - Bør af elge forsørgere β - Bolgkrteret 473, (4,36) [,] 93,4 (8,75) [,],54 (,98) [,486] -,5 (,44) [,5], (,9) [,78] Yderlgere test for homoskedastctet er vst tabel.6. og sker ved heholdsvs Breusch-Paga og Koeker-Basset lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. Testet ka geemføres ved, e (.7.3) LM = ESS = z. e e Deferes Z ved e ( P +) -matrx beståede af observatossæt af (, ) og deferes g som e vektor beståede af g = e ( e e ) ka z Breusch-Paga LM-testet specfceres ved, 4
106 Kommueres Udgftsbehov ( Z g ) (.7.4) LM = g Z( Z Z). - Z = (, z ),, (, z ) N ( P+) [ ] K. [ ] - g = e ( e e ), e ( e e ),K. I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (.7.5) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e ( ) = e, e, K, e ( ) u. ( ) (, K,) =. e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved p. (.7.6) Uder H er LM ( p) ~ χ. 5
107 Kommueres Udgftsbehov 6 Ved geemgag af tabel.7. ka kostateres, at hypotese om homoskedastctet lgeledes accepteres ved Breusch-Paga og Koeker- Basset på 5 % sgfkasveau, det sgfkassadsylghedere er gvet ved heholdsvs 7, % og 36,6 %. Tabel.7. Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM LM = e ESS = z e e 5, [,7] 3, [,366] For at estmatere fra modelle har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.7. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e ogelude pæ overesstemmelse mellem de emprske og teoretske fordelg, dog med afvgelser, bl.a. -,6- og 4,-blokke. I formelle test af ormalfordelgsatagelse for de stadardserede resdualer afvses hypotese på 5 % sgfkasveau ved det kvadrerede Ch-Goodess-of-ft-test( χ =,66, p <,), Kolmogorov-Smrov(D =,9, p =,6)-testet og Cramer-vo Mses(W =,48, p =,464)- testet, me accepteres lge ved Aderso-Darlg(A =,47, p =,5)- testet. Afvsge af hypotese de tre af testee må formodes at være særlgt forbudet med de store postve std. resdualer 4,-blokke, mes det øvrge data er bedre overesstemmelse med ormalfordelgsatagelse. Udtagelse af de seks mest ekstreme observatoer medfører mdlertd kke tl markate foradrger parameterestmatere og derved har de ekstreme observatoer kke oge alvorlgt forstyrrede effekt på modelles resultater. På dee baggrud bbeholdes modelle lgg (.7.). 6
108 Kommueres Udgftsbehov Fgur.7. Blokdagram for stadardserede resdualer vægtet model 3 5 P e r c e t St udet zed Res dual Curve: Normal ( Mu= S gma=) 7
109 Kommueres Udgftsbehov 8.8 Beskæftgelses- og uddaelsesudgfter Prmærkommueres beskæftgelses- og uddaelsesudgfter pr årg er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres beskæftgelses- og uddaelsesudgfter), er e fukto af 3 forklarede varable, gvet ved udskrvgsgrudlaget pr. dbygger, adele af -59- årge ude beskæftgelse over 5 % og det bysocale krterum, samt et kostatled : (.8.) y = β + βx + β x + β 3x3 + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (.8.), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (.8.) på baggrud af hver ekelt af de forklarede varable modelle. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet: (.8.) β : = H : log( e ) β + βxk =, k =,,3. I tabel.8. er vst resultatet fra estmato af modelle lgg (.8.) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at samtlge de forklarede varable har sgfkate parametre på et 5 % sgfkasveau, dvs. dsse tlfælde forkastes hypotese om homoskedastctet og de alteratve hypotese om heteroskedastctet accepteres. Det ka således kostateres, at modelle lgg (.8.) kke opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable, me er plaget af heteroskedastctet. Dette gør sg specelt gældede for adele af -59- årge ude beskæftgelse over 5 % med e t-værd på 3,7. E kosekves af heteroskedastctet er, at modelles varasestmat kke er mddelret og, at teststørrelsere for parametree er utroværdge. Hermed er der rsko for at medtage varable modelle, der uder et korrekt varasestmat kke vlle have sgfkate parametre, mes adre varable, 8
110 Kommueres Udgftsbehov der uder et korrekt varasestmat vlle have sgfkate parametre, udelukkes fra modelle. I tabel.8. agver de rude parateser teststørrelsesværde fra et t-test, mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra t-fordelge. Tabel.8. Mdste kvadraters estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 4,7 % - β - Kostatled β - Udskrvgsgrudlaget β årge u. beskæftgelse β 3 - Det bysocale krterum 95,78 (,) [,376] -, (-,55) [,3] 3,96 (,45) [,] 84,37 (3,4) [,6] - -,4 (-4,5) [,] 36,83 (3,7) [,] 44,48 (4,33) [,] E estmatosmetode, som tager højde for afhægghede mellem modelles resdualer og de forklarede varable, er således påkrævet, og alteratvt opstlles e loglkelhoodfukto, der uder estmato af modelles parametre samtdg korrgerer for heteroskedastctet ved at vægte med e eller flere af de varasstyrede forklarede varable opløftet poteser, der lgeledes estmeres uder maksmerg af loglkelhoodfuktoe. 9
111 Kommueres Udgftsbehov I det ormalfordelte og heteroskedastske tlfælde ka loglkelhoodfuktoe deferes ved, 75 π, = σ (.8.3) log L = log( ) log( σ ) + ( y ) β x hvor varase σ forvetes at være afhægg af samtlge tre forklarede varable, jf. Parks test, ete ekeltvs eller kombatoer af to eller tre. Uder optmerg af loglkelhoodfuktoe med forskellge kombatoer af de tre varasstyrede forklarede varable opås de højeste loglkelhoodværd ved at lade varase være e fukto af udskrvgsgrudlaget pr. dbygger og adele af -59-årge ude beskæftgelse over 5 % og dermed gvet ved, α α (.8.4) σ σ ( x x ) =,,, hvor x er udskrvgsgrudlaget pr. dbygger og, x er adele af -, 59-årge ude beskæftgelse over 5 %, og hvor estmatet for σ er gvet ved mdste kvadraters estmatet. Loglkelhoodfuktoe ka derfor deferes ved, 75 x, = (.8.5) log L = log( π ) log( σ ) α α ( y β x ) x = = ( ), α α σ x, x, I det ormalfordelte og homoskedastske tlfælde er maxmum lkelhood metodes estmerede parametre detske med parametree estmeret uder mdste kvadraters metode, og loglkelhoodfuktoe er dette tlfælde gvet ved, (.8.6) log L = log( ) log( σ ) ( β x ) 75 [ y ] π. σ =
112 Kommueres Udgftsbehov Estmato af loglkelhoodfuktoere udføres matrceprogrammet IML SAS. De avedte procedure tager udgagspukt et bereggsmodel, hvor heholdsvs modelle, varasfuktoe og loglkelhoodfuktoe specfceres. Dette bereggsmodul kaldes af e kke-leær optmergsrute, NPLDD (No-Lear Double Dogleg Optmzato), der på bagrud af talpukter, evetuelle parameterrestrktoer, determatoskrterer og parameterkotrol fder maksmum for loglkelhoodfuktoere. Test af, hvorvdt ML-estmatere er lg med ul foretages ved Waldteststørrelse, (.8.7) W = ( Rψˆ r) R Σ ( ψˆ ) [ R] ( Rψˆ r) ~ χ Et estmat af kovarasmatrce bereges ved hjælp af e uderrute IML, NLPFDD (No-Lear Programmg Fte Dfferece Approxmato), der på baggrud af loglkelhoodfuktoe og de estmerede parametre bereger de umerske. ordes afledede og Hessematrce. Estmatet for kovarasmatrce, Σ ( ψˆ ), er herefter gvet ved de verterede og egatve Hessematrce. I to-sdet test af, hvorvdt de ekelte parameter er lg med ul, H ψ ˆ, H : ψˆ er Wald-testet gvet ved, : =. (.8.8) H ψ ˆ, H : ψˆ : : = W ψˆ = ~ N(, ), var ( ψˆ ) der er stadard ormalfordelt. I tabel.8. agver de rude parateser teststørrelsesværde fra testet lgg (.8.8), mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra stadard ormalfordelge. Det skal bemærkes, at såfremt gve parametre lgger på græse tl det sgfkate eller hvs potesparametree har umersk store værder uderstøttes Wald-teststørrelse af et lkelhood rato test.
113 Kommueres Udgftsbehov Tabel.8. Maxmum lkelhood estmato af uvægtet og vægtet model Loglkelhood uder σ = σ σ = σ ormalfordelge α α ( x x ) R værd 4,7 % 39,5 % Loglkelhoodværd -83,98-87,54,, β - Kostatled β - Udskrvgsgrudlaget β årge u. beskæftgelse β 3 - Det bysocale krterum 95,8 (,6) [,] -, (-,53) [,57] 3,96 (,4) [,] 84,38 (3,3) [,] 79,68 (,44) [,73] -, (-,97) [,5] 3,96 (,8) [,] 76,37 (,87) [,] α - Potes : Udskrvggrudlaget α - Potes : -59 årge u. beskæf. - -,35 (-5,44) [,] -,47 (5,3) [,] LR = (-87,54 - (-83,98)) = 6,88 ~ χ ( ) <, I tabel.8. er agvet resultatere fra estmato af loglkelhoodfuktoe uder e atagelse om heholdsvs homoskedastctet, σ = σ, og α α heteroskedastctet, σ σ ( x x ) =. Som tdlgere ævt er maxmum,, lkelhood metode det homoskedastske og ormalfordelte tlfælde detsk med mdste kvadraters metode, hvlket resulterer at parametre,
114 Kommueres Udgftsbehov teststørrelsesværder og sgfkassadsylgheder tabel.8. (. koloe) og tabel.8. (. koloe) er detske. De højeste loglkelhoodværd, gvet ved -87,54, opås estmatoe uder atagelse om heteroskedastctet, mes loglkelhoodværde det homoskedastske tlfælde er på -83,98. I tabelles ederste række testes med et lkelhood rato test om dsse to loglkelhoodværder er lg med hade, hvlket med e sadsylghed på mdre ed, afvses. Det ka således kostateres, at loglkelhoodfuktoe uder atagelse om heteroskedastctet har e markat bedre loglkelhoodværd og dermed de forholdsvs bedste tlpasg. I det heteroskedastske tlfælde er varasspecfkatoe som vst gvet ved α α σ = σ ( x, x, ) og tabelles æstsdste række ses, at potesparametree er estmeret tl heholdsvs -,35 og,47, hvorved varasspecfkatoe mere præcst er gvet ved,.,35,47 (.8.9) = σ ( Udskrvgsgrudl 59 årge u. beskæf. ). σ. Estmato uder dee formulerg medfører, forhold tl estmato uder det homoskedastske tlfælde, tl ædrger parameterestmatere, mest markat llustreret kostatleddet og det bysocale krterum. Test for homoskedastctet de to loglkelhoodmodeller er vst tabel.8.3 og sker ved heholdsvs Breusch-Paga og Koeker-Basset lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. Testet ka geemføres ved, (.8.) LM = e ESS = z. e e Deferes Z ved e ( P +) -matrx beståede af observatossæt af (, ) og deferes g som e vektor beståede af g = e ( e e ) ka z Breusch-Paga testet specfceres ved, 3
115 Kommueres Udgftsbehov 4 ( Z g ) (.8.) LM = g Z( Z Z). - Z = (, z ),, (, z ) N ( P+) [ ] K. [ ] - g = e ( e e ), e ( e e ),K. I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (.8.) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e ( ) = e, e, K, e ( ) u. ( ) (, K,) =. e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved p. (.8.3) Uder H er LM ( p) ~ χ. 4
116 Kommueres Udgftsbehov Ved geemgag af tabel.8.3 s ederste række ka kostateres, at korrekto af varase ved lgg (.8.9) fjerer de kostaterede heteroskedastctet fra modelle og hypotese om homoskedastctet accepteres stærkt med sgfkassadsylgheder på heholdsvs 57,64 % og 7,45 %. I tlfældet hvor varase kke korrgeres for afhægghede tl de forklarede varable, d.v.s. hvor σ = σ, afvses hypotese om homoskedastctet, det sgfkassadsylghedere er mdre ed % begge test og alteratv hypotese om heteroskedastctet accepteres. Da varasestmatet modelle med mplct korrekto for heteroskedastctet vl have de højeste grad af mddelrethed varasestmatet foretrækkes at avede dee model aalyse. Tabel.8.3 Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM σ = σ (Logl = -83,98) σ = σ α ( x x ) α,, (Logl = -87,54) 5,9 [,4],89 [,5764] 4,8 [,7], [,745] For at estmatere fra modelle med mplct korrekto for heteroskedastctet har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.8. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e ogelude pæ overesstemmelse mellem de emprske og teoretske fordelg, dog med afvgelser, bl.a. -,9- og 3,9-blokke. 5
117 Kommueres Udgftsbehov 6 Fgur.8. Blokdagram for stadardserede resdualer vægtet model 5 P e r c e t St udet zed Res dual Curve: Normal ( Mu= S gma=) I formelle test af ormalfordelgsatagelse for de stadardserede resdualer afvses hypotese ved det kvadrerede Ch-Goodess-of-fttest( χ = 45,5, p <,), me accepteres ved Kolmogorov-Smrov(D =,5, p >,5)-testet, Aderso-Darlg(A =,38, p =,44)-testet og Cramer-vo Mses(W =,9, p >,5)-testet. Det må derfor ases for mest sadsylgt, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. 6
118 Kommueres Udgftsbehov.9 Vejudgfter Prmærkommueres vejudgfter pr. dbygger er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres vejudgfter), er e fukto af forklarede varable, gvet ved atallet af meter vej pr. dbygger og det logartmske dbyggeratal, samt et kostatled: (.9.) y = β + βx + β x + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (.9.), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (.9.) på baggrud af hver ekelt af de forklarede varable modelle. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet: (.9.) β : = H : log( e ) β + βxk =, k =,. I tabel.9. er vst resultatet fra estmato af modelle lgg (.9.) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at begge de forklarede varable har sgfkate parametre på et 5 % sgfkasveau, dvs. dsse tlfælde forkastes hypotese om homoskedastctet og de alteratve hypotese om heteroskedastctet accepteres. Det ka således kostateres, at modelle lgg (.9.) kke opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable, me er plaget af heteroskedastctet. Det skal dog bemærkes, at afhægghede er af forholdsvs beskede karakter, det ge af parametree tl de forklarede varable har t-værder på over 3, d.v.s. accept af de ekelte hypoteser om, at parametree kke er lg med ul er forholdsvs veuafølsomme for ædrger sgfkasveauet. E kosekves af heteroskedastctet er, at modelles varasestmat kke er mddelret og, at teststørrelsere for parametree er utroværdge. Hermed er der rsko for at medtage varable modelle, der uder et korrekt 7
119 Kommueres Udgftsbehov 8 varasestmat kke vlle have sgfkate parametre, mes adre varable, der uder et korrekt varasestmat vlle have sgfkate parametre, udelukkes fra modelle. I tabel.9. agver de rude parateser teststørrelsesværde fra et t-test, mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra t-fordelge. Tabel.9. Mdste kvadraters estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 4,6 % - β - Kostatled β - Meter vej pr. dbygger β - Logartmsk dbyggertal.34,4 (6,53) [,],3 (8,49) [,] -55,73 (-3,3) [,] -,3 (,35) [,95] -,4 (-,) [,446] På trods af, at afhægghede modelles resdualer og de forklarede varable er af forholsvs beskede karakter forsøges avedt e estmatosmetode, der højere grad tager højde for varasafhægghede. Alteratvt opstlles e loglkelhoodfukto, som uder estmato af modelles parametre samtdg korrgerer for heteroskedastctet ved at vægte med e eller begge af de varasstyrede forklarede varable opløftet poteser, der lgeledes estmeres uder maksmerg af loglkelhoodfuktoe. I det ormalfordelte og heteroskedastske tlfælde ka 8
120 Kommueres Udgftsbehov loglkelhoodfuktoe deferes ved, 75 π, = σ (.9.3) log L = log( ) log( σ ) + ( y ) β x hvor varase σ forvetes at være afhægg af de to forklarede varable, jf. Parks test, ete ekeltvs eller kombato. Uder optmerg af loglkelhoodfuktoe med forskellge kombatoer opås de højeste loglkelhoodværd ved at lade varase være e fukto af såvel atallet af meter vej pr. dbygger som det logartmske dbyggeratal og dermed gvet ved, α α (.9.4) σ σ ( x x ) =,,, hvor x, er atallet af meter vej pr. dbygger og x, er det logartmske dbyggeratal, og hvor estmatet for σ er gvet ved mdste kvadraters estmatet. Loglkelhoodfuktoe ka derfor deferes ved, 75 x, = (.9.5) log L = log( π ) log( σ ) α α ( y β x ) x = = ( ), α α σ x, x, I det ormalfordelte og homoskedastske tlfælde er maxmum lkelhood metodes estmerede parametre detske med parametree estmeret uder mdste kvadraters metode, og loglkelhoodfuktoe er dette tlfælde gvet ved, (.9.6) log L = log( ) log( σ ) ( β x ) 75 [ y ] π. σ = Estmato af loglkelhoodfuktoere udføres matrceprogrammet IML SAS. De avedte procedure tager udgagspukt et bereggsmodel, hvor heholdsvs modelle, varasfuktoe og loglkelhoodfuktoe 9
121 Kommueres Udgftsbehov specfceres. Dette bereggsmodul kaldes af e kke-leær optmergsrute, NPLDD (No-Lear Double Dogleg Optmzato), der på bagrud af talpukter, evetuelle parameterrestrktoer, determatoskrterer og parameterkotrol fder maksmum for loglkelhoodfuktoere. Test af, hvorvdt ML-estmatere er lg med ul foretages ved Waldteststørrelse, (.9.7) W = ( Rψˆ r) R Σ ( ψˆ ) [ R] ( Rψˆ r) ~ χ Et estmat af kovarasmatrce bereges ved hjælp af e uderrute IML, NLPFDD (No-Lear Programmg Fte Dfferece Approxmato), der på baggrud af loglkelhoodfuktoe og de estmerede parametre bereger de umerske. ordes afledede og Hessematrce. Estmatet for kovarasmatrce, Σ ( ψˆ ), er herefter gvet ved de verterede og egatve Hessematrce. I to-sdet test af, hvorvdt de ekelte parameter er lg med ul, H ψ ˆ, H : ψˆ er Wald-testet gvet ved, : =. (.9.8) H ψ ˆ, H : ψˆ : : = W ψˆ = ~ N(, ), var ( ψˆ ) der er stadard ormalfordelt. I tabel.9. agver de rude parateser teststørrelsesværde fra testet lgg (.9.8), mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra stadard ormalfordelge. Det skal bemærkes, at såfremt gve parametre lgger på græse tl det sgfkate eller hvs potesparametree har umersk store værder uderstøttes Wald-teststørrelse af et lkelhood rato test. I tabel.9. er agvet resultatere fra estmato af loglkelhoodfuktoe uder e atagelse om heholdsvs homoskedastctet, σ = σ, og α α heteroskedastctet, σ σ ( x x ) =. Som tdlgere ævt er maxmum,, lkelhood metode det homoskedastske og ormalfordelte tlfælde detsk med mdste kvadraters metode, hvlket resulterer at parametre, teststørrelsesværder og sgfkassadsylgheder tabel.9. (. koloe)
122 Kommueres Udgftsbehov og tabel.9. (. koloe) er detske. Tabel.9. Maxmum lkelhood estmato af uvægtet og vægtet model Loglkelhood uder σ = σ σ = σ ormalfordelge α α ( x x ) R værd 4,6 % 4,97 % Loglkelhoodværd -777, -77,4,, β - Kostatled β - Meter vej pr. dbygger β - Logartmsk dbyggertal.34,4 (6,57) [,],3 (8,5) [,] -55,73 (-3,3) [,5].6,6 (7,4) [,], (8,4) [,] -58,3 (-3,88) [,] α - Potes : Udskrvggrudlaget α - Potes : -59 årge u. beskæf. -,37 (3,48) [,3] - -,47 (-3,54) [,] LR = (-77,4 - (-777,)) =, ~ χ ( ) =,366 De højeste loglkelhoodværd, gvet ved -77,4 opås estmatoe uder atagelse om heteroskedastctet, mes loglkelhoodværde det homoskedastske tlfælde er på 777,. I tabelles ederste række testes med et lkelhood rato test om dsse to loglkelhoodværder er lg med hade, hvlket med e sgfkassadsylghed på,366 % afvses. Det ka således kostateres, at loglkelhoodfuktoe uder atagelse om heteroskedastctet har e bedre loglkelhoodværd og dermed de
123 Kommueres Udgftsbehov forholdsvs bedste tlpasg. Forbedrge er dog beskede, hvlket ka heføres tl de beskede grad af heteroskedstctet og dermed det beskede behov for korrekto af modelle. I det heteroskedastske tlfælde er varasspecfkatoe som vst gvet ved α α σ = σ ( x, x, ) og tabelles æstsdste række ses, at potesparametree er estmeret tl heholdsvs,37 og -,47, hvorved varasspecfkatoe mere præcst er gvet ved,,37,47 (.9.9) = σ ( Meter vej pr. dbygger Log. dbyggeratal ) σ. Estmato uder dee formulerg medfører, forhold tl estmato uder det homoskedastske tlfælde, tl mdre ædrger parameterestmatere, mest markat llustreret kostatleddet. Test for homoskedastctet de to loglkelhoodmodeller er vst tabel.9.3 og sker ved heholdsvs Breusch-Paga og Koeker-Basset lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. Testet ka geemføres ved, (.9.) LM = e ESS = z. e e Deferes Z ved e ( P +) -matrx beståede af observatossæt af (, ) og deferes g som e vektor beståede af g = e ( e e ) ka z Breusch-Paga LM-testet specfceres ved, ( Z g ) (.9.) LM = g Z( Z Z). - Z = (, z ),, (, z ) N ( P+) [ ] K. [ ] - g = e ( e e ), e ( e e ),K.
124 Kommueres Udgftsbehov I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (.9.) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e ( ) = e, e, K, e ( ) u. ( ) (, K,) =. e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved p. (.9.3) Uder H er LM ( p) ~ χ. Ved geemgag af tabel.9.3 s ederste række ka kostateres, at korrekto af varase ved lgg (.9.9) fjerer de kostaterede heteroskedastctet fra modelle og hypotese om homoskedastctet accepteres med sgfkassadsylgheder på heholdsvs 77, % og 78, %. I tlfældet hvor varase kke korrgeres for afhægghede tl de forklarede varable, d.v.s. hvor σ = σ, afvses hypotese om homoskedastctet dermod med sgfkassadsylgheder på heholdsvs,3 % og,44 % på 5 % sgfkasveau. 3
125 Kommueres Udgftsbehov 4 Da varasestmatet modelle med mplct korrekto for heteroskedastctet vl have de højeste grad af mddelrethed varasestmatet foretrækkes at avede dee model aalyse. Tabel.9.3 Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM σ = σ (Logl = -777,) σ = σ α ( x x ) α,, (Logl = -77,4),7 [,3], [,77] 9,4 [,44],8 [,78] For at estmatere fra modelle med mplct korrekto for heteroskedastctet har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.9. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e ogelude pæ overesstemmelse mellem de emprske og teoretske fordelg, dog med e mdre afvgelse,75-blokke. I formelle test af ormalfordelgsatagelse for de stadardserede resdualer accepteres hypotese ved det kvadrerede Ch-Goodess-of-fttest( χ = 3,8, p =,439), Kolmogorov-Smrov(D =,6, p =,7)- testet, Aderso-Darlg(A =,4, p =,6)-testet og Cramer-vo Mses(W =,4, p =,9)-testet. Det må derfor ases for mest sadsylgt, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. 4
126 Kommueres Udgftsbehov Fgur.9. Blokdagram for stadardserede resdualer vægtet model. 5. P e r c e t STDRES Curve: Normal ( Mu= S gma=) 5
127 Kommueres Udgftsbehov 6. Udgfter tl førtdspeso, revalderg og sygedagpege Prmærkommueres udgfter tl førtdspeso, revalderg og sygedagpege pr. -59 årg er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres udgfter), er e fukto af forklarede varable, gvet ved adele af -59-årge ude beskæftgelse og det forvetede atal førtdspesoer pr årge, samt et kostatled: (..) y = β + βx + β x + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (..), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (..) på baggrud af hver ekelt af de forklarede varable modelle. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet: (..) β : = H : log( e ) β + βxk =, k =,. I tabel.. er vst resultatet fra estmato af modelle lgg (..) med mdste kvadraters metode, samt bereget Parks test for hver af de to forklarede varable. Ved geemgag af sdstævte test ses, at krteret for det forvetede atal førtdspesoer pr årge har sgfkat parameter på et 5 % sgfkasveau, dvs. dette tlfælde forkastes hypotese om homoskedastctet og de alteratve hypotese om heteroskedastctet accepteres. Det ka således kostateres, at modelle lgg (..) kke opfylder atagelse om uafhægghed mellem resdualere og de forklarede varable, me er plaget af heteroskedastctet. Det formodes dog, at afhægghede er af forholdsvs beskede karakter, det det blot er de ee af de to varable, der har forklargskraft af modelles kvadrerede ersdualer. E kosekves af heteroskedastctet er, at modelles varasestmat kke er mddelret, og at teststørrelsere for parametree er utroværdge. Hermed er der rsko for at medtage varable modelle, der uder et korrekt 6
128 Kommueres Udgftsbehov varasestmat kke vlle have sgfkate parametre, mes adre varable, der uder et korrekt varasestmat vlle have sgfkate parametre, udelukkes fra modelle. I tabel.. agver de rude parateser teststørrelsesværde fra et t-test, mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra t-fordelge. Tabel.. Mdste kvadraters estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 48,8 % - β - Kostatled β årge u. beskæftg. β - Atal førtdspesoer -.7,45 (-4,64) [,] 4,96 (7,45) [,] 37,47 (7,9) [,] -,3 (,7) [,7],5 (4,) [,] På trods af, at afhægghede modelles resdualer og de forklarede varable formodes at være af forholdsvs beskede karakter forsøges avedt e estmatosmetode, der højere grad tager højde for varasafhægghede. Alteratvt opstlles e loglkelhoodfukto, som uder estmato af modelles parametre samtdg korrgerer for heteroskedastctet ved at vægte med de varasstyrede forklarede varabel opløftet e potes, der lgeledes estmeres uder maksmerg af loglkelhoodfuktoe. I det ormalfordelte og heteroskedastske tlfælde ka 7
129 Kommueres Udgftsbehov 8 loglkelhoodfuktoe deferes ved, 75 π, = σ (..3) log L = log( ) log( σ ) + ( y ) β x hvor varase σ forvetes at være afhægg af det forvetede atal førtdspesoer og evetuelt også adele af -59-årge ude beskæftgelse, jf. Parks test, ete ekeltvs eller kombato. Uder optmerg af loglkelhoodfuktoe med forskellge kombatoer af de to forklarede varable opås de højeste loglkelhoodværd ved at lade varase være e fukto af såvel det forvetede atal førtdspesoer som adele af -59-årge ude beskæftgelse og dermed gvet ved, α α (..4) σ σ ( x x ) =,,, hvor x, er adele af -59-årge ude beskæftgelse og x, er det forvetede atal førtdspesoer, og hvor estmatet for σ er gvet ved mdste kvadraters estmatet. Loglkelhoodfuktoe ka derfor deferes ved, 75 x, = (..5) log L = log( π ) log( σ ) α α ( y β x ) x = = ( ), α α σ x, x, I det ormalfordelte og homoskedastske tlfælde er maxmum lkelhood metodes estmerede parametre detske med parametree estmeret uder mdste kvadraters metode, og loglkelhoodfuktoe er dette tlfælde gvet ved, (..6) log L = log( ) log( σ ) ( β x ) 75 [ y ] π. σ = 8
130 Kommueres Udgftsbehov Estmato af loglkelhoodfuktoere udføres matrceprogrammet IML SAS. De avedte procedure tager udgagspukt et bereggsmodel, hvor heholdsvs modelle, varasfuktoe og loglkelhoodfuktoe specfceres. Dette bereggsmodul kaldes af e kke-leær optmergsrute, NPLDD (No-Lear Double Dogleg Optmzato), der på bagrud af talpukter, evetuelle parameterrestrktoer, determatoskrterer og parameterkotrol fder maksmum for loglkelhoodfuktoere. Test af, hvorvdt ML-estmatere er lg med ul foretages ved Waldteststørrelse, (..7) W = ( Rψˆ r) R Σ ( ψˆ ) [ R] ( Rψˆ r) ~ χ Et estmat af kovarasmatrce bereges ved hjælp af e uderrute IML, NLPFDD (No-Lear Programmg Fte Dfferece Approxmato), der på baggrud af loglkelhoodfuktoe og de estmerede parametre bereger de umerske. ordes afledede og Hessematrce. Estmatet for kovarasmatrce, Σ ( ψˆ ), er herefter gvet ved de verterede og egatve Hessematrce. I to-sdet test af, hvorvdt de ekelte parameter er lg med ul, H ψ ˆ, H : ψˆ er Wald-testet gvet ved, : =. (..8) H ψ ˆ, H : ψˆ : : = W ψˆ = ~ N(, ), var ( ψˆ ) der er stadard ormalfordelt. I tabel.. agver de rude parateser teststørrelsesværde fra testet lgg (..8), mes de frkatede parateser agver de tlhørede sgfkassadsylgheder fra stadard ormalfordelge. Det skal bemærkes, at såfremt gve parametre lgger på græse tl det sgfkate eller hvs potesparametree har umersk store værder uderstøttes Wald-teststørrelse af et lkelhood rato test. I tabel.. er agvet resultatere fra estmato af loglkelhoodfuktoe uder e atagelse om heholdsvs α α homoskedastctet, σ = σ, og heteroskedastctet, σ = σ ( x, x, ). Som tdlgere ævt er maxmum lkelhood metode det homoskedastske og 9
131 Kommueres Udgftsbehov 3 ormalfordelte tlfælde detsk med mdste kvadraters metode, hvlket resulterer at parametre, teststørrelsesværder og sgfkassadsylgheder tabel.. (. koloe) og tabel.. (. koloe) er detske. Tabel.. Maxmum lkelhood estmato af uvægtet og vægtet model Loglkelhood uder σ = σ σ = σ ormalfordelge α α ( x x ) R værd 48,8 % 49, % Loglkelhoodværd -996,58-995,4,, β - Kostatled β årge u. beskæftgelse β - Atal førtdspesoer -.7,45 (-4,64) [,] 4,96 (7,45) [,] 37,47 (7,9) [,] -.9,44 (-4,7) [,] 4,77 (7,46) [,] 39,75 (8,6) [,] α - Potes : -59-årge u. beskæft. α - Potes : Atal førtdspesoer -,69 (,54) [,68] - -,9 (-,54) [,68] LR = (-995,4 - (-996,58)) =,36 ~ χ ( ) =,376 De højeste loglkelhoodværd, gvet ved -995,4, opås estmatoe uder atagelse om heteroskedastctet, mes loglkelhoodværde det homoskedastske tlfælde er på -996,58. I tabelles ederste række testes 3
132 Kommueres Udgftsbehov med et lkelhood rato test om dsse to loglkelhoodværder er lg med hade, hvlket med e sgfkassadsylghed på 3,76 % accepteres stærkt. Det ka således kostateres, at loglkelhoodfuktoe uder atagelse om heteroskedastctet kke gver oge forbedrg loglkelhoodværde og dermed sker der ge forbedrg modelles tlpasg tl data forhold tl e atagelse om homoskedastctet. I det heteroskedastske tlfælde er varasspecfkatoe som vst gvet ved α α σ = σ ( x, x, ) og tabel.. s æstsdste række ses, at potesparametree er estmeret tl heholdsvs,69 og -,9, hvorved varasspecfkatoe mere præcst er gvet ved,,69,9 (..9) = σ ( 59 årge u. beskæft. førtdspesoer ) σ. Estmato uder dee formulerg medfører, forhold tl estmato uder det homoskedastske tlfælde, tl mdre ædrger parameterestmatere, mest markat llustreret kostatleddet. Det bemærkes, at de to potesparametre kke er sgfkate på 5 % sgfkasveau, d.v.s. hypotese om, at de to parametre er lg med ul accepteres på 5 % sgfkasveau. Test for homoskedastctet de to loglkelhoodmodeller er vst tabel..3 og sker ved heholdsvs Breusch-Paga og Koeker-Basset lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. Testet ka geemføres ved, (..) LM = e ESS = z. e e Deferes Z ved e ( P +) -matrx beståede af observatossæt af (, ) og deferes g som e vektor beståede af g = e ( e e ) ka z Breusch-Paga LM-testet specfceres ved, ( Z g ) (..) LM = g Z( Z Z). 3
133 Kommueres Udgftsbehov 3 - Z = (, z ),, (, z ) N ( P+) [ ] K. [ ] - g = e ( e e ), e ( e e ),K. I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (..) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e ( ) = e, e, K, e ( ) u. ( ) (, K,) =. e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved p. (..3) Uder H er LM ( p) ~ χ. Ved geemgag af tabel..3 s ederste række ka kostateres, at korrekto af varase ved lgg (..9) kke fjerer de kostaterede heteroskedastctet fra modelle og hypotese om homoskedastctet 3
134 Kommueres Udgftsbehov accepteres kke på 5 % sgfkasveau. Dette resultat kue forvetes ud fra de rge forbedrg loglkelhoodværde og de sgfkate potesparametre. I tlfældet hvor varase kke korrgeres for afhægghede tl de forklarede varable, d.v.s. hvor σ = σ, afvses hypotese om homoskedastctet mdlertd edu stærkere. Da varasestmatet modelle med mplct korrekto for heteroskedastctet kke markat korrgerer for grade af afhægghed resdualere og dermed kke forbedrer mddelrethede varasestmatet foretrækkes at bbeholde modelle lgg (..). Sammefattede ka kokluderes, at dee model e vs grad er plaget af heteroskedastctet, me at dee ete kke lader sg korrgere ved de avedte maxmum lkelhood estmato eller at heteroskedastctete er af e så svag karakter, at de kke slår geem ved e markat estmeret værd for de opløftede potes oveståede model. Tabel..3 Test for homoskedastctet Breusch-Paga LM Koeker-Basset LM σ = σ (Logl = -996,58) ( x ) α σ = σ, (Logl = -995,4) 9,95 [,] 7, [,7] 8,39 [,4] 6,85 [,8] Uder heteroskedastctet vl modelles parameterestmater stadg være mddelrette og modelles resultater ka derfor avedes, dog bør der som ævt udvses forsgtghed overfor modelles varasestmat, der ved heteroskedastctet ka være skævt og ete over- eller uderestmere de sade værder. For at estmatere fra modelle lgg (..) har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af 33
135 Kommueres Udgftsbehov 34 dee atagelse vser fgur.. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e pæ overesstemmelse mellem de emprske og teoretske fordelg med ku mdre afvgelser. Fgur.6. Blokdagram for stadardserede resdualer vægtet model 5 P e r c e t St udet zed Res dual Curve: Normal ( Mu= S gma=) I formelle test af ormalfordelgsatagelse for de stadardserede resdualer accepteres hypotese ved det kvadrerede Ch-Goodess-of-fttest( χ = 7,, p =,74), Kolmogorov-Smrov(D =,3, p >,5)-testet, Aderso-Darlg(A =,38, p >,5)-testet og Cramer-vo Mses(W =,5, p >,5)-testet. Det ka derfor kokluderes, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. 34
136 Kommueres Udgftsbehov. Admstratosudgfter Kommueres admstratosudgfter pr. dbygger er udgagspuktet søgt forklaret e leær model, estmeret med mdste kvadraters metode, hvor de afhægge varabel, y, (kommueres admstratosudgfter), er e fukto af 4 forklarede varable, gvet ved dummy-varable for hovedstadskommuer og små/store bykommuer, adele af -59-årge ude beskæftgelse over 5 % og ettodrftsudgftere pr. dbygger, samt et kostatled : (..) y = β + βd + β D + β 3x3 + β 4 x4 + ε, =,,..., 75. E vgtg atagelse dee model er, at resdualere er uafhægge af modelles forklarede varable, d.v.s. at der kke er heteroskedastctet. Test for heteroskedastctet ka ske ved Parks test, lgg (..), hvor der foretages regresso på logartme tl de kvadrerede resdualer fra estmato af lgg (..) på baggrud af hver ekelt af de forklarede varable modelle, dummy-varable dog udtaget. Nulhypotese tester, hvorvdt parametere tl de forklarede varabel er lg med ul. Såfremt ekelte eller flere af dsse varable er stad tl at forklare varatoe de kvadrerede resdualer, dvs. hvs de varable har et sgfkat parameterestmat, vl det være dkato på heteroskedastctet : (..) β : = H : log( e ) β + βxk =, k =,. I tabel.. er vst resultatet fra estmato af modelle lgg (..) med mdste kvadraters metode, samt bereget Parks test for hver af de forklarede varable. Ved geemgag af sdstævte test ses, at ettodrftsudgftere har e sgfkat parameter på 5 % sgfkasveau, dvs. hypotese om homoskedastctet afvses og de alteratve hypotese om heteroskedastctet accepteres for dee varabel. Det er mdlertd kke oge stærk afvsg af hypotese om, hvorvdt parametere er lg med ul, hvlket sammeholdt med det faktum, at ettodrftsudgftere er de eeste varabel med sgfkat parameter Parks testet medfører, at afhægghede de kvadrerede resdualer må formodes at være af forholdsvs svag karakter. 35
137 Kommueres Udgftsbehov 36 Tabel.. Mdste kvadrater estmato og Parks test af model Leær Regresso Parks test for heteroskedastctet Resposvarabel y log(e ) R værd 44,44 % - β - Kostatled β - Dummy-hovedstadskomm. β - Dummy-små/store bykomm. β årge u. beskæftgelse. β 4 - Nettodrftsudgfter pr. db. 64,94 (,9) [,3674] 4,84 (3,58) [,4] -, (-3,78) [,8], (4,) [,], (7,) [,] - - -,5 (,66) [,987], (,5) [,9] Yderlgere test for homoskedastctet de to loglkelhoodmodeller er vst tabel.. og sker ved heholdsvs Breusch-Paga og Koeker-Basset lagrage multplkator test. Hypotese er σ = σ f ( α + α z ), hvor z er e vektor af uafhægge varable. Modelle er homoskedastsk, hvs α =. Testet ka geemføres ved, 36
138 Kommueres Udgftsbehov e (..3) LM = ESS = z. e e Deferes Z ved e ( P +) -matrx beståede af observatossæt af (, ) og deferes g som e vektor beståede af g = e ( e e ) ka z Breusch-Paga LM-testet specfceres ved, ( Z g ) (..4) LM = g Z( Z Z). - Z = (, z ),, (, z ) N ( P+) [ ] K. [ ] - g = e ( e e ), e ( e e ),K. I Koeker-Basset forsøges at defere e estmator for varase af ε, der er mdre følsom overfor opretholdelse af ormalfordelgsatagelse ed 4 estmatore Breusch-Paga. Varase af ε er ødvedgvs kke lg σ, hvs ε kke er ormalfordelt. Uder ormalfordelge vl Koeker-Basset have de samme asymptotske fordelg som Breusch-Paga, me såfremt ormalfordelge kke er opfyldt ka Koeker-Basset være et stærkere test. V (..5) LM = ( u u) Z( Z Z) Z ( u u) e e - V = e ( ) = e, e, K, e ( ) u. ( ) (, K,) =. 37
139 Kommueres Udgftsbehov 38 - e e u =. Uder ulhypotese om homoskedastctet er LM-testee asymptotsk χ - fordelt med atal frhedsgrader, svarede tl atallet af varable z, gvet ved p. (..6) Uder H er LM ( p) Tabel.. Test for homoskedastctet ~ χ. Breusch-Paga LM Koeker-Basset LM LM = e ESS = z. e e,36 [,3],55 [,6] Ved geemgag af tabel.. ka kostateres, at hypotese om homoskedastctet afvses ved Breusch-Paga testet (sgfkas-ssh. : 3, %) og accepteres ved Koeker-Basset testet (sgfkas-ssh. : 6, %) på 5 % sgfkasveau. Bereges yderlgere et Goldfeldt-Quadt test opås e F-teststørrelse på,7 og e tlhørede sgfkassadsylghed på,5 %. Det ka således kke udelukkes, at modelle e svag grad er plaget af heteroskedastctet. Forsøg på korrekto af modelle for dee afhægghed ved avedelse af maxmum lkelhood estmato, hvor der vægtes med modelles forklarede varable opløftet estmerede poteser, forbedrer mdlertd kke loglkehoodværde forhold tl e estmato uder e atagelse om homoskedastctet og det bekræftes således, at grade af heteroskedastctet må formodes at være svag. På dee baggrud bbeholdes modelle lgg (..). Uder heteroskedastctet vl modelles parameterestmater stadg være mddelrette og modelles resultater ka derfor avedes, dog bør der som ævt udvses forsgtghed overfor modelles varasestmat, der ved 38
140 Kommueres Udgftsbehov heteroskedastctet ka være skævt og ete over- eller uderestmere de sade værder. Fordelgsatagelse for modelle lgg (..) medfører, at de stadardserede resdualer skal være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur.. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e ogelude pæ overesstemmelse mellem de emprske og teoretske fordelg, dog med mdre afvgelser -,9 og -,3-blokke. I formelle test af ormalfordelgsatagelse for de stadardserede resdualer afvses hypotese ved det kvadrerede Ch-Goodess-of-fttest( χ =,39, p =,86), me accepteres vedkolmogorov-smrov(d =,6, p =,69)-testet, Aderso-Darlg(A =,4, p >,5)-testet og Cramer-vo Mses(W =,, p >,5)-testet. Det må derfor ases for mest sadsylgt, at ormalfordelgsatagelse er opfyldt for modelles stadardserede resdualer. Fgur.. Blokdagram for stadardserede resdualer vægtet model 3 5 P e r c e t St udet zed Res dual Curve: Normal ( Mu= S gma=) 39
141 Kommueres Udgftsbehov 4 Kaptel 3. Modelkotrol af de amtskommuale udgftsaalyser Amtskommueres beskede atal medfører, at ordær leær regressosaalyse baseret på et ekelt tværstsmaterale ka være e uhesgtmæssg metode tl at aalysere udvklge de amtskommuale udgftsposter. E alteratv estmatosmetode er derfor ofte påkrævet og e mulghed består at supplere det beskede atal eheder, dvs. amtskommuer, tværstsmateralet med tdssereobservatoer. Amtskommueres datamaterale vl dee stuato bestå af såvel tværsts- som tdssereobservatoer og sådae datastrukturer kaldes paeldata. I paeldata ka koklusoere fra amtskommueres relatvt beskede tværst således uderstøttes ved samtdg udyttelse af de formato, der lgger tdsserere. I paeldata atages som udgagspukt, at dvduelle eheder er forskellge (heterogee), hvlket er overesstemmelse med strukture for amtskommuere Damark. Varatoe data ka edvdere geerelt opdeles mellem varatoe mellem amtskommuer af forskellg størrelse og varatoe defor de ekelte amtskommuer, hvor førstævte varato som regel er størst. Aalyser med paeldata har tlkyttet e række statstske modeller, hvs relevas afhæger af datamateralets størrelse og karakter. Er data således e tlfældg stkprøve fra e stor populato atages effekte af udeladte varable, som er specfkke for de dvduelle eheders karaktertræk at være tlfældge og e model af radom-effect-type vl regele blve avedt. Omfatter data dermod hele populatoe atages effekte af udeladte varable, som er specfkke for de dvduelle eheders karaktertræk at være faste og e model af fxed-effect-type vl regele blve avedt. E aalyse af amtskommuere deholder det samlede atal eheder populatoe og det er derfor rmelgt at atage, at de ekelte amtskommuers karaktertræk er faste, og at avedelse af e fxed-effect-model e gve form er de mest plausble løsg. I dee forbdelse er der valgt at fokusere på ete oe-way-fxed-effect-modeller eller two-wayfxed-effect-modeller, jf. edefor. 4
142 Kommueres Udgftsbehov Paeldata tager som ævt udgagspukt e atagelse om, at de dvduelle tværstseheder er forskellge (heterogee). I fxed-effectmodelle varetages dee heterogetet mellem de dvduelle eheder geem dummy-varable, hvlket har gvet aledg tl avet, mdste kvadraters dummy-varabel metode. Oe-way-fxed-effect-modeller deholder dummy-varable, der tager højde for effekte fra udeladte varable, som er specfkke for de dvduelle tværstseheder (amtskommuere), me som holder sg kostate over td. I oe-way-fxed-effect-modelle atages altså ge tdsspecfkke effekter, og der fokuseres udelukkede på de dvdspecfkke effekter, dvs. de dvduelle forskelle mellem amtskommuere. I modelle vl værde af de afhægge varabel for de te ehed på tdspukt t, y t, afhæge af K eksogee varable ( x t, K, x Kt ) = x t. Dsse eksogee varable varerer mellem tværstsehedere på et gvet tdspukt, me varerer også over td. Modelle deferes ved, * (3.) yt = α + β x t + ε t, =,, 6, t = 993,..., 997, hvor β er e ( K )-vektor af kostater og α * er e ( )-skalar kostat repræseterede effekte fra de varable, som er specfkke for de te dvduelle tværstsehed, me som er kostate over td. Fejlleddet ε t repræseterer effekte fra udeladte varable, der er specfkke for de ekelte dvduelle tværstseheder og tdsperoder. Det atages, at ε t er e uafhægg og detsk fordelt stokastsk varabel med mddelværd ul og varas σ u. Oe-way-fxed-effect-modelle ka alteratvt formuleres ved, (3.) yt = μ + α + β x t + ε t, =,, 6, t = 993,..., 997, hvor μ er et fast kostatled og α er de ekelte tværstseheders afvgelser fra det faste kostatled, dvs. de ekelte amtskommuers afvgelser fra et fælles kostatled. Test af fast dvduel effekt modelle sker ved et F-test, der tester e 4
143 Kommueres Udgftsbehov 4 hypotese om, hvorvdt parametree tl dummy-varablee for de faste effekter samlet set er lg ul. Lad β f være e -dmesoal vektor deholdede parametree tl de faste effekter. Specfkatostestet er herefter de kovetoelle F-teststørrelse for hypotese β f =, der med (J, M K) frhedsgrader er deferet ved, (3.3) F ˆ β ˆ = S ˆ β, hvor f f f Ŝ f er de estmerede kovaras-matrx for de faste effekter. Two-way-fxed-effect-modelle er e udvdelse af oe-way-fxed-effectmodelle, hvor der også tages højde for tdsspecfkke effekter, dvs. ædrger over td udgftere, som er es for alle amtskommuer. Dette sker ved formulerge, (3.4) yt = μ + α + γ t + β x t + ε t, =,, 6, t = 993,..., 997, hvor γ t varetager effekte fra de udeladte varable, som er specfkke for hver tdsperode, gvet ved , me som holder sg kostate over de 6 amtskommuer. Test af fast dvduel effekt sker, som oe-way-fxed-effect-modelle, ved et F-test, hvor der testes e hypotese om, hvorvdt parametree tl dummyvarablee for de faste effekter samlet set er lg ul. Atallet af parametre tl de faste effekter, dvs. dummy-varablee, er u blot udvdet tl også at dbefatte parametree tl dummy-varablee tl de ekelte tdsperoder. Dette svarer dette tl fre ye parametre, svarede tl åree med 997 fugerede som udgagspukt. Det vl sge, at åree vurderes forhold tl 997. Amtskommuere er dbyrdes geerelt mere homogee ed prmærkommuere, hvlket medfører mdre varato de avedte varable, og dermed mdre for modellere at forklare. Dette forhold komberet med avedelse af de forholdsvs mage dummy-varable medfører, at modellere de amtskommuale aalyser typsk kke deholder et stort atal forklarede varable, me ofte er begræset tl modeller med to eller tre forklarede varable. 4
144 Kommueres Udgftsbehov 3. Gymaseudgfter I aalyse af amtskommueres gymaseudgfter avedes e two-wayfxed-effect-model beskrevet lgg (3.4), hvor forskelle de amtskommuale udgftsveauer, såvel dbyrdes mellem amtskommuere, som for de ekelte amtskommue over td, udlges med avedelse af dummy-varable. Modelle består således af både et tværstsperspektv og et tdssereperspektv. Tl estmatoe avedes fem tværstsdatamateraler på amtskommuere for perode Estmato af dee model er vst tabel 3.., og ved geemgag bemærkes udgagspuktet de 5 parametre tl dummy-varablee, gvet ved α α5, samt parametere tl kostatleddet, gvet ved μ. Fortolkge af dsse alt 6 parametre tager udgagspukt sdstævte kostatled, det det er forhold tl kostatleddet at de øvrge 5 dummyvarable skal værdsættes. Kostatleddet svarer tl dummy-varable for de tværstsspecfkke effekt for Nordjyllads Amtskommue, og forhold tl dee værd sker der ete e postv eller egatv korrekto, år de tværstsspecfkke effekt for de øvrge 5 amtskommuer skal fdes. Således blver eksempelvs værde af de tværstsspecfkke effekt for Købehavs Kommue, gvet ved summe mellem værde af kostatleddet lg 6.4,4 og værde af parametre tl dummy-varable lg.78,53, hvlket blver 7.9,93. Det bemærkes dee forbdelse, at kke alle parametre tl de tværstsspecfkke dummy-varable er sgfkate, og det er således kke mellem alle amtskommuer, at der dee model er sgfkate tværstseffekter fra udeladte varable. De tdsspecfkke effekter, dvs. ædrger over td gymaseudgftere, som atages es for alle amtskommuer, varetages af fre dummy-varable, der agver effekte fra de udeladte varable, som er specfkke for hver tdsperode, , me som holder sg kostate over de 6 amtskommuer. I modelle svarer dette tl de fre parametre γ 993 γ996 for åree , med 997 fugerede som udgagspukt. Det vl sge, at åree vurderes forhold tl
145 Kommueres Udgftsbehov 44 Tabel 7.3. Two Way Fxed Effect Model for amtskommueres gymaseudgfter F-test for ge fast dvduel effekt F-testværd P = 4,84, Varabel Parameter P = α - Købehavs Kommue (3).78,53,894 α - Frederksberg Kommue (4) 565,35,7646 α 3 - Købehavs Amtskommue (5).7,7,59 α - Frederksborg Amtskommue ().695,38,3 4 α - Rosklde Amtskommue (5) 55,,973 5 α 6 - Vest-sjællads Amtskommue (3) -474,54,78 α - Storstrøms Amtskommue (35) 678,9,856 7 α - Borholms Amtskommue (4) 735,9,595 8 α 9 - Fys Amtskommue (4) -43,,834 α - Søderjyllads Amtskommue (5) -6,,449 α - Rbe Amtskommue (55) -56,9,349 α - Vejle Amtskommue (6) -55,58,835 α - Rgkøbg Amtskommue (65) 78,,535 3 α - Århus Amtskommue (7) -39,59, α - Vborg Amtskommue (76) 5,7, μ - Nordjyllads Amtskommue (8) 6.4,4,46 γ ,86,7 γ ,3,7 γ ,8, γ ,8,79 Befolkgsadel m. vderegåede uddaelse 8.69,,8 Adel gymaselærere over 45 år 3.873,35,56 Parvs korrelato mellem vdereg. udd. og gymaselærere over 45 år : 3,7 % 44
146 Kommueres Udgftsbehov I tabelle ses dummy-varablee for de tdsspecfkke effekter, gvet ved, γ 993 = -967,86, γ 994 = -99,3, γ 995 = -494,8 og γ 996 = -86,8. Dsse parameterværder er es for alle 6 amtskommuer, me forskellg fra år tl år. Værdere skal som beskrevet fortolkes som e korrekto forhold tl udgagspuktet, gvet ved 997, og det fremgår således, at der sde 993 har været e kostat vækst amtskommueres gymaseudgfter pr. 5-9 årg. Det bemærkes vdere, at alle parameterestmatere tl de tdsspecfkke effekter er sgfkate på 5 % veau. For at modelles estmater har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur 3.. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses ekelte uoveresstemmelser mellem de emprske og teoretske fordelg. Fgur 3.. Blokdagram for stadardserede resdualer 35 3 P e r c e t STDRES Curve: Normal ( Mu= S gma=) I formelle test accepteres ormalfordelgsatagelse for de stadardserede resdualer ved det kvadrerede Ch-Goodess-of-ft-test ( χ = 7,373, p =,39 ), Kolmogorov-Smrov-testet ( D =,8, p >,5 ), Aderso-Darlgtestet ( A =,86, p >,5 ) og Cramer-vo Mses-testet ( W =,6, p =, ). Det ka derfor kokluderes, at de observerede uoveresstemmelser er 45
147 Kommueres Udgftsbehov 46 af mdre betydg, og at ormalfordelgsatagelse med overvejede sadsylghed er opfyldt for modelles stadardserede resdualer. E ade vgtg atagelse er, at modelles resdualer er uafhægge af hade og af modelles forklarede varable. I e grafsk udersøgelse, vst fgur 3.., medfører dsse atagelser, at de stadardserede resdualer skal placere sg tlfældgt og kostat omkrg e ulpuktsle, år de plottes mod eksempelvs modelles beregede værder af gymaseudgftere pr. 5-9 årg. Ved geemgag af fgure ka det kostateres, at dsse betgelser er opfyldt for størstedele af de stadardserede resdualer, dog er der e tedes tl trompetform over tervallet, hvor værde af de stadardserede resdualer stger med værde af modelles beregede værder og dkerer e vs grad af afhægghed. Fgur 3.. Std. resdualer plottet mod beregede værder af gymaseudgftere pr. 5-9 årg Grade af afhægghed og heteroskedastctet udersøges formelt ved Goldfeldt-Quadt-testet (F =,6, df = ( k, k) = ( 35, 35 ), p =,46), Breusch-Paga/Godfrey-testet (LM =,7, df = z = 3, p =,) og Koeker-Basset (korrekto for Breusch-Paga/Godfrey)-testet (LM = 7,, df = z = 3, p =,8), der alle tre tlfælde på 5 % sgfkasveau accepterer hypotese om heteroskedastctet, det 46
148 Kommueres Udgftsbehov sadsylghede for at observere teststørrelsesværder større ed de faktsk fude er mdre ed 5 %. Det er således sadsylgt, at de stadardserede resdualer er plaget af e vs grad af heteroskedastctet. Uder heteroskedastctet vl modelles parameterestmater stadg være mddelrette og kosstete og modelles resultater ka derfor avedes, dog bør der udvses forsgtghed overfor modelles varasestmat, der ved heteroskedastctet ka være skævt og ete over- eller uderestmere de sade værder. Testee er ærmere beskrevet Wllam H. Greee, Ecoometrc Aalyss, 993, Pretce-Hall. 47
149 Kommueres Udgftsbehov Sygehusudgfter I aalyse af amtskommueres sygehusudgfter pr. forvetet atal segedage avedes e oe-way-fxed-effect-model beskrevet lgg (3.), hvor effekte fra udeladte forklarede varable, som er specfkke for de dvduelle tværstseheder, d.v.s. amtskommuere, varetages ved avedelse af dummy-varable, me hvor effekte fra udeladte forklarede varable, som er specfkke for hver tdsperode atages kostat over td. Tl estmatoe avedes fem tværstsdatamateraler på amtskommuere for perode Estmato af dee model er vst tabel 3.., og ved geemgag bemærkes udgagspuktet de 5 parametre tl dummy-varablee, gvet ved α α5, samt parametere tl kostatleddet, gvet ved μ. Fortolkge af dsse alt 6 parametre tager udgagspukt sdstævte kostatled, det det er forhold tl dee værd at de øvrge 5 dummyvarable skal værdsættes. Kostatleddet svarer tl dummy-varable for de tværsts-specfkke effekt for Nordjyllads Amtskommue og forhold tl dee værd sker der ete e postv eller egatv korrekto, år de tværsts-specfkke effekt for de øvrge 5 amtskommuer skal fdes. Således blver eksempelvs værde af de tværsts-specfkke effekt for Købehavs Kommue gvet ved forskelle mellem værde af kostatleddet lg , og værde af parametre tl dummyvarable lg -5.3,, hvlket blver ,. Det bemærkes dee forbdelse, at æste alle parametre tl de tværstsspecfkke dummyvarable er sgfkate. 48
150 Kommueres Udgftsbehov Tabel 7.4. Oe Way Fxed Effect Model for amtskommueres sygehusudgfter F-test for ge fast dvduel effekt F-testværd P = 9,7785, Varabel Parameter P = α - Købehavs Kommue (3) -5.3,, α - Frederksberg Kommue (4) ,, α - Købehavs Amtskommue (5) ,, 3 α 4 - Frederksborg Amtskommue () ,, α - Rosklde Amtskommue (5) -7.33,, 5 α - Vest-sjællads Amtskommue (3) -5.48,5, 6 α 7 - Storstrøms Amtskommue (35) -94,3,38 α - Borholms Amtskommue (4) -89,8,657 8 α - Fys Amtskommue (4) -.97,, 9 α - Søderjyllads Amtskommue (5) -4.99,93, α - Rbe Amtskommue (55).746,93, α - Vejle Amtskommue (6) ,87, α 3 - Rgkøbg Amtskommue (65) 8.485,79, α - Århus Amtskommue (7) ,, 4 α - Vborg Amtskommue (76) 8.774,75, 5 μ - Nordjyllads Amtskommue (8) ,, Elge bladt ældre over 65 år 86,8,9 Frasklte persoer 68,46, Befolkgstæthede 3.79,, For at modelles estmater har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur 3.. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses e pæ overesstemmelse mellem de emprske og teoretske fordelg, dog med ekelte afvgeler (- 49
151 Kommueres Udgftsbehov 5,5)- og (,)-blokkee. Fgur 3.. Blokdagram for de stadardserede resdualer 3 5 P e r c e t STDRES Curve: Normal ( Mu= S gma=) I formelle test accepteres ormalfordelgsatagelse for de stadardserede resdualer ved det kvadrerede Ch-Goodess-of-ft-test ( χ = 5,98, p =,55 ), Kolmogorov-Smrov-testet ( D =,7, p =, ), Aderso-Darlgtestet ( A =,746, p =,3 ) og Cramer-vo Mses-testet ( W =,57, p =,9 ). Det ka derfor kokluderes, at de observerede uoveresstemmelser er af mdre betydg og, at ormalfordelgsatagelse med overvejede sadsylghed er opfyldt for modelles stadardserede resdualer. E ade vgtg atagelse er, at modelles resdualer er uafhægge af hade og af modelles forklarede varable. I e grafsk udersøgelse, vst fgur 3.., medfører dsse atagelser, at de stadardserede resdualer skal placere sg tlfældgt og kostat omkrg e ulpuktsle, år de plottes mod eksempelvs modelles beregede værder af sygehusudgftere pr. segedag. Ved geemgag af fgure ka det kostateres, at dsse betgelser er opfyldt, det der kke er tedes tl trompetform over tervallet, hvor værde af de stadardserede resdualer stger med værde af modelles beregede værder og dermed kue dkere e vs grad af afhægghed. Grade af afhægghed og heteroskedastctet udersøges formelt ved k k = 35 8, 35 8,, Goldfeldt-Quadt-testet (F =,9, df = ( ) ( ) 5
152 Kommueres Udgftsbehov p =,933), Breusch-Paga/Godfrey-testet (LM = 9,6, df = z = 3, p =,548) og Koeker-Basset (korrekto for Breusch-Paga/Godfrey)-testet (LM = 8,98, df = z = 3, p =,65), der alle på 5 % sgfkasveau afvser hypotese om heteroskedastctet, det sadsylghede for at observere e teststørrelsesværd større ed de faktsk fude er større ed 5 %. Fgur 3.. Std. resdualer plottet mod beregede værder af sygehusudgftere pr. forvetet atal sygedage Resultatet er dog følsomt overfor ædrger sgfkasveauet og det ka kke helt udelukkes, at de stadardserede resdualer e svag grad er plaget af heteroskedastctet. Uder heteroskedastctet vl modelles parameterestmater stadg være mddelrette og kosstete og modelles resultater ka derfor avedes, dog bør der udvses forsgtghed overfor modelles varasestmat, der ved heteroskedastctet ka være skævt og ete over- eller uderestmere de sade værder. Det er mdlertd kke vdere sadsylgt, at de observerede svage grad af varasafhæghed skulle have så markate kosekveser for modelles varasestmat. Testee er ærmere beskrevet Wllam H. Greee, Ecoometrc Aalyss, 993, Pretce-Hall. 5
153 Kommueres Udgftsbehov Sygeskrgsudgfter I aalyse af amtskommueres sygeskrgsudgfter pr. dbygger avedes e oe-way-fxed-effect-model beskrevet lgg (3.), hvor effekte fra udeladte forklarede varable, som er specfkke for de dvduelle tværstseheder, d.v.s. amtskommuere, varetages ved avedelse af dummy-varable, me hvor effekte fra udeladte forklarede varable, som er specfkke for hver tdsperode atages kostat. Tl estmatoe avedes fem tværstsdatamateraler på amtskommuere for perode Estmato af dee model er vst tabel 3.3., og ved geemgag bemærkes udgagspuktet de 5 parametre tl dummy-varablee, gvet ved α α5, samt parametere tl kostatleddet, gvet ved μ. Fortolkge af dsse alt 6 parametre tager udgagspukt sdstævte kostatled, det det er forhold tl dette at de øvrge 5 dummy-varable skal værdsættes. Kostatleddet svarer tl dummy-varable for de tværsts-specfkke effekt for Nordjyllads Amtskommue og forhold tl dee værd sker der ete e postv eller egatv korrekto, år de tværsts-specfkke effekt for de øvrge 5 amtskommuer skal fdes. Således blver eksempelvs værde af de tværsts-specfkke effekt for Købehavs Kommue gvet ved forskelle mellem værde af kostatleddet lg -4,47 og værde af parametre tl dummy-varable lg med -4,7, hvlket blver 9.8. Det bemærkes dee forbdelse, at blot e ekelt parameter tl de tværstsspecfkke dummy-varable kke er sgfkat og således har størstedele af de betragtede amtskommuer sgfkate tværstseffekter fra udeladte varable. 5
154 Kommueres Udgftsbehov Tabel 3.3. Oe Way Fxed Effect Model for amtskommueres sygeskrgsudgfter F-test for ge fast dvduel effekt F-testværd P =,867, Varabel Parameter P = α - Købehavs Kommue (3) -4,7, α - Frederksberg Kommue (4) -6,96, α 3 - Købehavs Amtskommue (5) -,88, α - Frederksborg Amtskommue () -,78, 4 α - Rosklde Amtskommue (5) -,3, 5 α 6 - Vestsjællads Amtskommue (3) -,3,43 α - Storstrøms Amtskommue (35) -,6,698 7 α - Borholms Amtskommue (4),36, 8 α 9 - Fys Amtskommue (4) -,63, α - Søderjyllads Amtskommue (5),44, α - Rbe Amtskommue (55),35, α - Vejle Amtskommue (6) -,7, α - Rgkøbg Amtskommue (65),9, 3 α - Århus Amtskommue (7) -,75, 4 α - Vborg Amtskommue (76),8, 5 μ - Nordjyllads Amtskommue (8) -4,47, Adel persoer med vderegåede uddaelse,9, Adel frasklte persoer,54, Parvs korrelato mellem vderegåede uddaelse og frasklte : 8,73 % For at modelles estmater har optmale egeskaber skal de stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur 3.3. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses afvgelser (-,)- og (,6)-blokkee mellem de emprske og teoretske fordelg, samt e relatv 53
155 Kommueres Udgftsbehov 54 llle kocetrato af stadardserede resdualer (,)-blokke. Dette forhold er kke tlfredsstllede, og bør medtages e betragtg af troværdghede af modelles resultater, således at der udvses e vs forsgtghed fortolkge. Fgur 3.3. Blokdagram for de stadardserede resdualer 3 5 P e r c e t STDRES Curve: Normal ( Mu= S gma=) I formelle test afvses ormalfordelgsatagelse for de stadardserede resdualer på 5 % sgfkasveau ved det kvadrerede Ch-Goodess-of-fttest ( χ = 4,86, p =,4 ), me accepteres ved Kolmogorov-Smrov-testet ( D =,9, p >,5 ), Aderso-Darlg-testet ( A =,, p >,5 ) og Cramer-vo Mses-testet ( W =,6, p >,5 ). E ade vgtg atagelse er, at modelles resdualer er uafhægge af hade og af modelles forklarede varable. I e grafsk udersøgelse, vst fgur 3.3., medfører dsse atagelser, at de stadardserede resdualer skal placere sg tlfældgt og kostat omkrg e ulpuktsle, år de plottes mod eksempelvs modelles beregede værder af sygeskrgsudgftere pr. dbygger. Ved geemgag af fgure ka det kostateres, at dsse betgelser er opfyldt for størstedele af resdualere, dog er der tedes tl trompetform over tervallet.5-.9, hvor værde af de stadardserede resdualer stger med værde af modelles beregede værder og dermed dkerer e vs grad af afhægghed. 54
156 Kommueres Udgftsbehov Fgur 3.3. Std. resdualer plottet mod beregede værder af sygeskrgsudgftere pr. dbygger Grade af afhægghed og heteroskedastctet udersøges formelt ved Goldfeldt-Quadt-testet (F =,7, df = ( k, k) = ( 35 8, 35 8), p =,66), Breusch-Paga/Godfrey-testet (LM = 7,6, df = z = 3, p =,64) og Koeker-Basset (korrekto for Breusch-Paga/Godfrey)-testet (LM =,55, df = z = 3, p =,4), der to ud af tre tlfælde på 5 % sgfkasveau afvser hypotese om heteroskedastctet, det sadsylghede for at observere teststørrelsesværder større ed de faktsk fude er større ed 5 % 3. Resultatet er dog følsomt overfor ædrger sgfkasveauet og det ka kke helt udelukkes, at de stadardserede resdualer e svag grad er plaget af heteroskedastctet. Uder heteroskedastctet vl modelles parameterestmater stadg være mddelrette og kosstete og modelles resultater ka derfor avedes, dog bør der udvses forsgtghed overfor 3 Testee er ærmere beskrevet Wllam H. Greee, Ecoometrc Aalyss, 993, Pretce-Hall. 55
157 Kommueres Udgftsbehov 56 modelles varasestmat, der ved heteroskedastctet ka være skævt og ete over- eller uderestmere de sade værder. Det er mdlertd kke vdere sadsylgt, at de observerede svage grad af varasafhæghed skulle have så markate kosekveser for modelles varasestmat. 56
158 Kommueres Udgftsbehov 3.4 Vejudgfter I aalyse af amtskommueres vejudgfter pr. dbygger avedes mdste kvadraters regresso på blot et ekelt tværst, gvet ved datamateralet for 997. Da Købehav og Frederksberg Kommuer kke dgår aalyse består dette tværst af 4 observatoer. Estmato af dee model er vst tabel 3.4., og ved geemgag bemærkes, at det er mulgt at estmere e model på baggrud af ku 4 observatoer. Dette forhold skal med stor sadsylghed heføres tl ddragelse af e forklarede varabel som sporlægde, der er stad tl at forklare e meget stor adel af varatoe amtskommueres vejudgfter. Tabel 3.4. Aalyse af amtskommueres vejudgfter pr. dbygger 997 Forklarede varabel Parameter P = Elastctet Kotatled -5,5,96 - Sporlægde pr. dbygger 44,9,,3 Logartme tl befolkgstæthede 6,56,,6 R -værd 9,7 % For at modelles estmater har optmale egeskaber skal modelles stadardserede resdualer være ormalfordelte. Tl udersøgelse af dee atagelse vser fgur 3.4. de emprske fordelg for de stadardserede resdualer llustreret ved et blokdagram, hvorpå der er lagt kurve for e stadard ormalfordelg. Ved geemgag af fgure ses ekelte markate uoveresstemmelser mellem de emprske og teoretske fordelg. I formelle test accepteres ormalfordelgsatagelse for de stadardserede resdualer ved det kvadrerede Ch-Goodess-of-ft-test ( χ = 3,6, p =,647 ), Kolmogorov-Smrov-testet ( D =,5, p >,5 ), Aderso- Darlg-testet ( A =,36, p >,5 ) og Cramer-vo Mses-testet ( W =,5, p >,5 ). Det ka derfor kokluderes, at de observerede uoveresstemmelser kke medfører e afvsg af ormalfordelgsatagelse, dog skal der tages et forbehold overfor det beskede atal observatoer. 57
159 Kommueres Udgftsbehov 58 Fgur 3.4. Blokdagram for stadardserede resdualer vægtet model 4 35 P e r c e t St udet zed Res dual Curve: Normal ( Mu= S gma=) Fgur 3.4. Std. resdualer plottet mod beregede vejudgfter pr. dbygger E ade vgtg atagelse er, at modelles resdualer er uafhægge af hade og af modelles forklarede varable. I e grafsk udersøgelse, 58
160 Kommueres Udgftsbehov vst fgur 3.4., medfører dsse atagelser, at de stadardserede resdualer skal placere sg tlfældgt og kostat omkrg e ulpuktsle, år de plottes mod eksempelvs modelles beregede værder af vejudgftere. Ved geemgag af fgure ka det kostateres, at dsse betgelser er opfyldt for lagt størstedele af de stadardserede resdualer, dog skal der ge tages et forbehold overfor det beskede atal observatoer. Grade af afhægghed og heteroskedastctet udersøges formelt ved Goldfeldt-Quadt-testet (F =,7, df = ( k, k) = ( 7 3, 7 3), p =,), Breusch-Paga/Godfrey-testet (LM =,49, df = z = 3, p =,4764) og Koeker-Basset (korrekto for Breusch-Paga/Godfrey)-testet (LM =,984, df = z = 3, p =,533), der alle alle på 5 % sgfkasveau afvser hypotese om heteroskedastctet, det sadsylghede for at observere teststørrelsesværder større ed de faktsk fude er større ed 5 % 4. Modelles resultater må på dee baggrud bedømmes tl at være troværdge og dermed avedelge. 4 Testee er ærmere beskrevet Wllam H. Greee, Ecoometrc Aalyss, 993, Pretce-Hall. 59
Men tilbage til regression og Chi-i-anden. test. Begge begreber refererer til normalfordelingen med middelværdi μ og spredning σ.
χ test matematkudervsge χ - test gymasets matematkudervsg I jauar ummeret 8 af LMFK bladet havde jeg e artkel, hvor jeg harcelerede ldt over, at regresso og sær χ fordelg havde fudet dpas matematkudervsge
Økonometri 1. Funktionel form. Funktionel form (fortsat) Dagens program. Den simple regressionsmodel 14. september 2005
Dages program Økoometr De smple regressosmodel 4. september 5 Dee forelæsg drejer sg stadg om de smple regressosmodel (Wooldrdge kap.4-.6) Fuktoel form Hvorår er OLS mddelret? Varase på OLS estmatore Regressosmodelle
Statistik Lektion 14 Simpel Lineær Regression. Simpel lineær regression Mindste kvadraters metode Kovarians og Korrelation
Statstk Lekto 4 Smpel Leær Regresso Smpel leær regresso Mdste kvadraters metode Kovaras og Korrelato Scatterplot Scatterplot kf Advertsg Epedtures ( ad Sales ( Et scatterplot vser par (, af observatoer.
x-klasserne Gammel Hellerup Gymnasium
SANDSYNLIGHEDSREGNING OG KOMBINATORIK x-klassere Gammel Hellerup Gymasum Idholdsfortegelse SANDSYNLIGHEDSREGNING... 3 Sadsylghedsfelt... 3 Edelge sadsylghedsfelter (sadsylghedsfordelger):... 3 Uedelge
Økonometri 1. Instrumentvariabelestimation 26. november Plan for IV gennemgang. Exogenitetsantagelsen. Exogenitetsantagelsen for OLS
y = cy ( c 0 ) Pla for IV geemgag Økoometr Istrumetvarabelestmato 6. ovember 004 F9: Hvad er IV estmato: Bvarat model, et strumet: Kap.5. + afst -4 ote. F0: IV estmato det multple tlfælde (eksakt detfceret):
Elementær Matematik. Sandsynlighedsregning
lemetær Matematk Sadsylghedsregg Ole Wtt-Hase Køge Gymasum 008 INDHOLD KAP. KOMBINATORIK.... MULTIPLIKATIONS- OG ADDTIONSPRINCIPPT.... PRMUTATIONR... 3. KOMBINATIONR...3 KAP. NDLIGT SANDSYNLIGHDSFLT...7.
IKKE-KONTINUERTE (DISKRETE) STOKASTISKE VARIABLE MIDDELVÆRDI, VARIANS, SPREDNING FORDELINGER: HYPERGEOMETRISK, BINOMIAL, POISSON
IE-ONTINUERTE (DISRETE) STOASTISE VARIABLE MIDDELVÆRDI, VARIANS, SPREDNING FORDELINGER: HYPERGEOMETRIS, BINOMIAL, POISSON Edelgt sadsylghedsfelt V reeterer: Et sadsylghedsfelt ( P ) U, kaldes edelgt, hvs
Induktionsbevis og sum af række side 1/7
Iduktosbevs og sum af række sde /7 Skrver ma,,,...,,..., =, 2, 3,... 2 3 taler ma om e talfølge, eller blot e følge. Adre eksempler på følger er, -,, -,, -,..., (-) +,..., =, 2, 3,..., 2, 3, 4,...,,...,
Videregående Algoritmik. David Pisinger, DIKU. Reeksamen, April 2005
Vderegåede Algortmk Davd Psger, DIKU Reeksame, Aprl 5 Bsecto problemet Gvet e uvægtet graf G = (V, E) samt et heltal k. E bsecto af grafe G er e opdelg af kudere V to lge store mægder S og T. MAX-BISECTION
1.0 FORSIKRINGSFORMER
eam Lv forskrgsakteselskab Bereggsgrudlaget sgrp217 tl præmeberegg for gruppeforskrg e-am Lv forskrgsakteselskab 1. FORIKRINGFORMER 1.1 Oblgatorske ordger Alle gruppeforskrgsordger teget på dette grudlag
Statistik 9. gang 1 REGRESSIONSANALYSE. Korrelation (kontrol af model) Regression (tilpasning af model)
Statstk 9. gag REGRESSIONSANALYSE Korrelato kotrol af model Regresso tlpasg af model Statstk 9. gag KORRELATIONS ANALYSE. Grad af fælles varato mellem X og Y. Område og fordelg af sample data 3. Optræde
FORDELINGER: HYPERGEOMETRISK FORDELING, BINOMIALFORDELING MIDDELVÆRDI DEFINITION. X er en stokastisk variabel på et endeligt sandsynlighedsfelt ( )
FORDELINGER: HYERGEOMETRIS FORDELING, BINOMIALFORDELING MIDDELVÆRDI Mddelværd MIDDELVÆRDI (TYS: ERWARTUNGSWERT ) DEFINITION X er e stokastsk varabel på et edelgt sadsylghedsfelt U, ( ) Mddelværde af X
FACITLISTE TIL KOMPLEKSE TAL
FACITLISTE TIL KOMPLEKSE TAL Kaptel Opgave Opgave Opgave Det emmeste check af lgge er at opløfte begge sder tl. potes. Bombells metode gver følgede lgger: a a b = 5 ( ) b a b = 09 = 7. Løs dem med et CAS
FY01 Obligatorisk laboratorieøvelse. O p t i k. Jacob Christiansen Afleveringsdato: 3. april 2003 Morten Olesen Andreas Lyder
FY0 Oblgatorsk laboratoreøvelse O p t k Hold E: Hold: D Jacob Chrstase Alevergsdato: 3. aprl 003 Morte Olese Adreas Lyder Idholdsortegelse Idholdsortegelse Forål...3 Måleresultater...4. Salelser...4. Spredelse...5.3
Bilag 6: Økonometriske
Marts 2015 Blag 6: Økonometrske analyser af energselskabernes omkostnnger tl energsparendsatsen Energstyrelsen Indholdsfortegnelse 1. Paneldataanalyse 3 Specfkaton af anvendte panel regressonsmodeller
Lineær regressionsanalyse8
Lneær regressonsanalyse8 336 8. Lneær regressonsanalyse Lneær regressonsanalyse Fra kaptel 4 Mat C-bogen ved v, at man kan ndtegne en række punkter et koordnatsystem, for at afgøre, hvor tæt på en ret
hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i
Normalfordeliger For at e stokastisk variabel X ka være ormalfordelt, skal X agive værdie af e eller ade målig, f.eks. tid, lægde, vægt, beløb osv. Notatioe er: Xi ~ N( μ, σ hvor i er observatiosummeret,
Lineære Normale Modeller
Note tl Leære Normale Modeller Bo Rosbjerg. marts 009 Tegger udført af Herk Ve Chrstese Idhold E smpel leær ormal model 5. Modelbestemmelse........................... 5. Mdste kvadraters estmat......................
Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)
Løsigsforslag til skriftlig eksame i Kombiatorik, sadsylighed og radomiserede algoritmer (DM58) Istitut for Matematik & Datalogi Syddask Uiversitet Madag de 3 Jauar 011, kl. 9 13 Alle sædvalige hjælpemidler
Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse
Økonometr Prøveeksamen Indtjenng, konkurrencestuaton og produktudvklng danske vrksomheder Kommenteret vejledende besvarelse Resultaterne denne besvarelse er fremkommet ved brug af eksamensnummer 7. Dne
Motivation. En tegning
Motivatio Scatter-plot at det mådelige salg mod det måedlige reklamebudget. R: plot(salg ~ budget, data = salg) Økoometri Lektio Simpel Lieær Regressio salg 400 450 500 550 20 25 30 35 40 45 50 budget
Note til Spilteori Mikro 2. år 2. semester Erik Bennike. Note til Spilteori
Note tl Splteor Mkro. år. semester Erk Beke Note tl Splteor Gos s. - Splteor eskæftger sg med sttoer hvor der er strtegsk fhægghed geter mellem. Nytte for de ekelte get fhæger således kke lee f ege hdlger
Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel
Statstk II Lekton 5 Modelkontrol Modelkontrol Modelsøgnng Større eksempel Generel Lneær Model Y afhængg skala varabel 1,, k forklarende varable, skala eller bnære Model: Mddelværden af Y gvet =( 1,, k
Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros
Brachevejledig ulykker idefor lager området Brachearbejdsmiljørådet for trasport og egros Baggrud Udersøgelser på lager- og trasportområdet har vist, at beskrivelse af hædelsesforløbet ved udfyldelse
Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?
Dagens program Økonometr Heteroskedastctet 6. oktober 004 Hovedemnet for denne forelæsnng er heteroskedastctet (kap. 8.-8.3) Lneære sandsynlghedsmodel (kap 7.5) Konsekvenser af heteroskedastctet Hvordan
9. Binomialfordelingen
9. Biomialfordelige 9.. Gekedelse Hvert forsøg ka ku resultere i to mulige udfald; succes og fiasko. I modsætig til poissofordelige er atallet af forsøg edeligt. 9.. Model X : Stokastisk variabel, der
Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner
Projekter: Kapitel 4 Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Projekt 48 De reelle tal og hovedsætig om kotiuerte fuktioer Kotiuitet og kotiuerte fuktioer Ord som kotiuert og kotiuerlig
Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test
Opsamlng Smpel/Multpel Lneær Regresson Logstsk Regresson Ikke-parametrske Metoder Ch--anden Test Opbygnng af statstsk model Specfcer model Lgnnger og antagelser Estmer parametre Modelkontrol Er modellen
Branchevejledning. ulykker indenfor. godschauffør. området. Branchearbejdsmiljørådet for transport og engros
Brachevejledig ulykker idefor godschauffør området Brachearbejdsmiljørådet for trasport og egros Baggrud Udersøgelser på lager- og trasportområdet har vist, at beskrivelse af hædelsesforløbet ved udfyldelse
Elementær Matematik. Polynomier
Elemetær Matematik Polyomier Ole Witt-Hase 2008 Køge Gymasium Idhold 1. Geerelle polyomier...1 2. Divisio med hele tal....1 3. Polyomiers divisio...2 4. Polyomiers rødder....4 5. Bestemmelse af røddere
Beregning af strukturel arbejdsstyrke
VERION: d. 2.1.215 ofe Andersen og Jesper Lnaa Beregnng af strukturel arbedsstyrke Der er betydelg forskel Fnansmnsterets (FM) og Det Økonomske Råds (DØR) vurderng af det aktuelle output gap. Den væsentlgste
Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.
Matematik A Studetereksame Forsøg med digitale eksamesopgaver med adgag til iterettet Forberedelsesmateriale Vejledede opgave Forår 0 til stx-a-net MATEMATIK Der skal afsættes 6 timer af holdets sædvalige
Renteformlen. Erik Vestergaard
Reteformle Erik Vestergaard 2 Erik Vestergaard www.matematikfysik.dk Erik Vestergaard, 2010. Billeder: Forside: istock.com/ilbusca Side 4: istock.com/adresrimagig Desude ege illustratioer. Erik Vestergaard
Binomialfordelingen. Erik Vestergaard
Bnomalfordelngen Erk Vestergaard Erk Vestergaard www.matematkfysk.dk Erk Vestergaard,. Blleder: Forsde: Stock.com/gnevre Sde : Stock.com/jaroon Sde : Stock.com/pod Desuden egne fotos og llustratoner. Erk
Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017
Meigsmåliger KLADDE Thomas Heide-Jørgese, Rosborg Gymasium & HF, 2017 Idhold 1 Meigsmåliger 2 1.1 Idledig................................. 2 1.2 Hvorda skal usikkerhede forstås?................... 3 1.3
Ugeseddel 8. Gruppearbejde:
Ugeseddel 8 Gruppearbejde: 1. Ved at nkludere en dummyvarabel for et bestemt landeområde, svarer tl at konstatere, at dsse lande har nogle unkke karakterstka, som har betydnng for væksten, som kke gør
Lys og gitterligningen
Fysik rapport: Lys og gitterligige Forfatter: Bastia Emil Jørgese.z Øvelse blev udført osdag de 25. jauar 202 samme med Lise Kjærgaard Paulse 2 - Bastia Emil Jørgese Fysik rapport (4 elevtimer), februar
Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.
Praktisk ifo Liste med rettelser og meigsforstyrrede trykfejl i DS på Absalo. Statistisk aalyse af e ekelt stikprøve: kedt eller ukedt varias Sadsylighedsregig og Statistik (SaSt) Helle Sørese Projekt
Kogebog: 5. Beregn F d
tattk 8. gag KONFIDENINERVALLER Kofdetervaller: kaptel Valg og tet af fordelgfukto tattk 8. gag. KONFIDEN INERVALLER Et kofde terval udtrykker tervallet hvor de rgtge værd af parametere K, med γ % adylghed
6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, fredag
Afdelng for Epdemolog Afdelng for Bostatstk 6. SEESTER Epdemolog og Bostatstk Opgaver tl 3. uge, fredag Data tl denne opgave stammer fra. Bland: An Introducton to edcal Statstcs (Exercse 11E ). V har hentet
Projekt 9.10 St. Petersborg paradokset
Hvad er matematik? ISBN 978877066879 Projekt 9.0 St. Petersborg paradokset. De store tals lov & viderchacer I grudboges kapitel 9 omtales de store tals lov, som ka formuleres således: Hvis e spiller i
Projekt 1.3 Brydningsloven
Projekt 1.3 Brydigslove Når e bølge, fx e lysbølge, rammer e græseflade mellem to stoffer, vil bølge ormalt blive spaltet i to: Noget af bølge kastes tilbage (spejlig), hvor udfaldsvikle u er de samme
1 Indeksberegninger. 1.1 Indeksberegningers formål og brug. 1.2 Typer af indeks
7 Ideksberegger. Ideksbereggers formål og brug Damarks Sasks deks bruges l a gve e ekel og brugbar mål for udvklge værder, rser eller mægder over d. Hvs ma har e alrække over aal fødsler sde 9 ka ma dae
Den flerdimensionale normalfordeling
De flerdimesioale ormalfordelig Stokastiske vektorer Ved e stokastisk vektor skal vi forstå e vektor, hvor de ekelte kompoeter er sædvalige stokastiske variable. For de stokastiske vektor Y = Y,..., Y
Analyse af bivariate data: korrelation og regression. korrelation. Korrelation og regression: Co-varians:
,,,,,,,,,, Stattk for bologer -, modul og : Korrelato og regreo: Aale af bvarate data: korrelato og regreo Korrelato: llutrerer v.h.a. e koeffcet hvlke grad to varable er dbrde afhægge: - (perfekt egatv
Udvikling af en metode til effektvurdering af Miljøstyrelsens Kemikalieinspektions tilsyn og kontrol
Udvklng af en metode tl effektvurderng af Mljøstyrelsens Kemkalenspektons tlsyn og kontrol Orenterng fra Mljøstyrelsen Nr. 10 2010 Indhold 1 FORORD 5 2 EXECUTIVE SUMMARY 7 3 INDLEDNING 11 3.1 AFGRÆNSNING
Estimation og test i normalfordelingen
af Birger Stjerholm Made Samfudlitteratur 07 Etimatio og tet i ormalfordelige Dee tekt ideholder et overblik over ogle grudlæggede pricipper for etimatio og tet i ormalfordelige i hyppigt forekommede ituatioer:
Sandsynlighedsregning i biologi
Om begrebet sadsylighed Sadsylighedsregig i biologi Hvis vi kaster e almidelig, symmetrisk terig, er det klart for de fleste af os, hvad vi meer, år vi siger, at sadsylighede for at få e femmer er 1/6.
1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2
Idhold 1 Pukt- og itervalestimatio 2 1.1 Puktestimatorer: Cetralitet(bias) og efficies.................... 2 2 Kofidesiterval 3 2.1 Kofidesiterval for adel................................ 4 2.2 Kofidesiterval
