Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater
|
|
- Julius Eskildsen
- 6 år siden
- Visninger:
Transkript
1 Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold til lovgivningen. Med lovgivningen sigtes ikke alene til reglerne, som de fremgår af love og bekendtgørelser, men også til den praksis, der kan udledes af Ankestyrelsens principielle afgørelser. Vurderingen af afgørelsens materielle indhold er kernen i praksisundersøgelser og er afgørende for, om Ankestyrelsen eller nævnet kan erklære sig enig eller uenig i de indsendte afgørelser. I den materielle vurdering sammenlignes og rangordnes kommunerne på andelen fejlbehæftede sager samt på, i hvor høj grad de afgjorte sager er rigtigt oplyste. Rangordningen er baseret på en statistisk analyse af, om resultatet for kommunerne er signifikant forskelligt fra gennemsnittet af kommunerne. De statistiske analyser er baseret på en række antagelser, som forventes at være opfyldt. Disse antagelser diskuteres i det næste afsnit. Antagelser Sammenlignelighed For at kunne benchmarke kommunerne må de parametre, der vurderes, kunne sammenlignes mellem dem. Det betyder, at de spørgsmål, som stilles i måleskemaerne for de forskellige praksisundersøgelser, må være ens. Det materielle indholds rigtighed vurderes gennem analyse af spørgsmålet: Er afgørelsen samlet set rigtig? Derudover bruges spørgsmålet: I hvilket omfang er sagen oplyst? til at nuancere billedet fra analysen af det førstnævnte spørgsmål. Begge disse spørgsmål bliver stillet i alle praksisundersøgelser og vurderes at kunne besvares på en ensartet måde af alle kommuner uanset undersøgelsens emne. Dermed er det muligt at benchmarke kommunerne baseret på disse to spørgsmål. Stikprøvens størrelse Ofte er det ikke muligt at inddrage alle kommunens sager, når et givet område undersøges. Derfor udtages en stikprøve af den samlede population af sager. Ud fra den observerede gennemsnitlige 1
2 fejlprocent i en stikprøve af sager ønsker man at beregne et skøn for den gennemsnitlige fejlprocent i det samlede antal sager for kommunen. Ankestyrelsen indsamler i alt 14 sager per kommune per praksisundersøgelse, mens de sociale nævn indsamler 10 sager per kommune per praksisundersøgelse. Ud fra den observerede fejlprocent i denne stikprøve kan det beregnes, i hvilket interval den sande fejlprocent (dvs. fejlprocenten i alle kommunens sager) vil ligge. Jo større stikprøve, desto mindre bliver intervallet, dvs. præcisionen i beregningen stiger med stikprøvens størrelse. Hvis stikprøven er lig med den totale population, er præcisionen i beregningen dermed 100 procent. For små kommuner er det muligt, at det totale antal behandlede sager i et særligt emne er mindre end det antal sager, som bliver indsamlet af Ankestyrelsen eller de sociale nævn. For disse kommuner bliver derfor det totale antal sager indsamlet. Vi antager alligevel, at der også for disse kommuner er tale om en stikprøve fra den totale population af sager. Da praksisundersøgelser i et særligt emne ikke foretages hvert år, kan de sager, der samles ind fra disse kommuner, fx ses som en stikprøve af det totale antal sager over en længere tidsperiode. Antagelsen, at det drejer sig om en stikprøve også for disse kommuner, kan dermed siges være opfyldt. Randomiseret valg af sager Det er vigtigt, at de sager, som undersøges i praksisundersøgelsen, vælges ud slumpmæssigt ellers kan en kommune jo udvælge de sager, som man tror, er rigtigt afgjorte og godt oplyste til praksisundersøgelserne. For at sikre, at kommunerne ikke udvælger deres bedste sager til praksisundersøgelserne, bliver sagerne i alle kommuner indsamlet efter dato. Ankestyrelsen eller de sociale nævn indsamler de 14 henholdsvis 10 senest afgjorte sager før en særlig dato. På denne måde sikres det slumpmæssige valg af sager. Metode Er sagen rigtigt afgjort? Logistisk regressionsmodel 1 Den logistiske regressionsmodel estimerer sandsynligheden for fejl i forhold til sandsynligheden for ikke-fejl. Denne model er derfor meget egnet til at analysere spørgsmålet: Er afgørelsen samlet set rigtig? Enten er en sag jo rigtigt afgjort, eller også er den det ikke. Hvis der i stedet for logistisk regressionsmodel anvendes almindelig lineær regression er der risiko for, at der beregnes negative sandsynligheder eller sandsynligheder, der er større end en (dvs. større end 100 procent). Ved at 1 Se fx Long & Freese (2006) for mere information om den logistiske regressionsmodel. 2
3 anvende den logistiske regressionsmodel sikres det, at sandsynligheden for fejl altid vil ligge i intervallet mellem 0 og 1. Vi antager, at sandsynligheden for, at en sag er rigtigt afgjort, P, kan forklares af, i hvilken kommune, k i, sagen afgjordes. I den logistiske model antages, at sandsynligheden for, at en sag er rigtigt afgjort, kan beregnes på den følgende måde: P e β k + β k + βik = i β 1k1 + β2k βiki 1+ e Gennem statistiske maksimeringsmetoder estimeres koefficienter (β-værdier) så at overensstemmelsen mellem sandsynligheden for fejl (dvs. P) og faktiske fejl er så stor som muligt. β-værdierne viser den enkelte kommunes fejlsandsynlighed. Hvis for eksempel β 1 er større end det samlede gennemsnit for β erne, betyder det, at kommune 1 har relativt høj sandsynlighed for at afgøre en sag forkert og dermed en ringe sagsbehandlingskvalitet. Hvis β 1 kun er lidt større end det samlede gennemsnit, er det muligt, at det er en tilfældighed, at der observeres flere fejl i kommune 1 end i gennemsnitskommunen. Ved at beregne konfidensinterval kan det afgøres, om en kommune afviger signifikant fra gennemsnittet af alle kommuner. Vi bruger et konfidensinterval på 90 procent, dvs. vi kan med 90 procents sandsynlighed sige, at den observerede sandsynlighed for fejl ligger inden for konfidensintervallet. Hvorvidt en forskel er statistisk signifikant, illustreres med konfidensgrænser, der viser den højeste og laveste sandsynlighed, der med 90 procents sikkerhed kan tænkes, at en kommunes andel fejl er. Der bliver således i afrapporteringen taget højde for den statistiske usikkerhed for den enkelte kommune. Da det er muligt, at nogle typer af emner for praksisundersøgelser er sværere for kommunen at afgøre, inddrages indikatorer for emne i modellen. Ved at inddrage indikatorer for emne korrigeres der for, at nogle emner er sværere end andre. Det betyder altså, at emnet for praksisundersøgelsen ikke har nogen betydning for, hvordan kommunen benchmarkes. Dette gør, at benchmarkingen af kommunerne bliver mere retfærdig. Da sager fra forskellige emner indsamles i forskellige praksisundersøgelser, er disse uafhængige, hvilket er nødvendigt, for at modellen skal kunne estimeres. Hvis vi antager, at sager fra to forskellige praksisundersøgelser (om to forskellige emner) er blevet indsamlet, bliver den logistiske regressionsmodel: e P = 1+ e β β β γ + γ 1k1 + 1k1 + 2k iki + 1e1 2e2 β β β γ + γ 2k iki + 1e1 2e2 3
4 Hvor e erne betegner emne og γ erne er parametrene, som skal estimeres, og som viser, hvor svært det er at afgøre de forskellige emner. I hvilket omfang er sagen oplyst? Som tidligere nævnt kan svarene på spørgsmålet: I hvilket omfang er sagen oplyst? bruges på at nuancere analysen baseret på spørgsmålet, om afgørelsen samlet set er rigtig eller ej. Spørgsmålet har fire kategorier, hvor 1 betyder, at ingen oplysninger mangler, 2 betyder, at mindre væsentlige oplysninger mangler, 3 betyder, at flere oplysninger mangler, og 4 betyder, at afgørende oplysninger mangler. Også her bliver en logistisk model brugt i analysen, se s 12. Forholdet mellem i hvor høj grad sagen er oplyst og kommunens evne til at træffe en rigtig afgørelse For at en sag skal kunne afgøres på en rigtig måde, må enten ingen eller kun mindre væsentlige oplysninger mangle. Det er dog muligt, at en kommune har alle de nødvendige oplysninger, men stadigvæk træffer en forkert afgørelse. Vi undersøger derfor, i hvilken grad kommunerne henholdsvis i) har oplyst sagen og truffet en rigtig afgørelse, ii) har oplyst sagen, men truffet en forkert afgørelse, iii) ej oplyst sagen og truffet en forkert afgørelse. Multinomial logit regressionsmodel I dette tilfælde kan svaralternativerne ikke ordnes på nogen særlig måde. Alternativ ii) er fx ikke bedre end alternativ iii) afgørelsen er jo forkert i begge tilfælde (selv om distinktionen mellem alternativerne er meget vigtig, for at den enkelte kommune skal kunne forbedre den fremtidige sagsbehandlingskvalitet). Derfor bruger vi en multinomial regressions model, i hvilken vi kontrollerer for kommune og praksisundersøgelsens emne. Denne model kan bruges, når de forskellige alternativer i den afhængige variabel ikke kan ordnes i nogen særlig rækkefølge. I princippet estimerer modellen separate binære logit-modeller for alle par af svaralternativer, som skal sammenlignes (se Long & Freese, 2006, for mere information om modellen). Som tidligere kontrollerer vi for kommune og emne i modellen. Foreløbige resultater Deskriptiv statistik I 2007 s praksisundersøgelse er der blevet undersøgt sager om 14 forskellige emner. I gennemsnit blev 36 sager per kommune, fordelt på i gennemsnit 3 forskellige emner, undersøgt. I alt er
5 sager blevet undersøgt. Der mangler dog informationer om kommune og/eller, om sagen er rigtigt afgjort eller ej, i 12 sager i alt, og disse bliver derfor udelukket fra analysen. I alt bliver altså sager analyseret. I gennemsnit blev der truffet en rigtig afgørelse i 52 procent af de undersøgte sager (609 sager var rigtigt afgjorte). Kommunerne er blevet anonymiseret i teksten fordi resultaterne er baserede på foreløbige data. I tabel 1 viser vi andel rigtigt afgjorte sager i gennemsnit per kommune uden at tage højde for emnerne for de praksisundersøgelser, som kommunen deltog i. Det forekommer, at kommunenavn og kommunenummer ikke stemmer overens i data. Vi har da antaget, at kommunenavnet er rigtigt og har ændret kommunenummeret, så at det stemmer overens med kommunenavnet. Tabel 1. Andel rigtigt afgjorte sager per kommune i 2007 s praksisundersøgelse. Kommune Andel rigtige sager, procent Antal rigtige sager Antal undersøgte sager Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune Kommune I alt
6 I tabel 2 viser vi, hvor stor en andel af sagerne der var rigtigt afgjorte for de 14 forskellige praksisundersøgelser. Tabel 2 viser, at der er stor forskel mellem, hvor stor en andel af sagerne der er rigtigt afgjorte for de forskellige praksisundersøgelser. For praksisundersøgelsen Ledighedsydelse er alle sager rigtigt afgjorte, mens kun en sag er rigtigt afgjort for Svage. Tabel 2 viser dermed, at det er meget vigtigt at kontrollere for praksisundersøgelsens emne i regressionsanalysen, for at få et korrekt billede af den enkelte kommunes evne til at afgøre sager rigtigt. Tabel 2. Andel sager, der blev afgjort rigtigt, fordelt på praksisundersøgelsernes emne. Emne for praksisundersøgelse Andel rigtige sager (procent) Antal undersøgte sager Ledighedsydelse Hjælpemidler 83,8 165 Matchgrupper 82,6 144 Integration 67,8 87 Tilbagebetaling 64,4 59 Sygedagpenge 59,7 62 Revalidering 35,3 85 Anbringelse 35,2 142 Enkeltudgifter 34,4 93 Merudgifter voksne 33,7 83 Merudgifter børn 24,5 49 Støttehjemmet 20,7 58 FOEP 8,8 80 Svage 6,3 16 Vi undersøger også spørgsmålet I hvilken grad er sagen oplyst? Der er fire mulige svaralternativer, fra ingen oplysninger mangler til væsentlige oplysninger mangler. I alt har vi informationer om sager. Vi mangler dog kommuneoplysninger for 5 sager i alt. Derudover er 15 sager kodet som rigtigt afgjorte, selv om væsentlige eller afgørende oplysninger mangler. I alt er der derfor sager, som vi kan bruge i vores analyse. I tabel 3 viser vi fordelingen for de fire svaralternativer for disse sager. Tabel 3. I hvilken grad er sagen oplyst? Svaralternativ Andel sager (procent) Antal sager Ingen oplysninger mangler 32,3 454 Enkelte mindre væsentlige oplysninger mangler 28,4 328 Flere og/eller væsentlige oplysninger mangler 19,7 228 Afgørende oplysninger mangler 12,6 146 I alt Stikprøve Som nævnt er der i alt sager i vores data, men der er kun oplysninger om emne, kommune, om sagen er rigtigt afgjort for sager. Derudover er 15 sager kodet som rigtigt afgjorte, selv 6
7 om væsentlige eller afgørende oplysninger mangler. Det betyder, at vi har fuldstændige oplysninger om sager. I de videre analyser har vi dog udelukket alle sager fra praksisundersøgelserne Ledighedsydelse og Svage fra modellen. Det er ikke muligt at inddrage en variabel, der er perfekt korreleret med resultatet, og derfor er Ledighedsydelse blevet ekskluderet (alle sager i praksisundersøgelsen Ledighedsydelse er jo rigtige, dvs. altid når dummyen for Ledighedsydelse = 1, så er den afhængige variabel Rigtig = 1, dvs. dummyen for Ledighedsydelse kan ikke bidrage til at forklare sagens rigtighed). Dermed bliver 48 sager udelukket. Af den samme grund er Kommune 33 blevet udelukket fra modellen denne kommune har kun forkert afgjorte sager, så hver gang dummyen for Kommune 33 =1, så er den afhængige variabel Rigtig = 0, dvs. der er perfekt korrelation mellem variablerne. Tre sager bliver udelukket fra Kommune 33. Vi har også udelukket sagerne for praksisundersøgelsen Svage, fordi kun tre kommuner har deltaget i denne praksisundersøgelse. Da så få kommuner har deltaget, er det svært at vide, om det dårlige resultat for denne undersøgelse forklares af lav sagsbehandlingskvalitet i disse kommuner, eller af om undersøgelsen er svær. I alt 16 sager fra Svage bliver udelukket. I alt indgår dermed sager i regressionsmodellerne. Tabel 4 viser, hvordan vi kommer til vores endelige stikprøve, og hvor mange sager vi udelukker i hvert trin. Tabel 4. Stikprøvebeskrivelse. Antal sager Antal sager tilbage Det oprindelige datasæt Savner oplysninger om emne, kommune, eller om sagen er rigtigt afgjort Er ulogisk kodet Fra Svage og Ledighedsydelser Fra Kommune Benchmarking baseret på logistisk regressionsmodel Figur 1 viser, hvordan de inkluderede kommuner blev benchmarket baseret på praksisundersøgelser foretaget i Tallene i figur 1a er baseret på estimerede sandsynligheder for at afgøre en sag rigtigt fra en logistisk regressionsmodel. I modellen kontrollerer vi for praksisundersøgelsernes emne. De estimerede koefficienter findes i den første resultatkolonne i tabel A1 i appendiks. Når den estimerede sandsynlighed for fejl beregnes, har vi brugt emneparametrene vægtet med andelen af sager inden for hvert emne som reference i beregningerne for alle kommuner. For eksempel kommer ca. 15 procent af sagerne i vores stikprøve fra Hjælpemidler, 8 procent fra 2 Svage og Ledighedsydelser indeholder i alt 64 sager, men 2 af de 15 sager, som var ulogisk kodet, kommer fra Ledighedsydelser. Derfor bliver kun 62 sager udelukket i dette trin. 7
8 Integration osv. I beregningen af den estimerede sandsynlighed for en rigtig afgørelse inkluderes altså 0,15*γ hjælpemiddler +0,08*γ integration osv. Emnerne for de praksisundersøgelser, som den enkelte kommune har deltaget i, påvirker derfor ikke rangordningen af kommunerne.. Det betyder altså, at resultatet for den enkelte kommune ikke påvirkes af, at nogle typer af emner er sværere at afgøre rigtigt end andre. Det er vigtigt at tage højde for praksisundersøgelsens emne på den her måde, fordi kommuner, som egentlig har en høj sagsbehandlingskvalitet, men som er blevet undersøgte på svære emner, ellers risikerer at blive dårligere ranket end kommuner, som egentlig har en forholdsvis lav sagsbehandlingskvalitet, men som er blevet undersøgt på nemme emner. Figur 1a. Rangordning af kommuner i praksisundersøgelser i ,2 1 0,8 0,6 0,4 0,2 0 Kommune 10 Kommune 11 Kommune 12 Kommune 8 Kommune 26 Kommune 2 Kommune 17 Kommune 5 Kommune 31 Kommune 20 Kommune 6 Kommune 19 Kommune 1 Kommune 18 Kommune 25 Kommune 32 Kommune 15 Kommune 28 Kommune 22 Kommune 4 Kommune 30 Kommune 9 Kommune 13 Kommune 23 Kommune 21 Kommune 7 Kommune 29 Kommune 27 Kommune 14 Kommune 16 Kommune 24 Kommune 3 Figuren viser de estimerede sandsynligheder plus 90 procents konfidensinterval. Det betyder altså, at kommunens fejlprocent med 90 procents sandsynlighed ligger inden for det estimerede interval. 3 Vi har også markeret en linje ved den estimerede gennemsnitlige sandsynlighed for at afgøre en sag rigtigt i figuren (50,1 procent). De kommuner, som ligger oven for linjen (til venstre i figur 1a), er 3 Vi har brugt bootstrapping for at beregne konfidenceintervallet. Se Long & Freese (2006). 8
9 altså bedre end gennemsnittet, mens de kommuner, som ligger neden for linjen (til højre i figur 1a), er dårligere end gennemsnittet. Modellens præcision er dog ikke særlig stor, og det er få kommuner, der er signifikant bedre eller dårligere end gennemsnittet. Kommune 10 var den kommune, som havde størst estimeret andel rigtige sager. Den estimerede sandsynlighed for, at Kommune 10 skal afgøre en sag rigtigt, er 93,6 procent, mens det samme tal for Kommune 11 er 92,8 procent. Kommune 24 og Kommune 3 havner i bunden af de undersøgte kommuner med henholdsvis 25,0 og 14,7 procent af sagerne rigtigt afgjorte. Følsomhedsanalyse Der kan også være andre ting end kommunens sagsbehandlingskvalitet og emnets sværhedsgrad, som påvirker sandsynligheden for, at en sag er rigtigt afgjort. Vi har derfor prøvet at inddrage flere kontrolvariabler i modellen. For eksempel kontrollerer vi for, om Ankestyrelsen eller de sociale nævn har gennemført praksisundersøgelsen. Hvis fx Ankestyrelsen bedømmer kommunerne striktere end de sociale nævn, er det jo muligt, at de kommuner, som har deltaget i Ankestyrelsens praksisundersøgelser, bliver dårligere ranket end de kommuner, som har deltaget i sociale nævns. For at undersøge, om det har nogen betydning, hvis det er Ankestyrelsen eller de sociale nævn, der har gennemført praksisundersøgelsen, inkluderer vi en dummy-variabel, som er en, hvis Ankestyrelsen undersøgte sagen, og nul, hvis de sociale nævn undersøgte sagen, ud over kommune- og emne-dummyer. Ankestyrelsen undersøgte fire forskellige emner: Hjælpemidler, Matchgrupper, Sygedagpenge og Anbringelser. Da dummyen for ankestyrelsen er perfekt korreleret med disse fire emner, må ét af emnerne ekskluderes fra modellen for at undgå multikollinearitet. Vi har valgt at ekskludere dummyen for Sygedagpenge. Parameteren for Ankestyrelse-dummyen fanger dermed effekten af, at Ankestyrelsen har afgjort sagen plus effekten af Sygedagpenge. Den estimerede parameter for Sygedagpenge, når dummyen for Ankestyrelsen ikke er inkluderet i modellen, er 1,2. Den estimerede parameter for Ankestyrelse-dummyen, som altså fanger effekten af Ankestyrelsen og Sygedagpenge, er også 1,2. Vi konkluderer dermed, at det ikke har nogen betydning, hvis det er Ankestyrelsen eller de sociale nævn, som har afgjort en sag. For at undersøge, om der er nogen forskelle mellem regioner, inkluderer vi dummyer for regionerne: Hovedstaden, Syddanmark, Midtjylland og Syddanmark (Sjælland er reference-region) i modellen. For at undgå problemer med multikollinaritet udelukker vi kommune-dummyerne fra 9
10 analysen. Resultaterne viser, at der ikke er nogen signifikante forskelle mellem regionerne på 90 procents niveauet. Vi har også undersøgt, hvor meget det totale antal sager indsamlet fra kommunen påvirker sandsynligheden for en rigtig afgørelse. For at tage højde for, at antallet af sager per kommune måske har en ikke-lineær effekt på sandsynligheden for at træffe en rigtig afgørelse, inkluderer vi også kvadrattermen af antal sager. Modellen inkluderer dummyer for kommune og emne. Hverken variablen for antal sager eller kvadrattermen af antal sager er signifikante på 90 procents niveauet. Vi konkluderer dermed, at antallet af indsamlede sager ikke har nogen signifikant effekt på sandsynligheden for en rigtig afgørelse. Det er muligt, at sagsbehandlingskvaliteten i kommuner med mange indbyggere er højere end sagsbehandlingskvaliteten i kommuner med få indbyggere, fordi kommuner med mange indbyggere formodentlig har mere erfaring med mange af emnerne for praksisundersøgelserne. Vi har afprøvet denne hypotese ved at inkludere variabler for indbyggerantal i kommunen i analysen. Vi har opdelt kommunerne i tre grupper: små kommuner (< indbyggere), mellemstore kommuner (mellem og indbyggere) og store kommuner (> indbyggere). For at undgå multikolinearitet har vi ekskluderet kommunevariablerne fra analysen. Vores hypotese, at store kommuner har en højere sagsbehandlingskvalitet, bliver ikke bekræftet af data. Resultaterne viser, at der ikke er nogen signifikante (på 90 procents niveauet) forskelle mellem små, mellemstore og store kommuner. I hvilken grad er sagen oplyst? For at undersøge, hvilke kommuner der har højest sandsynlighed for at samle alle væsentlige oplysninger ind for at kunne træffe en rigtig afgørelse i en sag, analyserer vi spørgsmålet: I hvilken grad er sagen oplyst? Der er fire mulige svaralternativer, fra ingen oplysninger mangler til væsentlige oplysninger mangler. I alt har vi informationer om sager. Vi mangler dog kommuneoplysninger for nogle sager. Derudover er 15 sager kodet som rigtigt afgjorte, selv om væsentlige eller afgørende oplysninger mangler. Som tidligere ekskluderer vi sager fra Ledighedsydelse, Svage og fra Kommune 33 (se tabel 4 for en beskrivelse af, hvilke sager der er blevet udelukket fra analysen). I alt bliver sager analyseret i modellen. I tabel 5 viser vi fordelingen for de fire svaralternativer for disse sager. 10
11 Tabel 5. I hvilken grad er sagen oplyst? Svaralternativ Andel sager (procent) Antal sager Ingen oplysninger mangler 40,1 437 Enkelte mindre væsentlige oplysninger mangler 27,5 300 Flere og/eller væsentlige oplysninger mangler 20,4 223 Afgørende oplysninger mangler 12,0 131 I alt Når den afhængige variabel har værdier, som kan ordnes i en stigende skala, men hvor afstanden mellem kategorierne er ukendt, kan en såkaldt ordered probit model bruges. Svarene til spørgsmålet: I hvilket omfang er sagen oplyst? kan ordnes: det er bedre, at 1) ingen oplysninger mangler, end at 2) mindre væsentlige oplysninger mangler, hvilket på sin side er bedre, end at 3) flere oplysninger mangler osv. Det er dog uklart, hvor meget bedre det er, at ingen oplysninger mangler, end at mindre væsentlige oplysninger mangler. Det er heller ikke klart, om afstanden mellem fx alternativ 1 og 2 er den samme som afstanden mellem alternativ 2 og 3. Da en ordered probit model ikke er lineær, tager den højde for disse egenskaber hos svaralternativerne. En ordered probit model analyserer effekten af de inkluderede variabler på sandsynligheden for at opnå et højere niveau. Modellen er baseret på antagelsen, at effekten af de inkluderede variabler er den samme uanset niveau (den såkaldte parallel regression assumption ). Det kan testes, om denne antagelse er opfyldt ved hjælp af en LR-test. Desværre viser testen, at antagelsen ikke er opfyldt for vores data. 4 Derfor har vi valgt at kode den afhængige variabel til to forskellige alternativer: 0 væsentlige eller afgørende oplysninger mangler og 1 ingen eller mindre væsentlige oplysninger mangler. Denne model bliver estimeret med logit regression. De estimerede koefficienter findes i den anden resultatkolonne i tabel A1 i appendiks. I figur 2 har vi rangordnet kommunerne efter den estimerede sandsynlighed for, at ingen eller mindre væsentlige oplysninger mangler. Rangordningen i figur 2 adskiller sig lidt fra rangordningen i figur 1a, fordi det er muligt, at en sag er forkert afgjort, selv om ingen eller få oplysninger mangler. Den gennemsnitlige estimerede sandsynlighed, at ingen eller få oplysninger mangler, er 74,9 procent. 4 Se fx Long og Freese (2006) for mere information om ordered probit regression og den parallelle regressionsantagelse. 11
12 Figur 2. Graden af oplysthed. Estimerede sandsynligheder fra logit regression. 1,2 1 0,8 0,6 0,4 0,2 0 Det er især Kommune 9, 14, 23, 24 og 30, som har en væsentlig bedre placering i figur 2 end i figur 1a, mens det omvendte gælder i særlig høj grad for Kommune 2, 5, 6, og 18. Forholdet mellem graden af oplysthed og sandsynligheden for at træffe en rigtig afgørelse For at undersøge, hvor almindeligt det er, at en kommune har alle de nødvendige informationer i en sag, men stadigvæk træffer en forkert afgørelse, undersøger vi, hvor høj sandsynligheden er for, at en kommune henholdsvis 1) har oplyst sagen og truffet en rigtig afgørelse, 2) har oplyst sagen, men truffet en forkert afgørelse, og 3) ej oplyst sagen og truffet en forkert afgørelse. Vi bruger den samme stikprøve om sager som beskrevet i tabel 4. Vi viser fordelingen for de tre alternativer i tabel 6. 12
13 Tabel 6. Forholdet mellem graden af oplysthed og sandsynligheden for en rigtig afgørelse. Svaralternativ Andel sager (procent) Antal sager Sagen oplyst, rigtig afgørelse 50,3 549 Sagen oplyst, forkert afgørelse 17,2 188 Sagen ej oplyst, forkert afgørelse 32,5 354 I alt Tabel 6 viser, at det er relativt ualmindeligt, at en sag er oplyst, men at kommunen træffer en forkert afgørelse. Dette forekom i 17,2 procent af de undersøgte sager. I tabel 7 viser vi, hvor stor en andel af sagerne for hver kommune der er oplyste, men hvor kommunen har truffet en forkert afgørelse. Tabel 7. Andel sager, hvor ingen eller få oplysninger manglede, men kommunen traf en forkert afgørelse. Kommune Andel sager, procent Antal sager Kommune Kommune Kommune 4 2,7 1 Kommune 10 3,2 1 Kommune 21 3,6 1 Kommune Kommune 8 5,6 1 Kommune 12 6,3 1 Kommune 13 7,1 2 Kommune 23 11,4 5 Kommune 25 12,9 4 Kommune 29 12,9 4 Kommune Kommune 32 13,6 3 Kommune 3 13,8 4 Kommune 6 14,3 6 Kommune 22 14,6 7 Kommune 16 15,2 7 Kommune 24 16,2 6 Kommune 5 16,3 7 Kommune Kommune 11 18,8 3 Kommune 27 19,2 9 Kommune 18 19,6 10 Kommune 1 23,9 11 Kommune 17 24,3 9 Kommune 31 26,3 5 Kommune Kommune 19 27,9 12 Kommune 15 28,6 14 Kommune Kommune 30 48,4 15 Det er især Kommune 14 og Kommune 30, som har en høj sandsynlighed for at træffe en forkert afgørelse, selv om få eller ingen oplysninger mangler i sagen. Dette resultat er ikke forbavsende, 13
14 fordi disse to kommuner havde en væsentligt højere ranking i figur 2 end i figur 1a. I tabel 5 kontrollerer vi dog ej for sagens emne, hvilket kan påvirke resultaterne. I figur 3 præsenterer vi estimerede sandsynligheder for de tre alternativer fra en multinomial logit model, hvor vi kontrollerer for kommune og emne. I figur 3 har vi ordnet kommunerne efter sandsynligheden for, at en sag er rigtigt oplyst og kommunen truffet den forkerte afgørelse (dvs. på den samme måde som i tabel 4). Figur 3. Forholdet mellem grad af oplysthed og afgørelsens rigtighed. Estimerede sandsynligheder fra multinomial logit model % 90% 80% 70% 60% 50% 40% 30% 20% 10 % 0% oplyst, forkert ej oplyst, forkert oplyst, rigtig De kommuner, som ligger langt til højre i figur 3, har altså en høj sandsynlighed for at træffe en forkert afgørelse, selv om de har de rigtige informationer om sagen, mens det modsatte gælder for kommunerne langt til venstre i figuren. Hvis vi sammenligner figur 1a med figur 3, ser vi, at det er relativt almindeligt, at de kommuner, som klarer sig dårligt i praksisundersøgelsen, også har en høj sandsynlighed for at træffe en forkert afgørelse, selv om sagen er oplyst. Rangordningen af kommunerne forandres lidt sammenlignet med i tabel 7, hvilket viser, at sandsynligheden for at træffe en forkert afgørelse, selv om få eller ingen oplysninger mangler, er afhængig af sagens emne. 14
15 Kommune 14, 23, 24, 25 og 30 er de kommuner, som har højest sandsynlighed for at træffe en forkert afgørelse, selv om få eller ingen oplysninger mangler. Appendiks Tabel A1. Estimerede koefficienter fra logistisk regression. Sandsynligheden for en Sandsynligheden for, at ingen VARIABLER rigtig afgørelse eller få oplysninger mangler Kommune ** (1.102) *** (1.367) Kommune (1.146) *** (1.395) Kommune *** (1.118) *** (1.377) Kommune ** (1.122) *** (1.377) Kommune * (1.096) *** (1.346) Kommune ** (1.105) *** (1.356) Kommune ** (1.186) *** (1.480) Kommune (1.195) *** (1.456) Kommune ** (1.072) *** (1.296) Kommune (0.914) (1.211) Kommune 11 Reference Reference Kommune (1.136) * (1.373) Kommune ** (1.128) *** (1.441) Kommune *** (1.106) ** (1.255) Kommune ** (1.096) *** (1.352) Kommune *** (1.105) *** (1.360) Kommune * (1.121) ** (1.404) Kommune ** (1.093) *** (1.344) Kommune ** (1.101) *** (1.351) Kommune ** (1.111) *** (1.369) Kommune ** (1.144) *** (1.390) Kommune ** (1.112) *** (1.397) Kommune ** (1.124) *** (1.425) 15
16 Kommune *** (1.131) *** (1.429) Kommune ** (1.157) ** (1.433) Kommune (1.573) * (1.756) Kommune *** (1.104) *** (1.358) Kommune ** (1.100) *** (1.361) Kommune *** (1.143) *** (1.451) Kommune ** (1.122) ** (1.434) Kommune * (1.238) * (1.585) Kommune ** (1.215) *** (1.498) Hjælpemidler 2.900*** (0.539) 1.119*** (0.389) FOEP (0.701) *** (0.548) Integration 2.114*** (0.614) (0.473) Matchgrupper 2.818*** (0.553) 2.275*** (0.545) Merudgifter voksne (0.614) ** (0.681) Merudgifter børn Reference Reference Revalidering (0.606) *** (0.416) Anbringelse (0.546) (0.405) Sygedagpenge 1.152* (0.593) (0.432) Støttehjemmet * (0.919) *** (0.729) Enkeltudgifter (0.603) *** (0.396) Tilbagebetaling 1.434** (0.631) (0.490) Konstant (1.150) 5.701*** (1.298) Antal observationer Standardfejl i parentes: *** p<0.01, ** p<0.05, * p<0.1 Litteratur Long, Scott & Jeremy Freese (2006): Regression Models for Categorical Dependent Variables Using Stata. Second Edition. College Station, Texas: Stata Press. 16
Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.
Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede
Læs mereHver anden vil benytte øget åbningstid i dagtilbud
Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereFokus på Forsyning. Datagrundlag og metode
Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereBilag 1: Robusthedsanalyser af effektiviseringspotentialerne. Bilaget indeholder analyser af effektiviseringspotentialernes robusthed.
Bilag 1: Robusthedsanalyser af effektiviseringspotentialerne Bilaget indeholder analyser af effektiviseringspotentialernes robusthed. FORSYNINGSSEKRETARIATET OKTOBER 2013 Indholdsfortegnelse Indledning
Læs mereBaggrundsnotat: Søskendes uddannelsesvalg og indkomst
17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser
Læs mereUNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER
UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes
Læs mere1 Multipel lineær regression
1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet
Læs mereØkonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006
Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede
Læs mere1 Multipel lineær regression
Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R
Læs mereMorten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereStatistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning
Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereBaggrundsnotat: Modelteknisk
Sekretariatet for Energitilsynet Baggrundsnotat: Modelteknisk materiale Store forskelle i varmepriserne hvorfor? Center for Varme Tekniske bilag I dette baggrundsnotat gennemgås de økonometriske forhold
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereEpidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereLogistisk regression
Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller
Læs mereKvantitative metoder 2
Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative
Læs mereDansk Erhvervs gymnasieanalyse Sådan gør vi
METODENOTAT Dansk Erhvervs gymnasieanalyse Sådan gør vi FORMÅL Formålet med analysen er at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereAnvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Læs mereBaggrundsnotat: Modelteknisk
Energi-, Forsynings- og Klimaudvalget 2015-16 EFK Alm.del Bilag 410 Offentligt Sekretariatet for Energitilsynet Baggrundsnotat: Modelteknisk materiale Store forskelle i varmepriserne hvorfor? Center for
Læs mereSammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.
Sammenhængsanalyser Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. rygevaner som 45 årig * helbred som 51 årig Crosstabulation rygevaner
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereBilag 16: Robusthedsanalyser af effektiviseringspotentialerne Bilaget indeholder analyser af effektiviseringspotentialernes robusthed.
Bilag 16: Robusthedsanalyser af effektiviseringspotentialerne Bilaget indeholder analyser af effektiviseringspotentialernes robusthed. FORSYNINGSSEKRETARIATET FEBRUAR 2013 INDLEDNING... 3 1. COSTDRIVERSAMMENSÆTNING...
Læs mereBilag 12 Regressionsanalysens tabeller og forklaringer
Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler
Læs mereDet sorte danmarkskort:
Rockwool Fondens Forskningsenhed Arbejdspapir 37 Det sorte danmarkskort: Geografisk variation i danskernes sorte deltagelsesfrekvens Peer Ebbesen Skov, Kristian Hedeager Bentsen og Camilla Hvidtfeldt København
Læs mereRegressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs mereDet siger FOAs medlemmer om ledere og lederskab
FOA Kampagne & Analyse 30. marts 2009 Det siger FOAs medlemmer om ledere og lederskab Denne undersøgelse er gennemført via FOAs elektroniske medlemspanel i marts 2009. 2.031 FOA-medlemmer har medvirket
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereSkriftlig eksamen i samfundsfag
OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereTilkendelser af førtidspension og fleksjob 2003-2012
7. MARTS 2014 Tilkendelser af førtidspension og fleksjob 2003-2012 AF ANDREAS ØSTERGAARD NIELSEN En samlet analyse af tilkendelsespraksis 2003-2012 Formålet med dette notat er at give en samlet beskrivelse
Læs mereBilag 5 - Forsyningssekretariatets bemærkninger til høringssvar fra DANVA og FVD
Bilag 5 - Forsyningssekretariatets bemærkninger til høringssvar fra DANVA og FVD FORSYNINGSSEKRETARIATET OKTOBER 2011 INDLEDNING... 3 NETVOLUMEN OG DATAKVALITET... 3 MILJØ- OG SERVICEMÅL... 5 UDELADTE
Læs mereC) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.
C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011
Læs mereBilag S.1: Beskrivelse af beregningen af koefficienten på indvandrerbaggrund
Bilag S.1: Beskrivelse af beregningen af koefficienten på indvandrerbaggrund Det er kun i model (1) i artiklen, at den gennemsnitlige betydning af at have indvandrerbaggrund (α 1 ) direkte kan estimeres.
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mereDansk Erhvervs gymnasieeffekt - sådan gør vi
Dansk Erhvervs gymnasieeffekt - sådan gør vi FORMÅL Formålet har været at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge blot ved at
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereFagplan for statistik, efteråret 2015
Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat
Læs mereBetydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere
DET ØKONOMISKE RÅD S E K R E T A R I A T E T d. 20. maj 2005 SG Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere Baggrundsnotat vedr. Dansk Økonomi, forår 2005, kapitel
Læs mereTIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03.
05:2009 ARBEJDSPAPIR Mette Deding Trine Filges APPENDIKS TIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03. FORSKNINGSAFDELINGEN
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mereLogistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab
Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereVelkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen
1 Velkommen til kurset Teoretisk Statistik Lærer: Niels-Erik Jensen Plan for i dag: 1. Eks: Er euro'en skæv? 4. Praktiske informationer 2. Eks: Regressionsmodel (kap. 1) 5. Lidt om kursets indhold 3. Hvad
Læs mereØkonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1
Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006 Økonometri 1: F9 1 Program frem til efterårsferien Om goodness-of-fit, prediktion og residualer (kap. 6.3-4) Kvalitative egenskaber i den multiple
Læs mereStatistik i GeoGebra
Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik
Læs mereFORDELING AF ARV. 28. juni 2004/PS. Af Peter Spliid
28. juni 2004/PS Af Peter Spliid FORDELING AF ARV Arv kan udgøre et ikke ubetydeligt bidrag til forbrugsmulighederne. Det er formentlig ikke tilfældigt, hvem der arver meget, og hvem der arver lidt. For
Læs mereLars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereØkonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1
Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mål for sammenhæng mellem to variable Estimation Stikprøve Data Population Teori relativ hyppighed parameter estimat sandsynlighed parameter
Læs mereSimpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Læs mereSkriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00
Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Forskningsenheden for Statistik IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt.
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereReestimation af importrelationer
Danmarks Statistik MODELGRUPPEN Arbejdspapir Nis Mathias Schulte Matzen 28. november 211 Reestimation af importrelationer Resumé: Papiret estimerer import relationerne på to forskellige datasæt. Et korrigeret
Læs mereOR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere
Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver
Læs mereSkriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00
Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Forskningsenheden for Statistik IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt.
Læs mereSILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO
SILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO 1 INDHOLD Afsnit 01 Introduktion Side 03 Afsnit 02 Sammenfatning Side 05 Afsnit 03 Skoleresultater Side 07 Afsnit 04 SFO-resultater
Læs mereKausale modeller. Konstruktion og analyse
Kausale modeller Konstruktion og analyse 1 Kausale modeller = DAGs (Directed acyclic graphs) defineret ved Fuldstændig ordnet kausal struktur Definition af direkte kausal effekt Antagelser om fravær af
Læs mereBesvarelse af vitcap -opgaven
Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.
Læs mereBaggrundsnotat: Undervisningstimer på universitetet
17. december 2013 Baggrundsnotat: Undervisningstimer på universitetet Dette notat redegør for den økonometriske analyse af sammenhængen mellem undervisningstid og indkomst i afsnit 5.3 i Analyserapport
Læs mereKøbenhavnske ejerlejlighedspriser en meget begrænset indikator for hele landets boligmarked
N O T A T Københavnske ejerlejlighedspriser en meget begrænset indikator for hele landets boligmarked Baggrund og resume Efter i årevis at have rapporteret om et fastfrosset boligmarked, har de danske
Læs mereLogistisk regression
Logistisk regression Anvendt statistik Anders Tolver Jensen Institut for Grundvidenskab og Miljø Onsdag d. 25/2-2009 ATJ (IGM KU-LIFE) Logistisk regression Anvendt statistik 25/2-2009 1 / 12 (Multinomial)
Læs mereOR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model
Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereØkonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1
Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereKapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Læs mereUniversity of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version
university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,
Læs mereBilagsnotat til: De nationale tests måleegenskaber
Bilagsnotat til: De nationale tests måleegenskaber Baggrund Der er ti obligatoriske test á 45 minutters varighed i løbet af elevernes skoletid. Disse er fordelt på seks forskellige fag og seks forskellige
Læs mereBRUGERTILFREDSHED FORÆLDRE TIL ELEVER I FOLKESKOLER (INKL. SPECIALSKOLER) LANDSDÆKKENDE BASELINEMÅLING 2017
BRUGERTILFREDSHED FORÆLDRE TIL ELEVER I FOLKESKOLER (INKL. SPECIALSKOLER) LANDSDÆKKENDE BASELINEMÅLING 2017 INDHOLD Afsnit 01 Introduktion Side 03 Afsnit 02 Læsevejledning Side 04 Afsnit 03 Sammenfatning
Læs mereHypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Læs mereGenberegning af costdriveren renseanlæg
Genberegning af costdriveren renseanlæg April 2019 SIDE 2 Omkostningsækvivalenten for renseanlæg 1.1 Indledning Dette metodepapir beskriver, hvordan vi i forhold til OPEX-revisionen i 2017 har genberegnet
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereAppendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge
Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs mere