Projekt Osiris Fattigdom i Danmark: En socioøkonomisk fattigdomsgrænse Iulian Vlad Serban

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "Projekt Osiris Fattigdom i Danmark: En socioøkonomisk fattigdomsgrænse Iulian Vlad Serban"

Transkript

1 Appendikset Om appendikset Appendikset indeholder overordnet fire afsnit: - Teoretisk udledning og definition af modeller, - Supplerende statistiske resultater - Deskriptiv statistik - Udeladte undermodeller De teoretiske afsnit i appendikset er særdeles vigtige. Enhver læser med kendskab til statistik bør, efter at have læst rapporten, læse disse teoriafsnit. De lægger et fundament for de antagelser rapporten bygger på og retfærdiggør meget af det senere arbejde. Dertil viser de også hvordan man kan håndtere en række statistisk teoretiske problemer, samt hvordan den endelige model bør tolkes De supplerende statistiske resultater er vigtige for forskere og eksperter der arbejder med fattigdom. Med dem kan man trække langt flere konklusioner end den oprindelige rapport ligger op til. Desuden får man også et indblik i hvad man ikke kan udtale sig om, altså hvor det statistiske materiale tyder på insignifikans. Det tilskyndes derfor alle fattigdomsfaglige mennesker, at betragte graferne hertil, og se om de finder vigtigt materiale. Den deskriptive statistik er anført for, at de statistiske eksperimenter kan gentages. Hertil er det muligt også at få adgang til SAS koden fra projektet - man skal blot sende en til Der er to udeladte SSM undermodeller. Den første er modellen for dødsfald, da den giver et definitionsmæssigt absurd syn på fattigdom. F.eks. hvis blot flere fattige mennesker døde, ville fattigdommen i Danmark være faldende, hvilket er uacceptabelt. Den anden model er for pardannelse og separation. Den er udeladt af to lige vigtige årsager, at den tilfører en enorm kompleksitet til den overordnede model, og at dens indflydelse ville være relativ lille. Begge undermodeller er dog i sig selv udmærkede, og læsere som med særlig interesse for SSM modellen, bør også kigge på disse. Side 1

2 Indhold Appendikset... 1 Om appendikset... 1 Teori... 3 Logistisk regression Markov model... 3 SSM modellen SSM: Arbejdsløshedsmodel SSM: Handikap SSM: Uddannelse SSM: Fødsler PSM modellen PSM: Variabel estimater PSM: Variabel estimater Gennemsnitlig vægtning Resultater for data ESS: Logistisk Regression ESS: Resultater LIS: Resultater ESS: Fremskrivning Deskriptiv statistik ESS Data ESS Uddannelsesniveauer SSM - Udeladte undermodeller Pardannelse og separation Dødsfald Side 2

3 Teori Markov model Igennem vores arbejde, særligt SSM modellen, bruger vi de såkaldte endelige stationære tidskontinuerte markov kæder. At de er endelige antages herfra og diskuteres ikke videre. Modellen defineres formelt matematisk som en mængde S af N stadier: Mellem to stadier hører en transitionsintensitet,. Dertil defineres. Disse intensiteter opskrives typisk som en matrix benævnt intensitetsmatricen (eller infinitisimal generatoren) for en given stationær tidkontinuerte markov kæde: Til et givent tidspunkt vil vores markov kæde befinde sig i nøjagtigt ét af vores N stadier. Fra dette stadie vil den med bevæge sig til et nyt stadie, med eksponentiel sandsynlighedsfordeling. Med andre ord bestemmer intenstiteterne hvilken sandsynligheden markov kæden har til at hoppe til et andet stadie. Givet at kæden i tiden har foretaget nøjagtigt et hop, kan vi udregne sandsynligheden for at den befinder sig i stadiet j som værende: Hvor og definerer stadiet kæden befinder sig i til tiden t og t + s. Endvidere kan vi udregne følgende matrice: Hvor indgangen er sandsynligheden for kæden befinder sig i stadiet til tiden, givet at kæden befandt sig i stadiet til tiden Side 3

4 Lad os illustrere modellen med et konkret eksempel: antallet af taxaer holdende ved hovedbanegården. Lad os antage at vi kun kigger på tidsrummet på hverdage, og at der er så meget konstruktionsarbejde at der maksimalt kan holde 2 taxaer. Vi har således tre stadier i vores markov kæde. Lad os gå ud fra at alle taxaer i gennemsnit venter 10 min før de får en passager, men at der samtidig er så meget konkurrence om de få taxapladser, at der i gennemsnit kun går 2 min før en tom taxaplads bliver optaget. Da vi arbejder med eksponential fordelinger, og disse har middelværdi, hvor er fordelingensparameteren for eksponentiel fordelingen kan vi udregne intensiteterne således: =, =, Hvor alle andre intensiteter er nul. Modellen kan illustreres som nedenstående diagram: Vi kan desuden udregne vores matrice over sandsynligheder som: Hvis der f.eks. kl er 2 taxaer, så er sandsynligheden for at der kl 15:15 stadig er 2 taxaer: = 80,69% Det behøver dog ikke at være de samme taxaer. Eksempelvis kunne en af de to taxaer have samlet en passager op, hvorefter en ny taxa har optaget dens plads. Givet at der kun er en taxa på taxaholdepladsen, kan vi også udregne sandsynligheden for at denne ene taxa skal samle en passager op før en ny taxa ankommer. Det svarer til at vi befinder os i stadiet 1 og går til stadiet 0 før vi går til stadiet 2, og kan udregnes som: 16,67% Side 4

5 Vores intention er at benytte disse markov modeller til at modellere sociologiske processer. Endvidere er det eneste data vi har til rådighed aggregeret data til SSM modellen. Det vil sige at vi prøver at udtale om individers adfærd ud fra kollektiv adfærd. For at dette skal kunne lade sig gøre arbejder vi under en række antagelser: 1. Diskret udfaldsrum 2. Markov-egenskaben 3. Stationær proces (Tidshomogenitet) 4. Processen foregår i kontinuert tid 5. Eksponentielt fordelte spring mellem stadier 6. Homogenitet af befolkningen Disse antagelser er meget almindelige og udbredte i litteraturen, om end de sjældent bliver så udpenslet. Nedenfor diskuterer vi disse antagelser i kontekst om social mobilitet generelt. Når vi i analysen udarbejder de enkelte modeller bliver de mest væsentlige aspekter diskuteret videre. Diskret udfaldsrum Vores første antagelse, som alt vores senere arbejde bygger på, er at vi kan partionere vores udfaldsrum ind i et endeligt antal stadier. Vi arbejder således med kategorier i vores data, som eksempelvis: o Indkomstgrupper ( , ) o Aldersgrupper (10-14, ) o Fattig / Ikke fattig o Uddannelsesniveauer osv.. Det er klart at man altid vil miste nogle detaljer på denne måde. Et individ kan f.eks. godt være 14,99, i gang med en uddannelse eller ligge i en gråzone mellem to indkomstgrupper. Det er i virkeligheden ikke så væsentligt, da vi arbejder med et stort antal mennesker og derfor vil eventuelle fejl blive fuldstændigt udjævnet. Dertil skal det tilføjes at en overvældende mængde psykologisk teori peger på, at mennesker selv forstår verden i kategorier, eller kasser om man vil. Som konsekvens af dette bør måling af fattigdom også konsekvent arbejde med brede kategorier og ikke præcise tal som den rene statistik helst så. Markov-egenskaben Markov-egenskaben er antagelsen om, at sandsynligheden for at bevæge sig til et nyt stadie kun afhænger af det nuværende stadie. I taxa-eksemplet fra før, betyder dette at antallet af taxaer på taxaholdepladsen kun afhænger af hvornår den sidste taxa ankom eller afgik. Vi arbejder i kontinuert tid, så det er umuligt at udtale sig om præcist hvilket tidspunkt der er afgørende. Hvis vi ved at der kl var to taxaer, men kl Side 5

6 13:00 kun en taxa, og vi gerne vil udtale os om hvordan situationen er kl 13:15, så afhænger dette udelukkende af den ene taxa kl Dette giver fin mening i taxa-eksemplet, men når vi skal til at kigge på sociologiske processer kan det blive mere omstændigt og usikkert. Hvis vi f.eks. gerne vil udtale os om hvorvidt en lavtuddannet mand med arbejde i 2008, er blevet arbejdsløs i 2009, vil dette højst sandsynligt også afhænge af hans anciennitet på arbejdspladsen. Hvis han for eksempel i årene har været arbejdsløs, og netop i 2008 har fået arbejde, er der en væsentlig større sandsynlighed for at han igen i 2009 er arbejdsløs, end hvis han i stedet havde haft dette arbejde igennem 5 år. McFarland argumenterer for at markov-egenskaben i sociologiske processer, og særligt social mobilitet, har en forvrængede effekt på resultaterne fra modellen. Sociologiske teorier viser at tiden et individ befinder sig i et givent stadie (eksempelvis på en arbejdsplads eller i et ægteskab) påvirker individets billede af verden og derfor hans/hendes valg for at ændre stadie (som eksempelvis at skifte arbejde eller blive separeret). McFarland argumenterer og referer til empiriske studier, som til gengæld viser, at markovegenskaben bliver mere og mere pålidelig jo mindre tidsrum man arbejder i. Det er f.eks. fuldstændig absurd hvis man kigger på social mobilitet over generationer, men kan godt være acceptabel over en kort årrække. Vores håb er, at vi ved at anvende disse markov modeller til SSM modellen over en 5-årig periode, har reduceret problemerne ved markov-egenskaben. Vi vil blandt andet argumentere ud fra de resultater vi opnår og andre empiriske studier for at godtgøre denne antagelse. Det kan dog ikke lade sig gøre at måle usikkerheden direkte på denne antagelse dette ville kræve longditunal registerdata. Stationær proces Antagelsen om at vi har en stationær proces kan ses som en parallel til markov-egenskaben. Stationær proces betyder at, sandsynlighederne at skifte stadier ikke ændrer sig over tid. Det vil sige, at to identiske individer, hvoraf den første blev arbejdsløs i 2004 og den anden i 2008, begge har samme sandsynlighed for at opnå finde arbejde indenfor en 2-årig periode. I en vis forstand antager vi at resten af verden står stille dog ikke hele verden, kun den del af verden som kan påvirke vores lille system. Ligesom markov-egenskaben, betyder det, at vi ved at arbejde med en 5-årig periode har begrænset eventuelle fejl på denne antagelse væsentligt. Overordnet set er denne antagelse ikke væsentlig, da samtlige aggregeret data vi anvender selv stærkt udstråler stationaritet. Eventuelle t-test kan udføres for at eftervise hvor lille en fejl denne antagelse udøver på vores markov kæde. I afsnittet om arbejde og arbejdsløshed fører vid og en kortere diskussion, for at vi i perioden har et stationært arbejdsmarkedet da det er klart at en økonomisk krise kan påvirke denne væsentligt. Heldigvis er konsekvenserne af den økonomiske krise ikke begyndt før 2009, og vores antagelse er derfor acceptabel. Side 6

7 Processen foregår i kontinuert tid Denne antagelse betyder kort sagt, at spring mellem forskellige stadier kan ske i kontinuert tid. Fra taxaeksemplet betyder det, at vi kan være i to forskellige stadier for tiderne 12:01 og 12:02, og måske i et helt tredje stadie i 12:01:30. For mange sociologiske processer er dette en fornuftig antagelse, da der ingen begrænsninger er på hvornår de formes. Et ægteskab kan således indgås 1 minut efter to mennesker har mødt hinanden, såvel som 10 år efter at de har mødt hinanden. Det vil naturligvis være højst usandsynligt at to mennesker ville indgå et ægteskab efter 1 minut, men dette bliver korrigeret for af vores eksponentiel fordeling, som givet data vil tvinge denne sandsynlighed til næsten nul. Man kan dog diskutere hvorvidt kontinuitet altid er fornuftigt i sig selv. Eksempelvis vil vi også gerne modellere individer som forsøger at opnå en højere uddannelse, men uddannelsesinstitutionerne arbejder i hovedreglen udelukkende med faste datoer for indgang og afgang. Ligeledes er det (næsten) umuligt at finde arbejde på en søndag, da samtlige virksomheder holder lukket. Antagelsen er dog meget mild, da modellen vil blive korrigeret af de data vi benytter. Data på uddannelser, parforhold, dødsfald etc vil alle sammen afspejle de underliggende brud i den kontinuerte tid. Når vi opstiller modellerne for 5-årige perioder opnår vi derfor minimale fejl, som alle sammen er bør være jævnt fordelt omkring vores resultater. Grunden til at vi vælger at arbejde med kontinuert tid, og ikke diskret tid, er først og fremmest fordi en opdeling af tiden i diskrete mængder vil medføre væsentlige fejl på aggregeret niveau, og desuden komplicere modellen unødvendigt. Eksponentielt fordelte spring mellem stadier Eksponentielfordelingen er en sandsynlighedsfordeling som har en konstant rate. Det vil sige, at der er lige sandsynligheden er konstant for alle intervaller af en bestemt længde. Denne konstante rate medfører den særlige egenskab at den er hukommelsesløs. Netop derfor anvendes markov modeller hovedsagligt med denne fordeling. At den er hukommelsesløs er nemlig ensbetydende med at den overholder markovegenskaben. Derudover er eksonentielfordeling bredt anvend til at modellere en række sociologiske processer, og kan opfange mange af de underliggende processer som ikke kan observeres direkte. Da vi stadig arbejder i en 5-årige periode, og desuden kontrollerer for en række forhold som køn, alder og uddannelse, virker det som en rimelig antagelse at vi har en konstant rate af sandsynlighed for hop i mellem stadier. Homogenitet af befolkningen At vi antager homogenitet af befolkningen dækker over to ting. Først og fremmest antager vi, at aggregeret data er proportionelt til individuelt data. Det vil sige, at den gennemsnitlige intensitet for at hoppe mellem to stadier for er den samme for hele befolkningen såvel for individet. Sekundært antager vi at de individer Side 7

8 som ikke handler proportionelt til befolkningen er normaltfordelte omkring gennemsnittet på tværs af de parametre vi ikke kontrollere. Der er muligvis mange ting man ikke opfanger igennem aggregeret data, især når vi ikke kan kontrollere for indkomstniveauet i husstanden som et individ lever i. Det er klart, at der foregår to forskellige sociologiske processer for individer med samme køn, alder og uddannelse. Men hvis det ene individ hører til en økonomisk stærk husstand og den anden til en økonomisk svag husstand, vil deres handlinger afspejle dette. Dette kan vi ikke differentiere i mellem og vil derfor forvente at begge individer opfører sig ens igennem vores analyse. Dette er således måske den mest omstridte antagelse vi foretager. Derfor vil vi løbende igennem vores arbejde benytte andre empiriske analyser til at begrænse fejl og forskubbe eventuelle fejl, således at hvis vi har fejl i vores resultater, da vil de fremstille et mere positivt mål på social mobilitet end det der reelt eksisterer. Denne tilgang retfærdiggøres af vores hypotese: at social mobilitet er langt ringere for husstande i de laveste indkomstgrupper end for alle andre. Ved at fremstille den sociale mobilitet mere positivt vil eventuelle resultater som bekræfter vores hypotese, ikke kun være tilstrækkelige for at bekræfte vores hypotese, men også skabe stærk formodning om at den sociale mobilitet er endnu værre. Vi vælger så at sige, kun at se toppen af isbjerget. Men det vil uden tvivl være det rigtige isbjerg vi kigger på. Side 8

9 Kilder: INTRAGENERATIONAL SOCIAL MOBILITY AS A MARKOS PROCE.SS: INCLUDING A TIME-STATIONARY MARKOVIAN MODEL THAT EXPLAINS OBSERVED DECLINES IN MOBILITY RATES OVER TIME, David McFarland, 1970 On Estimating Transition Intensities of a Markov Process with Aggregate Data of a Certain Type: "Occurrences but no Exposures", 1986 Richard D. Gill Side 9

10 Logistisk regression Vi benytter logistisk regression til vores PSM model. Formelt definer vi en række binomial fordelte variable: Hvor antalsparameteren er velkendt, mens antages ukendt. Vi opstiller nu: Hvor er en stokastisk variabel vektor, som indeholder de beskrivende kategoriske variabler, og er den j te indgang til. Her er parametre til modellen som estimeres gennem maximum likelihood estimation. For en observeret stokastisk variabel vektor Z, i tilknytning til en uobserveret stokastisk bernoulli-fordelt variabel W, kan vi udregne sandsynligheden: Hvor er den j te indgang til. Da vores er er binomialt fordelte, vil fejlen på vores logistiske regression også være binomialt fordelte. Det giver således ikke mening at uddybe fordelingen af vores fejl teoretisk. I stedet skal denne betragtes for den konkrete model. Vores intention er at benytte logistisk regression til at modellere sociologiske processer, som beskrevet tidligere. For at dette skal kunne lade sig gøre arbejder vi under en række antagelser, hovedsagligt: 1. Logistisk (odds-lineær) sammenhæng mellem beskrivende variable og indkomst-mobilitet 2. Stationær proces (Tidshomogenitet) 3. Homogenitet af befolkningen (Se afsnittet for markov modeller) Disse antagelser er alle sammen beskrevet i afsnittet for markov modeller, på nær den første om den logistiske sammenhæng mellem vores variable. Denne antagelse bygger som beskrevet i ligningen ovenfor på, en eksponentiel lineær sammenhæng af vores beskrivende variable. Men da vores variable i både definitionen og praksis er kategoriske, så reduceres antagelsen betragteligt. Vi får nemlig tildelt en konstant til hvert eneste udfald i hver eneste beskrivende variabel, for derefter at maksimere vores likelihood. Antagelsen bliver derfor en antagelse på tværs af de beskrivende variable, og ikke imellem dem. Da vi stadigvæk arbejder med spatielt data, bør modellens antagelser være relativt milde. Modellen er derfor, næsten udelukkende, kun begrænset af de beskrivende variable vi har til rådighed. Side 10

11 SSM modellen SSM: Arbejdsløshedsmodel Vores statistikker udregnet ud fra Laborta Data og OECD Statitics: Uddannelsesniveau (EU Standard) Level 0-2 Level 3-4 Level 5-,6 Sandsynlighed for at Mænd 18 til 24 0, , , have et job 5 år 25 til 29 0, , , senere, givet at 25 til 54 0, , , individet ikke har job 30 til 34 0, , , på nuværende tidspunkt 35 til 39 0, , , til 44 0, , , til 49 0, , , til 54 0, , , til 59 0, , , til 64 0, , , til 64 0, , , til 69 0, , , til 74 0, , , , , , , , , alle 0, , , Kvinder 20 til 24 0, , , til 29 0, , , til 54 0, , , til 34 0, , , til 39 0, , , til 44 0, , , til 49 0, , , til 54 0, , , til 59 0, , , til 64 0, , , til 64 0, , , til 69 0, , , til 74 0, , , , , , , , , alle 0, , , Side 11

12 Uddannelsesniveau (EU Standard) Level 0-2 Level 3-4 Level 5-,6 Sandsynlighed for at Mænd 18 til 24 0, , , have et job 5 år 25 til 29 0, , , senere, givet at 25 til 54 0, , , individet HAR job på 30 til 34 nuværende tidspunkt 0, , , til 39 0, , , til 44 0, , , til 49 0, , , til 54 0, , , til 59 0, , , til 64 0, , , til 64 0, , , til 69 0, , , til alle 0, , , Kvinder 20 til 24 0, , , til 29 0, , , til 54 0, , , til 34 0, , , til 39 0, , , til 44 0, , , til 49 0, , , til 54 0, , , til 59 0, , , til 64 0, , , til 64 0, , , til 69 0, , , til alle 0, , , Side 12

13 SSM: Handikap De statistiske resultater er givet i nedenstående tabeller: Sandsynligheden for at blive alvorligt fysisk hæmmet efter 5-årig periode Uddannelsesniveau (EU Standard) Alder Mænd Kvinder Level , , Level , , Level , ,03933 Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level , , Side 13

14 SSM: Uddannelse Der foreligger ingen pålidelige data for årene blandt tilgang af elver til Level 5-6 uddannelser. Årsagen til dette er formentlig at der er høj tilgang, høj frafald og et stort antal forkerte registreringer. For at sikre os at vi ikke skaber et negativt bias, vil vi igen foretage en antagelse. Vi antager at alle mellem 18-24, som har en Level 3-4 uddannelse, påbegynder en Level 5-6 uddannelse. De statistiske resultater er givet i nedenstående tabel: Sandsynlighed for at opnå højere uddannelsesniveau ISCED97 Alder Mænd Kvinder Level , , Level , , Level , , Level , , Level , , Level , , Level , , Level Level Level Level , , Level , , Level , , Level , , De 3 rækker markeret med rød er estimeret til 100% her, da der kun foreligger fejlfyldt data om disses sandsynlighed for at starte på en uddannelse. Antagelsen bør udelukkende skabe et mere positivt syn på den sociale mobilitet, og vi opnår således stadigvæk solide resultater ved at bruge disse data senere hen. Side 14

15 SSM: Fødsler Sandsynlighed for at føde levende antal børn efter 5-årig periode, givet at moderen IKKE har nogen børn, afhængig af moderens alder og højeste uddannelsesniveau (EU Standard). Level 0-2 (ISCED 1997) Moderens alder Et barn To børn , , , , , , , , , , , ,99E ,51212E-05 9,83E-11 Level 3-4 (ISCED 1997) , , , , , , , , , ,19E , ,46E ,97184E-06 2,09E-11 Level 5-6 (ISCED 1997) , , , , , , , , , , , ,59E ,18985E-05 6,09E-11 Side 15

16 Sandsynlighed for at føde levende antal børn efter 5 årig periode, givet at individet KUN har et barn, afhængig af moderens alder og højeste uddannelsesniveau (EU Standard). Level 0-2 (ISCED 1997) Antal Børn: Et barn To børn , , , , , , , , , , , ,3E ,29989E-05 3,24E-11 Level 3-4 (ISCED 1997) , , , , , , , , , ,93E , ,13E ,99328E-06 6,88E-12 Level 5-6 (ISCED 1997) , , , , , , , , , ,75E , ,18E ,02284E-05 2E-11 Sandsynlighed for at føde levende antal børn efter 5 årig periode, givet at individet HAR to børn, afhængig af moderens alder og højeste uddannelsesniveau (EU Standard). Level 0-2 (ISCED 1997) Antal Børn: Et barn To børn , , , , , , , , , , , ,31E ,98041E-06 3,25E-12 Level 3-4 (ISCED 1997) , ,76E , , , ,45E , ,17E , ,94E , ,13E ,29627E-06 6,91E-13 Level 5-6 (ISCED 1997) , , , , , , , , , ,8E , ,19E ,91893E-06 2,01E-12 Side 16

17 PSM modellen PSM: Variabel estimater Nedenstående er vores maximum likelihood parametre med deres værdier og tilhørende 90%- konfidensintervaller for den primære PSM model: Profile Likelihood Confidence Interval for Parameters Primær PSM, husstande uden partner Parameter Estimate 90% Confidence Limits Intercept GNDR BLGETMG BLGETMG EDULVL EDULVL EDULVLM EDULVLM EDULVLM EDULVLF EDULVLF EDULVLF EDCTN Head_Unemployed DSBLD RTRD Number_Of_Children_S Number_Of_Children_S HHMMB HHMMB Side 17

18 Profile Likelihood Confidence Interval for Parameters Primær PSM, husstande med partner Parameter Estimate 90% Confidence Limits Intercept GNDR BLGETMG BLGETMG EDULVL EDULVL EDULVLP EDULVLP EDULVLP EDULVLM EDULVLM EDULVLM EDULVLF EDULVLF EDULVLF EDCTN Head_Unemployed DSBLD RTRD Number_Of_Children_S Number_Of_Children_S Spouse_Unemployed DSBLDP RTRDP EDCTNP HHMMB HHMMB Side 18

19 PSM: Variabel estimater Vi præsenterer nu estimaterne for den sekundære PSM model, altså estimaterne for LIS datasættet: Analysis of Maximum Likelihood Estimates Sekundær PSM, husstande uden partner Parameter Estimate Standard Error Chi- Square Pr > ChiSq Intercept 1 0, ,38 <,0001 D4 1 0,3516 0, ,94 <, ,5914 0, ,79 <,0001 D27 0-0,3116 0,077 16,38 <, ,8011 0, ,26 <, ,0979 0,0804 1,48 0,2232 MARRIED 0,,,, hpeduc 0-0,5428 0, ,2 <, ,1605 0, ,63 <,0001 hpdisabl 0-0,9083 0, ,09 <,0001 hpumas 0-0,2555 0, ,47 <,0001 hpethnat 0 0,4219 0, ,23 <, ,1449 0,0792 3,35 0,0673 Maximum Likelihood Analysis of Variance Sekundær PSM, husstande uden partner Source DF Chi-Square Pr > ChiSq Intercept 1 73,38 <,0001 D ,4 <,0001 D ,31 <,0001 MARRIED 0*,, Hpeduc 2 806,93 <,0001 Hpdisabl ,09 <,0001 hpumas 1 130,47 <,0001 hpethnat 2 110,98 <,0001 Likelihood Ratio ,02 <,0001 Analysis of Maximum Likelihood Estimates Sekundær PSM, husstande med partner Parameter Estimate Standard Error Chi- Square Pr > ChiSq Intercept 1 0, ,2 <,0001 D4 2-0,4962 0,12 17,11 <,0001 D27 0 0,5542 0,1825 9,22 0, ,066 0,0897 0,54 0,4619 Side 19

20 2-0,1445 0,0858 2,83 0,0923 MARRIED 2-0,101 0, ,05 0,0015 hpeduc 0-0,2731 0, ,55 <, ,2504 0,039 41,29 <,0001 hpdisabl 0-0,2643 0, ,04 <,0001 hpumas 0-0,2358 0,041 33,01 <,0001 hpethnat 0 0,1336 0,1529 0,76 0, ,4758 0,1554 9,38 0,0022 speduc 0-0,1566 0,04 15,29 <, ,1077 0,0414 6,77 0,0093 spdisabl 0-0,6267 0, ,11 <,0001 spumas 0-0,2616 0, ,99 <,0001 spethnat 0 0,2808 0,1171 5,75 0, ,2069 0,114 3,29 0,0696 Maximum Likelihood Analysis of Variance Sekundær PSM, husstande med partner Source DF Chi-Square Pr > ChiSq Intercept 1 47,2 <,0001 D4 1 17,11 <,0001 D ,04 <,0001 MARRIED 1 10,05 0,0015 Hpeduc 2 93,21 <,0001 Hpdisabl 1 19,04 <,0001 Hpumas 1 33,01 <,0001 Hpethnat 2 35,93 <,0001 Speduc 2 22,22 <,0001 Spdisabl 1 115,11 <,0001 Spumas 1 50,99 <,0001 Spethnat 2 24,15 <,0001 Likelihood Ratio 1,00E ,27 <,0001 Side 20

21 Gennemsnitlig vægtning Gennemsnitlig vægtning for alle husstande Datasæt Kategori / År Under 70%-medianen 2,58 2,55 2,47 2,48 2,47 2,33 2,48 2,37 Over 70%-medianen 0,82 0,83 0,84 0,84 0,84 0,85 0,84 0,85 Under 70%-medianen 2,46 2,42 2,35 2,37 2,36 2,23 2,37 2,28 Over 70%-medianen 0,76 0,77 0,78 0,78 0,78 0,79 0,78 0,79 Under 70%-medianen 2,43 2,39 2,32 2,34 2,33 2,20 2,34 2,25 Over 70%-medianen 0,76 0,76 0,77 0,77 0,77 0,78 0,77 0,78 Under 70%-medianen 2,46 2,42 2,35 2,37 2,36 2,23 2,37 2,28 Over 70%-medianen 0,76 0,77 0,78 0,78 0,78 0,79 0,78 0,79 For at vurdere konsekvensen af vores vægtning er ovenstående skema af vægtenes gennemsnit angivet. Der er et klart system i, at husstande under 70% medianen skal vægtes 2,5, og husstande over 70% medianen kun skal vægtes omkring 0,8. Det indikerer, at vores samples er pænt fordelte, og at der ikke sker uigennemskuelige beregninger. Side 21

22 Resultater for data ESS: Logistisk Regression Logistic Regression Results (Husstande uden partner) The LOGISTIC Procedure Model Information Data Set SASUSER.FILTER_FOR_CON_DATA_FORMATT_0005 Response Variable In_Poverty Number of Response Levels 2 Weight Variable Weight_Household_2009 Model binary logit Optimization Technique Fisher's scoring Number of Observations Read 849 Number of Observations Used 849 Sum of Weights Read Sum of Weights Used Response Profile Ordered Total Value In_Poverty Frequency Total Weight Probability modeled is In_Poverty='1'. Class Level Information Class Value Design Variables GNDR BLGETMG EDULVL EDULVLM EDULVLF Side 22

23 EDCTN Head_Unemployed DSBLD RTRD Number_Of_Children_SEC HHMMB Model Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC SC Log L Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio <.0001 Score <.0001 Wald <.0001 Side 23

24 Type 3 Analysis of Effects Wald Effect DF Chi-Square Pr > ChiSq GNDR BLGETMG EDULVL <.0001 EDULVLM EDULVLF EDCTN <.0001 Head_Unemployed DSBLD RTRD Number_Of_Children_S HHMMB Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept GNDR BLGETMG BLGETMG EDULVL EDULVL EDULVLM EDULVLM EDULVLM EDULVLF EDULVLF EDULVLF EDCTN <.0001 Head_Unemployed DSBLD RTRD Number_Of_Children_S Number_Of_Children_S HHMMB HHMMB Side 24

25 Odds Ratio Estimates 90% Wald Effect Point Estimate Confidence Limits GNDR 1 vs BLGETMG -1 vs 1 > <0.001 > BLGETMG 0 vs EDULVL 0 vs EDULVL 1 vs EDULVLM -1 vs EDULVLM 0 vs EDULVLM 1 vs EDULVLF -1 vs EDULVLF 0 vs EDULVLF 1 vs EDCTN 0 vs Head_Unemployed 0 vs DSBLD 0 vs RTRD 0 vs Number_Of_Children_S 0 vs Number_Of_Children_S 1 vs HHMMB 1 vs HHMMB 2 vs Association of Predicted Probabilities and Observed Responses Percent Concordant 64.5 Somers' D Percent Discordant 33.5 Gamma Percent Tied 2.0 Tau-a Pairs c Side 25

26 Profile Likelihood Confidence Interval for Parameters Parameter Estimate 90% Confidence Limits Intercept GNDR BLGETMG BLGETMG EDULVL EDULVL EDULVLM EDULVLM EDULVLM EDULVLF EDULVLF EDULVLF EDCTN Head_Unemployed DSBLD RTRD Number_Of_Children_S Number_Of_Children_S HHMMB HHMMB Year: Side 26

27 Logistic Regression Results (Husstande med partner) The LOGISTIC Procedure Model Information Data Set SASUSER.FILTER_FOR_CON_DATA_FORMATT_0004 Response Variable In_Poverty Number of Response Levels 2 Weight Variable Weight_Household_2009 Model binary logit Optimization Technique Fisher's scoring Number of Observations Read 500 Number of Observations Used 500 Sum of Weights Read Sum of Weights Used Response Profile Ordered Total Value In_Poverty Frequency Total Weight Probability modeled is In_Poverty='1'. Class Level Information Class Value Design Variables GNDR BLGETMG EDULVL EDULVLP EDULVLM Side 27

28 EDULVLF EDCTN Head_Unemployed DSBLD RTRD Number_Of_Children_SEC Spouse_Unemployed DSBLDP RTRDP EDCTNP HHMMB Model Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC SC Log L Side 28

29 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio Score Wald Type 3 Analysis of Effects Wald Effect DF Chi-Square Pr > ChiSq GNDR BLGETMG EDULVL EDULVLP EDULVLM EDULVLF EDCTN Head_Unemployed DSBLD RTRD Number_Of_Children_S Spouse_Unemployed DSBLDP RTRDP EDCTNP HHMMB Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept GNDR BLGETMG BLGETMG EDULVL EDULVL EDULVLP EDULVLP EDULVLP EDULVLM EDULVLM EDULVLM EDULVLF Side 29

30 EDULVLF EDULVLF EDCTN Head_Unemployed DSBLD RTRD Number_Of_Children_S Number_Of_Children_S Spouse_Unemployed DSBLDP RTRDP EDCTNP HHMMB HHMMB Odds Ratio Estimates 90% Wald Effect Point Estimate Confidence Limits GNDR 1 vs BLGETMG -1 vs BLGETMG 0 vs EDULVL 0 vs EDULVL 1 vs EDULVLP -1 vs EDULVLP 0 vs EDULVLP 1 vs EDULVLM -1 vs EDULVLM 0 vs EDULVLM 1 vs EDULVLF -1 vs EDULVLF 0 vs EDULVLF 1 vs EDCTN 0 vs Head_Unemployed 0 vs DSBLD 0 vs RTRD 0 vs Number_Of_Children_S 0 vs Number_Of_Children_S 1 vs Spouse_Unemployed 0 vs DSBLDP 0 vs RTRDP 0 vs EDCTNP 0 vs Side 30

31 HHMMB 1 vs 3 <0.001 <0.001 > HHMMB 2 vs Association of Predicted Probabilities and Observed Responses Percent Concordant 58.1 Somers' D Percent Discordant 40.1 Gamma Percent Tied 1.8 Tau-a Pairs c Profile Likelihood Confidence Interval for Parameters Parameter Estimate 90% Confidence Limits Intercept GNDR BLGETMG BLGETMG EDULVL EDULVL EDULVLP EDULVLP EDULVLP EDULVLM EDULVLM EDULVLM EDULVLF EDULVLF EDULVLF EDCTN Head_Unemployed DSBLD RTRD Number_Of_Children_S Number_Of_Children_S Spouse_Unemployed DSBLDP RTRDP EDCTNP HHMMB HHMMB Year: Side 31

32 ESS: Resultater Nedenstående diagram illustrer de procentvise stigninger for SIM og 70%-medianen fra 2003 til SIM 70%-median Nedenstående diagram illustrer de procentvise stigninger for SIM og 50%-medianen fra 2003 til SIM 50%-median Side 32

33 Nedenstående diagram viser procentdelen af fattige med de tilhørende 80% profil-konfidensintervaller for T-fordelingen. Denne skal anvendes til at forstå udviklingen af fattigdom over det sidste årti Konfidensområde Middelværdi Nedenstående illustrer sammenhængen mellem SIM og Gini-koefficienten: År Social-mobilitets fattigdomsgrænse Gini-Koefficient , , , , , , , , , , , , , , , ,8 SIM mod Gini-Koefficient 27,5 27,0 26,5 26,0 25,5 25,0 24,5 24,0 23,5 23,0 22,5 13, , , ,5 y = 1,8437x -2,6244 R² = 0,7912 Gini-Koefficient Lineær (Gini- Koefficient) Side 33

34 Nedenstående illustrer sammensætningen af befolkningen og de ifølge SIM fattige mellem 50-70% af indkomstmedianen: Hele Befolkningen Fattige (Mellem 50-70%) Ufaglært Faglært Akademiker Næste graf illustrer det samme, dog ud fra partnerens uddannelse: Hele Befolkningen Fattige (Mellem 50-70%) 10 0 Ufaglært Faglært Akademiker Side 34

35 Nedenstående viser procentdelen af henholdsvis mænd og kvinder der slipper fri. Resultatet er ikke signifikant. Pct. som slipper ud fordelt på køn 20,0 19,5 19,0 18,5 18,0 17,5 17,0 16,5 16,0 15,5 15,0 19,2 Mænd 17,9 Kvinder Nedenstående diagram viser procentdelen af fattige som undslipper fattigdom med de tilhørende 80% profil-konfidensintervaller for T-fordelingen. Denne skal anvendes til at forstå udviklingen af fattigdom over det sidste årti MOB Konfidensområde MOB Middelværdi MOB Konfidensområde Side 35

36 Nedenstående diagram viser procentdelen af fattige med de tilhørende 80% de simultanekonfidensintervaller for T-fordelingen. Denne skal anvendes til at sammenligne årene MOB Konfidensområde MOB Middelværdi MOB Konfidensområde Vi viser yderligere 2 resultater, under normalfordelingsantagelsen, for at understrege robustheden af vores data. Nedenstående diagram viser SIM med tilhørende 80% simultane-konfidensintervaller for normalfordelingen. Denne kan anvendes til at sammenligne enkelte år. 16, , ,5 14 Konfidensområde MOB Middelværdi MOB Konfidensområde 13, Side 36

37 0Nedenstående diagram viser procentdelen af fattige med de tilhørende 80% simultanekonfidensintervaller for normal-fordelingen. Denne kan anvendes til at sammenligne enkelte år MOB Konfidensområde MOB Middelværdi MOB Konfidensområde Side 37

38 LIS: Resultater Nedenstående graf viser kvartilerne for alle fattige under 70% medianen, deres chance for at undslippe fattigdom mod deres årlige medianindkomst , , , , ,5 Pct. som slipper ud af fattigdom mod median indkomst Nedenstående viser procentdelen af mennesker under 70% medianen som slipper fri fordelt på amter Pct. som slipper fri Side 38

39 Nedenstående viser procentdelen af mennesker under 70% medianen som slipper fri fordelt på beboelsesområder. 20 Pct. som slipper fri 19, , , , ,5 15 Metropolitan area Urban area Rural district Side 39

40 Nedenstående viser procentdelen af mennesker under 70% medianen som slipper fri fordelt på husstandstype. 25 Pct. som slipper fri owner occupied tenant semi-owned (condominium) living in institution various types of non-defined dwellings nursing homes, college room Nedenstående viser ratioen af fattige mennesker fordelt på husstandstype. 8 Ratio: fattige over hele befolkningen owner occupied tenant semi-owned (condominium) living in institution various types of non-defined dwellings nursing homes, college room Side 40

41 Nedenstående viser procentdelen af mennesker under 70% medianen som slipper fri fordelt på aktivitetstype I arbejde / studerende / pensioneret Pct. som slipper fri Arbejdsløs Pct. som slipper fri Nedenstående viser procentdelen af mennesker under 70% medianen som slipper fri fordelt på etnicitet Dansker Pct. som slipper fri 1. og 2. Generations Indvandrer Pct. som slipper fri Side 41

42 Nedenstående viser ratioen af fattige fordelt på etnicitet, uddannelsesniveau og arbejdsløshed. 3 Ratio: fattige over hele befolkningen 2,5 2 1,5 1 0,5 0 6 Ratio: fattige over hele befolkningen Side 42

43 Nedenstående viser ratioen af fattige fordelt på etnicitet og antal børn. 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 Ratio: fattige over hele befolkningen Side 43

44 ESS: Fremskrivning Vi starter med at fremskrive SIM, udelukkende ved brug af variablen år. Nedenstående viser de statistisk resultater for dette. Call: lm(formula = SIM ~ ÅR, data = mydata) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) ** ÅR ** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 6 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 6 DF, p-value: Side 44

45 cvcvc 5 % 95 % (Intercept) ÅR SIM Konfidens Konfidens Herefter fremskrives SIM ud fra både ÅR og procent af BNP som anvendes til indkomstoverførsler. Nedenstående viser de statistisk resultater for dette. Call: lm(formula = SIM ~ ÅR + TY, data = mydata) Residuals: Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) ** ÅR ** TY Signif. codes: 0 *** ** 0.01 * Residual standard error: on 5 degrees of freedom Multiple R-squared: 0.873, Adjusted R-squared: F-statistic: on 2 and 5 DF, p-value: Side 45

46 Pct. som slipper ud af fattigdom Konfidens Konfidens % 95 % (Intercept) ÅR TY Side 46

47 Herefter fremskrives pct. delen af mennesker som slipper ud af fattigdom i forhold til år. Nedenstående viser de statistisk resultater for dette. Call: lm(formula = PCT ~ ÅR, data = mydata) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) ** ÅR ** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 6 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 6 DF, p-value: % 95 % (Intercept) ÅR Side 47

48 - Side 48

49 SIM Konfidens Konfidens Til sidst fremskrives pct.delen af mennesker som slipper ud af fattigdom i forhold til år og procentdel af bruttonationalprodukt brugt på indkomstoverførsler. Nedenstående viser de statistisk resultater for dette. Call: lm(formula = PCT ~ ÅR + TY, data = mydata) Residuals: Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) ** ÅR ** TY Signif. codes: 0 *** ** 0.01 * Residual standard error: on 5 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 2 and 5 DF, p-value: % 95 % (Intercept) ÅR TY Side 49

50 SIM Konfidens Konfidens Side 50

51 Deskriptiv statistik ESS Data Data anvendt er fra runderne 1, 2, 3 og 4 der svarer til henholdsvis årene 2002, 2004, 2006 og Behandling af data for ESS 2008: For at vurderer hvorvidt en husstand lever under 70% medianen eller ej tages udgangspunkt i dokumentation for husstandens indkomst, der er kodet som variablen der tager nedenstående værdier: Grænse for at blive klassificeret som værende under 70% af medianen til året Maks. Disponible Indkomstniveau Min. antal mennesker Min. antal børn under 14 J 1 0 R 1 1 R 2 0 C 1 4 C 2 2 C 3 0 M 1 5 M 2 3 M 3 1 M 4 0 Side 51

52 Grænse for at blive taget med i betragtning til den logistiske regression (mht. 70%-medianen): Maks. Disponible Indkomstniveau Min. antal mennesker Min. antal børn under 14 R 1 0 C 1 1 C 2 0 M 1 4 M 2 2 M 3 0 F 1 5 F 2 3 F 3 1 F 4 0 Grænse for at blive klassificeret som værende under 60% af medianen til året Maks. Disponible Indkomstniveau Min. antal mennesker Min. antal børn under 14 J 1 0 R 1 1 R 2 0 C 1 2 C 2 2 C 3 0 M 1 5 M 2 2 M 3 1 M 4 0 Grænse for at blive taget med i betragtning til den logistiske regression (mht. 60%-medianen): Maks. Disponible Indkomstniveau Min. antal mennesker Min. antal børn under 14 R 1 0 C 1 1 C 2 0 M 1 2 M 2 2 M 3 0 F 1 5 F 2 2 F 3 1 F 4 0 Side 52

53 Behandling af data for ESS 2006, ESS 2004 og ESS 2002: For at vurderer hvorvidt en husstand lever under 70% medianen eller ej tages udgangspunkt i dokumentation for husstandens indkomst, der er kodet som variablen der tager nedenstående værdier: Grænse for at blive klassificeret som værende under 70% af medianen: Maks. Disponible Indkomstniveau Min. antal mennesker Min. antal børn under 14 J 1 0 R 1 0 C 1 0 M 1 0 F 1 1 F 2 0 S 1 4 S 2 2 S 3 0 K 1 5 K 2 3 K 3 1 K 4 0 Side 53

54 Grænse for at blive taget med i betragtning til den logistiske regression (mht. 70%-medianen): Maks. Disponible Indkomstniveau Min. antal mennesker Min. antal børn under 14 J 1 0 R 1 0 C 1 0 M 1 0 F 1 0 S 1 1 S 2 0 K 1 4 K 2 2 K 3 0 P 1 5 P 2 3 P 3 1 P 4 0 Grænse for at blive klassificeret som værende under 60% af medianen: Maks. Disponible Indkomstniveau Min. antal mennesker Min. antal børn under 14 J 1 0 R 1 0 C 1 0 M 1 0 F 1 1 F 2 0 S 1 2 S 2 1 S 3 0 K 1 4 K 2 2 K 3 1 K 4 0 Side 54

55 Deskriptiv statistik af sammenlagte ESS Data efter behandling: Under 70%-Medianen Husstandstype Alle år En voksen under En voksen over En voksen med et eller flere børn To voksne under To voksne, hvoraf mindst den ene er over To voksne med et barn To voksne med to børn To voksne med tre eller flere børn Tre eller flere voksne Tre eller flere voksne med børn Alle husstande Anvendt til logistisk regression, mht. 70% medianen Husstandstype Alle år En voksen under En voksen over En voksen med et eller flere børn To voksne under To voksne, hvoraf mindst den ene er over To voksne med et barn To voksne med to børn To voksne med tre eller flere børn Tre eller flere voksne Tre eller flere voksne med børn Alle husstande Side 55

56 Anvendt til logistisk regression (mht. 60% medianen) Husstandstype Alle år En voksen under En voksen over En voksen med et eller flere børn To voksne under To voksne, hvoraf mindst den ene er over To voksne med et barn To voksne med to børn To voksne med tre eller flere børn Tre eller flere voksne Tre eller flere voksne med børn Alle husstande Under 60%-Medianen Husstandstype Alle år En voksen under En voksen over En voksen med et eller flere børn To voksne under To voksne, hvoraf mindst den ene er over To voksne med et barn To voksne med to børn To voksne med tre eller flere børn Tre eller flere voksne Tre eller flere voksne med børn Alle husstande Side 56

57 Samples i alt Husstandstype Alle år En voksen under En voksen over En voksen med et eller flere børn To voksne under To voksne, hvoraf mindst den ene er over To voksne med et barn To voksne med to børn To voksne med tre eller flere børn Tre eller flere voksne Tre eller flere voksne med børn Alle husstande Grænse for at blive taget med i betragtning til den logistiske regression (mht. 60%-medianen): Maks. Disponible Indkomstniveau Min. antal mennesker Min. antal børn under 14 J 1 0 R 1 0 C 1 0 M 1 0 F 1 0 S 1 1 S 2 0 K 1 2 K 2 1 K 3 0 P 1 4 P 2 2 P 3 1 P 4 0 Side 57

58 ESS Uddannelsesniveauer Side 52, POPULATION STATISTICS, ESS ed. 3.0 (ESS4AppendixA1_e03.0.pdf) Side 58

59 SSM - Udeladte undermodeller Nedenstående er analyser som er udeladt fra den originale rapport, da deres viden ikke er essentielt for ovenstående metoder og konklusioner. I stedet er de medtaget som appendiks for at underbygge forståelsen af hvordan de sociale processer for dødelighed og separation/parforhold fungere for de lavt uddannede og økonomisk dårligst stillede danskere fra et statistisk synspunkt. Side 59

60 Pardannelse og separation Motivation Man kan spørge sig selv hvorfor pardannelse og separation er relevant for ulighed. Sociologiske teorier fortæller os at ægteskab og længere parforhold er et resultat af værdier hos de deltagende parter og deres bevidste handlingerne for at gå på kompromis og skabe en fremtid sammen. Sociologiske teorier fortæller os også ligeledes at status, indkomst, uddannelse og en lang række andre egenskaber kan være alt afgørende for denne proces. Smits et al og Hamplová bekræfter grundigt at der er stærk uddannelses homogami I Danmark (det vil sige at langt de fleste mennesker indgår i parforhold, hvor deres partner har samme uddannelsesniveau). Smits et al kommer blandt andet frem til at uddannelsesniveauet er langt mere afgørende end indkomsten for partner valg. Som konsekvens af dette vil individer med lavt uddannelsesniveau finde sammen med andre individer som også kun har et lavt uddannelsesniveau. Det forstærker naturligvis uligheden i samfundet. Forstærkelsen gælder både i forhold til antallet af børn parforholdet får, men også i forhold til indkomst og muligheden for at finde job i tilfælde af, at en part skulle blive arbejdsløs. Det er derfor afgørende at undersøge denne variabel så udstrakt vi kan. Faktorer og model Baseret på ESS data fra 2002 udvikler Hamplová en solid statistisk model til at bestemme frekvenserne for parforhold der afspejler begge parters uddannelsesniveau. Vi vil benytte disse frekvenser til at udregne sandsynligheden for hvilket parforhold et individ ender i. Nedenstående viser frekvenstablerne for de Skandinaviske lande: Vi antager at de sociale processer mellem mænd og kvinder, når det kommer til pardannelse og separation, er ens for alle de skandinaviske lander, og tillader derfor os selv at bruge modellens resultater. Det svarer i grove træk til at postulere at parforholds- mentaliteten er ens i alle de Skandinaviske lande. Det er klart at den aldrig helt vil være ens, men overordnet mener vi at dette er en mild antagelse. Man skal ikke forveksle denne antagelse om ens mentalitet med f.eks. løndiskrimination eller valg af uddannelses... Det er klart at både løndiskrimination og valg af uddannelse på baggrund af køn er forskellige i Skandinavien. Men vores antagelse holder ikke kønnene op mod hinanden, men går i stedet på det sammenspil der er mellem mand og kvinde. Side 60

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Simpel og multipel logistisk regression

Simpel og multipel logistisk regression Faculty of Health Sciences Logistisk regression Simpel og multipel logistisk regression 16. Maj 2012 Analyse af en binær responsvariabel. syg/rask, død/levende, ja/nej... Ud fra en eller flere forklarende

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

β 2 : forskel i skæring polymer 1 og 2. β 3 forskel i skæring polymer 1 og 3.

β 2 : forskel i skæring polymer 1 og 2. β 3 forskel i skæring polymer 1 og 3. Program suspended 200 250 300 350 400 1 2 3 6.5 7.0 7.5 8.0 8.5 9.0 1. kategoriske variable - kodning som indikator variable. 2. model selektion, R 2, F-test samt eksempler. ph Model: forskellig skæring

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: 1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14

Læs mere

Rygtespredning: Et logistisk eksperiment

Rygtespredning: Et logistisk eksperiment Rygtespredning: Et logistisk eksperiment For at det nu ikke skal ende i en omgang teoretisk tørsvømning er det vist på tide vi kigger på et konkret logistisk eksperiment. Der er selvfølgelig flere muligheder,

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Uge 13 referat hold 4

Uge 13 referat hold 4 Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Voldsom stigning i gruppen af meget fattige danskere

Voldsom stigning i gruppen af meget fattige danskere Voldsom stigning i gruppen af meget fattige danskere Antallet af personer, der er meget fattige og har en indkomst på under pct. af fattigdomsgrænsen, er steget markant, og der er nu 106.000 personer med

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

Fattigdom i Danmark. En socioøkonomisk fattigdomsgrænse. Detaljeret analyse og modelbeskrivelse, Målrettet sociologer, økonomer og statistikere.

Fattigdom i Danmark. En socioøkonomisk fattigdomsgrænse. Detaljeret analyse og modelbeskrivelse, Målrettet sociologer, økonomer og statistikere. Fattigdom i Danmark En socioøkonomisk fattigdomsgrænse Detaljeret analyse og modelbeskrivelse, Målrettet sociologer, økonomer og statistikere. 31.05.11 Kontaktperson: Iulian Vlad Serban Abstract English

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Basal Statistik for medicinske PhD-studerende November 2008

Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Markante sæsonudsving på boligmarkedet

Markante sæsonudsving på boligmarkedet N O T A T Markante sæsonudsving på boligmarkedet 9. marts 0 Denne analyse estimerer effekten af de sæsonudsving, der præger prisudviklingen på boligmarkedet. Disse priseffekter kan være hensigtsmæssige

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Sandsynlighedsregning: endeligt udfaldsrum (repetition) Program: 1. Repetition: sandsynlighedsregning 2. Sandsynlighedsregning fortsat: stokastisk variabel, sandsynlighedsfunktion/tæthed, fordelingsfunktion. 1/16 Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Del 3: Statistisk bosætningsanalyse

Del 3: Statistisk bosætningsanalyse BOSÆTNING 2012 Bosætningsmønstre og boligpræferencer i Aalborg Kommune Del 3: Statistisk bosætningsanalyse -Typificeringer Indholdsfortegnelse 1. Befolkningen generelt... 2 2. 18-29 årige... 2 3. 30-49

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Værktøjshjælp for TI-Nspire CAS Struktur for appendiks: Til hvert af de gennemgåede værktøjer findes der 5 afsnit. De enkelte afsnit kan læses uafhængigt af hinanden. Der forudsættes et elementært kendskab

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

På alle områder er konklusionen klar: Der er en statistisk sammenhæng mellem forældre og børns forhold.

På alle områder er konklusionen klar: Der er en statistisk sammenhæng mellem forældre og børns forhold. Social arv 163 8. Social arv nes sociale forhold nedarves til deres børn Seks områder undersøges Der er en klar tendens til, at forældrenes sociale forhold "nedarves" til deres børn. Det betyder bl.a.,

Læs mere

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A) Økonometri 1 Forår 2003 Ugeseddel 13 Program for øvelserne: Gruppearbejde Opsamling af gruppearbejdet og introduktion af SAS SAS-øvelser i computerkælderen Øvelsesopgave 6: Hvem består første årsprøve

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/?? Dagens Temaer k normalfordelte obs. rækker i proc glm. Test for lineær regression Test for lineær regression - via proc glm p. 1/?? Proc glm Vi indlæser data i datasættet stress, der har to variable: areal,

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Klar sammenhæng mellem børns og forældres livsindkomst

Klar sammenhæng mellem børns og forældres livsindkomst Klar sammenhæng mellem børns og forældres livsindkomst Der er stor forskel på størrelsen af den livsindkomst, som 3-årige danskere kan se frem til, og livsindkomsten hænger nøje sammen med forældrenes

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares) Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

Logistisk regression og prædiktion

Logistisk regression og prædiktion Faculty of Health Sciences Introduktion Logistisk regression og prædiktion 16. Maj 2012 Julie Forman Biostatistisk Afdeling, Københavns Universitet Hvad er en god diagnostisk model? En model med god overensstemmelse

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

Modul 5: Test for én stikprøve

Modul 5: Test for én stikprøve Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Store gevinster af at uddanne de tabte unge

Store gevinster af at uddanne de tabte unge Store gevinster af at uddanne de tabte unge Gennem de senere år har der været stor diskussion om, hvor stor gevinsten vil være ved at uddanne den gruppe af unge, som i dag ikke får en uddannelse. Nye studier

Læs mere

To samhørende variable

To samhørende variable To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen

Læs mere

NOTAT 48 02.10.2015 EFFEKTEN AF HF. Metode

NOTAT 48 02.10.2015 EFFEKTEN AF HF. Metode NOTAT 48 02.10.2015 EFFEKTEN AF HF er tiltænkt rollen som social og faglig løftestang for de personer, der ikke følger den direkte vej gennem ungdomsuddannelsessystemet. I dette notat viser DEA, at hf

Læs mere

SAMFUNDSØKONOMISK AFKAST AF UDDANNELSE

SAMFUNDSØKONOMISK AFKAST AF UDDANNELSE 20. juni 2005 Af Mikkel Baadsgaard, direkte tlf.: 33557721 Resumé: SAMFUNDSØKONOMISK AFKAST AF UDDANNELSE Investeringer i uddannelse er både for den enkelte og for samfundet en god investering. Det skyldes

Læs mere

Tabel 1. BMI, kropsvægt, overvægt og fedme for voksne og børn fordelt på køn. BMI gennemsnit Kropsvægt Normalvægtig Overvægtig Fed Totalt % (N) Alle voksne 25,60 50 35 15 100% (1746) Kvinder 25,54 52 33

Læs mere

Stor ulighed blandt pensionister

Stor ulighed blandt pensionister Formuerne blandt pensionisterne er meget skævt fordelt. Indregnes de forbrugsmuligheder, som formuerne giver i indkomsten, så er uligheden blandt pensionister markant større end uligheden blandt de erhvervsaktive.

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Eksempel på logistisk vækst med TI-Nspire CAS

Eksempel på logistisk vækst med TI-Nspire CAS Eksempel på logistisk vækst med TI-Nspire CAS Tabellen herunder viser udviklingen af USA's befolkning fra 1850-1910 hvor befolkningstallet er angivet i millioner: Vi har tidligere redegjort for at antallet

Læs mere

Hvor længe venter de studerende inden de begynder uddannelse? Og hvad laver de imens?

Hvor længe venter de studerende inden de begynder uddannelse? Og hvad laver de imens? Eurostudent IV DENMARK Analysenotat 2: Om hvad de studerende laver inden de begynder universitetsuddannelse Hvor længe venter de studerende inden de begynder uddannelse? Og hvad laver de imens? Det er

Læs mere

9. Chi-i-anden test, case-control data, logistisk regression.

9. Chi-i-anden test, case-control data, logistisk regression. Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/

Læs mere

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles

Læs mere

Multipel regression 22. Maj, 2012

Multipel regression 22. Maj, 2012 Data: Det færøske kviksølv-studie Simpel linær regression Confounding Multipel lineær regression Fortolkning af parametre Vekselvirkning Kollinearitet Modelkontrol Multipel regression 22. Maj, 2012 Esben

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

LØNDANNELSE BLANDT MEDLEMMER AF IDA HOVEDKONKLUSIONER OG SURVEYRESULTATER

LØNDANNELSE BLANDT MEDLEMMER AF IDA HOVEDKONKLUSIONER OG SURVEYRESULTATER Til Ingeniørforeningen, IDA Dokumenttype Rapport Dato 14. Juni 2012 LØNDANNELSE BLANDT MEDLEMMER AF IDA HOVEDKONKLUSIONER OG SURVEYRESULTATER LØNDANNELSE BLANDT MEDLEMMER AF IDA HOVEDKONKLUSIONER OG SURVEYRESULTATER

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Introduktion til GLIMMIX

Introduktion til GLIMMIX Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.

Læs mere

Besvarelse af opgavesættet ved Reeksamen forår 2008

Besvarelse af opgavesættet ved Reeksamen forår 2008 Besvarelse af opgavesættet ved Reeksamen forår 2008 10. marts 2008 1. Angiv formål med undersøgelsen. Beskriv kort hvordan cases og kontroller er udvalgt. Vurder om kontrolgruppen i det aktuelle studie

Læs mere

BILAG 3: DETALJERET REDEGØ- RELSE FOR REGISTER- ANALYSER

BILAG 3: DETALJERET REDEGØ- RELSE FOR REGISTER- ANALYSER Til Undervisningsministeriet (Kvalitets- og Tilsynsstyrelsen) Dokumenttype Bilag til Evaluering af de nationale test i folkeskolen Dato September 2013 BILAG 3: DETALJERET REDEGØ- RELSE FOR REGISTER- ANALYSER

Læs mere

De rigeste er mere tilfredse med livet i lige lande

De rigeste er mere tilfredse med livet i lige lande De rigeste er mere tilfredse med livet i lige lande I de mere lige lande er befolkningen gennemsnitligt mere tilfredse med livet som helhed. Dette skyldes ikke alene, at de fattigste har det bedre i de

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Effekter af studiejob, udveksling og projektorienterede forløb

Effekter af studiejob, udveksling og projektorienterede forløb Effekter af studiejob, udveksling og projektorienterede forløb En effektanalyse af kandidatstuderendes tilvalg på universiteterne Blandt danske universitetsstuderende er det en udbredt praksis at supplere

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere