U L I G H E D I D A N M A R K



Relaterede dokumenter
Statistik. Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal.

Huskeliste Printark. U4 Tastetider U5 Hvor hurtigt regner du? E4 Begreber og fagord - Statistik. Materialer. Mobiltelefon Stopur

Statistik. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer.

Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau)

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Dennis Pipenbring. Matematik B-niveau. - stx 2017 MATX.DK

Indkomstskat i Danmark

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)

Dennis Pipenbring. Matematik C-niveau. - stx 2017 MATX.DK

Statistik er at behandle en stor mængde af tal, så de bliver lettere at overskue og forstå.

Dennis Pipenbring. Matematik C-niveau. - stx 2017 MATX.DK

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

brikkerne til regning & matematik statistik preben bernitt

Økonomiske konsekvenser af en skattestigning i Furesø Kommune

Deskriptiv statistik for hf-matc

Noter til Statistik. Lisbeth Tavs Gregersen. 1. udgave

Deskriptiv statistik for matc i stx og hf

for gymnasiet og hf 2016 Karsten Juul

Antal timer Køn k m k m m k m k m k k k m k k k

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Matematik og samfundsfag Gini-koefficienten

c. Radius for hver sekter er målt i cm og angivet i følgende tabel. Desuden er arealet af hvert område beregnet.

statistik og sandsynlighed

Grupperet materiale kan f.eks. være befolkningsdata eller indkomstfordelinger.

Formelsamling Matematik C

Deskriptiv statistik. for C-niveau i hf Karsten Juul

Statistik - supplerende eksempler

Nogle emner fra. Deskriptiv Statistik Karsten Juul

Hvad siger statistikken?

for gymnasiet og hf 2017 Karsten Juul

Ved et folketingsvalg eller en folkeafstemning spørger man alle stemmeberettigede, og kun en del af dem stemmer.

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

S. 55 AFSNIT 3.2 Ø1 S. 55. Pindediagram

Grupperede observationssæt Deskriptiv statistik: Middelværdi, frekvensfordeling, sumkurve, kvartilsæt, boxplot

Deskriptiv statistik

Statistik (deskriptiv)

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Undervisningsbeskrivelse

Graph brugermanual til matematik C

OM KAPITLET ELEVFORUDSÆTNINGER STATISTIK

Projektforløb: Personbeskatning i Danmark

Undervisningsbeskrivelse

positiv. Hvis man omvendt har større renteudgifter end renteindtægter, er kapitalindkomsten negativ. Med skattepligtig indkomst forstås indkomst

Et CAS program til Word.

9 Statistik og sandsynlighed

for matematik pä B-niveau i hf

H Å N D B O G M A T E M A T I K 2. U D G A V E

En lille introduktion til WordMat og statistik.

1/6. Samfundsbeskrivelse B Forår 2010 Hold 3. Note 6 - Beregning af personlig indkomstskat

Undervisningsbeskrivelse

Under 63 år : 92% Under 55 år : 55% Ved at trække den nederste fra den øverste af de to grupper fås: Melllem 55 og 63 år :

Matematik A. Højere handelseksamen. 1. Delprøve, uden hjælpemidler. kl

9.1 I en klasse blev alle elevernes højde målt. Det gav følgende resultater:

Supplerende opgaver til TRIP s matematiske GRUNDBOG. Forlaget TRIP. Opgaverne må frit benyttes i undervisningen.

SKAT PÅ INDKOMST ER FALDET SIDEN

Eksponentielle funktioner for C-niveau i hf

5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime

Løsninger til kapitel 1

Kapitel 2. Indblik i indkomstniveauet og indkomstfordelingen i Grønland

GUX. Matematik. A-Niveau. Torsdag den 1. juni Kl Prøveform a GUX171 - MAA

Lektion 9s Statistik - supplerende eksempler

Statistikkompendium. Statistik

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Lyngallup profil af partier til BT Dato: 13. juni 2012

Metodenotat. Rentefradrag

OM KAPITLET STATISTIK. egne svar eller Elevernes egne forklaringer. I disse

Folkepensionisternes indkomst og formue 2016

Middelværdi med mere Hyppighed og frekvens Diagrammer Hvilket diagram er bedst? Grupperede observationer...

Undervisningsbeskrivelse

Kandidater ved Folketingsvalget 5. juni 2019

Undervisningsbeskrivelse

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

statistik og sandsynlighed

Opgavesamling Matematik A HTX

Arbejdsplan generel Tema 4: Statistik

Navn:&& & Klasse:&& STATISTIK - Fase 2. Undersøge sammenhæng i omverdenen med datasæt. Vurdering fra 1 til 5 (hvor 5 er højst) Lærer.

Rentesregning. Procent- og rentesregning. Rentesregning. Opsparingsannuitet

Statistik med GeoGebra

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Faggruppernes troværdighed 2015

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS

Undervisningsbeskrivelse

Lyngallup om den økonomiske krise Dato: 2. november 2011

Navn:&& & Klasse:&& STATISTIK - Fase 2. Undersøge sammenhæng i omverdenen med datasæt. Vurdering fra 1 til 5 (hvor 5 er højst) Lærer.

Median, kvartiler, boksplot og sumkurver

M A T E M A T I K B A NK E NS S T A T I S T I K K O M P E ND I U M

Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4

Deskriptiv statistik (grupperede observationer)

Uligheden mellem indvandrere og danskere slår alt

Undervisningsbeskrivelse

Radius Kommunikation // November Troværdighedsundersøgelsen 2016

Middelklassen bliver mindre

I. Deskriptiv analyse af kroppens proportioner

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Transkript:

D E N N I S P I P E N B R I N G U L I G H E D I D A N M A R K M AT X. D K

Copyright 2013 Dennis Pipenbring offentliggjort på matx.dk layout af tufte-latex.googlecode.com Materialet er til fri afbenyttelse så længe det ikke udnyttes kommercielt. Materialet må downloades og distribueres frit både elektronisk og i print. First printing, June 2013

Indhold Forord 9 Statistiske diskriptorer 11 Lorenzdiagram og Ginikoefficent 17 Diskrete observationer 21 Danmark 1900-2010 25 Det skrå skatteloft 27 Svar på opgaver 31 Litteratur 33

Figurer 1 Histogram over familieindkomsten 14 2 Sumkurve over familieindkomst 15 3 Kvartilsæt over familieindkomst 15 4 Boksplot over familieindkomsten (uden knorhår) 16 5 Boksplot til sammenligning af flere grupper 16 6 Lorenzdiagram med fuldstændig lighed 17 7 Lorenzdiagram for familier i Danmark 1997 og 2007 18 8 Arealer som bruges i beregningen af Ginikoefficienten 18 9 Arealet af en trapez 19 10 Søjledigram over fordelingen af stemmer i Nordsjælland. 22 11 Fordelingen af karaktere 23 12 Forbrugerprisindex (1900=100) 1900-2010 25 13 Forbrugerprisindex (1900=100) 1900-1945 25 14 Forbrugerprisindex (1900=100) 1945-1980 26 15 Forbrugerprisindex (1900=100) 1980-2010 26 16 Andelen af lønindkomsten der betales i skat. 27

Tabeller 1 Familieindkomst i intervaller med hyppighed.[6, år 2007] 11 2 Regneark: Beregning af Frekvens 12 3 Pars indkomst i intervaller med hyppighed.[6, år 2007] 12 4 Enliges indkomst i intervaller med hyppighed.[6, år 2007] 12 5 Gennemsnitligfamilieindkomst og frekvens fra tabel 2.[6, år 2007] 13 6 Pars indkomst med gennemsnit for hvert interval.[6, år 2007] 14 7 Regneark: Beregning af summeret frekvens 14 8 Enliges indkomst med gennemsnit for hvert interval.[6, år 2007] 14 9 Intervaller og højder til histogram 15 10 Regneark: Beregning af den samlede indkomst 17 11 Regneark: Beregning af summeret indkomstfrekvens 18 12 Familernes andels af den samlede indkomst. [tabel 11 og tabel 7] 19 13 Folketingsvalget 2011, hyppighed for nordsjælland og vestjylland [7]. 21 14 Folketingsvalget 2011, hyppighed og frekvens for nordsjælland.[7] 22 15 Karkaterfoedelingen ved eksamen i Molekylær mikrobiologi, DTU, Vinter 2011[1] 23 16 Bruttoindkomst for familier [5, år 2009] 27 17 Disponipel indkomst for familier [4, år 2009] 27 18 Principperne for skatteberegningen i 2011 28

Forord Materialet er udarbejde så de studerende selvstændigt kan arbejde med det. Det er således ikke meningen, at store dele af forløbet skal gå med tavleundervisning. Lærerens opgave er at definere hvilke opgaver eleverne skal besvare evt. i samspil med samfundsfag. Udvalget af opgaver skal være således at besvarelsen som helhed udgør en rapport i matematik. Hvis der samarbejdes med samfundsfag er det vigtigt at der indgår ekstra samfundsfagligt materiale, til at belyse et emne om ulighed f.eks. levevilkår.

Statistiske diskriptorer Indledning Statistik er et redskab til at beskrive et datamateriale. Ofte vil et datamateriale være for omfattende til, at det er muligt at overskue og konkludere noget om det blot ved at se på selve datamaterialet. Derfor er der udviklet forskellige metoder, modeller og tabeller, som gør det muligt at overskue store mængder af data, og på baggrund af disse modeller og tabeller er det muligt at drage konklusioner på baggrund af datamaterialet. Hvis man ikke forstår at læse tabeller og hvis man ikke ved, hvordan man skal forstå de statistiske begreber, kan man ikke selv drage konklusioner eller forstå andres konklusioner. Så man vil meget let blive snydt når man læser, hører eller ser andres udtalelser, når disse tager udgangspunkt i statistisk materiale. Observation og hyppighed Den mindste enhed i et datasæt er en observation. Det kan være observationer af næsten alt hvad, man kan tænke sig, f.eks. kan det være en families indkomst I dette tilfælde vil der være tale om 2.741.498 observationer. Observationerne er i dette tilfælde grupperede af hensyn til overskueligheden. Indkomst Hyppighed Under 200.000 kr. 698.872 200.000-299.999 kr. 516.181 300.000-399.999 kr. 378.214 400.000-499.999 kr. 248.121 500.000-599.999 kr. 237.841 600.000 kr. og derover 662.269 I alt 2.741.498 Tabel 1: Familieindkomst i intervaller med hyppighed.[6, år 2007] Ved at aflæse på tabel 1, kan det ses at antallet af familier med en indkomst under 400.000 er ca. 1,6 mio. 698.872 + 516.181 + 378.214 = 1.593.267

12 Frekvens Frekvensen er hyppigheden divideret med det totale antal observationer. Frekvensen = Hyppigheden Det totale antal observationer 100% Definition 1: Frekvens I eksempelet fra før, er frekvensen af antal familier der har en indkomst under 400.000 ca. 58 % 1.593.267 100% 58,1% 2.741.498 For at vise hvordan udregnerne kan gøres i et regneark, vil der ved hver udregning være vist med grønt hvilken formel der står i cellen og resultatet er med almindelig skrift i samme celle. I regnearket vil det kun være resultatet der kan ses, men det er formlen der skal skrives. A B C 1 Indkomst Hyppighed Frekvens 2 0-200 tkr. 698.872 =B2/B8 25,5 % 3 200-299 tkr. 516.181 =B3/B8 18,8 % 4 300-399 tkr. 378.214 =B4/B8 13,8 % 5 400-499 tkr. 248.121 =B5/B8 9,1 % 6 500-599 tkr. 237.841 =B6/B8 8,7 % 7 600 - tkr. 662.269 =B7/B8 24,2 % 8 I alt =SUM(B2:B7) 2.741.498 =SUM(C3:C8) 100,0 % Tabel 2: Regneark: Beregning af Frekvens Det er værd at bemærke at summen af frekvenserne altid skal være 100 %. Hvis det ikke er tilfældet, er der lavet en regnefejl. Opgave 1 - Udregn frekvensen af de enkelte intervaller for hhv. par og enlige. Hyppighederne ses i tabel 3 og 4. Opgave 2 - Kommentér forskellen mellem indkomsten for enlige og par. Hvorfor er det vigtigt at omregne til frekvens (procent)? Gennemsnit Det samlede gennemsnit udregnes ved at gange gennemsnittet med frekvensen for hvert interval og lægge resultaterne sammen. Kendes gennemsnittet ikke for de enkelte intervaller anvendes intervalmidtpunkterne til udregningen af det samlede gennemsnit. Tabel 3: Pars indkomst i intervaller med hyppighed.[6, år 2007] Indkomst Hyppighed Under 200.000 kr. 37.264 200.000-299.999 kr. 151.005 300.000-399.999 kr. 148.708 400.000-499.999 kr. 158.789 500.000-599.999 kr. 203.937 600.000 kr. og derover 624.154 I alt 1.323.857 Tabel 4: Enliges indkomst i intervaller med hyppighed.[6, år 2007] Indkomst Hyppighed Under 200.000 kr. 661.608 200.000-299.999 kr. 365.176 300.000-399.999 kr. 229.506 400.000-499.999 kr. 89.332 500.000-599.999 kr. 33.904 600.000 kr. og derover 38.115 I alt 1.417.641

13 Indkomst Gennemsnit Frekvens Under 200.000 kr. 136.975 kr. 25,5 % 200.000-299.999 kr. 247.782 kr. 18,8 % 300.000-399.999 kr. 345.991 kr. 13,8 % 400.000-499.999 kr. 448.028 kr. 9,1 % 500.000-599.999 kr. 550.331 kr. 8,7 % 600.000 kr. og derover 993.927 kr. 24,2 % Samlet gennemsnit 443.208 kr. Tabel 5: Gennemsnitligfamilieindkomst og frekvens fra tabel 2.[6, år 2007] Eksempel 2: Gennemsnittet af familieindkomsten bliver: 136.975 25,5% + 247.782 18,8% + + 993.927 24,2% = 443.208 kr Bemærk at middeltallet skal være et tal der ligger mellem det højeste og det laveste tal i datasættet, ellers er der lavet en regnefejl. Opgave 3 - Udregn gennemsnittet af indkomsten for par og enlige. Brug frekvensen fra opgave 1 og oplysningerne i tabel 6 og tabel 8. Summerede frekvenser Tabel 6: Pars indkomst med gennemsnit for hvert interval.[6, år 2007] Indkomst Gennemsnit Under 200.000 kr. 125.147 kr. 200.000-299.999 kr. 248.740 kr. 300.000-399.999 kr. 349.629 kr. 400.000-499.999 kr. 451.612 kr. 500.000-599.999 kr. 551.606 kr. 600.000 kr. og derover 924.824 kr. Den summerede frekvens er summen af alle tidligere frekvenser, dette lader sig bedst illustrere ved et eksempel. A B C 1 Indkomst Frekvens Summeret frekvens 2 0-200 tkr. 25,5 % =B2 25,5% 3 200-299 tkr. 18,8 % =B3+C2 44,3% 4 300-399 tkr. 13,8 % =B4+C3 58,1% 5 400-499 tkr. 9,1 % =B5+C4 67,2% 6 500-599 tkr. 8,7 % =B6+C5 75,8% 7 600 - tkr. 24,2 % =B7+C6 100,0 % 8 I alt 100,0 % Hvis den summerede frekvens ikke ender med at være 100% ± 0,5% er der hvert fald lavet mindst en fejl. Den summerede frekvens kan bruges til f.eks. at fastslå at 58,1% af familierne har en indkomst, der er mindre end 400.000. Eller at fastslå at 100% 67,2% = 32,8% af familierne har en indkomst, der er over 500.000. Opgave 4 - Udregn den summerede frekvens for enlige og par. Tabel 7: Regneark: Beregning af summeret frekvens Tabel 8: Enliges indkomst med gennemsnit for hvert interval.[6, år 2007] Indkomst Gennemsnit Under 200.000 kr. 137.641 kr. 200.000-299.999 kr. 247.386 kr. 300.000-399.999 kr. 343.634 kr. 400.000-499.999 kr. 441.658 kr. 500.000-599.999 kr. 542.663 kr. 600.000 kr. og derover 1.082.991 kr.

14 Opgave 5 - Hvor mange procent af parene hhv. de enlige har en indkomst over 400.000 kr? Histogram Et diagram er en grafisk måde at illustrere frekvenser/summerede frekvenser og observationsværdier. Der er to forskellige typer af diagrammer: Histogram og sumkurve. Histogram bruges til at illustrere sammenhængen mellem frekvens og observationsværdi, mens sumkurven bruges til at illustrere sammenhængen mellem summeret frekvens og observationsværdi. Med udgangspunkt i tabel 7 tegnes et histogram. Det sidste interval sættes til at have endepunkt 1.400.000 kr. I histogrammet skal bredden af søjlerne være intervallængden og højden er intervalfrekvensen divideret med intervallængden [Tabel 9]. Interval Interval længde Interval frekvens Højde [ 10 6 ] 0 200000 200000 0.255 1.28 200000 300000 100000 0.188 1.88 300000 400000 100000 0.138 1.38 400000 500000 100000 0.091 0.91 500000 600000 100000 0.087 0.87 600000 1400000 800000 0.241 0.30 Opgave 6 - Sumkurve Tegn histogrammet for de enlige og parenes indkomst. Sumkurven konstrueres ved at afmærke den summerede frekvens som y-værdien og endepunkterne af de tilhørende intervaller som x-værdien i et koordinatsystem. Der ud over afmærkes startpunktet af det første interval på x-aksen, som i dette tilfælde er 0. På grafen er disse punkter markeret med. Herefter sættes streger mellem punkterne. Kvartilerne aflæses ved at gå fra hhv. 25 %, 50 % og 75 % på y- aksen til kurven og derefter ned på x-aksen og aflæse kvartilerne. En sumkurve kan også anvendes til at aflæse hvor mange procent der er indenfor et givet interval. På sumkurven ses at 35% har en indkomst der er 250.000 kr. eller under og der er 62% der har en indkomst der er 450.000 kr. eller under. Ved at trække de to procenttal fra hinanden, fås det at 27% har en indkomst mellem 250.000 kr. og 450.000 kr. Opgave 7 - Tegn sumkurven for de enliges og parenes indkomst. Frekvens 1.5 1 0.5 2 10 6 0 0.5 1 1.5 Indkomst 10 6 Figur 1: Histogram over familieindkomsten Tabel 9: Intervaller og højder til histogram 100 80 60 40 20 % Q1 Q2 1.000 kr Q3 100 200 300 400 500 600 700 800 900 1.000 Figur 2: Sumkurve over familieindkomst Symbol Kvartil Indkomst Q1 Nedre kvartil 195.000 kr. Q2 Median 340.000 kr. Q3 Øvre kvartil 590.000 kr. Figur 3: Kvartilsæt over familieindkomst

15 Opgave 8 - Aflæs kvartilerne for de enliges og parenes indkomst. Opgave 9 - Udregn hvor mange procent af hhv. enlige og par, der har en indkomst mellem 250.000 kr. og 450.000 kr. Opgave 10 - Fattigdomsgrænsen kan f.eks. sættes ved 50% af median-indkomsten.[2] 1. Hvad er så fattigdomsgrænsen for familier i kr.? 2. Hvor mange procent af familierne er så fattige? 3. Diskuter om fattigdomsgrænsen for familier kan anvendes på enlige og par. 4. Hvor mange par og enlige er fattige hvis fattigdomsgrænseen for familier anvendes. 5. Kan man tænke sig et samfund uden fattige, hvis fattigdomsgrænsen sættes ved 50% af median-indkomsten? Boksplot Boksplot kan tegnes udfra en sumkurve, hvis den mindste og den største observationsværdi i datasættet er kendt. De resterende deskriptorer aflæses på sumkurven. Det skal tegnes for sig selv, ikke på sumkurven. [Figur 4] Meget ofte anvendes boksplottet til at sammenligne to eller flere datasæt. Ét kvartilsæt bestemmes for hver af datasæt, og boksplottene tegnes i samme koordinatsystem. [Figur 5] Opgave 11 - Tegn boksplottet for indkomsten for enlige og par i samme koordinatsystem. Antag at minimum for begge grupper er 0 kr. og at maksimum er 1.000.000 for begge grupper. Opgave 12 - Kommentér forskellen i indkomsten for enlige og par med udgangspunkt i boksplottet. Indkomst 6 4 2 10 5 Familier Figur 4: Boksplot over familieindkomsten (uden knorhår) Karakterer 15 10 5 0 Drenge Piger Aliens Figur 5: Boksplot til sammenligning af flere grupper

Lorenzdiagram og Ginikoefficent 100 Lorenzdiagram Lorenzdiagrammet viser hvor stor uligheden er f.eks. i forhold til indkomsten. I figur 6 er der fuldstændig lighed idet de 10 % af familierne, som har den laveste indkomst, også har 10 % af den samlede indkomst. Og 20 % af familierne, som har den laveste indkomst, også har 20 % af den samlede indkomst osv. For at tegne Lorenzdiagrammet skal den samlede indkomst for de enkelte grupper beregnes. For at beregne den, ganges den gennemsnitlige indkomst med antallet af familier i gruppen. (Tabel 10) % af indkomst 80 60 40 20 0 0 20 40 60 80 100 % af familier Figur 6: Lorenzdiagram med fuldstændig lighed A B C 1 Gennmsnitlig Hyppighed Samlet indkomst (i kr.) indkomst Tabel 10: Regneark: Beregning af den samlede indkomst 2 136.975 kr. 698.872 =A2*B2 95.727.992.200 3 247.782 kr. 516.181 =A3*B3 127.900.360.542 4 345.991 kr. 378.214 =A4*B4 130.858.640.074 5 448.028 kr. 248.121 =A5*B5 111.165.155.388 6 550.331 kr. 237.841 =A6*B6 130.891.275.371 7 993.927 kr. 662.269 =A7*B7 618.510.900.363 8 I alt 2.741.498 =SUM(C2:C7) 1.215.053.845.584 Indkomstfrekvensen er den samlede indkomst divideret med den totale indkomst for alle familier. (Tabel 11) Eksempel 3: Indkomstfrekvensen for gruppen 200.000-299.999 er 127.900.360.542 100% = 10,53% 1.215.053.845.584 Udfra tabel 11 og tabel 7 kan Lorenzdiagrammet for alle familier i Danmark 2007 tegnes (figur 7). Opgave 13 - Tegn Lorenzdiagrammet for indkomsten for hhv. par og enlige.

18 A B C 1 Samlet indkomst Indkomst frekvens Summeret indkomst frekvens 2 95.727.992.200 =A2/A8 7,9% =B2 7,9% 3 127.900.360.542 =A3/A8 10,5% =B3+C2 18,4% 4 130.858.640.074 =A4/A8 10,8% =B4+C3 29,2% 5 111.165.155.388 =A5/A8 9,2% =B5+C4 38,3% 6 130.891.275.371 =A6/A8 10,8% =B6+C5 49,1% 7 618.510.900.363 =A7/A8 50,9% =B7+C6 100,0% 8 1.215.053.845.584 =SUM(B2:B7) 100,0% Tabel 11: Regneark: Beregning af summeret indkomstfrekvens Opgave 14 - Sammenlign Lorenzdiagrammet for hhv. alle familier, par og enlige og diskuter årsager til forskellene. Opgave 15 - Sammenlign Lorenzdiagrammet for 2007 med 1997 se figur 7. Ginikoefficienten % af indkomst 100 80 60 40 20 0 2007 1997 0 20 40 60 80 100 % af familier Figur 7: Lorenzdiagram for familier i Danmark 1997 og 2007 Ginikoefficient er et tal mellem 0 og 1 der viser uligheden i indkomstfordelingen, mellem en bestemte grupper ex. familier eller individer i en given gruppe ex. den danske befolkning. Hvis alle havde samme indkomst, ville Ginikoefficienten være 0, og hvis én havde hele indkomsten ville Ginikoefficienten være 1. Ginikoefficienten G er defineret som forholdet mellem arealet mellem linien der beskriver lighed og Lorenzkurven (A) og arealet mellem linien der beskriver lighed og x-aksen. Arealet mellem Lorenzkurven og x-aksen kaldes B se figur 8 Formlen for Gini-koefficienten er G = A A + B Da A + B = 0,5 er G = A 0,5 = 2 A Da det er nemmest at udregne arealet B omskrives formlen idet A = 0,5 B. G = 2 (0,5 B) = 1 2B 100 50 y % af indkomst A B % af familier 50 100 Figur 8: Arealer som bruges i beregningen af Ginikoefficienten x Arealet B beregnes ved at bruge tallene som blev brugt at tegne Lorenzdiagrammet.

19 Indkomst % familier % indkomst Under 200.000 kr. 25,5 % 7,88 % 200.000-299.999 kr. 44,3 % 18,40 % 300.000-399.999 kr. 58,1 % 29,17 % 400.000-499.999 kr. 67,2 % 38,32 % 500.000-599.999 kr. 75,9 % 49,10 % 600.000 kr. og derover 100,0 % 100,0 % Tabel 12: Familernes andels af den samlede indkomst. [tabel 11 og tabel 7] y Lorenzdiagram for familier i Danmark år 2007 100 90 80 70 60 50 40 30 20 10 % af indkomst B 1 B 2 B 3 B 4 B 5 B 6 % af familier 10 20 30 40 50 60 70 80 90 100 x Arealet af B kan nu beregnes som summe af arealerne B 1 til B 6. Hver af arealerne har form som en trapez. a A = g a + b 2 b B = (0,255 0) 0 + 0,0788 0,0788 + 0,184 + (0,443 0,255) + } {{ 2 } } {{ 2 } B 1 B 2 0,184 + 0,2927 (0,581 0,443) + } {{ 2 } B 3 0,2917 + 0,3832 (0,672 0,581) + } {{ 2 } B 4 0,3832 + 491 2 (0,759 0,672) } {{ } B 5 Nu kan Ginikoefficienten beregnes + (1 0,759) 0,491 + 1 0,316 } {{ 2 } B 6 Figur 9: Arealet af en trapez g G = 1 2 0,316 = 0,368 Ginikoefficienten for familier i Danmark i 2007 var 0,37. Opgave 16 - Beregn Ginikoefficienten for par og enlige i Danmark i 2007.

20 Opgave 17 - Læs artiklen "Øget ligestilling skaber mere ulighed"[9] og diskuter arktilens påstand overfor dine udregnede Ginikoefficienter for par og enlige samt for familier. I artiklen står der bl.a....siden begyndelsen af 1990 erne er højtlønnede mænd oftere og oftere begyndt at danne par med højtlønnede kvinder...

Diskrete observationer Nogle observationer er diskrete, det vil sige at de ikke bliver inddelt i intervaller. Et eksempel kunne være folketingsvalg. Parti Nordsjælland Vestjylland A. Socialdemokratiet 54182 7608 B. Radikale Venstre 33537 24090 C. Det Konservative Folkeparti 19765 12677 F. Socialistisk Folkeparti 21012 26819 I. Liberal Alliance 20613 16061 K. Kristendemokraterne 1171 9664 O. Dansk Folkeparti 30279 40378 V. Venstre 91870 113443 Ø. Enhedslisten 15062 11505 I alt 287491 330845 Tabel 13: Folketingsvalget 2011, hyppighed for nordsjælland og vestjylland [7]. Antallet stemmer omregnes til procent af det samlede antal stemmer i tabel 14.

22 A B C Tabel 14: Folketingsvalget 2011, hyppighed og frekvens for nordsjælland.[7] 1 Parti Hyppighed Frekvens 2 A. 54182 =B2/B11 18,8% 3 B. 33537 =B3/B11 11,7% 4 C. 19765 =B4/B11 6,9% 5 F. 21012 =B5/B11 7,3% 6 I. 20613 =B6/B11 7,2% 7 K. 1171 =B7/B11 0,4% 8 O. 30279 =B8/B11 10,5% 9 V. 91870 =B9/B11 32,0% 10 Ø. 15062 =B10/B11 5,2% 11 I alt =SUM(B2:B10) 287491 =SUM(C3:C8) 100,0 % Opgave 18 - Beregn frekvensfordelingen på partier ved folketingsvalget 2011 for Vestjylland. Søjlediagram Søjlediagrammet tegnes ved at angive observationsværdierne på x-aksen. På y-aksen angives frekvensen. [Figur 10] Opgave 19 - Tegn et søjldiagram der viser frekvensfordelingen af stemmer ved folketingsvalget 2011 for Vestjylland. % af stemmerne 30 20 10 0 A B C F I K O V EL Figur 10: Søjledigram over fordelingen af stemmer i Nordsjælland. Trappediagram På trappediagrammet angives observationsværdierne på x-aksen og den summerede frekvens på y-aksen.

23 A B C 1 Karakter Frekvens Summeret frekvens 2-3 4,8% =B2 4,8% 3 00 13,5% =B3+C2 18,3% 4 02 10,6% =B4+C3 28,9% 5 4 13,5% =B5+C4 42,4% 6 7 31,7% =B6+C5 74,1% 7 10 17,3% =B7+C6 91,4% 8 12 8,7% =B8+C7 100,0% 9 I alt 100% =B9+C8 - Tabel 15: Karkaterfoedelingen ved eksamen i Molekylær mikrobiologi, DTU, Vinter 2011[1] Kvartilsættes aflæses på trappediagrammet til 2, 7 og 10, ved hhv. 25 %, 50 % og 75 %. Opgave 20 - Udregn den summerede frekvens, tegn trappediagrammet og aflæs kvartilsættet for endenstående fordeling af caries hos 15-årige. Antal Hyppighed Antal Hyppighed 0 7926 8 137 1 1929 9 124 2 1309 10 110 3 758 11 96 4 482 12 68 5 344 13 55 6 206 14 41 7 179 15 13 % 100 90 75 60 50 40 25 10 Q1 Q2 Q3 0 3 0 2 4 7 10 12 Karakter Figur 11: Fordelingen af karaktere

Danmark 1900-2010 Indextal anvendes for at sammenligne størrelser i forhold til én given værdi. Et typisk index er forbrugerprisindexet[8]. Forbrugerprisindex Forbrugerprisindexet er et index der viser udviklingen i prisen for de vare som typisk købes af forbrugere. Dette index er udregnet af Danmarks Statistik siden 1900. Den gennemsnitlige vækst i forbrugerprisindexet har i perioden 1900-2010 været 3,987 % (den røde linie). Figur 12. For at analysere udviklingen deles perioden op i tre dele. Indexet anvendes til at omregne priser. En vare der I 1985 (index: 3507) kostede 75 kr. Kan omregnes til en 2010 (index: 6432) pris. Turbulens 1900-1945 75 kr. 3507 6432 = 173,55 kr. I perioden 1900-1950 er den gennemsnitlige vækst i indexet 2,8%, hvilket er lavere end gennemsnittet for perioden 1900-2010. Men der er meget store udsving i indexet, derfor navnet turbulens. Figur 13. Historisk kan man så spørge: 1. I perioden 1900-1914 er der en meget lille vækst i indexet, hvad kendetegner denne periode historisk set? 2. Hvad skete der i 1914, siden at indexet pludseligt vokser kraftigt? 6.000 4.000 2.000 1900 30 70 2000 Årstal Figur 12: Forbrugerprisindex (1900=100) 1900-2010 300 200 100 1900 14 20 32 39 45 År efter 1900 Figur 13: Forbrugerprisindex (1900=100) 1900-1945 3. I perioden 1914-1920 er der en kraftig vækst i indexet, hvad kendetegner denne periode historisk set? 4. Hvad skete der i 1920, siden at indexet pludseligt falder? 5. I perioden 1920-1922 falder indexet, hvilket historisk er meget atypisk, hvad kendetegner denne periode historisk set? 6. Hvad skete der i 1922, siden at indexet igen begynder at vokse?

26 7. I periode 1922-1932, falder indexet, hvilket er den længste periode indexet er faldet i den tid indexet er beregnet, hvad kendetegner denne periode historisk set? 8. I 1932 begynder indexet at vokse langsomt, hvad skete der siden indexet begynder at vokse igen efter 10 år med fald. 9. I perioden 1932-1939 vokser indexet langsomt, hvad kendetegner denne periode historisk set? 10. I perioden 1939-1941 vokser indexet kraftigt, hvad starter og stopper denne vækst så hurtigt? 11. I perioden 1941-1945 vokser indexet langsomt, hvad kendetegner denne periode historisk set? Stabilitet 1945-1980 I perioden 1945-1980 er der en meget god overensstemmelse mellem modellen for væksten i indexet og indexet selv. Der er ikke de store udsving i indexet når der tages højde for en stabil vækst, der dog kan deles op i tre perioder, med hver deres vækst i indexet. Figur 14 Perioden 1945-1980 er meget stabil sammenlignet med perioden 1900-1945. Der ikke spring i væksten i indexet som der var i den tidligere periode. Kan denne konklusion også forsvares historisk? Der er tre vækstrater i perioden, 3,5 % i perioden 1945-1960 (den grønne linie), 5,9 % i perioden 1960-1973 (den blå linie) og 11,0 % i perioden 1973-1980 (den lilla linie). Hvad er den samfundsfaglige/historiske forklaring på denne opdeling af perioden? Stagnation 1980-2010 I perioden 1980-2010 kan indexet ikke længere tilnærmes med en eksponentiel model. Der er stadigvæk en stabil vækst, men i denne periode er den linier. I perioden 1980-1989 er væksten 184 indexpoint pr. år. I 1980 svare det til en vækst på 7,3 % og i 1989 til en vækst på 4,2 %. Hvad kendetegner denne periode? Hvad sker der i 1989? I perioden 1989-2010 er væksten 108 indexpoint pr. år. I 1990 svare det til en vækst på 2,7 % og i 2010 til en vækst på 1,7 %. Den periode som bedst kan sammenligens med perioden 1989-2010 er perioden 1900-1911, som ligeledes var linieær med en vækst på 0,87 % i år 1911. 2.000 1.500 1.000 500 1945 60 73 80 Årstal Figur 14: Forbrugerprisindex (1900=100) 1945-1980 6.000 5.000 4.000 3.000 1980 90 2000 10 Årstal Figur 15: Forbrugerprisindex (1900=100) 1980-2010

Det skrå skatteloft Indkomst beskattes i Danmark progressivt, det betyder at jo mere en person tjener jo mere betales i skat forholdsmæssig. Dette kaldes også for det skrå skatteloft. Der er to spring i beskatningsprocenten afhængigt af indkomst, ved 42.900 kr. (bundskat) og ved 389.900 kr. (topskat). Konkret ses her på indkomstbeskatning ved at se hvor stor en andel af indkomsten personer med forskellige indkomst betaler. Grafen giver et bedre billede af indkomsbeskatning i Danmark. Figur 16. Et eksempel på skatteberegning kan ses i tabel 18, beregning er lavet ud fra [3] hvor procentsatser og fradrag er reguleret til 2011. 45 40 35 30 25 20 15 10 5 % 1.000 kr 200 400 600 800 1.000 Figur 16: Andelen af lønindkomsten der betales i skat. Indkomst Antal familier Gennemsnits indkomst Under 200.000 kr. 678.073 131.126 200.000-299.999 kr. 517.019 247.954 300.000-399.999 kr. 391.380 346.965 400.000-499.999 kr. 259.015 446.925 500.000-599.999 kr. 219.313 550.081 600.000 kr. og derover 711.591 903.496 Tabel 16: Bruttoindkomst for familier [5, år 2009] Indkomst Antal familier Gennemsnits indkomst Under 200.000 kr. 1.080.875 121.326 200.000-299.999 kr. 608.044 244.707 300.000-399.999 kr. 376.802 348.438 400.000-499.999 kr. 325.032 447.944 500.000-599.999 kr. 205.680 544.329 600.000 kr. og derover 179.958 825.238 Tabel 17: Disponipel indkomst for familier [4, år 2009] Der er derfor en forskel i den indkomst, en familie har og de penge, de selv kan disponere over. Opgave 21 - Beregn Gini koefficienten udfra bruttoindkomst (Tabel 16) og disponipel indkomst (Tabel 17). Vurdér, hvordan og hvorvidt skatter og afgifter kan bruges som redskab til at øge ligheden.

28 INDKOMSTOPGØRELSE: (1) Lønindkomst 450.000 (2) Arbejdsmarkedsbidrag (8,0 % af lønindkomsten)ă 36.000 (3) Personlig indkomst (1)-(2) 414.000 (4) Kapitalindkomst (indtægter - udgifter) 0 (5) Ligningsmæssige fradrag (eks. A-kasse) 0 (6) Beskæftigelsesfradrag (4,25% af (1) maks. 13.600 kr.) 13.600 (7) Skattepligtig indkomst (3)+(4)-(5)-(6) 400.400 SKATTEBEREGNING: Skat til kommune og kirke: (8) Skattepligtig indkomst 400.400 (9) Personfradrag 42.900 (11) 25,0 pct. af (8)-(9) = 357.500 89.375 Sundhedsbidrag til staten: (12) 8,0 pct. af (8)-(9) = 357.500 28.600 Bundskat til staten: (3) Personlig indkomst (+ evt. positiv (4)) 414.000 (9) Personfradrag 42.900 (13) 3,64 pct. af (3)-(9) = 371.100 13.508 Topskat til staten: (3) Personlig indkomst (+ evt. positiv (4)) 414.000 (10) Bundfradrag i topskat 389.900 (14) 15,0 pct. af (3)-(10) = 24.100 3.615 (15) Indkomstskat (11)+(12)+(13)+(14) 135.098 (2) Arbejdsmarkedsbidrag 36.000 I alt indkomstskat og arbejdsmarkedsbidrag 171.098 Andel af lønindkomst som betales i skat 171.098 450.000 100% 38,0% Kr. Tabel 18: Principperne for skatteberegningen i 2011

29 Opgave 22 - Anvend beregningsmodellen i tabel 18 samt definitionen af fattigdom på 50% af medianindkomsten til at varierer en eller flere af parameterne: Personfradrag, bundfradrag i topskat, kommuneskat, sundhedsbidrag og arbejdsmarkedsbidrag, således at den øgende indkomst via skatter kan omfordeles således, at der efter omfordelig ikke er fattige i samfundet. Brug et lille modelsamfund med f.eks. 20 indkomster, gerne fordelt lidt realistisk. Besvarelsen af opgaven giver mange gode diskussioner og kan evt. bruges til at se hvilke konsekvenser forskellige politiske partieres visioner kunne realiseres.

Svar på opgaver Opgave 1. For par Indkomst Hyppighed Frekvens Under 200.000 kr. 37.264 2,8% 200.000-299.999 kr. 151.005 11,4% 300.000-399.999 kr. 148.708 11,2% 400.000-499.999 kr. 158.789 12,0% 500.000-599.999 kr. 203.937 15,4% 600.000 kr. og derover 624.154 47,1% I alt 1.323.857 100,0 % For enlige Indkomst Hyppighed Frekvens Under 200.000 kr. 661.608 46,7% 200.000-299.999 kr. 365.176 25,8% 300.000-399.999 kr. 229.506 16,2% 400.000-499.999 kr. 89.332 6,3% 500.000-599.999 kr. 33.904 2,4% 600.000 kr. og derover 38.115 2,7% I alt 1.417.641 100,0% Opgave 3. For par er den samlede gennemsnitlige indkomst 646.334 kr. og for enlige er den samlede gennemsnitlige indkomst 253.520 kr. Opgave 4. For par Indkomst Summeret frekvens Under 200.000 kr. 2,8% 200.000-299.999 kr. 14,2% 300.000-399.999 kr. 25,5% 400.000-499.999 kr. 37,4% 500.000-599.999 kr. 52,9% 600.000 kr. og derover 100,0% For enlige Indkomst Summeret frekvens Under 200.000 kr. 46,7% 200.000-299.999 kr. 72,4% 300.000-399.999 kr. 88,6% 400.000-499.999 kr. 94,9% 500.000-599.999 kr. 97,3% 600.000 kr. og derover 100,0% Opgave 5. 74,5 % af parene har en indkomst over 400.000 kr. og 11,4 % af de enlige har en indkomst over 400.000 kr.

32 Opgave 18. Parti Hyppighed Frekvens A. Socialdemokratiet 7608 23,0% B. Radikale Venstre 24090 7,3% C. Det Konservative Folkeparti 12677 3,8% F. Socialistisk Folkeparti 26819 8,1% I. Liberal Alliance 16061 4,9% K. Kristendemokraterne 9664 2,9% O. Dansk Folkeparti 40378 12,2% V. Venstre 113443 34,3% Ø. Enhedslisten 11505 3,5% I alt 330845 100,0%

Litteratur [1] DTU. 27025 molekylær mikrobiologi, vinter 2011. http://karakterer.dtu.dk/histogram/1/27025/winter-2011, 2011. [2] Camilla Faurholdt-Löfvall og Maj Susanne Junker. Her er danmarks nye fattigdomsgrænse: 103.200 kr. dr.dk, http://www.dr.dk/nyheder/indland/2013/06/07/093351.htm, 7.6.2013. [3] Skatteministeriet. Skatten i danmark 2008. http://www.skm.dk/publikationer/udgivelser/skattenidanmark2008/, 2008. ISBN: 978-87-90922-84-9. [4] Danmarks Statistik. Disponibel familieindkomst efter område, enhed, familietype og indkomstinterval. http://www.statistikbanken.dk/indkf31, 2009. [5] Danmarks Statistik. Familiernes indkomst i alt efter område, enhed, ejer/lejer af bolig, familietype og indkomstinterval. http://www.statistikbanken.dk/indkf2, 2009. [6] Danmarks Statistik. Familiernes indkomst i alt efter kommune, enhed, familietype og indkomstinterval. http://www.statistikbanken.dk/indkf22, 2012. [7] Danmarks Statistik. Folketingsvalget 2011 efter tid, valgresultat og område. http://www.statistikbanken.dk/fv11tot, 2012. [8] Danmarks Statistik. Forbrugerprisindeks, årsgennemsnit (1900=100). http://www.statistikbanken.dk/pris8, 2012. [9] Per Thiemann. Øget ligestilling skaber mere ulighed. politikken.dk, http://politiken.dk/indland/ece1992548/oeget-ligestillingskaber-mere-ulighed/, 10.6.2013.