Praktisk Statistik til Mikroøkonomi og Makroøkonomi

Størrelse: px
Starte visningen fra side:

Download "Praktisk Statistik til Mikroøkonomi og Makroøkonomi"

Transkript

1 Praktisk Statistik til Mikroøkonomi og Makroøkonomi Til brug sammen med Mikroøkonomi Teori og beskrivelse og Makroøkonomi Teori og beskrivelse LIMEDESIGN

2 Praktisk statistik Formålet med dette appendiks er at præsentere centrale redskaber i den praktiske statistik, dvs. redskaber til at illustrere centrale egenskaber ved et datamateriale. Afsnittet behandler forskellige metoder til beregning og vurdering af niveaumål og spredningsmål. Niveaumålene har til formål at præsentere gennemsnit eller midterværdier i et datamateriale. Spredningsmålene søger at opstille tal for spredningen eller ensartetheden i et talmateriale. Endvidere præsenteres metoder til beskrivelse af vækst og udvikling. Særlig fokus rettes mod konstruktionen af prisindeks. Underves gives veleding i tabelmæssig og grafisk præsentation af datamaterialer. I fremstillingen benyttes næsten udelukkende kvantitative datamaterialer, dvs. datamaterialer, hvor data kan angives ved tal og hvor regneoperationer meningsfuldt kan anvendes. Mange af de viste metoder lader sig i praksis nemmest gennemføre ved brug af lommeregner eller regnearksprogrammer. Det falder dog uden for denne fremstillings rammer at give egentlig instruktion i lommeregneranvendelse og anvendelse af regneark. Niveaumål Middeltal for observationssæt Statistik beskæftiger sig med systematisk indsamling og bearbedning af datamaterialer. De registrerede data kaldes observationer og en samling af sammenhørende observationer kaldes et observationssæt. Et eksempel kunne være de karakterer, som 16 studerende opnåede ved en eksamen: Beregningen af deltagernes karaktergennemsnit sker ved at dividere summen af karaktererne med antallet af deltagerne: ( 3) ,5 Et gennemsnit beregnet på denne måde kaldes også et aritmetisk gennemsnit eller et middeltal: Gennemsnittet eller middeltallet ( x) for et observationssæt beregnes ved at dividere summen af observationsværdierne (x1 + x + + xn = x i ) med antallet af observationer (n): n i1 x x 1 x... x n n n i1 n x i

3 Praktisk statistik 3 I eksemplet ovenfor er observationsværdierne (x værdierne) altså karakterværdierne (x1 = 00, x = 7,..., xn = x16 = 7), og n er antallet af studerende, dvs. 16. Øvelse 1: Følgende talmateriale viser det antal minutter, som de studerende på et hold havde brugt til forberedelse før en lektion i mikroøkonomi: Beregn det gennemsnitlige antal minutter brugt på forberedelse. Grupperede observationssæt. Fordelinger Ofte vil man møde datamateriale, som er grupperet efter et eller flere kendetegn. Der er derfor behov for metoder til at beregne gennemsnit med udgangspunkt i grupperede observationssæt. Antag fx at vi ønsker at beregne karaktergennemsnit for et meget stort antal deltagere, som er grupperet efter den opnåede karakter. De grupperede observationer fremgår af følgende tabel: Tabel 1 Studerende fordelt efter eksamenskarakter Det samlede karaktergennemsnit beregnes stadig som den samlede karaktersum divideret med det samlede antal deltagere. I tabel er vist karaktersummen i de enkel Observationsværdi nr. i Karakter x i Antal i gruppen (hyppighed) h i I Tabel 1 er observationssættet grupperet således, at vi direkte kan aflæse, hvor hyppigt de enkelte karakterer forekommer. Et sådant observationssæt kaldes også en fordeling 1. En fordeling består af et antal kendetegn (her forskellige karakterer) med tilhørende hyppigheder, der angiver, hvor mange gange i datamaterialet, det pågældende kendetegn forekommer. 1 Man taler her om en empirisk fordeling for at understrege, at fordelingen er baseret på indsamlede oplysninger, dvs. en empirisk undersøgelse.

4 4 Praktisk statistik te karaktergrupper. Eksempelvis har de 44 deltagere, som har opnået karakteren 4, en samlet karaktersum på 4 44 = 176. Tabel Beregning af karaktersum Observationsværdi nr. Karakter x Antal i gruppen (hyppighed) h Karaktersum i gruppen x h I alt Den samlede karaktersum får vi ved at lægge alle tallene i den sidste kolonne sammen: 7 Samlet karaktersum = x h = = Det samlede karaktergennemsnit vil derfor være: 7 x h 1 1 x 7 n 7 x h 1 h ,3 Undertiden vil man med fordel kunne beregne middeltal eller gennemsnit ved at lave fordelingen om til en frekvensfordeling. I eksemplet ovenfor sker det ved at omregne hyppighederne til frekvenser, dvs. andele af det samlede antal deltagere, som opnåede en bestemt karakter. Da der er 44 ud af 18 deltagere, der opnåede karakteren 4, vil frekvensen af 4 taller være: 44 f4 = = 0, Frekvensen af 4 taller er da 0, Det betyder, at godt 0 pct. af deltagerne fik karakteren 4.

5 Praktisk statistik 5 Tabel 3 Hyppighedsfordeling og frekvensfordeling Observationsværdi nr. i Karakter x i Antal i gruppen (hyppighed) h i Andel i gruppen (frekvens) f i Procentandele , , , , , , , , , , , , , ,1 I alt ,00 Med udgangspunkt i frekvensfordelingen kan middeltallet eller gennemsnittet beregnes ved at gange de enkelte karakterværdier med deres frekvens. Således kan 4 tallernes bidrag til gennemsnittet beregnes som 4 0,01835 = 0, Det samlede gennemsnit bliver: 7 x x f = ( 3) 0, , , = 5,3 1 Gennemsnittet eller middeltallet ( x) for en fordeling, der er opdelt i k grupper kan beregnes som: x x 1 h 1 x h n... x k h k k 1 x h n k 1 x h 7 1 h hvor h er hyppigheden for observationsværdi x k er antal forskellige observationsværdier (antal grupper) n er antal observationer i alt. eller som: x = x1 f1 + x f + + xk fk = x hvor f er frekvensen for observationsværdi x k 1 f

6 6 Praktisk statistik Øvelse : I en lille provinsby har en trafikomlægning givet anledning til en del trafikulykker med personskader. I 006 blev der for hver ulykke optalt følgende antal personer med skader: a. Opstil en hensigtsmæssig fordeling, der giver overblik over ulykkernes omfang. b. Udregn fordelingens middeltal. Øvelse 3: I tabellen nedenfor er vist fordelingen af husstandene i en gade efter antal børn. Tabel 4 50 husstande fordelt efter antal børn Antal børn i husstanden Antal husstande a. Beregn frekvensfordelingen ud fra ovenstående tabel. b. Udregn det gennemsnitlige antal børn pr. husstand ud fra frekvensfordelingen. Typetal Betragt følgende tabel, der viser fordelingen af sygedage på et skoleår blandt eleverne i en skoleklasse. Tabel 5 30 elever fordelt efter antal sygedage Antal sygedage i skoleåret Antal elever

7 Praktisk statistik 7 Ud fra tabellen kan vi beregne middeltallet, dvs. det gennemsnitlige antal sygedage til 3,6. I tabellen kan vi se, at der er 5 elever, der har et fravær over gennemsnittet, mens de resterende 5 elever har et fravær under gennemsnittet. Man kan derfor kritisere gennemsnittet for ikke at udtrykke det normale sygefravær i klassen. Årsagen til dette er, at fordelingen er skæv i den forstand, at eleven med 50 sygedage har en meget stor indflydelse på middeltallet. Vil vi have et udtryk for det normale sygefravær, som ikke i så hø grad er præget af enkelte ekstreme observationer, kan vi opgøre typetallet (modus). Typetallet i en fordeling er den (de) observationsværdi(er), der har den største hyppighed eller den største frekvens. I tabellen ovenfor er et sygefravær på 1 dag den oftest forekommende observationsværdi. Derfor er typetallet 1 sygedag. Øvelse 4: Efter sæsonafslutningen har en fodboldklub opgort antallet af advarsler, som hver af deres førsteholdsspillere er blevet tildelt i sæsonens kampe. Resultatet er følgende: a. Opstil en hyppighedsfordeling til beskrivelse af talmaterialet. b. Udregn fordelingens middeltal og typetal. Øvelse 5: Bestem typetallet for talmaterialet i Øvelse 3. Median Et andet mål for det gennemsnitlige niveau i et observationssæt er medianen. Medianen opgøres som den midterste observationsværdi, når observationerne opstilles i størrelsesorden. Det vil sige den værdi, der opdeler talmaterialet i to lige store dele henholdsvis over og under værdien. Betragt fx følgende tal, der viser legemsvægten i kg for 13 drenge på et fodboldhold: Ordnet efter vægt ser talmaterialet sådan ud: Medianen vil her være 56 kg, idet der er 6 drenge, der veer mindre end 56 kg, og 6 drenge, der veer mere end 56 kg. Hvis antallet af observationer i et talmateriale er et lige tal, er der ikke en enkelt observation, som kan siges at være den midterste observation. Her kan medianen findes ved at tage gennemsnittet af de to midterste observationers værdier.

8 8 Praktisk statistik Vender vi tilbage til eksemplet med sygefraværet, er bestemmelsen af medianen ikke helt så enkel. Vi kan ikke her finde et antal sygedage, der opdeler materialet på en måde, så der er lige mange elever med et lavere og med et høere sygefravær. For at finde en entydig metode til bestemmelse af medianen, ser vi på frekvensfordelingen: Tabel 6 30 elever fordelt efter antal sygedage Antal sygedage i skoleåret Antal elever Frekvens Summeret frekvens Summeret procentandel 0 3 0, 0, 10, ,300 0,400 40,0 8 0,67 0,667 66, ,167 0,833 83,3 4 0,067 0,900 90,0 5 0,067 0,967 96, ,033 1,000,0 I alt I tabel 6 er frekvensfordelingen beregnet ved at dividere antallet af elever i hver gruppe med 30. I tabellens sidste kolonne er vist den summerede frekvens (kumulerede frekvens). Den summerede frekvens fås ved at lægge frekvenserne sammen: Den summerede frekvens for 1 sygedag er 0, + 0,300 = 0,400 og det betyder at 40 pct. af eleverne havde 0 eller 1 sygedag. Den summerede frekvens for sygedage er 0, + 0, ,67 = 0, ,7 pct. af eleverne havde altså eller færre sygedage. Medianen er et udtryk for den midterste observation, når observationerne opstilles i størrelsesorden. Medianen i ovenstående fordeling er derfor sygedage. Vi kan aflæse medianen i kolonnen med de summerede frekvenser ved at finde den observationsværdi x, hvor den summerede frekvens første gang når op på eller overstiger 0,5. Medianen bestemmes som den mindste observationsværdi, der har en summeret frekvens på mindst 0,5. Øvelse 6: Bestem median og typetal for talmaterialet i Øvelse. Øvelse 7: Bestem medianen for talmaterialet i Øvelse 3. Øvelse 8: Bestem medianen for talmaterialet i Øvelse 4.

9 Praktisk statistik 9 Intervalgrupperede fordelinger I mange talmaterialer er antallet af forskellige observationsværdier meget stort. Indsamles eksempelvis oplysninger om befolkningens skattepligtige indkomster, vil man få flere hundredetusinde forskellige observationsværdier. Skal et sådant talmateriale præsenteres overskueligt, er der behov for en gruppering af observationsværdierne i intervaller. Fastlæggelsen af, hvilke intervaller, som er hensigtsmæssige, må bero på en vurdering af det konkrete talmateriale. Generelt må intervallerne opfylde følgende krav: Intervallerne er entydigt afgrænsede. Der må ikke herske tvivl om, i hvilket interval en observationsværdi skal placeres. Intervallerne dækker hele talmaterialet. Det skal være muligt at placere en hvilken som helst tænkelig observationsværdi i et af intervallerne. Et overskueligt antal intervaller. Overskueligheden kan nemt forsvinde, hvis man vælger for mange intervaller. Omvendt må man have et tilstrækkeligt antal intervaller til at fordelingens struktur tydeligt fremgår. Som en praktisk tommelfingerregel kan anbefales, at man stræber mod et antal intervaller på mellem 5 og 15. Følgende er et eksempel på en konkret intervalgrupperet fordeling. Tabel 7 Fordeling af medarbedere efter ugentligt antal overtimer Interval nr. Antal ugentlige overtimer (interval) x -1 ;x Antal personer i intervallet (hyppighed) h Intervalmidtpunkt x 1 x m Samlet overtimetal i intervallet m h 1 0;,5 31 1,5 38,75,5;5,0 48 3,75 180,00 3 5,0;7,5 6 6,5 16,50 4 7,5;10,0 14 8,75 1, ,0;1,5 8 11,5 90,00 6 1,5;15,0 13,75 7, ,0;17,5 1 16,5 16,5 I tabellens anden kolonne er intervallerne specificeret. I første interval placeres medarbedere med et ugentligt overtimetal på,5 timer eller lavere. I andet interval placeres medarbedere med et overtimetal, som er større end,5, men ikke over 5,0, osv. Bemærk at den entydige intervalinddeling er sikret ved at lade intervallerne være åbne ved den nedre grænse og lukkede ved den øvre grænse. At et interval er åbent ved nedre grænse betyder, at den nedre grænse ikke er med. Det symboliseres med en intervalklamme, hvis grene vender væk fra tallet. At et interval er lukket ved øvre grænse betyder, at den øvre grænse er med. Det symboliseres med en intervalklamme, hvis grene vender hen mod tallet.

10 10 Praktisk statistik Trede kolonne i tabel 7 viser hyppighederne i de enkelte intervaller. Fx ses, at der er 48 medarbedere, der har et ugentligt overtimetal, som er høere end,5, men ikke over 5,0. Beregningen af middeltallet dvs. det gennemsnitlige overtimetal for virksomhedens medarbedere foregår efter samme metode som tidligere. Det vil sige ved at opgøre det samlede antal overtimer og dividere med antallet af medarbedere i virksomheden. Vi støder dog her på det problem, at vi ikke kender medarbedernes præcise overtimetal. Vi ved, hvor mange der er placeret i de forskellige intervaller, men vi ved ikke, hvor i intervallet de er placeret. Hvis det kan antages og det vil ofte være tilfældet at de enkelte medarbederes timetal er ævnt fordelt over intervallet, kan problemet klares på følgende måde. Det gennemsnitlige overtimetal inden for hvert interval vil da være intervalmidtpunktet. I beregningerne kan vi lade som om, at alle personer i de enkelte intervaller har et overtimetal svarende til intervalmidtpunktet. I tabellens sidste kolonne er vist det samlede overtimetal i hvert interval beregnet som intervalmidtpunktet (m) ganget med antal personer i det pågældende interval (h). Virksomhedens samlede overtimetal får vi da ved at summere alle tallene i denne kolonne: 7 Samlet overtimetal = m h = 38, , , ,5 = 637,50 1 Det samlede antal medarbedere finder vi i tabellens trede kolonne ved at lægge antallet af personer i de enkelte intervaller sammen: Samlet antal medarbedere = n = h = = 130 Det samlede overtimegennemsnit vil derfor være m h 1 1 x 7 n 7 m h 1 h 637, ,9 Som tilfældet var med de ikke intervalgrupperede fordelinger, kan middeltallet også beregnes ud fra frekvensfordelingen. Frekvensen for de enkelte intervaller findes ved at dividere intervallets hyppighed (antal medarbedere i det pågældende interval) med det samlede antal observationer (det samlede antal medarbedere). Frekvenser og summerede frekvenser er vist i tabel 8.

11 Praktisk statistik 11 Tabel 8 Intervalgrupperet frekvensfordeling Antal ugentlige overtimer (interval) x -1 ;x Antal personer i intervallet (hyppighed) h Intervalmidtpunkt x 1 x m Intervalfrekvens f Summeret frekvens F 0;,5 31 1,5 0,385 0,385,5;5,0 48 3,75 0,369 0,6077 5,0;7,5 6 6,5 0,000 0,8077 7,5;10,0 14 8,75 0,1077 0, ,0;1,5 8 11,5 0,0615 0,9770 1,5;15,0 13,75 0,0154 0,993 15,0;17,5 1 16,5 0,0077 1,0000 Herefter kan gennemsnittet beregnes ved at gange de enkelte intervalmidtpunkter med deres frekvens. Således er første intervals bidrag til gennemsnittet 1,5 0,385 = 0,981. Gennemsnittet eller middeltallet bliver: 7 x m f = 1,5 0, ,75 0, ,5 0,0077 = 4,9 1 Gennemsnittet eller middeltallet ( x) for en intervalgrupperet fordeling kan beregnes som: x m 1 h 1 m h n... m k h k k 1 m h n k 1 m h 7 1 h hvor h er hyppigheden for interval nr. k er antal intervaller n er antal observationer i alt eller som: x = m1 f1 + m f + + mk fk = m k 1 f, hvor x 1 er inter hvor f er frekvensen for interval nr. x 1 x m er intervalmidtpunktet i interval nr.. m = vallets nedre grænse og x intervallets øvre grænse.

12 1 Praktisk statistik Øvelse 9: En beboerforening har i forbindelse med overveelser om igangsætning af fritidsaktiviteter for børn indsamlet oplysninger om aldersfordelingen for de børn, der bor i foreningens område. Resultatet er følgende tabel: Tabel 9 Fordeling af børn efter alder Alder Antal børn 0-3 år år år år 5 Beregn middeltallet, dvs. den gennemsnitlige alder for børnene i området. Overve nøe, hvordan intervalmidtpunkterne bør fastlægges. Øvelse 10: I Statistisk Tiårsoversigt 006 findes følgende fordeling af de personer, som i løbet af 005 blev registreret som ledige. De ledige er fordelt efter ledighedsperiodens varighed. Tabel 10 Fordeling af ledige efter ledighedsperiodens varighed Ledighedsperiodens varighed Antal tusinde personer Under 74 dage dage dage dage dage og derover 38 Opstil frekvensfordelingen og beregn herudfra middeltallet. Forklar, hvad middeltallet udtrykker. Øvelse 11: Ved en undersøgelse af størrelsesfordelingen af 48 medlemsvirksomheder i en brancheforening indsamles følgende oplysninger om antal beskæftigede i de 48 virksomheder: a. Foretag en hensigtsmæssig intervalgruppering af observationerne. b. Beregn middeltallet ud fra intervalgrupperingen. c. Beregn middeltallet direkte ud fra grundmaterialet. d. Forklar forskellen mellem resultaterne i b. og c.

13 Praktisk statistik 13 I stedet for typetallet (modus) for en intervalgrupperet fordeling bestemmes typeintervallet, dvs. det interval, hvor der er flest observationer. I ovenstående fordeling af antal overtimer vil typeintervallet således være,5 ; 5,0. Det betyder, at det er mest almindeligt, at det ugentlige antal overtimer ligger mellem,5 og 5,0. Typeintervallet i en intervalgrupperet fordeling med lige store intervaller er den (de) observationsinterval(ler), der har den største hyppighed eller den største frekvens. Øvelse 1: Bestem typeintervallerne i Øvelse 9 og Øvelse 10. Medianen for en intervalgrupperet fordeling er ligesom i en ugrupperet fordeling den observationsværdi, der opdeler talmaterialet i to lige store dele henholdsvis over og under værdien. Vi har tidligere brugt den summerede frekvens som et redskab til at finde medianen, nemlig som den mindste observationsværdi, der har en summeret frekvens på mindst 0,5. Forsøger vi at bruge denne metode på fordelingen af medarbedere efter ugentligt overtimetal i tabel 8, kan vi se, at medianen må befinde sig i intervallet fra,5 til 5,0 overtimer. Hvis vi vil bestemme medianen mere præcist, kan vi bruge vores forudsætning om, at observationerne er ævnt fordelt i de enkelte intervaller. I tabel 8 kan vi se, at den summerede frekvens stiger fra 0,385 til 0,6077, når intervallet fra,5 til 5,0 gennemløbes. Er observationerne ævnt fordelt, vil frekvensen 0,5 opnås, når en 0,5 0,385 andel på er gennemløbet. Derfor kan medianen bestemmes som: 0,6077 0,385,5 + 0,5 0,385 (5,0,5) = 4,7. 0,6077 0,385 Medianen bestemmes som den mindste observationsværdi, der har en summeret frekvens på mindst 0,5. I en intervalgrupperet fordeling findes medianen ved først at identificere det interval, hvor den summerede frekvens passerer 0,5. Kaldes den summerede frekvens ved intervallets start for FSTART og den summerede frekvens ved intervallets afslutning for FSLUT kan medianen bestemmes som: Median = Nedre intervalgrænse + 0,5 F F SLUT F START START Intervalbredden Øvelse 13: Bestem medianen i Øvelse 9 og Øvelse 10.

14 14 Praktisk statistik Grafisk afbildning af fordelinger Ofte kan det være en god ide at illustrere en fordeling i et diagram. Almindeligvis anvendes et sølediagram, hvor sølernes høde markerer hyppigheden (eller eventuelt frekvensen) for hver observationsværdi eller observationsinterval. I figur 1 er fordelingen fra tabel 1 taget som eksempel. Figur 1 Fordeling af studerende efter eksamenskarakter Antal studerende Karakter Kilde: Tabel 1 Figur viser et eksempel på sølediagram for en intervalgrupperet fordeling med udgangspunkt i fordelingen fra tabel 7. Figur Fordeling af medarbedere efter ugentligt antal overtimer 60 Antal medarbedere Kilde: Tabel 7 0 -,5,5-5,0 5,0-7,5 7, ,5 1,5-15,0 15,0-17,5 Antal overtimer pr. uge

15 Praktisk statistik 15 Hvis det specielt har interesse at præsentere den relative eller procentvise fordeling af observationsværdier, kan et cirkeldiagram som vist i figur 3 være at foretrække. Figur 3 Fordeling af medarbedere efter ugentligt antal overtimer 17% 10% % 1% Antal overtimer pr. uge 0 -,5 38% 5,0-7,5 7, ,5 1,5-15,0 15,0-17,5 3% Kilde: Tabel 7 Spredningsmål Meget ofte er det relevant at beregne tal, der siger noget om spredningen eller variationen af observationsværdierne i et talmateriale. Som for niveaumålene er der flere forskellige mulige angrebsvinkler, når man skal beregne spredningstal. Det mest simple udtryk for spredningen i et talmateriale er at finde den mindste og den største observationsværdi. I starten af dette appendiks så vi på de karakterer, som 16 studerende opnåede ved en eksamen: I dette talmateriale er 00 den mindste observationsværdi og 1 den høeste talværdi. Forskellen mellem største og mindste observationsværdi i et talmateriale kaldes variationsbredden. I vores talmateriale er variationsbredden 1 00 = 1. Variationsbredden i et talmateriale er udtryk for den maksimale spredning i et talmateriale. Variationsbredde = Største observationsværdi mindste observationsværdi Problemet med variationsbredden er, at beregningen udelukkende baseres på de to mest ekstreme observationsværdier i et talmateriale. Variationsbredden siger derfor ikke nødvendigvis noget om den almindelige spredning i talmaterialet.

16 16 Praktisk statistik Et andet spredningsmål, hvor alle observationsværdier inddrages i beregningen er standardafvigelsen (s), som er et skøn over observationsværdiernes gennemsnitlige afvigelse fra middeltallet. Beregningen sker ved hælp af formlen n (x i x) i1 s = n 1 Størrelsen under kvadratrodstegnet kaldes variansen (s ) og er et skøn over gennemsnittet af observationernes kvadrerede afvigelser fra middeltallet. Lad os bruge talmaterialet med eksamenskaraktererne som eksempel på beregningen af varians og standardafvigelse. Tidligere har vi beregnet middeltallet i talmaterialet til 4,5. Først vises beregningen af variansen: (00 4,5) (7 4,5) (1 4,5)... (7 4,5) 4 s = 16, Variansen kan ikke give nogen praktisk fortolkning. Variansberegningens rolle i beregningen er at kvadrere alle afvigelser fra middeltallet, så afvigelserne får samme fortegn. Ellers ville positive og negative afvigelser fra middeltallet udligne hinanden. Herefter beregnes standardafvigelsen ved at tage kvadratroden af variansen: s = s =, = 4,017 Den gennemsnitlige afvigelse fra middelkarakteren på 4,5 er derfor ca. 4 karakterpoint. Standardafvigelsen (s) for et observationssæt beregnes som observationsværdiernes gennemsnitlige afvigelse fra middeltallet: s = (x 1 x) (x x)... (x n 1 n x) = n i1 (x i x) n 1 n er antal observationer For grupperede fordelinger sker beregningen ved hælp af de enkelte observationsgruppers eller observationsintervallers hyppigheder:

17 Praktisk statistik 17 Standardafvigelsen (s) for en grupperet fordeling beregnes som observationsværdiernes gennemsnitlige afvigelse fra middeltallet: s = ( x1 x) h1 (x x) h... (x k x) h k n 1 = k 1 (x x) n 1 h n er samlet antal observationer k er antal forskellige observationsværdier (antal grupper) I en intervalgrupperet fordeling bruges intervalmidtpunkterne m i stedet for x. Beregningen af standardafvigelse for en grupperet fordeling kan illustreres med fordelingen af overtimer i tabel 7. Middeltallet for det ugentlige antal overtimer er tidligere beregnet til 4,9. Tabel 11 Fordeling af medarbedere efter ugentligt antal overtimer Interval nr. Intervalmidtpunkt m Antal personer h Afvigelse fra middeltal m - x Kvadrat på afvigelse (m - x) Produkt (m - x) h 1 1,5 31-3,65 13,35 41,9975 3, ,15 1,35 63, ,5 6 1,35 1,85 47, , ,85 14,85 07, ,5 8 6,35 40,35 3, ,75 8,85 78,35 156, ,5 1 11,35 18,85 18,85 Sum n = ,450 Variansen er derfor s = 1339, = 10,383 og standardafvigelsen er s = s =, = 3, Vores beregninger af middeltal og standardafvigelse viser, at de 130 medarbedere i gennemsnit havde 4,9 arbedstimer pr. uge, og at medarbederne i gennemsnit afveg 3, timer fra dette gennemsnit. Øvelse 14: Bestem standardafvigelsen i Øvelse 9. Øvelse 15: Bestem standardafvigelsen i Øvelse 10.

18 18 Praktisk statistik I nogle tilfælde vil beregningen af standardafvigelsen føre til misvisende resultater. Det kan ske, når et talmateriale indeholder en eller flere meget afvigende observationer. Hvis vi beregner standardafvigelsen på talmaterialet i tabel 5 (s. 94) får vi et resultat på 8,9, hvilket ikke giver meget mening. I sådanne tilfælde kan vi opnå en bedre beskrivelse af fordelingens spredning ved at beregne det såkaldte kvartilsæt. Kvartilsættet består af tre tal, der inddeler et sorteret talmateriale i fire lige store dele. Kvartilsættets tre tal kaldes henholdsvis Første kvartil, Anden kvartil og Trede kvartil. Første kvartil (nedre kvartil) er den observationsværdi, hvor en ferdedel af talmaterialets værdier er lavere. Anden kvartil er den observationsværdi, hvor to ferdedele eller halvdelen af talmaterialets værdier er lavere. Anden kvartil bliver hermed det samme som medianen. Endelig er trede kvartil eller øvre kvartil den observationsværdi, hvor tre ferdedele af materialet er lavere og en ferdedel er høere. Forskellen mellem øvre kvartil og nedre kvartil kaldes kvartilafstanden (eller interkvartilbredden). Kvartilafstanden udtrykker det område, hvor den midterste halvdel af observationerne befinder sig. Nedre og øvre kvartil kan defineres ved hælp af de summerede frekvenser: Nedre kvartil (Første kvartil) bestemmes som den mindste observationsværdi, der har en summeret frekvens på mindst 0,5. I en intervalgrupperet fordeling findes medianen ved først at identificere det interval, hvor den summerede frekvens passerer 0,5. Kaldes den summerede frekvens ved intervallets start for FSTART og den summerede frekvens ved intervallets afslutning for FSLUT, kan den nedre kvartil bestemmes som: Nedre kvartil = Nedre intervalgrænse + 0,5 F F SLUT F START START Intervalbredden Øvre kvartil (Trede kvartil) bestemmes som den mindste observationsværdi, der har en summeret frekvens på mindst 0,75. I en intervalgrupperet fordeling findes medianen ved først at identificere det interval, hvor den summerede frekvens passerer 0,75. Kaldes den summerede frekvens ved intervallets start for FSTART og den summerede frekvens ved intervallets afslutning for FSLUT, kan den øvre kvartil bestemmes som: 0,75 FSTART Øvre kvartil = Nedre intervalgrænse + Intervalbredden F F SLUT START Forsøger vi at bruge denne metode på fordelingen af medarbedere efter ugentligt overtimetal i tabel 8, kan vi se, at nedre kvartil må befinde sig i intervallet fra,5 til 5,0 overtimer. Derfor kan nedre kvartil bestemmes som:,5 + 0,5 0,385 (5,0,5) =,58. 0,6077 0,385

19 Praktisk statistik 19 Øvre kvartil befinder sig derimod i intervallet fra 5,0 til 7,5 overtimer og kan bestemmes til 5,0 + 0,75 0,6077 (7,5 5,0) = 6,78 0,8077 0,6077 Med baggrund i disse beregninger kan vi skønne, at de midterste 50 pct. af observationerne har en værdi mellem,58 og 6,78. Kvartilafstanden kan beregnes til: Øvre kvartil Nedre kvartil = 6,78,58 = 4,0. Kvartilafstand = Øvre kvartil Nedre kvartil Øvelse 16: Bestem kvartilafstanden i Øvelse 9. Kvartilerne findes ved at inddele et ordnet talmateriale i fire lige store dele En finere inddeling kan opnås ved at inddele i fem lige store dele (kvintiler) eller i ti lige store andele (deciler). Kvintiler og deciler bruges af Danmarks Statistik blandt andet i opgørelser af indkomstfordelinger. Grafisk illustration af spredningen. Lorenz kurven I mange tilfælde kan det være en god ide at vise spredningen i et talmateriale ved en grafisk illustration. Tabel 1 Fordeling af familieindkomster før skat. Danmark 004 Indkomstinterval (0 kr. pr. år) Procentandel af familier i intervallet Procentandel af indkomst i intervallet Summeret procentandel af familier Summeret procentandel af indkomst 0 11,4 10 1,6 10 1,6 11,4 148,9 10 3,6 0 5, 148,9 183,7 10 4,5 30 9,7 183,7 9,6 10 5, ,3 9,6 84, ,3 84,0 351,3 10 8, ,9 351,3 453, , ,8 453,0 558, , ,6 558,1 696, ,9 90 7,5 Mere end 696,3 10 7,5,0 I alt,0 - - Kilde. Indkomster 004. Danmarks Statistik 006.

20 0 Praktisk statistik I tabel 1 er vist en intervalgrupperet fordeling af danske familiers indkomster i 004. Familierne er sorteret efter indkomstens størrelse og herefter inddelt i ti lige store grupper, dvs. i deciler. Tabellen skal læses på den måde, at i 1. decil, dvs. den tiendedel af familierne med de laveste indkomster, var høeste familieindkomst på kr. i 004. Tilsammen havde familierne i 1. decil en andel på 1,6 pct. af de samlede indkomster. Vi kan også se af tabellens kolonner for de summerede procentandele at de første fem deciler, dvs. den halvdel af familierne med de laveste indkomster, tilsammen havde, 3 pct. af de samlede indkomster. De sidste 77,7 pct. af den samlede indkomst tilfalder derfor den halvdel med de høeste indkomster. Tabellen tyder derfor på en betydelig spredning i fordelingen af familieindkomster. Et grafisk billede af denne skævhed kan opnås ved at tegne tabellens to sidste kolonner som en kurve i et koordinatsystem med de summerede procentandele af familierne (tabellens lysegrønne kolonne) markeret på den vandrette akse og de summerede procentandele af de samlede indkomster (tabellens lyseblå kolonne) markeret på den lodrette akse. Herved fremkommer Lorenz kurven som vist i figur 4. Figur 4 Fordeling af familieindkomster 004. Lorenz-kurve 90 Pct. af samlet familieindkomst Helt ligelig fordeling Lorenz-kurve Pct. af antal familier Kilde: Tabel 1 I figur 4 er udover Lorenz kurven vist diagonallinien, der viser hvordan Lorenzkurven ville forløbe, hvis alle familier havde lige stor indkomst. I så fald ville der være præcis 10 pct. af den samlede indkomst i hver tiendedel af familierne. Den mest ulige fordeling, der kan tænkes, hvis vi ser bort fra muligheden af negativ indkomst vil være, hvis én familie havde al familieindkomsten og alle øvrige familier havde en indkomst på 0. Tegnede man en Lorenz kurve på dette grundlag ville det med en mere detaleret gruppeinddeling end tiendedele give en vinkelret Lorenz

GRUNDLÆGGENDE STATISTIK

GRUNDLÆGGENDE STATISTIK Stephan Skovlund APRIL 2013 GRUNDLÆGGENDE STATISTIK Statistik med fokus på anvendelighed i erhvervslivet Statistik Excel - Dataanalyse Statlearn.com Indholdsfortegnelse FORORD... 6 KAPITEL 1: STATISTIKKENS

Læs mere

Statistik. Erik Vestergaard

Statistik. Erik Vestergaard Statistik Erik Vestergaard 2 Erik Vestergaard www.matematiksider.dk Erik Vestergaard, 2009. Billeder: Forside: istock.com/3pod Side 19: istock.com/cimmerian Side 25: istock.com/mihneasim Desuden egne fotos

Læs mere

Statistik. Erik Vestergaard

Statistik. Erik Vestergaard Statistik Erik Vestergaard 2 Erik Vestergaard www.matematiksider.dk Erik Vestergaard www.matematiksider.dk 3 1. Grupperede observationer I statistik beskæftiger man sig med indsamling, bearbejdelse og

Læs mere

INTRODUKTION TIL KRITISK STATISTIK. på 1. semester i Metodefaget.

INTRODUKTION TIL KRITISK STATISTIK. på 1. semester i Metodefaget. INTRODUKTION TIL KRITISK STATISTIK på 1. semester i Metodefaget. Merete Watt Boolsen 2004 2 INDLEDNING I studieordning 2000 for faget Introducerende metode og videnskabsteori kan man se, at det blandt

Læs mere

Matematik for C niveau

Matematik for C niveau Matematik for C niveau M. Schmidt 2012 1 Indholdsfortegnelse 1. Tal og bogstavregning... 5 De elementære regnings arter og deres rækkefølge... 5 Brøker... 9 Regning med bogstavudtryk... 12 Talsystemet...

Læs mere

INDFLYTTERE I ALMENE BOLIGER

INDFLYTTERE I ALMENE BOLIGER INDFLYTTERE I ALMENE BOLIGER Økonomiske og sociale forhold JØRGEN ANKER/IVAN CHRISTENSEN/MARTIN RASMUSSEN/ TINA SKOVGAARD ROMOSE/TOBIAS BØRNER STAX KØBENHAVN 2003 SOCIALFORSKNINGSINSTITUTTET 03:23 INDHOLD

Læs mere

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp.

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp. Udarbejdet af Thomas Jensen og Morten Overgård Nielsen Indhold Introduktion til materialet. s. 2 Introduktion til chi i anden test. s. 4 Et eksempel hastighed og ulykker på motorveje s. 8 Sådan udregnes

Læs mere

Borgernes efterlevelse af skattereglerne. Indkomståret 2012

Borgernes efterlevelse af skattereglerne. Indkomståret 2012 Borgernes efterlevelse af skattereglerne Indkomståret 2012 Rapporten er udarbejdet af: Indsats Indsatsplanlægning og -analyse Indsatsanalyse Østbanegade 123 2100 København Ø +45 72 22 18 18 www.skat.dk

Læs mere

FORHØJET TOBAKSAFGIFT

FORHØJET TOBAKSAFGIFT en rapport fra vidensråd for forebyggelse Kristianiagade 12 2100 københavn ø vff@dadl.dk www.vidensraad.dk FORHØJET TOBAKSAFGIFT PÅVIRKNING AF TOBAKS- FORBRUG, GRÆNSEHANDEL SAMT STATENS AFGIFTSPROVENU

Læs mere

Matematik. Grundforløbet. Mike Auerbach (2) Q 1. y 2. y 1 (1) x 1 x 2

Matematik. Grundforløbet. Mike Auerbach (2) Q 1. y 2. y 1 (1) x 1 x 2 Matematik Grundforløbet (2) y 2 Q 1 a y 1 P b x 1 x 2 (1) Mike Auerbach Matematik: Grundforløbet 1. udgave, 2014 Disse noter er skrevet til matematikundervisning i grundforløbet på stx og kan frit anvendes

Læs mere

KAPITEL II INDKOMSTFORDELING

KAPITEL II INDKOMSTFORDELING KAPITEL II INDKOMSTFORDELING II.1 Indledning Kapitlets fokus Ønsket grad af lighed et politisk anliggende Lighed i muligheder eller udfald? Et af velfærdssamfundets formål er at sikre en rimelig fordeling

Læs mere

Virksomheder med udvidet socialt ansvar

Virksomheder med udvidet socialt ansvar September 2013 Virksomheder med udvidet socialt ansvar Rasmus Højbjerg Jacobsen CEBR CENTRE FOR ECONOMIC AND BUSINESS RESEARCH EN DEL AF COPENHAGEN BUSINESS SCHOOL Indholdsfortegnelse Indholdsfortegnelse

Læs mere

Detailomsætningsindekset og dankortomsætningen

Detailomsætningsindekset og dankortomsætningen Detailomsætningsindekset og dankortomsætningen Resumé I dette notat beskrives en række vigtige faktorer, der skal tages i betragtning, når dankortomsætningen sammenlignes med detailomsætningsindekset.

Læs mere

Teknisk note nr. 2. Udviklingen i udbredelsen af frynsegoder blandt danske lønmodtagere 1979-1997. Noten er udarbejdet af Claus Larsen

Teknisk note nr. 2. Udviklingen i udbredelsen af frynsegoder blandt danske lønmodtagere 1979-1997. Noten er udarbejdet af Claus Larsen Teknisk note nr. 2 Udviklingen i udbredelsen af frynsegoder blandt danske lønmodtagere 19791997 Noten er udarbejdet af Claus Larsen Rockwool Fondens Forskningsenhed København 1997 Kort om dette notats

Læs mere

Transport-SMV er Segmentering og performance

Transport-SMV er Segmentering og performance Transport-SMV er Segmentering og performance September 2003 Forord Det danske transporterhverv er kendetegnet ved mange små og mellemstore virksomheder primært inden for vejtransport, men også inden for

Læs mere

Matematik. Undervisningsvejledningen indeholder afsnit om:

Matematik. Undervisningsvejledningen indeholder afsnit om: Undervisningsvejledningen indeholder afsnit om: Fagsyn - hvad er kernen i faget og hvordan bidrager faget til at opfylde avu s formålsparagraf. Didaktiske overvejelser om kriterier for undervisningens

Læs mere

Vejledende rådighedsbeløb en kommunal praksis?

Vejledende rådighedsbeløb en kommunal praksis? Socialudvalget 200809 B 154 Bilag 1 Offentligt Rådet for Socialt Udsatte Vejledende rådighedsbeløb en kommunal praksis? April 2006 Rådet for Socialt Udsatte Vejledende rådighedsbeløb en kommunal praksis?

Læs mere

Lektion 9s Statistik - supplerende eksempler

Lektion 9s Statistik - supplerende eksempler Lektion 9s Statistik - supplerende eksempler Middelværdi for grupperede observationer... Summeret frekvens og sumkurver... Indekstal... Lektion 9s Side 1 Grupperede observationer Hvis man stiller et spørgsmål,

Læs mere

Virksomhedernes efterlevelse af skattereglerne. Indkomståret 2008

Virksomhedernes efterlevelse af skattereglerne. Indkomståret 2008 Virksomhedernes efterlevelse af skattereglerne Indkomståret 2008 Version 1.0 Rapporten er udarbejdet af: Koncerncentret Borger og Virksomhed Indsats og analyse Østbanegade 123 2100 København Ø +45 72 22

Læs mere

BOLIGØKONOMISK VIDENCENTER

BOLIGØKONOMISK VIDENCENTER BOLIGØKONOMISK VIDENCENTER WORKING PAPER DECEMBER 2013 Administration, drift og vedligehold af lejligheder Udgifter til administration, drift og vedligeholdelse af lejligheder Marc Lund Andersen November

Læs mere

Liberaliseringen af bogmarkedet

Liberaliseringen af bogmarkedet En evaluering set med forbrugernes øjne Konkurrence- og Forbrugerstyrelsen November 2013 Indholdsfortegnelse 1 Sammenfatning 3 2 Indledning 4 3 Forbrugergevinsten ved liberaliseringen 5 4 Bøgers tilgængelighed

Læs mere

12. Bevisets stilling

12. Bevisets stilling 12. Bevisets stilling Opgave 4 Hvorfor dur (x,y) = (1,-3) ikke? Det er et spørgsmål, der kan give anledning til forskellige overvejelser. Her beskrives en af dem. Vi har den mindste sum: 13 + 27 = 40,

Læs mere

Ældres hjælperelationer og sociale relationer over ti år

Ældres hjælperelationer og sociale relationer over ti år Eigil Boll Hansen Ældres hjælperelationer og sociale relationer over ti år Udviklingen over tid og med stigende alder fra til Publikationen Ældres hjælperelationer og sociale relationer over ti år Udviklingen

Læs mere

EVALUERING AF MERE FRIT SKOLEVALG (2.0)

EVALUERING AF MERE FRIT SKOLEVALG (2.0) Til Ministeriet for Børn og Undervisning Dokumenttype Rapport Dato November 2011 EVALUERING AF MERE FRIT SKOLEVALG (2.0) EVALUERING AF MERE FRIT SKOLEVALG (2.0) INDHOLD 1. Resumé 1 2. Indledning 4 2.1

Læs mere

KAPITEL II ULIGHED OG OMFORDELING I DANMARK. Dansk Økonomi efterår 2001. II.1 Indledning

KAPITEL II ULIGHED OG OMFORDELING I DANMARK. Dansk Økonomi efterår 2001. II.1 Indledning Dansk Økonomi efterår 2001 KAPITEL II ULIGHED OG OMFORDELING I DANMARK II.1 Indledning Stort fokus på indkomstfordelingen Meget lige indkomstfordeling i Danmark Økonomiske argumenter for og imod lighed

Læs mere

Manual til risikostyring ved anvendelse af den bayesianske netværksmodel. RiBay. Af Svend Rasmussen, 14. marts, 2013

Manual til risikostyring ved anvendelse af den bayesianske netværksmodel. RiBay. Af Svend Rasmussen, 14. marts, 2013 Manual til risikostyring ved anvendelse af den bayesianske netværksmodel RiBay Af Svend Rasmussen, 14. marts, 2013 1. INTRODUKTION Risikostyring beskæftiger sig med to hovedproblemer: 1) Hvordan man i

Læs mere

Lighed gennem uddannelse - hvordan er det gået?

Lighed gennem uddannelse - hvordan er det gået? Lighed gennem uddannelse - hvordan er det gået? Indholdsfortegnelse Side Hovedresultater og perspektiver 2 Afgrænsning 6 Hvem kom i restgruppen 2001? - de enkelte baggrundsfaktorer 8 Udviklingen 1981-2001

Læs mere

Analyse af revisorerklæringer

Analyse af revisorerklæringer Analyse af revisorerklæringer Thomas Riise Johansen, CBS, og Lars Kiertzner, FSR danske revisorer 2 Analyse af revisorerklæringer Forord Der er i dag en rimelig præcis viden omkring omfanget af lovpligtig

Læs mere

Prøver Evaluering Undervisning. Matematik. Maj-juni 2008

Prøver Evaluering Undervisning. Matematik. Maj-juni 2008 Prøver Evaluering Undervisning Matematik Maj-juni 2008 Ved fagkonsulent Klaus Fink Indhold Indledning...3 Fælles for faget...4 Fagets identitet...5 De skriftlige prøver i matematik...8 Den nye karakterskala...8

Læs mere

Brugervejledningens indhold:

Brugervejledningens indhold: Matematik med regneark 25 regneark til Works 4.0 og Excel 97 Vejledning Brugervejledningens indhold: 1. Forord En kort orientering til læreren 2. Installation 3. Vejledning Et kort kursus i brugen af Works

Læs mere