Lektion 9s Statistik - supplerende eksempler Middelværdi for grupperede observationer... Summeret frekvens og sumkurver... Indekstal... Lektion 9s Side 1
Grupperede observationer Hvis man stiller et spørgsmål, hvor der er mange mulige svar, så må man samle svarerne i grupper. Disse grupper kaldes intervaller. Eksempel på opgave På et VUC-hold bliver kursister spurgt om, hvor langt (helt antal km) de har til VUC. Der er 18 kursister. Svarene er: 10, 1, 18, 6, 14, 4, 22, 3, 19, 8, 13, 4, 1, 10, 0, 2 4, 1 Grupper svarene i intervallerne 0-4 km, 5-9 km o.s.v. Lav en tabel over hyppighed og frekvens. Lav et diagram over frekvensfordelingen: Tabellen laves på præcis samme måde som tidligere vist. Først tæller man op, hvor mange der har svaret 0, 1, 2, 3 eller 4 km. Så tæller man op, hvor mange der har svaret 5, 6, 7, 8 eller 9 km. O.s.v. Tabellen ser således ud: Antal km 0-4 5-9 10-14 15-19 20-24 I alt Hyppighed 8 2 5 2 1 18 Frekvens 44% 11% 28% 11% 6% 100% Tabellen her over ser ud, som de typisk vil gøre det i en avis eller på TV. Men i matematik bruger vi en lidt anden måde at skrive intervaller på. Man bruger enten firkantede parenteser eller større end- og mindre end-tegn. Her er nogle eksempler: Lukket interval Åbent interval Halvåbent interval Halvåbent interval [0 ; 5] ] 0 ; 5[ [0 ; 5[ ] 0 ; 5] 0 x 5 0 < x < 5 0 x < 5 0 < x 5 0 5 0 5 0 5 0 5 0-5 1-4 0-4 1-5 eller 0,0-5,0 eller 0,1-4,9 eller 0,0-4,9 eller 0,1-5,0 eller 0,00-5,00 eller 0,01-4,99 eller 0,00-4,99 eller 0,01-5,00 eller. eller. eller. eller. Lektion 9s Side 2
Med firkantede parenteser kan hyppigheds- og frekvenstabellen skrives således: Antal km [0 ; 5[ [5 ; 10[ [10 ; 15[ [15 ; 20[ [20 ; 25[ I alt Hyppighed 8 2 5 2 1 18 Frekvens 44% 11% 28% 11% 6% 100% I matematik laver vi diagrammer over hyppighed eller frekvens på denne måde: 50% 40% 30% 20% 10% 0% 0 5 10 15 20 25 Læg mærke til at søjlerne ingen mellemrum har. Dette diagram kaldes et histogram. Lektion 9s Side 3
Middelværdi for grupperede observationer Eksempel på opgave Tabellen til højre viser månedslønningerne for de ansatte i et firma. Find et cirka-tal for gennemsnitslønnen? Man kan naturligvis ikke finde en præcis middelværdi, når man ikke kende de ansattes præcise lønninger, men man kan finde et cirka-tal. (husk at gennemsnit og middelværdi er det samme). Metoden kaldes interval-midtpunkts-metoden. Månedsløn i kr. Antal [12.000 ; 16.000[ 11 [16.000 ; 20.000[ 16 [20.000 ; 25.000[ 8 [25.000 ; 30.000[ 5 [30.000 ; 40.000[ 2 Man lader som om, at de 11 personer, der har en månedsløn i intervallet [12.000 ; 16.000[, alle tjener 14.000 kr. Altså lønnen midt i intervallet. Det gør de givetvis ikke, men hvis deres lønningerne er (nogenlunde) jævnt fordelt på intervallet, så bliver fejlen ikke så stor. Man gør det samme for de andre løn-intervaller, og den samlede månedsløn bliver: 11 14.000 16 18.000 8 22.500 5 27.500 2 35.000 829.500 kr. 829.500 Da der i alt er 42 ansatte bliver gennemsnitlønnen: 42 19.750 kr. Lektion 9s Side 4
Summeret frekvens og sumkurver Eksempel på opgave (fortsat) Tabellen til højre viser månedslønningerne for de ansatte i et firma. Udvid tabellen således at den også viser frekvens og summeret frekvens. Tabellen kommer til at se ud som vist herunder. For overblikkets skyld er der tilføjet en i alt-række. Månedsløn i kr. Antal [12.000 ; 16.000[ 11 [16.000 ; 20.000[ 16 [20.000 ; 25.000[ 8 [25.000 ; 30.000[ 5 [30.000 ; 40.000[ 2 Frekvenserne er fundet ved almindelig procent-beregning. 11 100 Fx er frekvensen for intervallet [12.000 ; 16.000[ fundet således: 42 De summerede frekvenser findes ved at lægge frekvenserne sammen nedad. Den første summerede frekvens er lig med den første "almindelige" frekvens. Den næste summerede frekvens (64%) er fundet som 26% + 38%. Den viser, at der er 64% af de ansatte, der tjener op til 20.000 kr. Den tredje summerede frekvens (83%) er fundet som 26% + 38% + 19% (eller lidt hurtigere som 64% + 19%) Den viser, at der er 83% af de ansatte, der tjener op til 25.000 kr. Månedsløn i kr. Antal Frekvens Summeret frekvens [12.000 ; 16.000[ 11 26% 26% [16.000 ; 20.000[ 16 38% 64% [20.000 ; 25.000[ 8 19% 83% [25.000 ; 30.000[ 5 12% 95% [30.000 ; 40.000[ 2 5% 100% I alt 42 100% Således fortsætter man - man kan dog ikke beregne en summeret frekvens for "i alt". Man kan også beregne summerede hyppigheder (antal). Det gøres på tilsvarende vis. Prøv selv at gøre det! Bemærk at alle procent-tallene ovenfor er afrundet til helt tal. Ofte tager man en decimal med, men der er normalt ingen grund til at tage en masse decimaler med. 26% Man kan også skrive frekvenstal og summerede frekvenstal som brøker eller decimaltal. Lektion 9s Side 5
Eksempel på opgave (fortsat) Tabellen til højre viser månedslønningerne for de ansatte i et firma. Lav en sumkurve ud fra de summerede frekvenser. Aflæs medianen og vurder hvor stor en andel af de ansatte der har en månedsløn over 22.000 kr. Månedsløn i kr. Frekvens Summeret frekvens [12.000 ; 16.000[ 26% 26% [16.000 ; 20.000[ 38% 64% [20.000 ; 25.000[ 19% 83% [25.000 ; 30.000[ 12% 95% [30.000 ; 40.000[ 5% 100% Sumkurven ser ud som vist herunder. Først afsættes ud fra de summerede frekvenser "knækpunkterne". Altså punkterne: (12.000 kr. ; 0%), (16.000 kr. ; 26%), (20.000 kr. ; 64%) (40.000 kr.; 100%). Så laver man lige streger fra punkt til punkt, fordi man antager, at lønningerne er jævnt fordelt på intervallerne. 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% Her aflæses at ca. 72% tjener op til 22.000 kr. Her aflæses medianen Sumkurver er svære at forstå. Men dette punkt betyder fx, at 83% tjener op til 25.000 kr. Sumkurven starter ved 12.000 kr., fordi ingen af de ansatte tjener under dette beløb. 0% 10.000 15.000 20.000 25.000 30.000 35.000 40.000 Månedsløn i kr. Medianen er 50%-værdien. Den aflæses til ca.18.500 kr. Det betyder, at den lavest lønnede halvdel tjener op til ca. 18.500 kr., mens den bedst lønnede halvdel tjener mere. Medianen kan let forveksles med middelværdien, men den betyder ikke det samme. På sumkurven aflæses også, at 100% - ca. 72% ca. 28% tjener over 22.000 kr. Lektion 9s Side 6
Indekstal version 1 Øresundsbroen Motorkøretøjer pr. døgn Indekstal basisår 2000 År 2000 2001 2002 2003 9100 8100 9400 10400 100 89 103 114 I ovenstående tabel kan det være svært at se, hvordan udviklingen er i den øverste række tal det er let nok at se, at der har været færre køretøjer i 2001 end i 2000, og at der har været flere køretøjer i 2002 end de to foregående år men hvor mange flere, og hvor mange færre. Man kan i stedet angive mængden af køretøjer med forholdstal eller indekstal. Det betyder, at man starter med at sætte et indekstal på 100 for år 2000, hvor der er 9100 køretøjer, og så udregne, at hvis 9100 køretøjer svarer til indeks 100, så må 8100 køretøjer svare til indeks 89, 9400 køretøjer må svare til indeks 103 osv. På den måde bliver det let at se at trafikken for 2001 er 89 100 at trafikken for 2002 er 103 100 at trafikken for 2003 er 114 100 eller 89 % af trafikken for 2000. eller 103 % af trafikken for 2000. eller 114 % af trafikken for 2000. Man kan også se at trafikken er faldet 11 100 fra 2000 til 2003. eller 11 % fra 2000 til 2001, samt at den er steget 14 % Fidusen er altså, at man udnævner et basistal på 100, og de andre tal skal så indsættes i forhold hertil. Grunden til at man laver indekstal er altså, at man lettere kan se, hvor meget tallene stiger/falder i forhold til et starttal. Det behøver faktisk ikke at være det første tal, man vælger som indeks 100. Herunder er valgt det år, man ønsker at sammenligne med, nemlig 2000. År 92 93 94 95 96 97 98 99 2000 01 02 03 04 05 06 Forbruger prisindeks 84,6 85,6 87,3 88,9 91 93,1 94,8 97 100 102,4 104,7 106,7 108,1 110,3 112,5 Lektion 9s Side 7
I beregninger med indekstal kan man med fordel tage udgangspunkt i følgende sammenhæng: Indekstal Indekstal år1 år2 Faktisk tal Faktisk tal år1 år2 Det betyder, at hvis vi skal lave indekstal for trafikken over Øresund i årene 2000-2003, og vi har de trafiktal, der er angivet herunder, så starter vi med at sætte 2000 til indeks 100. faktisk tal 1 faktisk tal 2 Øresundsbroen Motorkøretøjer pr. døgn Indekstal basisår 2000 År 2000 2001 2002 2003 9100 8100 9400 10400 100 indekstal 1 indekstal 2 Nu kan vi i formlen herover indsætte, de tal vi kender, og beregne indeks for 2001: 100 9100 Indekstal 8100 år2 Hvilket giver et indekstal år2 på 89 og beregne indeks for 2002: 100 9100 Indekstal 9400 år2 Hvilket giver et indekstal år2 på 103 og beregne indeks for 2003: 100 9100 Indekstal 10400 år2 Hvilket giver et indekstal år2 på 114 Lektion 9s Side 8
Det kunne også være, at vi omvendt havde indekstallene og skulle finde de faktiske tal, som i skemaet herunder. År jan feb mar april Antal sygedage i Ajax a / s 546 Indekstal 100 102 105 104 Vi kan benytte den samme formel om det er år, dage eller måneder er selvfølgelig underordnet: Indekstal Indekstal Faktisk tal Faktisk tal 1 1 2 2 Beregning at det faktiske tal for feb: 100 546 102 Faktisk tal 2 Hvilket giver et faktisk tal 2 på 557 100 546 105 Faktisk tal 2 Hvilket giver et faktisk tal 2 på 573 100 546 104 Faktisk tal 2 Hvilket giver et faktisk tal 2 på 568 De beregnede værdier indsættes i skemaet: År jan feb mar april Antal sygedage i Ajax a / s 546 557 573 568 Indekstal 100 102 105 104 Lektion 9s Side 9
Indekstal version 2 Indekstal er en slags procenttal, der bruges til at beskrive, hvordan en talstørrelse (fx en pris) forandrer sig over tid. Indekstal beregnes således: Indekstal Periodens tal 100 Basisperiodens tal Eksempel på opgave Yrsa Olsen arbejder på en fabrik. Hun bor i en lejlighed i en anden by, og hun tager hver dag bussen på arbejde. Tabellen viser hendes timeløn og husleje samt prisen på et månedskort til bussen. År 1990 1992 1994 1996 1998 2000 Timeløn 67 72 76 82 89 96 Husleje 3.345 3.415 3.598 3.746 3.817 4.075 Buskort 375 425 480 510 545 565 Sammenlign løn- og prisudviklingen ved at lave en indekstabel. Brug 1990 som basisår. Man laver en tabel præcis magen til tabellen ovenfor, men i stedet for krone-beløbene skriver man indekstal. Alle tre indekstal for 1990 sættes til 100, da dette år er basisår. De øvrige indekstal beregnes som vist herunder: Timeløn 1992: 72 100 107,5 Timeløn 1994: 67 76 100 113,4 Timeløn 1996: 67 Læg mærke til at man altid dividerer med timelønnen fra 1990 (basisåret). I alt får man denne tabel (kontroller selv tallene): År 1990 1992 1994 1996 1998 2000 Timeløn 100,0 107,5 113,4 122,4 132,8 143,3 Husleje 100,0 102,1 107,6 112,0 114,1 121,8 Buskort 100,0 113,3 128,0 136,0 145,3 150,7 82 100... 67 I tabellen er indekstallene skrevet med en decimal. Ofte afrunder man til helt tal. Indekstallene viser, at huslejen er steget klart langsommere end lønnen. Til gengæld er prisen på buskortet vokset noget hurtigere end lønnen. Indekstal er gode til at vise en udvikling, da det er let at sammenligne et tal med tallet 100. Indekstal er gode, hvis man skal sammenligne udviklingen af meget forskellige talstørrelser. Lektion 9s Side 10
VIGTIGT VIGTIGT - VIGTIGT - VIGTIGT - VIGTIGT - VIGTIGT VIGTIGT - VIGTIGT Indekstal er en slags procental. Men når indekstallet for Yrsa Olsens løn fra 1994 til 1996 stiger fra 113,4 til 122,4, så siger man, at stigningen er på 122,4-113,4 9,0 procentpoint. Stigningen er ikke på 9% af lønnen i 1994 men på 9% af lønnen i 1990 (basisåret). Derfor siger man procentpoint og ikke procent. Det kan være svært at huske (og forstå). Eksempel på opgave (fortsat) Indekstabellen viser udviklingen i prisen på et månedskort til en busrute. År 1990 1992 1994 1996 1998 2000 Buskort 100,0 113,3 128,0 136,0 145,3 150,7 Find stigningen fra 1994 til 1996 i både procentpoint og procent. Stigningen i procentpoint er forskellen i indekstal: 136,0-128,0 8,0 procentpoint. Stigningen i procent findes ved almindelig procentregning: 8,0 100 6,25% 128,0 Kik evt. i modulet om procentregning, hvis du døjer med at huske regnemetoderne. Hvis man beregner stigningen i procent fra 1994 til 1996 ud fra de rigtige buspriser fra 30 100 eksemplet på forrige side, så får man: 6,25%. Altså præcis samme resultat. 480 Det vil altid være tilfældet. Tabellen i eksemplet ovenfor viser tydeligt, at prisstigningen er størst i starten. Den største stigning målt i procentpoint er på 14,7 procentpoint fra 1992 til 1994. 14,7 100 Det svarer til en stigning på : 13,0% 113,3 Men den største stigning i "almindelige" procent er faktisk fra 1990 til 1992. Her er stigningen på 13,3% (og i øvrigt også på 13,3 procentpoint). Danmarks Statistik udregner indekstal for den gennemsnitlige prisudvikling i samfundet. Tallene kaldes forbrugerprisindeks. Beregningen af tallene er kompliceret, og den er ikke kun baseret på priserne på almindelige "købmandsvarer". Der indgår også udgifter til fx husleje og transport. Her er vist forbrugerprisindeks med 1980 som basisår. År 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 Indeks 100,0 123,0 139,8 151,7 165,0 177,4 185,5 191,6 199,7 207,9 219,3 I tabellen er af pladshensyn kun vist tal fra hvert andet år, men der bliver beregnet nye tal hver eneste måned året rundt. Tallene er gode som sammenligningsgrundlag. Lektion 9s Side 11
Eksempel på opgave (fortsat) Sammenlign udviklingen i prisen på et månedskort (se forrige sider) med udviklingen i forbrugerprisindekset. Man kan ikke umiddelbart sammenligne indekstal med forskellige basisår, men det er alligevel muligt at lave en sammenligning. Man kan omregne forbrugerprisindekset, således at 1990 bliver basisår. Man får: År 1980. 1988 1990 1992 1994 1996 1998 2000 Indeks 56,4. 93,0 100,0 104,6 108,0 112,6 117,2 123,6 De nye indekstal for 1998 er fx fundet således: 207,9 100 177,4 117,2 Nu kan man tydeligt se, at prisen på buskortet er vokset en del hurtigere end forbrugerprisindekset. Men sammenligningen kan også laves på flere andre måder. Overvej selv hvordan. Eksempel på opgave Et forsikringsselskab regulerer sine præmier efter udviklingen i forbrugerprisindekset. En indboforsikring kostede 778 kr. i 1998. År 1996 1997 1998 1999 Indeks 199,7 204,1 207,9 213,0 Find prisen på forsikringen i 1999. Prisen kan beregnes således: Pris i 1999 Pris i1998 Indekstalfra 1999 Indekstalfra 1998 778 213,0 207,9 797 kr. Metoden kan sættes på formel på denne måde: Nyt tal Gammelt tal Gammelt Nyt indekstal indekstal NB: Beregningen i eksemplet ovenfor er lidt urealistisk. Man kender naturligvis ikke forbrugerprisindekset for 1999, når man skal beregne forsikringspræmien for 1999. I praksis vil man lave en "forsinket" indeksregulering. Man vil bruge indekstallene fra 1997 og 1998 som det gamle og det nye indekstal. Lektion 9s Side 12