Median, kvartiler, boksplot og sumkurver Median, kvartil, boksplot og sumkurver... 2 Opgaver... 7 Side 1
Median, kvartil, boksplot og sumkurver Medianen er det midterste af en række tal, der er skrevet op efter størrelse. Medianen angiver grænsen mellem den største og den mindste halvdel af tallene. Eksempler på opgaver På en arbejdsplads er der syv ansatte. De får disse lønninger (kr./time): 98, 108, 119, 124, 129, 156 og 175. Hvad er median-lønnen? På en arbejdsplads er der seks ansatte. De får disse lønninger (kr./time): 102, 117, 128, 132, 134 og 153. Hvad er median-lønnen? Når der er et ulige antal lønninger, er medianen det midterste tal. Når der er et lige antal lønninger, er medianen midt imellem de to midterste tal. 98 108 119 124 129 156 175 102 117 128 132 134 153 Median-lønnen bliver derfor 124 kr./time Tallet midt imellem 128 og 132 er 130. Median-lønnen bliver derfor 130 kr./time. 128 + 132 Tallet kan evt. beregnes: = 130 2 I eksemplerne ovenfor er medianen løn-grænsen mellem den dårligst lønnede halvdel og den bedst lønnede halvdel af de ansatte. Kvartil betyder en kvart (en fjerdedel) eller 25%. Man taler om 1. kvartil, 2. kvartil og 3. kvartil. 1. kvartil er det midterste af de tal, som ligger under medianen. 3. kvartil er det midterste af de tal, som ligger over medianen. 2. kvartil er det samme som medianen. Eksempel på opgave Ved en fartkontrol måler politiet disse hastigheder (km/time) på 11 biler: 98, 80, 79, 82, 92, 85, 81, 78, 87, 105 og 78. Hvad er median-hastigheden for bilerne? Hvad er 1. kvartil og 3. kvartil? Tallene skrives først op efter størrelse: 78 78 79 80 81 82 85 97 92 98 105 Medianen findes som det midterste tal: 82 km/time Side 2
1. kvartil findes på samme måde som medianen, men man kikker kun på de tal, som er under medianen. 3. kvartil findes på samme måde som medianen, men man kikker kun på de tal, som er over medianen. 78 78 79 80 81 82 85 97 92 98 105 Man får, at 1. kvartil er 79 km/time, og 3. kvartil er 92 km/time Eksempel på opgave På et basketball-hold er der otte spillere. Deres højde (cm) er: 205, 192, 188, 198, 210, 179, 207 og 201. Hvad er median-højden for spillerne? Hvad er 1. kvartil og 3. kvartil? Tallene skrives op efter størrelse, og median og kvartiler findes som midtpunkter som vist: 179 188 192 198 201 205 207 210 188 + 192 2 = 190 198 + 201 = 199,5 2 205 + 207 2 = 206 Man får: 1. kvartil er 190 cm. Medianen er 199,5 cm. 3. kvartil er 206 cm Median og kvartiler kan defineres på flere måder Ovenfor er median og kvartiler defineret som de midterste tal. Der findes også en anden definition af median og kvartiler, som du kan støde ind i nogle steder: - Medianen er det største tal, som tilhører den mindste halvdel (50%) af tallene. - 1. kvartil er det største tal, som tilhører den mindste fjerdedel (25%) af tallene. - 3. kvartil er det største tal, som tilhører de mindste tre fjerdedele (75%) af tallene. Hvis man bruger denne definition på basketball-spillerne i eksemplet ovenfor, får man, at 1. kvartil er 188 cm, medianen er 198 cm og 3. kvartil er 205 cm. Tænk selv over hvorfor! I eksemplerne i dette hæfte indgår der kun ganske få tal (lønningerne for syv ansatte, højden på otte basketball-spillere osv.). Ellers ville det være uoverskueligt at regne på tallene. Men så kan de to definitioner desværre give forskellige resultater. I praksis (uden for matematik-bøger) bruger man næsten kun median og kvartiler, når man beskriver meget store mængder af tal. Fx lønningerne for alle lærere i Danmark eller højden på alle piger, der har en bestemt alder. Når tal-mængderne er så store, har det ingen praktisk betydning, hvilken definition, man bruger. Side 3
Man kan let tro, at median og middelværdi er det samme tal, men det er sjældent tilfældet. Eksempler på opgaver På en arbejdsplads er der fem ansatte, som får disse lønninger (kr./time): 130, 140, 150, 160 og 170. Hvad er median-lønnen? Hvad er middelværdien? På en arbejdsplads er der fem ansatte, som får disse lønninger (kr./time): 100, 140, 150, 160 og 170. Hvad er median-lønnen? Hvad er middelværdien? På en arbejdsplads er der fem ansatte, som får disse lønninger (kr./time): 130, 140, 150, 160 og 200. Hvad er median-lønnen? Hvad er middelværdien? Median-lønnen er 150 kr. i alle tre opgaver. Det er det midterste tal, når tallene står efter størrelse. Middelværdien er forskellig i de tre opgaver. Man får: 130 + 140 + 150 + 160 + 170 = 5 750 = 150 kr. 5 100 + 140 + 150 + 160 + 170 = 5 720 = 144 kr. 5 130 + 140 + 150 + 160 + 5 780 = 156 kr. 5 200 = Forestil dig, at det er de samme fem personer, som opgaverne handler om. Hvis lønnen falder for en af de lavest lønnede, eller lønnen stiger for en af de højst lønnede, påvirker det ikke medianen, men det påvirker naturligvis middelværdien. Man kan vise medianen og kvartilerne sammen med mindste- og største-værdi i et boksplot. Eksempel på opgave Tabellen viser resultatet af en undersøgelse af prisen på en liter letmælk i en række butikker. Lav et boksplot ud fra tallene. Mindsteværdværdi Største- 1. kvartil Median 2. kvartil 3,95 kr. 5,75 kr. 7,20 kr. 8, 25 kr. 9,95 kr. Man laver et boksplot i et koordinatsystem som vist. Mindste-værdi 1. kvartil median 3. kvartil Største-værdi Man markerer først medianen og de to kvartiler og tegner en boks. Derefter markerer man mindste-værdi og største-værdi, og tegner to linje-stykker. Alle boksplottets fire vandrette dele svarer til 25% af mælkepriserne. 3 4 5 6 7 8 9 10 11 Side 4
Eksempel på opgave Boksplottet viser højdefordelingen i cm for en gruppe mænd. Aflæs mindste-værdi, største-værdi, median og kvartiler. Fortæl lidt om, hvad disse tal viser om mændenes højde. 150 160 170 180 190 200 210 220 Mindste-værdien er 158 cm. Største-værdien er 211 cm. Median-højden er 181 cm. 1. kvartil er 175 cm, og 3. kvartil er 187 cm. Tallene viser (fx), at den midterste halvdel af mændenes højder ligger inden for et lille interval på 187 175 = 12 cm, mens alle mændenes højder er fordelt på et stort interval på 211 158 = 53 cm. Hvis man kender frekvens-tallene for en grupperet fordeling, kan man finde median og kvartiler ved først at beregne de summerede frekvenser og derefter tegne en sumkurve. Det er lidt kompliceret, men jeg vil prøve at vise det i det næste eksempel. Eksempel på opgave Tabellen viser frekvens-fordelingen for højden på en gruppe kvinder. Lav en tabel med summerede frekvenser. Lav et histogram. Lav en sumkurve. Find median og kvartiler vha. sumkurven. Tabellen kommer til at se ud som vist til højre. De summerede frekvenser findes ved at lægge frekvenser sammen. Fx er den summerede frekvens for intervallet [160 ; 170[ på 58%. Tallet er fundet som 3% + 18% + 37%. Den summerede frekvens for [160 ; 170[ er altså frekvensen af alle dem, som har en højde på op til lige under 170 cm. Det betyder; at 58% af kvinderne er under 170 cm. Højde i cm Frekvens [140 ; 150[ 3% [150 ; 160[ 18% [160 ; 170[ 37% [170 ; 180[ 28% [180 ; 190[ 12% [190 ; 200[ 2% Ialt 100% Højde i cm Frekvens Sum. frekv. [140 ; 150[ 3% 3% [150 ; 160[ 18% 21% [160 ; 170[ 37% 58% [170 ; 180[ 28% 86% [180 ; 190[ 12% 98% [190 ; 200[ 2% 100% Ialt 100% Side 5
På det øverste diagram er der både tegnet et histogram og en sumkurve. Man kan sagtens lave en sumkurve uden at tegne et histogram, men det giver et fint billede, når man tegner dem sammen. Sumkurven viser de summerede frekvenser fra tabellen. Man starter med at afsætte punktet (Første intervals start-punkt, 0). Altså (140, 0). Derefter afsætter man punkter af typen (Interval-endepunkt, summeret frekvens). Altså (150, 3), (160, 21) osv. Man kan se at sumkurven er mest stejl i de intervaller, hvor histogrammet er højt, og der derfor er mange personer. Kurven viser, hvor mange af pigerne, der er op til en bestemt højde. Fx kan man se, at ca. 72% er op til 175 cm. 100 90 80 70 60 50 40 30 20 10 0 140 150 160 170 180 190 200 På det nederste diagram er histogrammet fjernet for ikke at få for mange streger med. I stedet er der lavet vandrette markeringer ud for 25%, 50% og 75%. Vha. disse markeringer kan man aflæse, at: 1. kvartil er ca. 161 cm median-højden er ca. 168 cm 3. kvartil er ca. 176 cm Brugen af sumkurver forudsætter, at fordelingen inden for de enkelte intervaller er nogenlunde jævn. Fx at de 37% af kvinderne, som er i intervallet [160 ; 170[, er nogenlunde jævnt fordelt på højderne imellem 160 cm og 170 cm. 100 90 80 70 60 50 40 30 20 10 0 140 150 160 170 180 190 200 Side 6
Opgaver 1: Ølpriser Tabellen viser prisen på en øl på de forskellige værtshuse i en by Den røde ko 25 Hønsehuset 27 Overhuset 38 Guldkalven 35 Løveburet 30 Tronsalen 35 Hos Hans 24 Mødestedet 20 Underhuset 18 a: Hvor mange værtshuse er der? b: Find medianen c: Find 1. kvartil og 3 kvartil. d: Find middelværdien Guldkalven, Overhuset og Tronsalen sætter alle deres pris ned til 30 kr. e: Hvad sker der med middelværdi og median? 2: Aldersfordeling Tabellerne viser alderen på kursisterne på to forskellige VUC-hold Allan 45 Ester 49 Mogens 41 Rania 24 Victor 21 Conny 32 Henry 62 Olga 56 Svend 70 Yrsa 61 Anton 21 Eskild 18 Jackie 18 Leon 42 Rami 18 Brian 27 Fartun 17 Kasper 19 Lisa 35 Rikke 31 Dagny 51 Goran 27 Kate 26 Matin 23 Sabrina 17 Ditte 22 Halima 20 a: Hvor mange kursister er der på hvert af de to hold? b: Find median, 1. kvartil og 3. kvartil for det første hold c: Find median, 1. kvartil og 3. kvartil for det andet hold d: Tegn boksplot for begge hold. e: Sammenlign aldersfordelingen på de to hold 3: Undersøg aldersfordelingen på dit eget hold. Find median, 1. kvartil og 3. kvartil. Lav evt. også et boksplot. Side 7
4: Højde-sammenligning De to boksplot viser Højdefordeling for basketball-spillere højde-fordeling i cm på to forskellige grupper af mandlige idrætsfolk. En gruppe basketball-spillere og en gruppe gymnaster. a: Prøv at beskrive de to grupper. 140 150 160 170 180 190 200 210 220 Hvorledes ville de se ud, Højdefordeling for gymnaster hvis de stod ved siden af hinanden? b: Aflæs mindste-værdi, og største-værdi for basketball-spillerne. c: Aflæs mindste-værdi, og største-værdi for gymnasterne. d: Aflæs medianen, 140 150 160 170 180 190 200 210 220 1 kvartil og 3. kvartil for basketball-spillerne. e: Aflæs medianen, 1 kvartil og 3. kvartil gymnasterne. f: Hvor mange cm er den højeste basketball-spiller højere end den laveste gymnast? 5: SMS-er VUC-kursisterne fra opgave 2 har holdt øje med, hvor mange SMS-er de sendte på en dag. Tallene er vist i tabellen. Allan 1 Ester 1 Mogens 2 Rania 5 Victor 8 Conny 2 Henry 0 Olga 2 Svend 0 Yrsa 0 Anton 5 Eskild 19 Jackie 38 Leon 2 Rami 32 Brian 12 Fartun 22 Kasper 25 Lisa 0 Rikke 3 Dagny 1 Goran 7 Kate 41 Matin 6 Sabrina 10 Ditte 15 Halima 5 a: Beskriv tallene for det nederste hold vha. boksplot. b: Lav evt. også et boksplot for det øverste hold men overvej først om det giver mening. Hvis det ikke giver mening, så overvej at lave et andet diagram for det øverste hold. Side 8
6: Fritidsaktiviteter En klasse med skolebørn er blevet spurgt om, hvor mange timer om ugen de bruger på fritids-aktiviteter (sport, spejder, musik mv.). Svarerne er vist i tabellen. a: Hvor mange børn er der? b: Find medianen c: Find 1. kvartil og 3 kvartil d: Sammenlign median og middelværdi e: Lav et boksplot Hvor mange timer bruger du om ugen? Så mange Ahmed 0 Hans 0 Mads 1 Ronni 14 Asta 5 Hilda 6 Mette 2 Sidsel 4 Bent 3 Ismail 3 Mie 4 Søren 1 Carl 0 Kirstin 2 Ninna 0 Tanja 0 Fatima 2 Lone 8 Peter 10 Torben 1 7: Løn-sammenligning De to boksplot viser Timelønnen på Poulsen Pølsefabrik timelønnen på to forskellige virksomheder. a: Aflæs mindste-værdi, og største-værdi på pølsefabrikken. b: Aflæs mindste-værdi, og største-værdi 0 50 100 150 200 250 300 350 på isfabrikken. Timelønnen på Iversens Isfabrik c: Aflæs medianen, 1 kvartil og 3. kvartil på pølsefabrikken. d: Aflæs medianen, 1 kvartil og 3. kvartil på isfabrikken. e: Vurder hvilke 0 50 100 150 200 250 300 350 af disse udsagn der er rigtige: - 50% af medarbejderne på pølsefabrikken tjener over 150 kr. - 50% af medarbejderne på isfabrikken tjener mellem 140 kr. og 200 kr. - De dårligst lønnede 25% af medarbejderne på pølsefabrikken får under 95 kr. - De bedst lønnede 25% af medarbejderne på isfabrikken får over 250 kr. - 75% af medarbejderne på pølsefabrikken får mellem 95 kr. og 210 kr. - 75% af medarbejderne på isfabrikken får mellem 140 kr. og 250 kr. Skriv selv rigtige udsagn i stedet for de forkerte udsagn. Side 9
8: Leverpostej Der står 500 g på alle bakker med Lenes Leverpostej. Her er resultatet af en kontrol-vejning af nogle bakker: Lenes Leverpostej 500 g KUN 16,95 kr. 498 g 491 g 481 g 480 g 499 g 472 g 486 g 487 g 504 g 512 g 500 g 469 g 508 g 462 g 470 g 492 g 485 g 475 g 479 g 496 g 493 g 516 g 497 g 501 g 488 g 0 4 9 8 g a: Hvor mange bakker er blevet vejet? b: Find mindsteværdi, størsteværdi og variationsbredde. c: Find medianen, 1. kvartil og 3. kvartil. d: Lav et boksplot. e: Lav og udfyld en tabel med hyppighed og frekvens som den viste? f: Lav et histogram. g: Sammenlign boksplot og histogram. Hvad synes du giver det bedste billede? h: Sammenlign kg-prisen for den letteste og den tungeste bakke. Vægt i gram Hyppighed Frekvens [460 ; 470[ [470 ; 480[ [480 ; 490[ [490 ; 500[ [500 ; 510[ [510 ; 520[ I alt 9: Hastigheds-kontrol Boksplottet viser resultatet Hastighed i km/time af en hastigheds-kontrol på bilerne en landevej. Hastigheds-grænsen er 80 km/t. a: Aflæs den laveste og den højeste hastighed. b: Aflæs median, 1. kvartil og 3. kvartil. 70 80 90 100 110 120 130 140 c: Vurder hvor mange procent af bilerne, der har overholdt hastighedsgrænsen. d: Vurder hvor mange procent af bilerne, der har kørt over 100 km/t. Ved en senere kontrol overholdt 50% af bilerne hastigheds-grænsen, og alle hastigheder lå mellem 70 km/t og 105 km/t. e: Hvilke oplysninger mangler du for at kunne lave et boksplot? f: Prøv at skitsere et boksplot, selv om du mangler nogle oplysninger. Side 10
10: Histogram tabel sumkurve Histogrammet viser befolkningens aldersfordeling i et område af en by. 30% 20% 10% 10 20 30 40 50 60 70 80 90 100 110 a: Aflæs frekvenserne (cirka-tal) for de forskellige aldersintervaller og skriv tallene ind i tabellen til højre. b: Udregn de summerede frekvenser og skriv tallene ind i tabellen til højre. c: Tegn ud fra tallene i tabellen en sumkurve i koordinatsystemet herunder. d: Aflæs (cirka-tal) median, 1. kvartil og 3. kvartil. e: Find evt. et cirka-tal for gennemsnitsalderen. Alder Frekvens Sum. Fre. [0 ; 15[ [15 ; 30[ [30 ; 45[ [45 ; 60[ [60 ; 75[ [75 ; 90[ [90 ; 105[ 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 10 20 30 40 50 60 70 80 90 100 110 Side 11
11: Sumkurve tabel histogram Sumkurven viser befolkningens aldersfordeling i et område af en by. 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 10 20 30 40 50 60 70 80 90 100 110 a: Aflæs de summerede frekvenser (cirka-tal) for de forskellige aldersintervaller og skriv tallene ind i tabellen til højre. b: Udregn frekvenserne og skriv tallene ind. c: Lav ud fra tallene i tabellen et histogram i koordinatsystemet herunder. d: Sammenlign aldersfordelingen i denne opgave med aldersfordelingen i sidste opgave. Brug evt. median, kvartiler og/eller gennemsnit. Alder Frekvens Sum. Fre. [0 ; 15[ [15 ; 30[ [30 ; 45[ [45 ; 60[ [60 ; 75[ [75 ; 90[ [90 ; 105[ 30% 20% 10% 10 20 30 40 50 60 70 80 90 100 110 Side 12