Thomas Jensen & Morten Overgård Nielsen At bestemme kvartilsæt Indhold - At finde kvartilsæt i ikke-grupperet datamateriale (link til dokumentet her) - At bestemme kvartilsæt ved hjælp af Excel (link til dokumentet her) - At finde kvartilsæt i grupperet datamateriale (link til dokumentet her) Et regneark er særdeles velegnet til at behandle datamateriale. Når man har et datamateriale, skal man fra en begyndelse vælge metode til at behandle materialet. Her beskriver vi to metoder: - Når man sorterer sit materiale i intervaller (i kasser ) fordi materialet er meget stort. Dette kalder man at man grupperer materialet. - Når materialet ikke kræver en sortering, kalder man materialet for ikkegrupperet. Grupperet materiale kan f.eks. være befolkningsdata eller indkomstfordelinger. Når man arbejder med boksplot, kan man både beskrive et grupperet og et ikkegrupperet materiale i et boksplot. Et boksplot kræver imidlertid at man har den mindste og den største værdi (minimum og maksimum). Når man arbejder med grupperet materiale, er det ikke altid man har oplysninger om mindste- og størsteværdi. Det kan f.eks. være en indkomstfordeling fra Danmarks Statistik hvor der måske var 32 % af borgerne i en kommune der tjente over 400 000 kr. i 2003. I nogle tilfælde er det en forholdsvis lille del af materialet det ligger uden for oplyste værdier. Det kan være at 3 % af de 15-24-årige borgere i en kommune tjente over 400 000 kr. i 2003. Man kan derfor vælge at se bort fra op til 5 % materiale i bunden og i toppen, for derved at få en mindste- og størsteværdi til et boksplot. Dette kræver naturligvis at man tydeligt gør opmærksom på det i sin fremlæggelse af databehandlingen. Et boksplot kræver følgende oplysninger: - Den mindste værdi i materialet (minimum) - Den største værdi i materialet (maksimum) - Nedre kvartil - Median - Øvre kvartil At finde kvartilsæt i ikke-grupperet datamateriale Hvis et materiale er overskueligt, er det lettest at finde kvartilsættet på følgende måde: Eksempel 1 med ulige antal data 4 6 10 12 18 18 22 29 31 35 38 44 50 Her kan vi umiddelbart aflæse at minimum er 4 og maksimum er 50. For at finde medianen finder vi det midterste tal der her er 22. Vi finder dernæst den midterste værdi Side 1 af 3
Thomas Jensen & Morten Overgård Nielsen af dataene under medianen og derefter den midterste værdi af dataene over medianen. Dette kan anskueliggøres således: 4 6 10 12 18 18 22 29 31 35 38 44 50 Nedre kvartil Median Øvre kvartil Bemærk at det udelukkende er tallene under medianen der anvendes til at bestemme nedre kvartil. Tilsvarende er det tallene over medianen der anvendes til at bestemme den øvre kvartil. 10 + 12 22 Den nedre kvartil udregnes som: = = 11 2 2 35 + 38 73 Den øvre kvartil udregnes på samme måde som: = = 36, 5. 2 2 Eksempel 2 med ulige antal data Et datasæt med ulige antal data kan også være som følgende eksempel, og man kan da umiddelbart bestemme kvartilsættet: 78 90 96 103 119 141 193 Nedre kvartil Median Øvre kvartil Bemærk igen at det er ud fra tallene under medianen at nedre kvartil bestemmes. Dermed er nedre kvartil 90, medianen 103 og øvre kvartil 141. Eksempel 1 med lige antal data Hvis det er et lige antal data, kan medianen ikke umiddelbart aflæses. Vi markerer her også her med pile: 120 134 134 140 141 145 153 156 169 180 240 267 313 326 Nedre kvartil Median Øvre kvartil Igen indgår medianen ikke i bestemmelsen af nedre og øvre kvartil. 153 + 156 309 Vi beregner her medianen til: = = 154, 5. 2 2 Nedre kvartil aflæses til 140, men den øvre kvartil aflæses til 240. Side 2 af 3
Thomas Jensen & Morten Overgård Nielsen Eksempel 2 med lige antal data Med lige antal data kan man også møde følgende type: 57 60 64 70 72 80 85 98 Nedre kvartil Median Øvre kvartil I denne situation skal vi bestemme alle tre dele af kvartilsættet som gennemsnit: Nedre kvartil: 60 + 64 124 = = 62 2 2 Median: 70 + 72 142 = = 71 2 2 Øvre kvartil: 80 + 85 165 = = 82, 5 2 2 At bestemme kvartilsæt ved hjælp af Excel Det kan også være at man har et stort datamateriale som man ikke ønsker at gruppere fordi man har dataene liggende i sit regneark. I et sådant tilfælde kan Excel finde kvartilsættet på følgende måde, idet vores data her står i cellerne A1 til A100: 1. Nedre kvartil: I en celle skriver man: =kvartil(a1:a100;1). Dernæst trykker man Enter. 2. Median: I næste celle skriver man: =kvartil(a1:a100;2). Igen efterfulgt af Enter. 3. Øvre kvartil: Endelig skriver man: =kvartil(a1:a100;3). Også efterfulgt af Enter. Hvis det er vanskeligt at overskue hvad der er minimum og maksimum, kan Excel finde dem på samme måde som kvartilsættet. Her skriver man blot 0 for minimum og 4 for maksimum, altså: 1. Minimum: I en celle skriver man: =kvartil(a1:a100;0) efterfulgt af Enter. 2. Maksimum: I en celle skriver man: =kvartil(a1:a100;4) efterfulgt af Enter. At finde kvartilsæt i grupperet datamateriale Hvis et datamateriale er grupperet, finder man kvartilsættet vha. sumkurven som det er beskrevet i bogen s. 185-188. Se evt. vejledningen At tegne sumkurve vha. Excel her på hjemmesiden. Side 3 af 3