Nogle emner fra. Deskriptiv Statistik. 2011 Karsten Juul



Relaterede dokumenter
Deskriptiv statistik. for C-niveau i hf Karsten Juul

Deskriptiv statistik for hf-matc

for gymnasiet og hf 2016 Karsten Juul

Deskriptiv statistik for matc i stx og hf

for gymnasiet og hf 2017 Karsten Juul

Statistik. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer.

for C-niveau i stx 2017 Karsten Juul

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

for matematik pä B-niveau i hf

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Statistik er at behandle en stor mængde af tal, så de bliver lettere at overskue og forstå.

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal.

for matematik på C-niveau i stx og hf

Statistik (deskriptiv)

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)

5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime

Statistik - supplerende eksempler

Formelsamling Matematik C

En lille introduktion til WordMat og statistik.

brikkerne til regning & matematik statistik preben bernitt

Deskriptiv statistik (grupperede observationer)

Noter til Statistik. Lisbeth Tavs Gregersen. 1. udgave

Ved et folketingsvalg eller en folkeafstemning spørger man alle stemmeberettigede, og kun en del af dem stemmer.

for gymnasiet og hf 2011 Karsten Juul

1hf Spørgsmål til mundtlig matematik eksamen sommer 2014

for matematik pä B-niveau i hf

Under 63 år : 92% Under 55 år : 55% Ved at trække den nederste fra den øverste af de to grupper fås: Melllem 55 og 63 år :

sammenhänge for C-niveau i stx 2013 Karsten Juul

Start pä matematik. for gymnasiet og hf (2012) Karsten Juul

Forklar hvad betyder begrebet procent og hvordan man beregner det. Forklar, hvordan man lægger procenter til og trækker procenter fra.

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul

Deskriptiv statistik

Under 63 år : 88% Under 55 år : 55% Ved at trække den nederste fra den øverste af de to grupper fås: Melllem 55 og 63 år :

Antal timer Køn k m k m m k m k m k k k m k k k

H Å N D B O G M A T E M A T I K 2. U D G A V E

Potensfunktioner samt proportional og omvent proportional. for hf Karsten Juul

Grupperet materiale kan f.eks. være befolkningsdata eller indkomstfordelinger.

Funktioner generelt. for matematik pä B- og A-niveau i stx og hf Karsten Juul

Median, kvartiler, boksplot og sumkurver

Statistisk beskrivelse og test

Hvad siger statistikken?

Lineære modeller. Taxakørsel: Et taxa selskab tager 15 kr. pr. km man kører i deres taxa. Hvis vi kører 2 km i taxaen koster turen altså

1q + 1qs Ikast-Brande Gymnasium maj Procent og rente Forklar hvad betyder begrebet procent og hvordan man beregner det.

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

for matematik pä B-niveau i hf

Nordisk Matematikkonkurrence. samt Danmarks Matematiklærerforening. Skoleåret Opgaver ved semifinalen

Opgaver om koordinater

Statistik med GeoGebra

Matematik C. Højere forberedelseseksamen

Statistikkompendium. Statistik

Løsninger til kapitel 1

Grupperede observationer

U L I G H E D I D A N M A R K

1hf Spørgsmål til mundtlig matematik eksamen sommer 2014

Lektion 9 Statistik enkeltobservationer

Funktioner generelt. for matematik pä B-niveau i stx Karsten Juul

QR15 Vejledning i at bestemme kvartilsæt og at tegne sumkurver med Nspire, Maple og Geogebra

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Et CAS program til Word.

Grupperede observationssæt Deskriptiv statistik: Middelværdi, frekvensfordeling, sumkurve, kvartilsæt, boxplot

Eksponentielle sammenhænge

Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4

Integralregning. med Ävelser. for B-niveau i gymnasiet og hf Karsten Juul

Variabel- sammenhænge

statistik og sandsynlighed

T A L K U N N E N. Datasæt i samspil. Krydstabeller Grafer Mærketal. INFA Matematik Allan C

Huskeliste Printark. U4 Tastetider U5 Hvor hurtigt regner du? E4 Begreber og fagord - Statistik. Materialer. Mobiltelefon Stopur

Lineære sammenhænge. Udgave Karsten Juul

Opgavesamling Matematik A HTX

Kort om Eksponentielle Sammenhænge

Navn:&& & Klasse:&& STATISTIK - Fase 2. Undersøge sammenhæng i omverdenen med datasæt. Vurdering fra 1 til 5 (hvor 5 er højst) Lærer.

OM KAPITLET STATISTIK. egne svar eller Elevernes egne forklaringer. I disse

Lektion 9s Statistik - supplerende eksempler

GrundlÄggende variabelsammenhänge

Supplerende opgaver til TRIP s matematiske GRUNDBOG. Forlaget TRIP. Opgaverne må frit benyttes i undervisningen.

OM KAPITLET ELEVFORUDSÆTNINGER STATISTIK

SPØRGSMÅL TIL MUNDTLIG EKSAMEN, MAT C sommer2014

Undersøge funktion ved hjælp af graf. For hf-mat-c.

Differentialregning. Et oplæg Karsten Juul L P

Eksempler med Regression (Se også TilpasFunktion's eksemplet nedenfor)

I. Deskriptiv analyse af kroppens proportioner

statistik og sandsynlighed

Kvantitative Metoder 1 - Forår Dagens program

Oversigt. funktioner og koordinatsystemer

Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau)

Vejledning i at tegne boksplot i Excel 2007

Asymptoter. for standardforsøgene i matematik i gymnasiet Karsten Juul

Trekants- beregning for hf

Eksamensspørgsmål 4emacff1

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Transkript:

Nogle emner fra Deskriptiv Statistik 75 50 25 2011 Karsten Juul

Indhold Hvad er deskriptiv statistik?... 1 UGRUPPEREDE OBSERVATIONER Hyppigheder... 1 Det samlede antal observationer... 1 Middeltallet... 1 Frekvenser... 2 GRUPPEREDE OBSERVATIONER Gruppering af observationer... 3 Histogram... 5 Sumkurve... 6 Median og kvartiler for grupperede observationer... 7 BOKSPLOT Median for ugrupperede observationer... 8 Nedre og Ävre kvartil for ugrupperede observationer... 8 Boksplot... 9 Sammenligning af boksplot... 9 Nyere häfte: http://mat1.dk/deskriptiv_statistik_for_c_niveau_i_hf.pdf Nogle emner fra deskriptiv statistik Å 2011 Karsten Juul Dette hçfte kan downloades fra http://mat1.dk/noter.htm HÇftet mé benyttes i undervisningen hvis lçreren med det samme sender en e-mail til kj@mat1.dk som dels oplyser at dette hçfte benyttes, dels oplyser om hold, lçrer og skole.

Hvad er deskriptiv statistik? Den deskriptive statistik bestér af metoder til at fé overblik over nogle indsamlede tal. De indsamlede tal kaldes observationer. I dette hçfte er der eksempler pé nogle af metoderne fra den deskriptive statistik Hyppigheder UGRUPPEREDE OBSERVATIONER PÉ en skole har alle elever taget tid pé hvor mange minutter det tager dem at komme fra deres hjem til skolen. RÇkken af observationer er uoverskuelig: 7 5 8 7 4 6 6 9 8 6 7 7 5 For at fé overblik over observationerne tçller vi op hvor mange gange observationen 4 forekommer, hvor mange gange observationen 5 forekommer, osv. Hyppigheden af en observation er antallet af gange den forekommer. Observationerne ovenfor har fälgende hyppigheder: Observation: 4 5 6 7 8 9 Hyppighed: 16 20 24 26 28 25 Det samlede antal observationer Af tabellen ser vi at der er 16 firtaller, 20 femtaller, osv. Det samlede antal observationer er altsé 16 20 24 26 28 25 139 Middeltallet Middeltallet for nogle observationer er det vi plejer at kalde gennemsnittet. Vi kan udregne middeltallet ved at lçgge observationerne sammen og dividere resultatet med antallet af observationer. NÉr vi lçgger de 16 firtaller sammen fér vi 4 16, nér vi lçgger de 20 femtaller sammen fér vi 5 20, osv. Middeltallet kan vi altsé udregne sédan: 4 16 5 20 6 24 7 26 8 28 9 25 139 6,75540 6,8 Nogle emner fra deskriptiv statistik Side 1 2011 Karsten Juul

Frekvenser Observationerne ovenfor er fra 1985. I 2000 var tallene sédan: Observation: 4 5 6 7 8 9 Hyppighed: 13 16 10 9 16 20 I 1985 er der flere der har 4 minutter til skole end i 2000, men der er ogsé flere elever pé skolen, sé tallene kan ikke uden videre sammenlignes. I stedet kan vi spärge om der i 1985 var en stärre procentdel af eleverne der havde 4 minutter til skole. Frekvensen af en observation er hyppigheden divideret med det samlede antal observationer. I 1985 er frekvensen af 4 lig 16 139 0,115108 12% At 4 har frekvensen 12 %, betyder at firtallerne udgär 12 % af observationerne. Vi udregner ogsé de andre frekvenser: Observation: 4 5 6 7 8 9 1985 Frekvens i %: 12 14 17 19 20 18 2000 Frekvens i %: 15 19 12 11 19 24 Ekempel: Vi ser at de der har 5 minutter eller mindre til skole, udgär 12 % + 14 % = 26 % i 1985 15 % + 19 % = 34 % i 2000. Nogle emner fra deskriptiv statistik Side 2 2011 Karsten Juul

GRUPPEREDE OBSERVATIONER Gruppering af observationer I 2010 er forholdene helt Çndret: obs. 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 % 2 6 6 3 7 6 4 8 7 10 9 10 12 7 3 Dette er uoverskueligt. Vi kan gäre det mere overskueligt ved at gruppere observationerne i intervaller. Vi kan f.eks. gruppere i fälgende tre intervaller: Interval 5,5-10,5 10,5-15,5 15,5-20,5 Frekvens 24 % 35 % 41 % Denne tabel er fremkommet sédan: I intervallet 5,5-10,5 ligger de observationer der er 6, 7, 8, 9 eller 10. Disses frekvenser lçgger vi sammen: 2 % + 6 % + 6 % + 3 % + 7 % = 24 % Dette betyder at 24 % af observationerne ligger i intervallet 5,5-10,5. Hvorfor lader vi det andet interval begynde ved 10,5 i stedet for 10? Hvis vi lader andet interval begynde ved 10, sé ser det sédan ud: Hvis nogle elever f.eks. har 9,8 eller 10,4 minutter til skole, sé har vi skrevet at de har 10 minutter til skole. I tabellen stér at 7 % af observationer er 10. Dette betyder at 7 % af tidene ligger mellem 9,5 og 10,5. NÉr vi deler ved 10 i stedet for 10,5, sé vil nogle af de 7 % ligge färste interval, og andre af dem i andet interval. Vi har valgt 10,5 i stedet for 10 for at opné at alle 7 % kommer i samme interval. Nogle emner fra deskriptiv statistik Side 3 2011 Karsten Juul

Hvis vi deler ved 10 er der bl.a. fälgende muligheder: 1. De 7 % fordeles mellem färste og andet interval sé vi tçller dem med som 3,5 % i hvert af de to intervaller. 2. Alle 7 % tçller med i färste interval. Dvs. i intervallerne 5-10, 10-15, 15-20 härer det häjre endepunkt med til intervallet. 3. Alle 7 % tçller med i andet interval. Dvs. i intervallerne 5-10, 10-15, 15-20 härer det venstre endepunkt med til intervallet. I det danske gymnasium er der tradition for at bruge 2. mulighed. Nspire bruger 3. mulighed. Fejlen er lige stor i de to metoder, men gér hver sin vej. Observationerne er jçvnt fordelt i hvert interval I tabellen hvor observationerne er grupperet ved vi kun at 24 % ligger i färste interval. Vi ved ikke om der ligger flest i venstre del eller häjre del eller et andet sted. Derfor regner vi som om observationerne er jçvnt fordelt i intervallet. Da observationerne er jçvnt fordelt i färste interval, ligger halvdelen af de 24 % i färste halvdel af intervallet. Det betyder at 12 % af eleverne har 8 minutter eller mindre til skole. Da intervallet 7,5-8,5 har lçngde 1, udgär det en femtedel af intervallet 5,5-10,5. En femtedel af 24 % er 4,8 %, sé men 4,8 % af eleverne har ca. 8 minutter til skole, 0 % af eleverne har prçcis 8 minutter til skole. At 0 % af eleverne har prçcis 8 minutter til skole, fortçller ikke noget om virkeligheden. Det er en egenskab ved de grupperede observationer. Nogle emner fra deskriptiv statistik Side 4 2011 Karsten Juul

Histogram (1) Figuren ovenfor hedder et histogram. Histogrammet viser de grupperede observationer. (2) Over hvert af de tre intervaller er der et rektangel der viser frekvensen. Toppen af färste rektangel er ud for 24 % pé den lodrette akse. Det betyder at arealet af färste rektangel er 24 %. (3) Det er arealet der viser frekvensen. FÄrste halvdel af färste rektangel har arealet 12 %. Dette betyder at 12 % af eleverne har 8 minutter eller derunder til skole. Nedenfor til venstre er vist den del af färste rektangel som svarer til intervallet 7,5-8,5. Denne del er en femtedel af rektanglet, sé arealet er 24% 4,8 %. Dette betyder at 4,8 % af eleverne har ca. 8 minutter til skole. Nedenfor til häjre er vist den del af rektanglet der svarer til prçcis 8 minutter. Arealet af denne del er 0 %, sé 0 % af eleverne har prçcis 8 minutter til skole. Dette gçlder pé histogrammet. Det fortçller intet om virkeligheden. 5 Nogle emner fra deskriptiv statistik Side 5 2011 Karsten Juul

Sumkurve Vi ser stadig pé fälgende grupperede observationer: Interval 5,5-10,5 10,5-15,5 15,5-20,5 Frekvens 24 % 35 % 41 % Hvor mange procent af observationerne er 13 eller derunder? Observationerne i färste interval er under 13. Disse udgär 24 %. Observationerne i färste halvdel af andet interval er ogsé under 13. Disse udgär halvdelen af 35 %, altsé 17,5 %. 24 % + 17,5 % = 41,5 %, sé 41,5 % af observationerne er 13 eller derunder. SÉdan aflçser vi pé en sumkurve Svaret pé spärgsmélet "Hvor mange procent af observationerne er 13 eller derunder?" kan vi nemt aflçse pé sumkurven nedenfor: % Vi begynder pé den vandrette akse ved 13, gér lodret op til kurven, og gér vandret ind pé den lodrette akse. Her aflçser vi svaret 41,5 %. minutter Nogle emner fra deskriptiv statistik Side 6 2011 Karsten Juul

SÉdan gär vi for at fé tegnet sumkurven. FÄrst ser vi pé tabellen der viser de grupperede observationer, og finder ud af at 0 % af observationerne er 5,5 eller mindre 24 % af observationerne er 10,5 eller mindre 59 % af observationerne er 15,5 eller mindre 100 % af observationerne er 20,5 eller mindre Disse tal bruger vi til at afsçtte fire punkter i koordinatsystemet. Det er de 4 prikker. Mellem to af disse punkter er grafen lineçr da observationerne er jçvnt fordelt i hvert af de tre intervaller. Kurvens knçk Ved 10,5 pé den vandrette akse har kurven et knçk. Dette fortçller ikke noget om virkeligheden. Det fortçller kun at vi har valgt at begynde pé et nyt interval her. Eksempel der skal give indsigt i brugen af sumkurve 70 % af obs. er 5 eller mindre (aflçst). 100 % 70 % = 30 % af obs. er stärre end 5. % 50 % af obs. er 3 eller mindre (aflçst). 70 % 50 % = 20 % af obs. er mellem 3 og 5. 65 % 55 % = 10 % er mellem 3,5 og 4,5. 2 % er mellem 3,9 og 4,1. 0,2 % er mellem 3,99 og 4,01. 0 % er prçcis 4. 1 % er ca. 4, hvis vi vedtager at "ca. 4" betyder "mellem 3,95 og 4,05". Median og kvartiler for grupperede observationer PÉ figuren har vi vist hvordan vi aflçser de tre kvartiler. Vi starter pé den lodrette akse ved 25 %, 50 % og 75 %. Vi gér vandret ud til sumkurven og lodret ned pé den vandrette akse. Vi ender i tallene 1, 2 og 3,5. Disse tre tal kaldes kvartilerne fordi de deler observationerne op i fire portioner der hver indeholder 25 % af observationerne. 1 er den nedre kvartil. 2 er medianen. 3,5 er den Ävre kvartil. 75 50 25 Nogle emner fra deskriptiv statistik Side 7 2011 Karsten Juul

BOKSPLOT For grupperede observationer aflçser vi kvartilerne pé sumkurven. For ugrupperede observationer finder vi kvartilerne sédan som det er vist nedenfor. Median for ugrupperede observationer En klasse har haft en präve. De 17 elever fik fälgende point: (1) 52 69 70 20 47 71 48 27 27 62 15 48 23 52 49 39 36 Vi ordner disse tal efter stärrelse sé tallet til venstre er mindst: (2) 15 20 23 27 27 36 39 47 48 48 49 52 52 62 69 70 71 Vi ser at det midterste af tallene er 48. Man siger at tallenes median er 48. Antag at der i stedet havde vçret et lige antal tal: (3) 3 3 4 5 6 6 7 8 Da der er et lige antal tal, er der ikke et tal der stér i midten. I stedet udregner vi gennemsnittet af de to midterste tal: 5 6 2 Man siger at tallenes median er 5,5. 5,5. Nedre og Åvre kvartil for ugrupperede observationer I linjen (2) stér 8 tal til venstre for det midterste tal. Vi ser at disse 8 tals median er 27: 15 20 23 27 27 36 39 47 48 48 49 52 52 62 69 70 71 Man siger at 27 er nedre kvartil for tallene i linjen (1). I linjen (2) stér 8 tal til häjre for det midterste tal. Vi ser at disse 8 tals median er 57. Man siger at 57 er Ävre kvartil for tallene i linjen (1). Ved kvartilerne for nogle tal forstés fälgende tre tal: nedre kvartil, median og Ävre kvartil. Kvartilerne for tallene i linjen (1) er altsé de tre tal 27, 48 og 57. Nogle emner fra deskriptiv statistik Side 8 2011 Karsten Juul

Boksplot Figuren nedenfor viser kvartiler samt stärste- og mindstevçrdi for tallene i linjen (1). En sédan figur kaldes et boksplot. 0 10 20 30 40 50 60 70 point Kassen viser hvor den midterste halvdel af tallene ligger. Den vandrette streg i venstre ende af boksplottet viser hvor den fjerdedel af tallene der er mindst, ligger. Den vandrette streg i häjre ende af boksplottet viser hvor den fjerdedel af tallene der er stärst, ligger. Sammenligning af boksplot Boksplot er isçr nyttige nér man vil sammenligne tal fra forskellige steder, f.eks. point fra to eller flere klasser. De to klasser 1a og 1b har haft samme präve hvor hver elev fik et antal point. Figuren viser fordelingen af point i de to klasser. 1a 1b 0 10 20 30 40 50 60 70 point Af figuren ses: 1a har klaret sig bedre end 1b: BÉde mindstevçrdi, nedre kvartil, median, Ävre kvartil og stärstevçrdi i 1a: 35, 52, 60, 66, 75 er stärre end den tilsvarende stärrelse i 1b: 15, 27, 48, 57, 71. Der gçlder endda at mindstevçrdien i 1a (35) er stärre end nedre kvartil i 1b (27). Det betyder at de mindste 25 % af pointtallene i 1b er mindre end alle pointtal i 1a. Pointtallene ligger mindre spredt i 1a end i 1b: Forskellen pé häjeste og laveste pointtal i 1a: 75 35 40 er mindre end i 1b: 71 15 56. Forskellen pé Ävre og nedre kvartil i 1a: 66 52 14 er mindre end i 1b: 57 27 30. Nogle emner fra deskriptiv statistik Side 9 2011 Karsten Juul