Statistik. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer.



Relaterede dokumenter
Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik er at behandle en stor mængde af tal, så de bliver lettere at overskue og forstå.

Statistik. Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal.

Ved et folketingsvalg eller en folkeafstemning spørger man alle stemmeberettigede, og kun en del af dem stemmer.

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)

Deskriptiv statistik for hf-matc

5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime

Deskriptiv statistik for matc i stx og hf

brikkerne til regning & matematik statistik preben bernitt

Grupperet materiale kan f.eks. være befolkningsdata eller indkomstfordelinger.

En lille introduktion til WordMat og statistik.

Nogle emner fra. Deskriptiv Statistik Karsten Juul

Statistik - supplerende eksempler

Løsninger til kapitel 1

Grupperede observationssæt Deskriptiv statistik: Middelværdi, frekvensfordeling, sumkurve, kvartilsæt, boxplot

Noter til Statistik. Lisbeth Tavs Gregersen. 1. udgave

Deskriptiv statistik

Deskriptiv statistik. for C-niveau i hf Karsten Juul

Antal timer Køn k m k m m k m k m k k k m k k k

Under 63 år : 92% Under 55 år : 55% Ved at trække den nederste fra den øverste af de to grupper fås: Melllem 55 og 63 år :

for gymnasiet og hf 2016 Karsten Juul

Statistik (deskriptiv)

Deskriptiv statistik (grupperede observationer)

Hvad siger statistikken?

for gymnasiet og hf 2017 Karsten Juul

Under 63 år : 88% Under 55 år : 55% Ved at trække den nederste fra den øverste af de to grupper fås: Melllem 55 og 63 år :

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

c. Radius for hver sekter er målt i cm og angivet i følgende tabel. Desuden er arealet af hvert område beregnet.

Eksamensspørgsmål 4emacff1

Median, kvartiler, boksplot og sumkurver

Huskeliste Printark. U4 Tastetider U5 Hvor hurtigt regner du? E4 Begreber og fagord - Statistik. Materialer. Mobiltelefon Stopur

Undervisningsbeskrivelse

Et CAS program til Word.

Undervisningsbeskrivelse & Oversigt over projektrapporter

H Å N D B O G M A T E M A T I K 2. U D G A V E

Supplerende opgaver til TRIP s matematiske GRUNDBOG. Forlaget TRIP. Opgaverne må frit benyttes i undervisningen.

Taldata 1. Chancer gennem eksperimenter

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Statistikkompendium. Statistik

Undervisningsbeskrivelse & Oversigt over projektrapporter

S. 55 AFSNIT 3.2 Ø1 S. 55. Pindediagram

M A T E M A T I K B A NK E NS S T A T I S T I K K O M P E ND I U M

OM KAPITLET ELEVFORUDSÆTNINGER STATISTIK

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Undervisningsbeskrivelse

for C-niveau i stx 2017 Karsten Juul

Formelsamling. Ib Michelsen

Formelsamling Matematik C

x + 4 = 3x - 2 Redegør for opstilling af formler til løsning af praktiske problemer. Vis, hvordan en formel kan omskrives.

SPØRGSMÅL TIL MUNDTLIG EKSAMEN, MAT C sommer2014

Undervisningsbeskrivelse

Undervisningsbeskrivelse

statistik og sandsynlighed

Undervisningsbeskrivelse

Undervisningsbeskrivelse

1hf Spørgsmål til mundtlig matematik eksamen sommer 2014

for matematik pä B-niveau i hf

Undervisningsbeskrivelse

Undervisningsbeskrivelse

1. Tal. Du skal redegøre for løsningsregler for ligninger. Forklar, hvordan følgende ligning kan løses grafisk: x + 4 = 3x - 2

OM KAPITLET STATISTIK. egne svar eller Elevernes egne forklaringer. I disse

Forklar hvad betyder begrebet procent og hvordan man beregner det. Forklar, hvordan man lægger procenter til og trækker procenter fra.

9 Statistik og sandsynlighed

Statistik med GeoGebra

HYPPIGHED OG FREKVENS

1q + 1qs Ikast-Brande Gymnasium maj Procent og rente Forklar hvad betyder begrebet procent og hvordan man beregner det.

U L I G H E D I D A N M A R K

Emne Mål Brug af IT Materialer Evaluering Timetal

Navn:&& & Klasse:&& STATISTIK - Fase 2. Undersøge sammenhæng i omverdenen med datasæt. Vurdering fra 1 til 5 (hvor 5 er højst) Lærer.

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Navn:&& & Klasse:&& STATISTIK - Fase 2. Undersøge sammenhæng i omverdenen med datasæt. Vurdering fra 1 til 5 (hvor 5 er højst) Lærer.

Undervisningsbeskrivelse

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Tegning af grafer. Grafen for en ligning (almindelig) Skriv ligningen ind. Højreklik og vælg Plots -> 2-D Plot of Right Side.

Undervisningsbeskrivelse

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Undervisningsbeskrivelse

QR15 Vejledning i at bestemme kvartilsæt og at tegne sumkurver med Nspire, Maple og Geogebra

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Da der er tale om ét indskud og renten er fast, benytter vi kapitalfremskrivningsformlerne til beregningen, hvor

Undervisningsbeskrivelse

Undervisningsbeskrivelse & Oversigt over rapporter

Arbejdsplan generel Tema 4: Statistik

Undervisningsbeskrivelse

Navn:&& & Klasse:&& STATISTIK - Fase 2. Undersøge sammenhæng i omverdenen med datasæt. Vurdering fra 1 til 5 (hvor 5 er højst) Lærer.

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Lektion 9s Statistik - supplerende eksempler

Undervisningsbeskrivelse

STATISTIK SIDE OM KAPITLET

Matematik c - eksamen

Transkript:

Statistik Formålet... 1 Mindsteværdi... 1 Størsteværdi... 1 Ikke grupperede observationer... 2 Median og kvartiler defineres ved ikke grupperede observationer således:... 2 Middeltal defineres ved ikke grupperede observationer således:... 2 Boksplot (eller kassediagram):... 2 Grupperede observationer... 3 hyppighed (antal)... 3 Sumkurve... 3 Frekvensen... 3 Kumuleret hyppighed... 3 Kumuleret frekvens... 3 Median og kvartiler defineres ved grupperede observationer således:... 4 Middeltal ved grupperede observationer... 5 Illustration af forskel på middeltal og median... 5 Histogram... 5 Boksplot bruges også ved grupperede observationer... 5 Formålet med statistik er at få overblik over et stort talmateriale. Vi anvender nogle såkaldte deskriptorer, der beskriver talmaterialet. De enkelte tal i talmaterialet kaldes observationer. Hele talmaterialet kaldes observationssættet Vi vil her lærer betydningen af følgende såkaldte deskriptorer: Mindsteværdi (den mindste observation) Størsteværdi (Den største observation) Middeltal (gennemsnit), Median eller andet kvartil (midten af observationerne, altså grænsen efter første halvdel) Første kvartil eller nedre kvartil (Grænsen efter første fjerdedel af observationerne) Tredje kvartil eller øvre kvartil (Grænsen efter tredje fjerdedel af observationerne) Kvartilsæt (de 3 tal 1. kvartil, median og 3. kvartil) Første kvartil og nedre kvartil er det samme. Ligeledes er tredje kvartil lig øvre kvartil. Når vi arbejder med statistik kan vi gøre det på to måder. Nogen gange grupperer vi observationerne i intervaller. Så kalder vi det grupperede observationer. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer. Peter Sørensen: Statistik Side 1

Ikke grupperede observationer Median og kvartiler defineres ved ikke grupperede observationer således: Observationerne sorteres i stigende orden Ved et ulige antal observationer defineres medianen som den midterste observation. Ved et lige antal observationer defineres medianen som midtpunktet af de 2 midterste observationer. Fx Medianen for 4 personer i alderen 4, 6, 8 og 10 år er 7 år. Medianen kaldes også anden kvartil eller 2. kvartil. Første kvartil eller 1. kvartil eller nedre kvartil defineres som medianen for de observationer, der er før hele observationssættets median. Tredje kvartil eller 3. kvartil eller øvre kvartil defineres som medianen for de observationer, der er efter hele observationssættets median. Kvartilsættet udgøres af 1. kvartil, 2.kvartil og 3. kvartil Middeltal defineres ved ikke grupperede observationer således: Middeltallet ved ikke grupperede observationer er summen af alle observationer divideret med antal observationer. Eksempel: Vi betragter 7 personer med følgende aldre: 3, 5, 9, 10, 12, 14, 20 Median: 10 1. kvartil: 5 3. kvartil: 14 Kvartilsæt: 5, 10, 14 Mindsteværdi: 3 Størsteværdi: 20 Middeltal: (3+5+9+10+12+14+20) / 7 = 10,4 afrundet. Boksplot (eller kassediagram): En boksplot er en grafisk fremstilling af nogle observationer. Boksplotten viser mindsteværdien, de 3 kvartiler og størsteværdien. I en boksplot indgår et rektangel, hvor de to tider angiver 1. og 3. kvartil. Parellelt med disse sider er inde i rektanglet et linjestykke, som viser 2. kvartil (medianen) Vinkelret herpå, tværs gennem rektanglet, er et linjestykke, hvis endepunkter viser mindste og størsteværdi. Peter Sørensen: Statistik Side 2

Grupperede observationer Når der er mange forskellige observationer vælger man ofte at gruppere observationerne, fx: Alder: 0 29 30 59 60 89 90 120 Alder: [0;30[ [30;60[ [60;90[ [90;120[ hyppighed (antal) 3500 3000 2000 1500 Sumkurve Ved grupperede observationer tegner man ofte en såkaldt sumkurve. Inden vi ser hvordan må vi lige høre om yderligere et par deskriptorer: Frekvensen angiver hvor stor en brøkdel, der er i et interval i forhold til alle observationer. Frekvens = hyppighed / antal observationer i alt Frekvens kan angives i % eller som decimalbrøk, fx 35% eller 0,35 Kumuleret hyppighed, der beregnes ved at lægge hyppigheder sammen. Kumuleret frekvens, der beregnes ved at lægge frekvenser sammen. Hvis frekvenserne er afrundede tal, kan det være mere nøjagtigt i stedet at dividere kumuleret hyppighed med antal observationer i alt. Her ses et skema med beregninger af de forskellige deskriptorer: Alder: 0 29 30 59 60 89 90 120 Alder: [0;30[ [30;60[ [60;90[ [90;120[ Antal (hyppighed) h 3500 3000 2000 1500 Kumuleret hyppighed H 3500 Frekvens (Benyttes ved tegning af et såkaldt histogram, som vi senere skal se) Kumuleret frekvens (Benyttes ved tegning af en såkaldt sumkurve, som vi senere skal se) Interval-midtpunkt Midtpunkt af aldersintervallet (Benyttes ved beregning af middeltal) f 3500 / 10000 = 0,35 = 35% F 35% 15 3500+3000 = 6500 3000 / 10000 = 0,30 = 30% 6500 / 10000 = 0,65 = 65% (30+60)/ 2 = 45 Peter Sørensen: Statistik Side 3 6500+2000 = 8500 8500+1500 = 10000 20% 15% 8500 / 10000 = 0,85 = 85% (60+90)/ 2 = 75 100% h, f, H og F er hyppigt anvendte forkortelser for hyppighed, frekvens, kumuleret hyppighed og kumuleret frekvens. 105

Den kumulerede frekvens F er en funktion, der fortæller hvor mange %, der er under en bestemt alder. Fx ses at 65% er under 60 år. Grafen for denne funktion kaldes en sumkurve og sumkurver tegnes altid med rette linjestykker mellem støttepunkterne. Skemaet fortæller ikke, hvordan de grupperede observationer fordeler sig i hvert interval, men man har vedtaget at betragte det som om, de fordeler sig jævnt i hvert interval. Det er derfor, der tegnes rette linjestykker mellem støttepunkterne. De rette linjestykker er udtryk for, at man betragter observationerne, som om de fordeler sig jævnt i hvert interval. Støttepunkter: Alder 0 30 60 90 120 F 0% 35% 65% 85% 100% Median og kvartiler defineres ved grupperede observationer således: Ved grupperede observationer aflæser vi kvartilsættet ved hjælp af sumkurven: 1. kvartil: Gå vandret fra 25% på 2.aksen til sumkurven og så lodret til 1.aksen. Medianen: Gå vandret fra 50% på 2.aksen til sumkurven og så lodret til 1.aksen. 3. kvartil: Gå vandret fra 75% på 2.aksen til sumkurven og så lodret til 1.aksen. Ved ovenstående sumkurve bliver kvartilsættet: 22 år, 45 år, 75 år Peter Sørensen: Statistik Side 4

Middeltal ved grupperede observationer Ved grupperede observationer kan man som tidligere nævnt ikke vide, hvordan observationerne fordeler sig i hvert interval, og man har vedtaget at betragte det som om, de fordeler sig jævnt. Ved beregning af middeltallet kommer det ud på det samme, som at betragte det som om, alle observationer i hvert interval ligger midt i intervallet. Derfor beregnes middeltallet ved for hvert interval at gange intervalmidtpunktet med intervallets frekvens og derefter lægge alle produkterne sammen I ovenstående eksempel er intervalmidtpunkterne: 15, 45, 75 og 105. Middeltallet = 15 35% + 45 30% + 75 20% + 105 15% = 15 0,35 + 45 0,30 + 75 0,20 + 105 0,15 = 49,5 Illustration af forskel på middeltal og median Man kan forestille ovennævnte aldersfordeling i en lille kommune. Lad os antage at nogen af de 90 120 årige fraflytter kommunen. I stedet flytter nogen endnu ældre på mellem 120 og 130 til kommunen i samme antal. Derfor ændrer vi det sidste interval til 90 130. Vil denne ændring ændre på medianen og/eller Middeltallet? Medianen forbliver den samme, kun sidste del af sumkurven ændres. Det stykke, hvor medianen aflæses ændres ikke. Derimod ændres middeltallet, fordi det sidste intervalmidtpunkt bliver ændret. De meget gamle trækker i middeltallet, men ikke i medianen. Histogram Frekvensen (eller hyppigheden) kan fremstilles grafisk i et såkaldt histogram: Boksplot bruges også ved grupperede observationer og defineres på samme måde som ved ikke-grupperede observationer. Peter Sørensen: Statistik Side 5