Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)
|
|
- Martin Svendsen
- 9 år siden
- Visninger:
Transkript
1 Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Til Gribskovløbet 006 gennemførte 118 kvinder 1,4 km distancen. Fordelingen af kvindernes løbstider fremgår af tabellen nedenfor. Tid (minutter) Antal kvinder Her er det underforstået at det første interval er ] ;60] med i første interval. Observationssættets størrelse er 118, da det består af 118 observationer. Vi kan herefter udarbejde følgende tabel: 50 så en løber med en løbetid på 60 min. er talt Tidsinterval I Intervalhyppighed h(i) Intervalfrekvens f(i) ,6 % 15,3 % 8,8 % 0,3 % 13,6 % 8,5 % Intervalhyppigheden angiver altså hvor mange observationer der er i det aktuelle interval, og intervalfrekvensen hvor stor en procentdel af alle observationerne der er i det aktuelle interval. Intervalhyppighederne eller intervalfrekvenserne kan illustreres grafisk med et histogram. Histogram observationer Arealet over et interval svarer til intervalfrekvensen. Man vælger altså en passende arealenhed til f.eks. 10 % hvis histogrammet tegnes i hånden. Bemærk at 1. og 5. interval begge har intervalfrekvensen 13,6 %. Da det første interval er dobbelt så bredt som det 5. interval, er højden af rektanglet over det første interval kun det halve af højden på rektanglet over det 5. interval. Hermed er arealerne lige store. 1/4
2 Middeltallet (my) kan beregnes ved hjælp af intervalmidtpunkterne og intervalfrekvenserne: µ = 55 0,136+ 6,5 0, ,5 0,88+ 7,5 0,03+ 77,5 0, ,085 68,7 min. dvs. den gennemsnitlige løbetid for kvinderne er 68,7 minutter variansen v (læs først sidste afsnit i denne tekst) kan udregnes ved v = f ( I1 ) ( m1 µ ) + f ( I ) ( m µ ) + f ( I 3) ( m3 µ ) +... hvor f(i 1 ) er frekvensen af det første interval, m 1 er midtpunktet af det første interval osv. v= 0,136 (55 + 0,153 (6,5 + 0,88 (67,5 + 0,03 (7,5 + 0,136 (77,5 + 0,085 (85 v= 67,8687 Spredningen udregnes herefter, idet s = v og heraf fås s= 67,8687 8, Sumkurven tegnes ud fra de kumulerede frekvenser: Her finder man ud fra intervalfrekvenserne at f.eks. F(65)=13,6 % + 15,3 % =8,8 % Det betyder af 8,8% af løbstiderne er 65 minutter eller derunder. x løbstid i minutter F(x) Kumulerede frekvens 0 % 13,6 % 8,8 % 57,6 % 78,0 % 91,5 % 100 % Sumkurve kumuleret frekvens i % tid i minutter Punkterne (x,f(x)) afsættes i koordinatsystemet og herefter forbindes punkterne med rette liniestykker. Vi går nemlig ud fra at observationerne i et interval er jævnt fordelt. /4
3 Herefter kan kvartilsættet aflæses, som markeret på sumkurven. 1. kvartil er 63,7 minutter (dvs. 5 % af kvinderne løb på 63,7 minutter eller kortere tid). kvartil er 68,7 minutter (dvs. 50 % af kvinderne løb på 68,7 minutter eller kortere tid) 3. kvartil er 74,3 minutter (dvs. 75 % af kvinderne løb på 74,3 minutter eller kortere tid) Kvartilsættet kan dog også beregnes ud fra de kumulerede frekvenser: Her vises hvordan 1. kvartil kan beregnes. Af tabellen over de kumulerede frekvenser ses at F(60)=13,6 % og F(65)=8,8 %. Dvs. at 1. kvartil, må være mellem 60 og 65 minutter. Der er 15,3 % af kvinderne der har en tid i intervallet ]60;65]. Da 13,6%+11,4%=5 % skal vi bruge 11,4%-point ud af de 15,3%-point der er i intervallet 11,4 ]60;65]. Derfor udregnes 1. kvartil ved 60 + (65 60) = 63, 73 minutter 15,3 Til sidst er vist et boksplot for tiderne: Her er mindste og største observation liniens endepunkter, og kassen tegnes ud fra kvartilsættet. Kassens højde vælges frit. boksplot Indførelse af begreberne varians og spredning. Vi tager udgangspunkt i to forskellige observationssæt som viser vægtfordelingen i to forskellige persongrupper I og II. Histogrammerne ses nedenfor. Histogram I Histogram II 30 % 40 % 30 % Observationer - vægt i kg 15 % 0 % 30 % 0 % 15 % Observationer vægt i kg Af histogrammerne ses at begge observationssæt har middelværdien 75 kg. Det er tydeligt at se der er større variation i vægtene hos gruppe II. Vi vil indføre et tal som skal være et mål for variationens størrelse. 3/4
4 Som ved udregning af middeltallet vil vi tage udgangspunkt i intervalmidtpunkterne, idet vi går ud fra at fx de 30% fra gruppe I som vejer mellem 60 og 70 kg, i gennemsnit vejer 65 kg. Vi ser nu på forskellene mellem intervalmidtpunkterne og middelværdien for observationssæt I: (65-75)= -10 kg, (75-75)kg=0 kg og (85-75)=10 kg Det er egentlig afstandene til middelværdien og ikke forskellene mellem intervalmidtpunkt og middelværdi der er interessant. Derfor ses på størrelsen af kvadraterne (65-75), (75-75) og (85-75) Nu udregnes middelværdien af disse kvadrater (intervalfrekvenserne aflæses på histogrammet) 0,30 (65 75) + 0,40 (75 75) + 0,30 (85 75) = 60 Dette tal kaldes variansen af vægtfordelingen X i gruppe I og vi skriver var(x)=60 Dette tal er altså et udtryk for hvor meget vægtene varierer i gruppe I. På samme måde beregnes variansen for vægtfordelingen Y i gruppe II: var( Y ) = 0,15 (55 75) + 0,0 (65 75) + 0,30 (75 75) + 0,0 (85 75) var( Y ) = ,15 (95 75) Variansen for gruppe II er størst og det passer jo med hvad vi ser af histogrammerne. Kvadratroden af variansen kaldes spredningen så vi har σ ( X ) = 60 7,7 ogσ (Y) = 160 1,6 ( σ er det græske bogstav: lille sigma) Både varians og spredning er altså udtryk for hvor stor variation der er i observationerne, og de kan bruges til at sammenligne observationssæt som her. Definition Vi definerer variansen for et observationssæt ved tallet Var ( X ) = f ( I ) ( m µ ) + f ( I ) ( m µ ) + f ( I ) ( m µ ) Hvor µ er middelværdien, f(i 1 ) er frekvensen af det første interval, m 1 er midtpunktet af det første interval osv. Og spredningen defineres ved σ ( X ) = var( X )... 4/4
Grupperet materiale kan f.eks. være befolkningsdata eller indkomstfordelinger.
Thomas Jensen & Morten Overgård Nielsen At bestemme kvartilsæt Indhold - At finde kvartilsæt i ikke-grupperet datamateriale (link til dokumentet her) - At bestemme kvartilsæt ved hjælp af Excel (link til
Læs mereHvad er meningen? Et forløb om opinionsundersøgelser
Hvad er meningen? Et forløb om opinionsundersøgelser Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004
Læs mereStatistik. Erik Vestergaard
Statistik Erik Vestergaard 2 Erik Vestergaard www.matematiksider.dk Erik Vestergaard www.matematiksider.dk 3 1. Grupperede observationer I statistik beskæftiger man sig med indsamling, bearbejdelse og
Læs mereEt CAS program til Word.
Et CAS program til Word. 1 WordMat WordMat er et CAS-program (computer algebra system) som man kan downloade gratis fra hjemmesiden www.eduap.com/wordmat/. Programmet fungerer kun i Word 2007 og 2010.
Læs mereDen lille hjælper. Positionssystem...3. Positive tal...3. Negative tal...3. Hele tal...3. Potenstal...3. Kvadrattal...3
Den lille hjælper Positionssystem...3 Positive tal...3 Negative tal...3 Hele tal...3 Potenstal...3 Kvadrattal...3 Parentes...4 Parentesregler...4 Primtal...4 Addition (lægge sammen) også med decimaltal...4
Læs mereOversigt over Procent, absolut og relativ tilvækst samt indekstal
Oversigt over Procent, absolut og relativ tilvækst samt indekstal Indhold Oversigt over Procent, absolut og relativ tilvækst samt indekstal... 1 Procent... 1 Hvad er én procent?... 1 Procentsatser over
Læs mereLøs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp.
Udarbejdet af Thomas Jensen og Morten Overgård Nielsen Indhold Introduktion til materialet. s. 2 Introduktion til chi i anden test. s. 4 Et eksempel hastighed og ulykker på motorveje s. 8 Sådan udregnes
Læs mereFagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF
Fagligt samspil mellem Ma-B og SA-A Lisbeth Basballe, Mariagerfjord Gymnasium og Marianne Kesselhahn, Egedal Gymnasium og HF Vi ønskede at planlægge og afprøve et undervisningsforløb, hvor anvendelse af
Læs mereSkriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.
Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med
Læs mereSådan gør du i GeoGebra.
Sådan gør du i GeoGebra. Det første vi skal prøve er at tegne matematiske figurer. Tegne: Lad os tegne en trekant. Klik på trekant knappen Klik på punktet ved (1,1), (4,1) (4,5) og til sidst igen på (1,1)
Læs mereDen lille hjælper. Krogårdskolen. Hvordan løses matematik? Indskoling 0. 3. klasse, mellemtrin 4. 6. klasse og udskoling 7. 9.
Den lille hjælper Krogårdskolen Indskoling 0. 3. klasse, mellemtrin 4. 6. klasse og udskoling 7. 9. klasse Hvordan løses matematik? Positionssystem... 4 Positive tal... 4 Negative tal... 4 Hele tal...
Læs merePiger bryder den sociale arv drengene gør det modsatte
Piger bryder den sociale arv drengene gør det modsatte Pigerne er generelt bedre end drengene til at bryde den sociale arv. Og mens pigerne er blevet bedre til at bryde den sociale arv i løbet af de seneste
Læs mereKapital- og rentesregning
Rentesregning Rettet den 28-12-11 Kapital- og rentesregning Kapital- og rentesregning Navngivning ved rentesregning I eksempler som Niels Oles, hvor man indskyder en kapital i en bank (én gang), og banken
Læs mereINDHOLDSFORTEGNELSE. Side Indledning 2. Kapitel 1 Introduktion til funktioner af 2 variable 3 Niveaukurver 5
INDHOLDSFORTEGNELSE Side Indledning Kapitel 1 Introduktion til funktioner af variable 3 Niveaukurver 5 Kapitel Partiel differentiation og gradienten 7 Kapitel 3 Differentialet 1 Fejlvurdering 13 Tangentplan
Læs mereStatistik med TI-Nspire CAS version 3.2. Bjørn Felsager September 2012. [Fjerde udgave]
Statistik med TI-Nspire CAS version 3.2 Bjørn Felsager September 2012 [Fjerde udgave] Indholdsfortegnelse Forord Beskrivende statistik 1 Grundlæggende TI-Nspire CAS-teknikker... 4 1.2 Lister og regneark...
Læs mereMellem stjerner og planeter
Mellem stjerner og planeter Et undervisningmateriale for gymnasieklasser om begrebet parallakse og statistik. Titelbladet fra Tycho Brahes bog De Nova Stella, udgivet i 1573. Oversat fra latin står der
Læs mereareal og rumfang trin 1 brikkerne til regning & matematik preben bernitt
brikkerne til regning & matematik areal og rumfang trin 1 preben bernitt brikkerne til regning & matematik areal og rumfang, trin 1 ISBN: 978-87-92488-17-6 1. Udgave som E-bog 2003 by bernitt-matematik.dk
Læs mereMaple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.
Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt
Læs mereAfstande Afstande i universet
Side 1 Til læreren i universet Her får man en fornemmelse af rummeligheden i universet at stjernerne ikke, som antaget i Middelalderen, sidder på indersiden af en kugleflade, men i stedet er spredt i rummet
Læs mereLøsningsforslag til Geometri 1.-6. klasse
1 Løsningsforslag til Geometri 1.-6. klasse Bemærk, at vi benytter betegnelsen øvelser som en meget bred betegnelse. Derfor er der også nogle af vores øvelser, der nærmer sig kategorien undersøgelser,
Læs mereHvor meget energi har jeg brug for?
Hvor meget energi har jeg brug for? Du bruger energi hele tiden. Når du går, når du tænker, og selv når du sover. Energien får du først og fremmest fra den mad, du spiser. Den kommer fra proteiner, og
Læs mereUafhængighed et eksempel på en rød tråd i statistikken
Uafhængighed et eksempel på en rød tråd i statistikken Statistiknoter til TI-Nspire CAS version 3.1 Bjørn Felsager Revideret November 2011 329 Uafhængighed et eksempel på en rød tråd i statistikken Chi-i-anden-testen
Læs mereElevprofil af hovedforløbselever pa socialog sundhedsskolerne
Elevprofil af hovedforløbselever pa socialog sundhedsskolerne Indledning har udarbejdet en profil af de elever, som påbegyndte et hovedforløb, henholdsvis pædagogisk assistentuddannelse, social- og sundhedshjælperuddannelsen
Læs mereDifferential- regning
Differential- regning del () f () m l () 6 Karsten Juul Indhold Tretrinsreglen 59 Formler for differentialkvotienter64 Regneregler for differentialkvotienter67 Differentialkvotient af sammensat funktion7
Læs mereEmmas og Frederiks nye værelser - maling eller tapet?
Emmas og Frederiks nye værelser - maling eller tapet? Emmas og Frederiks familie skal flytte til et nyt hus. De har fået lov til at bestemme, hvordan væggene på deres værelser skal se ud. Emma og Frederik
Læs mereDen sociale arv er ligeså stærk som for 20 år siden
Den sociale arv er ligeså stærk som for år siden Forældrenes uddannelsesniveau er helt afgørende for, om børnene får en uddannelse. Jo højere forældrenes uddannelse er, desto større er sandsynligheden
Læs mereVejledning om sammenhængen. Post og e-boks til erhverv samt hvilke muligheder det giver for synkronisering
Vejledning om sammenhængen mellem Digital Post og e-boks til erhverv samt hvilke muligheder det giver for synkronisering Version: 1.0 Udarbejdet: Okt. 2013 Udarbejdet af: Erhvervsstyrelsen og Digitaliseringsstyrelsen.
Læs mereopløsning - det om DPI, PPI og LPI » DPI - PPI - LPI? » Hvad er opløsning for noget? » Opløsning - i praksis S I D E 1
KNL DtP s ARTIKLER Opløsning - det om DPI, PPI og LPI opløsning - det om DPI, PPI og LPI I takt med at flere og flere køber digitalkameraer, og begynder at bruge computeren til at redigere deres billeder
Læs mereHer er et spørgsmål, du måske aldrig har overvejet: kan man finde to trekanter med samme areal?
Her er et spørgsmål, du måske aldrig har overvejet: kan man finde to trekanter med samme areal? Det er ret let at svare på: arealet af en trekant, husker vi fra vor kære folkeskole, findes ved at gange
Læs mere