Ved et folketingsvalg eller en folkeafstemning spørger man alle stemmeberettigede, og kun en del af dem stemmer.

Relaterede dokumenter
Statistik. Kvartiler og middeltal defineres forskelligt ved grupperede observationer og ved ikke grupperede observationer.

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Statistik. Statistik er analyse af indsamlet data. Det vil sige at man bearbejder et datamateriale som i matematik næsten altid er tal.

Statistik er at behandle en stor mængde af tal, så de bliver lettere at overskue og forstå.

Deskriptiv statistik for hf-matc

Deskriptiv statistik for matc i stx og hf

Antal timer Køn k m k m m k m k m k k k m k k k

5. Statistik. Hayati Balo,AAMS. 1. Carstensen, Frandsen og Studsgaard, stx mat B2, systime

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Noter til Statistik. Lisbeth Tavs Gregersen. 1. udgave

for gymnasiet og hf 2017 Karsten Juul

Huskeliste Printark. U4 Tastetider U5 Hvor hurtigt regner du? E4 Begreber og fagord - Statistik. Materialer. Mobiltelefon Stopur

for gymnasiet og hf 2016 Karsten Juul

Taldata 1. Chancer gennem eksperimenter

Hvad siger statistikken?

Løsninger til kapitel 1

brikkerne til regning & matematik statistik preben bernitt

Supplerende opgaver til TRIP s matematiske GRUNDBOG. Forlaget TRIP. Opgaverne må frit benyttes i undervisningen.

statistik og sandsynlighed

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

Statistik - supplerende eksempler

En lille introduktion til WordMat og statistik.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Deskriptiv statistik. for C-niveau i hf Karsten Juul

for matematik pä B-niveau i hf

Deskriptiv statistik

Nogle emner fra. Deskriptiv Statistik Karsten Juul

Grupperede observationssæt Deskriptiv statistik: Middelværdi, frekvensfordeling, sumkurve, kvartilsæt, boxplot

Personlig stemmeafgivning

OM KAPITLET STATISTIK. egne svar eller Elevernes egne forklaringer. I disse

Median, kvartiler, boksplot og sumkurver

Statistik. Deskriptiv statistik, normalfordeling og test. Karsten Juul

Statistisk beskrivelse og test

Undervisningsbeskrivelse

OM KAPITLET ELEVFORUDSÆTNINGER STATISTIK

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Undervisningsbeskrivelse

statistik og sandsynlighed

Indhold Grupperede observationer... 1 Ugrupperede observationer... 3 Analyse af normalfordelt observationssæt... 4

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Statistikkompendium. Statistik

I. Deskriptiv analyse af kroppens proportioner

Deskriptiv statistik (grupperede observationer)

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Projekt 2.9 Sumkurver som funktionsudtryk anvendt til Lorenzkurver og Ginikoefficienter (især for B- og A-niveau)

c. Radius for hver sekter er målt i cm og angivet i følgende tabel. Desuden er arealet af hvert område beregnet.

bernitt-matematik.dk Fjordvej Holbæk

Statistik (deskriptiv)

Undervisningsbeskrivelse

Et CAS program til Word.

Arbejdsplan generel Tema 4: Statistik

S. 55 AFSNIT 3.2 Ø1 S. 55. Pindediagram

M A T E M A T I K B A NK E NS S T A T I S T I K K O M P E ND I U M

Undervisningsbeskrivelse

Hvad er meningen? Et forløb om opinionsundersøgelser

Under 63 år : 92% Under 55 år : 55% Ved at trække den nederste fra den øverste af de to grupper fås: Melllem 55 og 63 år :

Undervisningsbeskrivelse

Undervisningsbeskrivelse

Undervisningsbeskrivelse

statistik og sandsynlighed

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

9 Statistik og sandsynlighed

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Undervisningsbeskrivelse

(Projektets første del er rent deskriptiv, mens anden del peger frem mod hypotesetest. Projektet kan gemmes til dette emne, eller tages op igen der)

statistik basis+g DEMO

Torben Rønne. Statistik. med TI InterActive

Undervisningsbeskrivelse

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Statistik med GeoGebra

Undervisningsbeskrivelse

for matematik pä B-niveau i hf

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Undervisningsbeskrivelse

Undervisningsbeskrivelse

STUDENTEREKSAMEN GUX MAJ MATEMATIK A-NIVEAU. Prøveform a. Kl GUX-MAA

Dig og din puls Lærervejleding

Formelsamling Matematik C

Undervisningsbeskrivelse

Det er en af de hyppigst forekommende udregninger i den elementære talbehandling at beregne gennemsnit eller middeltal af en række tal.

Matematik A. Studentereksamen

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode

Middelværdi med mere Hyppighed og frekvens Diagrammer Hvilket diagram er bedst? Grupperede observationer...

Undervisningsbeskrivelse

U L I G H E D I D A N M A R K

statistik og sandsynlighed

1q + 1qs Ikast-Brande Gymnasium maj Procent og rente Forklar hvad betyder begrebet procent og hvordan man beregner det.

Fagårsplan 12/13 Fag: Matematik Klasse: 6.a Lærer: LBJ Fagområde/ emne

Undervisningsbeskrivelse

Lektion 9s Statistik - supplerende eksempler

9.1 I en klasse blev alle elevernes højde målt. Det gav følgende resultater:

Undervisningsbeskrivelse

QR15 Vejledning i at bestemme kvartilsæt og at tegne sumkurver med Nspire, Maple og Geogebra

Undervisningsbeskrivelse

Transkript:

Matematik C (må anvendes på Ørestad Gymnasium) Statistik Statistik er bearbejdning af talmaterialer, der ofte indeholderstore mængder af tal. De indsamles og registreres i mange forskellige sammenhænge og med mange formål: folketællinger, opinionsundersøgelser, trafikmålinger, helbredsundersøgelser, produktionskontrol osv. Indsamling og registrering og statistisk bearbejdning af tal kan foretages på mange forskellige måder. Ved en folketælling registreres alle personer i en befolkning, det vil typisk være med køn, alder, bopæl, stilling, indtægt, familieforhold, boligforhold osv. Formålet er at få de vigtigste befolkningsmæssige forhold belyst. I en opinionsundersøgelse spørger man kun en udvalgt del af en befolkning om deres holdning til et bestemt emne. Man spørger ikke hele befolkningen og ved derfor heller ikke, hvad alle mener, men undersøgelsen kan alligevel give et ret pålideligt skøn over hele befolkningens holdning. Hvor sikkert undersøgelsen afspejler hele befolkningens holdning afhænger af, hvorledes delgruppen er udvalgt. Ved et folketingsvalg eller en folkeafstemning spørger man alle stemmeberettigede, og kun en del af dem stemmer. En trafikmåling kan bestå i at registrere trafiktætheden, fx antallet af biler, der benytter en udvalgt vejstrækning i en bestemt tidsperiode. Eller det kunne være måling af hastigheden af de biler, der passerer. Eller antallet af færdselsuheld i et bestemt vejkryds. Side 121

En produktionskontrol vil typisk være en løbende kontrol af produkterne fra en virksomhed, f.eks. mængden af virksomt stof i medicin, alkoholprocenten i vin, sprøjtemiddelrester i grønsager o.l. Et talmateriale er således en række målinger (tal), som er foretaget med henblik på en eller anden bearbejdning og fortolkning. Bearbejdningen kan bestå i forskellige beregninger eller grafiske illustrationer, som er velegnede til at vise karakteristiske egenskaber ved målingerne. Denne bearbejdning kaldes deskriptiv statistik. Fortolkning af et talmateriale, dvs at vurdere, hvad tallene kan fortælle, og at drage konklusioner ud fra tallene, er en del af statistikken, som benytter sandsynlighedsregning. Det kaldes matematisk statistik. 8.1 Beregninger på et observationssæt I dette afsnit ser vi, hvilke beregninger og illustrationer, man normalt foretager på et talmateriale. Tallene nedenfor viser målinger af vægten af 50 smertestillende piller, Lornoxicam. Den virksomhed, som producerer Lornoxicam, fremstiller et stort antal piller hver dag. Man kan forestille sig, at målingerne er foretaget på 50 tilfældige piller fra produktionen for at kontrollere produktionens ensartethed. Målingerne er i mg. 212, 214, 214, 218, 216, 215, 214, 214, 215, 214, 212, 215, 214, 217, 215, 215, 217, 214, 212, 217, 217, 217, 214, 211, 214, 214, 213, 210, 214, 212, 213, 212, 213, 214, 213, 215, 218, 213, 212, 215, 214, 212, 215, 216, 216, 214, 216, 215, 215, 215. De enkelte målinger kaldes observationer, og tilsammen udgør de et observationssæt. Antallet af observationer i et observationssæt kaldes observationssættets størrelse, her er størrelsen 50. Det fremgår, at observationerne er ret ens, som man vil forvente af en maskinel produktion. Men helt ens er de jo ikke, og forskellene kommer frem, når man måler med så stor nøjagtighed som her. Hvis man afsætter observationerne på en talakse, får man et prikdiagram: Side 122

På et prikdiagram kan man lettere overskue, hvorledes målingerne fordeler sig: den mindste måling er 210, den største er 218, en stor del af målingerne ligger på 214 og 215 mg, 7 målinger er på 217 eller mere, osv. Målingen 211 forekommer kun én gang, derfor siger vi, at hyppigheden af 211 er 1. Tilsvarende har 213 hyppigheden 5, og hyppigheden af 219 er 0. Definition: En hyppighed angiver således altid et antal målinger med en bestemt værdi. Hvis der var foretaget målinger på 100 piller i stedet for 50, måtte man forvente, at hyppighederne var blevet nogenlunde dobbelt så store. En hyppighed må derfor vurderes ud fra, hvor stort observationssættet er. Det er grunden til, at man ofte beskriver et observationssæt ved procentdelen (eller andelen) af observationerne, der har en bestemt størrelse, og det kaldes frekvensen. Frekvensen af 211 er 1 ud af 50, dvs. eller 2%. Tilsvarende er frekvensen af 213 lig med 10%, og frekvensen af målingerne under 214 er eller 26%. Definition: Frekvensen er lig med hyppigheden divideret med observationssættets størrelse. Observation: x: 210 211 212 213 214 215 216 217 218 Hyppighed: h(x): 1 1 7 5 14 11 4 5 2 Frekvens: f(x) = 2% 2% 14% 10% 28% 22% 8% 10% 4% Side 123

I stedet for et prikdiagram kan man illustrere målingerne med et pindediagram (stolpediagram), hvor højden af hver pind angiver enten hyppigheden eller frekvensen af den pågældende måling. I dette eksempel, hvor målingerne er vægt i mg, vil det være mere korrekt at erstatte pindene med smalle rektangler. Eksempelvis er der 5 målinger på 213 mg, men disse målinger er afrundede til et helt antal mg, og er udtryk for, at de helt præcise vægte har ligget i intervallet 212,5 213,5, og derfor giver et rektangel over dette interval med højden 10% (eller højden 5) et mere korrekt billede af pillernes vægt. Denne illustration kaldes et histogram. Lornoxicam benyttes fortrinsvis mod gigtsmerter og skal ifølge deklarationen på pakken indeholde 8 mg af det virksomme stof, dvs. dosis i en pille skal være 8 mg. Derfor foretog man samtidig måling af dosis-indholdet i et antal piller. Resultatet af disse målinger er samlet i tabellen næste side. Af tabellen kan man fx aflæse, at 14% af målingerne lå i intervallet 8.05-8.10. Det kaldes en intervalfrekvens. Her er målingerne altså allerede samlet i grupper, Side 124

grupperet, så vi ikke helt kan rekonstruere de oprindelige målinger. Og måske ved vi slet ikke, hvor mange målinger, der i alt er tale om. Dosisinterval Intervalfrekvens 7.95-8.00 8.00-8.05 8.05-8.10 8.10-8.15 8.15-8.20 8.20-8.25 8.25-8.30 8.30-8.35 8% 10% 14% 24% 22% 16% 4% 2% Figuren herunder viser et histogram over dosis-målingerne i tabellen. Hvis man i tabellen ovenfor summerer frekvenserne nedefra, dvs. fra de mindste observationer og opefter, så får man en tabel over de kumulerede frekvenser, se tabellen herunder. Intervallet med de mindste målinger er ]7,95 ; 8,00]. Derfor kalder vi tallet 7,95 for mindsteværdien eller mindsteobservationen. Tilsvarende indeholder intervallet ]8,30 ; 8,35] de støre observationer, og vi kalder tallet 8,35 for størsteværdien eller størsteobservationen. Endvidere ses, at intervallet ]1,10 ; 8,15] har den højeste frekvens (søjlen med størst areal), og dette interval kaldes for typeintervallet. Dosis (mg) 8.00 8.05 8.10 8.15 8.20 8.25 8.30 8.35 Kumuleret frekvens 8% 18% 32% 56% 78% 94% 98% 100% Af tabellenkan man fx aflæse, at 32% af observationerne var mindre end eller lig med 8.10 mg (eller højst 8.10 mg). Bemærk, at en kumuleret frekvens hører til intervallets højre endepunkt. Når 32% af observationerne er højst 8.10, kan man slutte, at 68% af observationerne var større end 8.10 mg. Således er de kumulerede frekvenser i nogle situationer mere anvendelige end frekvenserne selv, fordi de direkte angiver, hvor stor en andel af observationerne, der ligger over eller under en given værdi. Og ud fra de kumulerede frekvenser kan de oprindelige frekvenser i tabellen øverst på siden findes, hvis man ønsker det: fx er intervalfrekvensen af intervallet 8.10-8.15 lig med 56% 32% = 24%. Side 125

Grafen herunder viser en tegning af de kumulerede frekvenser. Tallene er afsat i et koordinatsystem med observationerne (højre intervalendepunkt) på 1.aksen og de kumulerede frekvenser på 2.aksen. Punkterne forbindes med rette linjestykker. Kurven kaldes en sumkurve. Figur Sumkurve: På sumkurven kan man aflæse, hvorledes målingerne fordeler sig. På figuren er vist, hvorledes man aflæser, at 65% af målingerne er mindre end 8.17, og at de 10% største målinger har været på 8.24 mg eller derover. Med udgangspunkt i en sumkurve, kan man stadig rekonstruere hele det oprindelige observationssæt ved at aflæse de kumulerede frekvenser og regne baglæns til intervalfrekvenserne. Så al information om målingerne er bevaret. Det gælder ikke for de følgende beregninger på et observationssæt. Aflæsninger på sumkurven fra 25%, 50% og 75% på 2.aksen giver 3 måltal på 1.aksen, som kaldes kvartilsættet. For dosismålingerne bliver kvartilsættet (8.07, 8.14, 8.19). Kvartilsættet viser f.eks., at en fjerdedel af målingerne var mindre end 8.07, at halvdelen af målingerne var mindre end 8.14 (og den anden halvdel større end 8.14), og at de 25% største målinger var større end 8.19. Således angiver kvartilsættet en deling af observationerne i 4 lige store dele. Den midterste kvartil, som kaldes medianen, ligger midt i observationerne, i den forstand, at der ligger 50% på begge sider af medianen. Definition: De tre tal i kvartilsættet kaldes (1.kvartil, 2.kvartil, 3.kvartil) eller (nedre kvartil, median, øvre kvartil). På en bestemt motorvejsstrækning har man over en periode målt hastigheden (km/t) af de forbipasserende biler. Det oplyses, at kvartilsættet var (92, 103, 109). Ud fra kvartilsættet alene, kan man langt fra rekonstruere de oprindelige målinger, men til gengæld får man nogle centrale oplysninger på kort form: Halvdelen af bilisterne kørte under 103 km/t (og den anden halvdel kørte over 103 km/t), halvdelen kørte mellem 92 og 109 km/t, den hurtigste fjerdedel kørte over Side 126

109 km/t osv. Man får både oplysning om, hvad der var den gennemgående almindeligste hastighed (103 km/t) og nogen oplysning om, hvor store forskelle, der er i bilisternes hastigheder. Med et kvartilsæt taber man detaljeret information, men vinder overblik. Man illustrerer ofte kvartilsættet i et såkaldt boxplot. Her angiver man de fem værdier: mindste observation (7,95), første kvartil (8,07), median (8,14), tredje kvartil (8,19) og største observation (8,35) ved følgende figur. Boxplottet giver en hurtig oversigt over observationernes størrelse og fordeling. En deskriptor (en beskriver ) er et tal, beregnet ud fra målingerne i observationssættet, der indeholder en bestemt information om observationssættet. Kvartilsættet består således af tre deskriptorer. I det følgende defineres et par andre deskriptorer. Gennemsnittet af observationerne kaldes i statistik middeltallet. Middeltallet findes ved at addere alle målinger og dividere med observationssættets størrelse. Middeltallet betegnes. For de oprindelige Lornoxicam-vægte fås Ser man på histogrammet, side 121, ligger middeltallet,, nogenlunde midt i observationssættet. Men det er midt i i en anden forstand end medianen gør. Hvis observationerne fordeler sig symmetrisk omkring medianen, så er lig med medianen. Middeltallet: Formel for middeltallet: hvor er de n observationer. Hvis observationssættet er grupperet og givet ved en frekvenstabel som dosis-målingerne i tabel xx4, så beregner man middeltallet, som om alle målingerne i et hvert interval lå i intervallets midtpunkt. I tabel xx4 betyder det, at 8 målinger er 7.975, 10 målinger er 8.025 osv., og i alt er der 100 målinger. Middeltallet for dosis bliver således En anden deskriptor er spredningen. Spredningen er et mål for, hvor meget målingerne i et observationssæt varierer. Hvis alle målingerne ligger tæt på middeltallet, er spredningen lille. Hvis nogle målinger ligger længere væk, bliver spredningen større. Kort sagt beregnes spredningen som et gennemsnit af, hvor meget observationerne afviger fra. Side 127

Matematik C (må anvendes på Ørestad Gymnasium) Formel for variansen, v, og spredningen, s: 8.2 Populationer og stikprøver I tilknytning til et observationssæt er det hensigtsmæssigt at indføre betegnelserne population og stikprøve. Et observationssæt vil vi altid opfatte som en stikprøve fra en population. Tag et eksempel fra den daglige nyhedsformidling: 60% af stockholmerne er imod indførelse af bompenge for biltrafikken i Stockholm Fra 3. januar 2006 startede et forsøg i Stockholm, hvor man afkrævede bilister bompenge ved ind- og udkørsel fra den svenske hovedstad. I den anledning havde man spurgt 600 stockholmere om deres holdning til forsøget, og 60% af de adspurgte var imod forsøget. Formålet med undersøgelsen var at belyse stockholmernes holdning til bompenge. Derfor må man formode, at populationen var hele Stockholms befolkning. Observationssættet bestod af de 600 svar på spørgsmålet (for, imod, ved ikke), og stikprøven bestod af de 600 stockholmere, som blev spurgt. Men det er valget af stikprøven, der i virkeligheden afgør, hvad populationen har været. Hvis de 600 personer i stikprøven alle var bilister, så er stikprøven ikke repræsentativ for alle stockholmere, da bilister oplagt kunne have et andet syn på bompenge end andre Side 128

indbyggere. Af samme grund ville det ikke være repræsentativt at spørge 600 tilfældigt forbipasserende på gågaden. En stikprøve skal være repræsentativ for den population, man udtaler sig om. En stikprøve anses for repræsentativ, hvis den i alle henseender afspejler de forhold ved populationer, som kan have betydning for resultatet af undersøgelsen. Det kan være meget svært at sikre, fordi man ikke altid på forhånd kan vide, hvilke forhold, der har betydning. Til demonstration af begrebet repræsentativitet, se på følgende eksempler Hvis man vil undersøge, hvilken højde eleverne på et hold har, så er det ikke repræsentativt at måle højden af de elever, der sidder på første række. Den stikprøve kan indeholde systematiske fejl, fordi der kan være et mønster i elevernes valg af siddeplads. Måske sidder de højeste elever bagest, eller pigerne forrest e.l. Hvis man vil undersøge, hvor stor en del af eleverne på en skole, der er overvægtige, er det ikke repræsentativt at vælge de første 20 elever, der selv melder sig til en undersøgelse. Hvis man vil undersøge dette års karakterer i skriftlig dansk ved studentereksamen, er det ikke repræsentativt at vælge eleverne på et gymnasium på Frederiksberg. Som udgangspunktet for valg af en stikprøve vil man kræve, at den er tilfældigt valgt fra populationen, altså valgt ved en form for lodtrækning, hvor alle i populationen har samme sandsynlighed for at komme med i stikprøven. Ved at vælge stikprøven tilfældigt undgår man systematiske fejl i selve udvælgelsen. Men man kan naturligvis ikke gardere sig imod, at en tilfældigt valgt stikprøve uheldigvis kommer til at indeholde systematiske fejl, der får betydning for resultatet. I nogle stikprøvesituationer, f.eks. i politiske meningsmålinger, benytter man ofte faste vælger-stikprøver, der er udvalgt, så de i sammensætning er repræsentative for hele vælgerbefolkningen, en slags mini-danmark, med hensyn til alder, køn, erhverv, indtægt osv. Det er en anden måde at sikre sig repræsentativitet på. 8.2.1 Eksempel På Experimentarium i Hellerup, København, kan de besøgende besvare et genetisk spørgeskema, hvor et af spørgsmålene er, om du er venstreeller højrehåndet. En bestemt dag er der indkommet 217 svar, hvoraf de 40 svarer venstrehåndet, og 177 svarer højrehåndet. Observationssættet er de 217 svar (højre, venstre). Populationen er de besøgende på Experimentarium den pågældende dag, og stikprøven er de 217 personer, der har valgt at svare på skemaet. Hvad kan man bruge observationssættet til? Side 129